LongCat

LongCat

美团研发的生成式 AI 大模型系列

对话聊天

9 个月前

3834

1888

1

LongCat 介绍

LongCat（龙猫）是美团（Meituan）自主研发的生成式 AI 大模型系列，旨在通过高效的计算架构和强大的多模态能力，提升企业内部工作效率和创新应用。它于 2025 年 8 月 31 日正式开源最新版本 LongCat-Flash-Chat，迅速成为 AI 社区关注的焦点。该模型不仅在技术创新上领先，还在智能体（Agent）任务和指令遵循方面表现出色，适用于对话、编程、工具调用等多种场景。

核心特点与架构

LongCat-Flash 采用 Mixture-of-Experts (MoE) 混合专家架构，总参数量高达 5600 亿（560B），但每个 token（词元）仅激活 18.6 亿至 31.3 亿参数（平均约 27 亿），实现了“按需计算”的高效利用。这种动态激活机制通过引入 零计算专家（Zero-Computation Experts），让模型根据输入复杂度的“预算”智能分配资源：简单任务节省算力，复杂任务投入更多计算。

此外，它创新性地使用 Shortcut-Connected MoE (ScMoE) 架构，通过跨层快捷连接扩展计算-通信重叠窗口，使训练和推理过程并行执行，提升系统吞吐量。在 H800 硬件上，推理速度可达 单用户 100+ tokens/s，每百万输出 token 成本仅 0.70 美元。

性能亮点

LongCat-Flash-Chat 在多项基准测试中脱颖而出，尤其在 智能体任务 上达到 SOTA（State-of-the-Art）水平：

τ²-Bench：超越多数模型，在智能体任务中领先。
VitaBench：得分 24.30，位列第一。
IFEval（指令遵循）：得分 89.65，第一名。
TerminalBench（编程）：得分 39.51，第二名，与 Claude 4 Sonnet 相当。
MMLU（通用知识）：89.71 分；CEval（中文能力）**：90.44 分。

它支持 128K 上下文长度，并经过指令对齐和人类反馈训练，优化了多轮对话和工具调用能力。在编程、推理和编码方面，与 GPT-4.1、Claude 4 Sonnet 等顶级模型竞争。

应用场景

内部集成：已部署到美团的六大办公场景，如 AI 编程、智能会议、文档助手，帮助生成代码、视频脚本和图片。
多模态支持：处理文本、图像等多种数据，适合复杂任务如环境交互和迭代推理。
开源应用：研究者可用于智能交互、应用集成；开发者可在 Hugging Face 上下载权重。

如何体验与获取

在线试用：访问官网 longcat.chat 或 longcat.ai，直接开启对话。
开源资源：GitHub 仓库 meituan-longcat/LongCat-Flash-Chat，包含部署指南。
Windows 应用：可在 Microsoft Store 下载官方 App。

LongCat 的开源标志着美团在 AI 基础设施和模型效率上的深耕，未来有望推动更多高效 AI 应用。如果你对特定基准或部署有疑问，欢迎进一步咨询！（数据基于 2025 年 9 月最新发布）

大模型 AI聊天多模态

免责声明：本网站仅提供网址导航服务，对链接内容不负任何责任或担保。

相关网站

Venice AI

注重隐私的生成式AI平台

ChatterUI

本地移动端优先的AI聊天应用

LLaMA-Factory Online

LLaMA-Factory Online

在线大模型微调平台 | 一站式低代码训练服务

SQLBot

基于大模型和RAG的智能问数系统

Spirit VLA

千寻智能视觉-语言-动作模型

Voiceflow

智能客服开发平台

WAN

阿里通义万相视频生成大模型

Xiaomi MiMo

小米通用智能基座 MiMo

相关资讯