LongCat 介绍

LongCat(龙猫)是美团(Meituan)自主研发的生成式 AI 大模型系列,旨在通过高效的计算架构和强大的多模态能力,提升企业内部工作效率和创新应用。它于 2025 年 8 月 31 日正式开源最新版本 LongCat-Flash-Chat,迅速成为 AI 社区关注的焦点。该模型不仅在技术创新上领先,还在智能体(Agent)任务和指令遵循方面表现出色,适用于对话、编程、工具调用等多种场景。

核心特点与架构

LongCat-Flash 采用 Mixture-of-Experts (MoE) 混合专家架构,总参数量高达 5600 亿(560B),但每个 token(词元)仅激活 18.6 亿至 31.3 亿参数(平均约 27 亿),实现了“按需计算”的高效利用。这种动态激活机制通过引入 零计算专家(Zero-Computation Experts),让模型根据输入复杂度的“预算”智能分配资源:简单任务节省算力,复杂任务投入更多计算。

此外,它创新性地使用 Shortcut-Connected MoE (ScMoE) 架构,通过跨层快捷连接扩展计算-通信重叠窗口,使训练和推理过程并行执行,提升系统吞吐量。在 H800 硬件上,推理速度可达 单用户 100+ tokens/s,每百万输出 token 成本仅 0.70 美元。

性能亮点

LongCat-Flash-Chat 在多项基准测试中脱颖而出,尤其在 智能体任务 上达到 SOTA(State-of-the-Art)水平:

  • τ²-Bench:超越多数模型,在智能体任务中领先。
  • VitaBench:得分 24.30,位列第一。
  • IFEval(指令遵循):得分 89.65,第一名。
  • TerminalBench(编程):得分 39.51,第二名,与 Claude 4 Sonnet 相当。
  • MMLU(通用知识):89.71 分;CEval(中文能力)**:90.44 分。

它支持 128K 上下文长度,并经过指令对齐和人类反馈训练,优化了多轮对话和工具调用能力。在编程、推理和编码方面,与 GPT-4.1、Claude 4 Sonnet 等顶级模型竞争。

应用场景

  • 内部集成:已部署到美团的六大办公场景,如 AI 编程、智能会议、文档助手,帮助生成代码、视频脚本和图片。
  • 多模态支持:处理文本、图像等多种数据,适合复杂任务如环境交互和迭代推理。
  • 开源应用:研究者可用于智能交互、应用集成;开发者可在 Hugging Face 上下载权重。

如何体验与获取

LongCat 的开源标志着美团在 AI 基础设施和模型效率上的深耕,未来有望推动更多高效 AI 应用。如果你对特定基准或部署有疑问,欢迎进一步咨询!(数据基于 2025 年 9 月最新发布)

免责声明:本网站仅提供网址导航服务,对链接内容不负任何责任或担保。
相关资讯