法国Mistral AI公司AI技术平台介绍

9 个月前 语言模型 123

Mistral AI 是一家位于法国巴黎的人工智能初创公司。该公司成立于 2023 年 5 月,其愿景是把开源的人工智能模型带到前沿。Mistral AI 的三位创始人分别是 CEO 阿瑟·门斯(Arthur Mensch)、首席科学家纪尧姆·兰普尔(Guillaume Lample)和 CTO 蒂莫西·拉克鲁瓦(Timothée Lacroix)。他们的履历光鲜,门斯曾任谷歌旗下人工智能公司 DeepMind 的高级研究科学家,积累了优化大型语言模型的经验;兰普尔和拉克鲁瓦则在 Meta 人工智能团队共同领导了大型语言模型 Llama 的开发,且三人均有巴黎综合理工学院和巴黎高等师范学院的学习经历。

法国“Mistral AI”公司的技术概览:

  1. AI模型:Mistral AI发布了世界上最强大的开放模型,支持前沿的人工智能创新。

  2. 开发者平台:公司提供了一个便携的开发者平台,用于构建快速智能的应用,提供灵活的访问选项。

  3. 开源模型:Mistral AI致力于通过开源技术赋能AI社区。其开放模型在效率上树立了标杆,可在Apache 2.0许可下免费使用,这是一个完全开放的许可,允许在无限制的情况下在任何地方使用模型。

    • Mistral 7B:公司首个7B参数的变换器模型,部署快速且易于定制,虽小但功能强大,适用于多种用例,特别擅长处理英文和代码,具有32k的上下文窗口。
    • Mixtral 8x7B:7B参数的稀疏混合专家(SMoE)模型,使用12.9亿活动参数,总参数45亿,擅长英文、法文、意大利文、德文、西班牙文,并在处理代码方面表现出色。
    • Mixtral 8x22B:目前性能最佳的开放模型,22B参数的稀疏混合专家(SMoE)模型,仅使用39亿活动参数,总参数141亿,支持64k上下文窗口,具有原生函数调用能力,支持API端点的函数调用和json模式。
  4. 优化模型:Mistral AI的商业优化模型专为性能而设计,提供灵活的部署选项。

    • Mistral Small:针对低延迟工作负载的成本效益推理模型。
    • Mistral Large:针对高复杂度任务的顶级推理模型,Mistral AI家族中最强大的模型。
    • Mistral Embed:最先进的语义模型,用于提取文本摘录的表示。
  5. Codestral:是一个明确设计用于代码生成任务的开放权重生成型AI模型,帮助开发人员通过共享指令和补全API端点编写和交互代码。

  6. Pareto最优的Apache模型:公司不断创新,提供能力强大且效率高的模型,如Mixtral 8x22B,相比竞争对手参数更少,性能更强大。

  7. La Plateforme:通过位于欧洲的开发者平台访问公司的最新产品,该平台面向开发者设计,提供最佳的价格/性能比,数据安全有保障,并且可以在La Plateforme上使用Mistral的微调代码对Mistral开源模型进行微调。

  8. 部署:用户可以通过Mistral的开发者平台快速开始使用Mistral模型构建自己的应用和服务,服务器位于欧盟。

  9. 按需付费定价:Mistral AI为开源模型和优化模型提供了明确的价格表,包括输入和输出令牌的费用。

  10. 微调定价:Mistral AI通过La Plateforme提供微调API,使用户可以轻松微调开源和商业模型,提供了一次性训练、存储和输入/输出令牌的价格明细。

Mistral AI 被视作 OpenAI 的潜在挑战者,它的发展受到法国的关注,被视为法国挑战美国科技巨头的一个机遇。其推出的产品在性能和效率方面表现出色,例如 Mistral 7b 虽是 70 亿参数规模的小模型,但在很多方面表现优秀,具有推理速度快、可在笔记本电脑上运行、采用多种优化技术以及易于微调等特点。最新发布的 Mistral Large 模型在多个常规基准测试中的表现仅次于 GPT-4,具有较高的准确率,能处理长文本,且拥有出色的多语言能力。


资讯来源:mistral.ai

相关资讯