Phi-3 AI模型是微软推出的一系列语言模型。主要特点如下:

  • 多种参数规模版本:包含 phi-3-mini(38亿参数)、phi-3-small(70亿参数)和 phi-3-medium(140亿参数)等版本,以满足不同场景和需求的应用。
  • 性能表现优异
    • phi-3-mini 虽参数规模小,但在多项基准测试中表现出色,甚至超越参数规模大一倍多的模型,如在一些测试中比 Meta 的 Llama38b 更优异,而 phi-3-small 和 phi-3-medium 可超越 GPT-3.5 Turbo 等尺寸大得多的模型。
    • 能以较低成本提供与大型模型相匹敌的推理能力,例如 phi-3-mini 可在手机上实现每秒 12 个 token 的生成速度,且成本大幅降低,为网络资源受限或需离线推理等场景带来优势。
  • 创新的训练方式:使用了包括经过严格质量筛选的网络公开文档、精选的高质量教育数据和编程代码,以及 AI 生成的“合成数据”(如数学、编码、常识推理、世界常识、心理科学等),并辅以独特的指令微调和 RLHF 训练,提高了小语言模型的性能。
  • 可支持多模态任务(以 phi-3-vision 为例):微软推出的具有 42 亿参数的多模态小模型变种 phi-3-vision,能够支持通用视觉推理任务以及图表、图形和表格的推理,允许用户提出关于图表的问题或对特定图像进行开放式询问。

不过,Phi-3 系列模型也并非完美无缺,比如在事实性知识方面的表现并不理想,在某些任务上可能受到模型规模的限制,但微软也在探索相应的缓解方法。

免责声明:本网站仅提供网址导航服务,对链接内容不负任何责任或担保。
相关资讯