Phi-3

微软语言模型，以小博大

训练模型 8 个月前 1244 126 0

Phi-3 AI模型是微软推出的一系列语言模型。主要特点如下：

多种参数规模版本：包含 phi-3-mini（38亿参数）、phi-3-small（70亿参数）和 phi-3-medium（140亿参数）等版本，以满足不同场景和需求的应用。
性能表现优异：
- phi-3-mini 虽参数规模小，但在多项基准测试中表现出色，甚至超越参数规模大一倍多的模型，如在一些测试中比 Meta 的 Llama38b 更优异，而 phi-3-small 和 phi-3-medium 可超越 GPT-3.5 Turbo 等尺寸大得多的模型。
- 能以较低成本提供与大型模型相匹敌的推理能力，例如 phi-3-mini 可在手机上实现每秒 12 个 token 的生成速度，且成本大幅降低，为网络资源受限或需离线推理等场景带来优势。
创新的训练方式：使用了包括经过严格质量筛选的网络公开文档、精选的高质量教育数据和编程代码，以及 AI 生成的“合成数据”（如数学、编码、常识推理、世界常识、心理科学等），并辅以独特的指令微调和 RLHF 训练，提高了小语言模型的性能。
可支持多模态任务（以 phi-3-vision 为例）：微软推出的具有 42 亿参数的多模态小模型变种 phi-3-vision，能够支持通用视觉推理任务以及图表、图形和表格的推理，允许用户提出关于图表的问题或对特定图像进行开放式询问。

不过，Phi-3 系列模型也并非完美无缺，比如在事实性知识方面的表现并不理想，在某些任务上可能受到模型规模的限制，但微软也在探索相应的缓解方法。

免责声明：本网站仅提供网址导航服务，对链接内容不负任何责任或担保。