01 端侧模型 vs 小模型
严格来说,“端侧模型”与“小模型”的概念并不能直接等同。
“小模型”通常指的是那些参数规模远少于GPT-3或Llama-13B的大语言模型,几个具有代表性的参数为1.5B、3B、7B等。
这些小模型虽然参数规模较少,但通过特定的设计和优化,仍然能够在某些任务上达到与大型模型相似的性能,从而降低计算资源消耗,提高能耗比。
“端侧模型”则通常指的是部署在手机、电脑、或其他移动设备、嵌入式系统等资源受限的设备上的模型,这些设备的计算资源(AI算力、内存等)往往不足以直接运行大型的预训练模型,同时对于端侧的能耗、发热等问题有着更为极致的要求。
因此,端侧模型需要特别设计以减少模型大小和模型架构,以便能够在端侧设备上高效运行。
其中,学术界关于小模型的技术研究较为深入,而产业界更注重端侧模型的工程化研究。
不过目前手机、PC等终端设备受限于计算资源问题,大多只能流畅运行小模型,因此大量相关研究都存在重合领域。本文内容对于两类模型均有所覆盖。
02 小模型三大技术流派
目前来看,全球关注度最高的小模型和端侧模型,仍要数Meta、微软、苹果分别与今年发布的Llama-3、Phi-3-mini、OpenELM/Apple Foundation Model。
从最底层技术架构上来说,Llama-3、Phi-3、OpenELM/Apple Foundation Model都采用了当前主流的、由GPT引领的Decoder-only Transformer架构。
同时,当前主流小模型也统一采用了“预训练Pre-train + 微调Fine-tune + 对齐Alignment”的模型训练思路。
03 端侧模型的竞争
而不久前的苹果WWDC大会上,苹果先是推出了端侧AI系统Apple Intelligence,随后又在技术博客中介绍了其自研的端侧3B小模型——性能全面超越主流7B大模型。
在更早之前的4月,则更是全球小模型和端侧模型“神仙打架”的月份。短短的一月之内,Meta、微软、苹果等集中发布Llama-3、Phi-3、OpenELM,对小模型和端侧模型产业带来极大冲击。如果把时间放宽到2024年上半年,则还有MobileLLM、Gemma-7B、Qwen-7B、MiniCPM、TinyLlama等一系列代表玩家。
手机厂商更是早早就杀入局中。在全球手机/PC市场保有量居高不下、用户换机周期高达51个月的当前,AI大模型无疑成为各大终端厂商全力押注之处。
从2023年下半年开始,华为、小米、OPPO、vivo、苹果、三星,以及产业链上的高通、联发科等都陆续推出手机AI大模型或手机AI大模型芯片。根据Counterpoint数据,仅在2024年第一季度,全球具有生成式AI功能的智能手机型号就从16个增加到30多个,AI手机销量占比从1.3%提高到6%。
大模型厂商、终端厂商、终端芯片厂商……小模型与端侧模型的兴起,已经逐渐成为产业共识。
来源:智猩猩AGI
8 个月前
在语言模型领域如今出现了一种新趋势:小型语言模型(SLM)正逐渐崭露头角,AI巨头们也在“以小博大”。
8 个月前
微软公司开发的Phi-3 AI语言模型在以下领域有应用: 自然语言处理: 聊天机器人:可用于构建智能聊天机器人,理解用户的问题并提供准确、自然的回答,应用于客服、在线咨询等场景,为用户提供实时的交互服务。 文本生成:能够生成各种类型的文本,如文章、故事、诗歌等。例如在内容创作领域,帮助作者快速生成初稿或提供创意灵感。 语言翻译:辅助机器翻译系统,提高翻译的准确性和效率,促进不同语言之间的交流与沟通。 智能办公: 文档处理:可以对文档进行分析、总结、提取关键信息等操作,帮助用户快速处理大量的文本资料,如合同审查、报告分析等。 邮件管理:自动分类、筛选和回复邮件,提高邮件处理的速度和效率,减轻用户的工作负担。 教育培训: 智能辅导:作为学生的学习助手,解答问题、提供学习建议和指导,进行个性化的学习辅导。 教学资源生成:协助教师生成教学材料,如教案、试题、课件等,丰富教学内容和形式。 金融领域: 风险评估:对金融数据进行分析和预测,评估投资风险、信用风险等,为金融决策提供参考依据。 市场分析:通过对大量金融新闻、市场数据的处理,分析市场趋势和动态,帮助投资者制定投资策略。 医疗保健: 医疗辅助诊断:分析患者的病历、症状等信息,为医生提供辅助诊断建议,提高诊断的准确性和效率。 医学研究:协助医学研究人员进行文献分析、数据挖掘等工作,加速医学研究的进程。 移动设备和边缘计算:Phi-3模型的小巧和高效使其适合资源受限的环境,如移动设备或边缘计算场景。能够在手机等终端设备上运行,为用户提供个性化的智能服务,而无需依赖云端连接,保护用户隐私的同时降低了延迟。 总之,Phi-3 AI大模型凭借其优异的性能和特点,在多个领域都具有广泛的应用前景,能为各行业的发展带来创新和变革。但具体的应用还需要根据实际需求和场景进行进一步的开发和优化。 豆包AI
9 个月前
严格来说,“端侧模型”与“小模型”的概念并不能直接等同。
9 个月前
从谷歌 Gemma 2 2B 的强大性能也可以看到一种趋势,即「小」模型逐渐拥有了与更大尺寸模型匹敌的底气和效能优势。