腾讯混元大模型(Tencent Hunyuan)

10 个月前语言模型 174

腾讯混元大模型（tencent hunyuan）是由腾讯研发的大语言模型。它具备强大的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力。

其主要产品包括混元生文与混元生图，具有多轮对话、内容创作、逻辑推理、知识增强、多模态五大核心能力，可应用于文档、会议、广告、营销四种场景。能够完成专业领域的多轮问答，支持文学创作、文本摘要、角色扮演等；也能够基于已有数据或信息进行推理、分析，有效解决事实性、时效性问题。

腾讯混元大模型的发展历程如下：

2023年8月3日，进入应用内测阶段。
2023年9月，获国家网信办备案。
2023年9月6日，微信上线“腾讯混元助手”小程序。
2023年9月7日，在2023腾讯全球数字生态大会上正式亮相，并宣布通过腾讯云对外开放。
2023年9月15日，通过《生成式人工智能服务管理暂行办法》备案。
2023年10月26日，正式对外开放“文生图”功能。
2023年12月，通过国内首个官方“大模型标准符合性评测”测试。
2024年3月20日，腾讯总裁刘炽平表示计划在2024年内推出基于混元模型的更多小程序甚至独立 app。
2024年4月，混元大模型技术架构升级为混合专家模型（moe）架构，参数规模达万亿，可处理复杂场景和多任务场景。
2024年5月14日，宣布混元大模型升级，并对外开源，开源内容包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。升级后的混元文生图大模型采用了与 sora 一致的 dit 架构，除支持文生图外，也可作为视频等多模态视觉生成基础。该大模型是业内首个中文原生的 dit 架构文生图开源模型，并且支持中英文双语输入及理解，参数量15亿。

截至2023年10月26日，已有超过180个腾讯内部业务接入腾讯混元，包括腾讯会议、腾讯文档、企业微信、腾讯广告、微信搜一搜、QQ 浏览器等。此外，也有来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户，通过腾讯云调用腾讯混元大模型 api，应用于智能问答、内容创作、数据分析、代码助手等多个场景。

腾讯混元大模型的产品规格和价格如下（数据截止2024年5月14日）：

混元生文：
新用户专享资源包：文本生成模型共享10万token，embedding 模型专属100万token，购买之日起1年内有效，可体验混元文本生成各版本模型，免费。
hunyuan-pro：万亿级参数规模 moe 模型，最大输入28k，最大输出4k，适用于对模型效果有高要求的场景，支持32k 上下文，0.1元/千tokens。
hunyuan-standard：混合专家模型训练，最大输入30k，最大输出2k，32k 多专家模型可对实现对长文本输入的处理，0.01元/千tokens。
hunyuan-lite：最大输入3k，最大输出1k，满足绝大部分对效果、推理性能、成本控制相对平衡的需求场景，在中文 nlp、英文 nlp、代码、数学等方向显著优于同等规模开源模型，0.008元/千tokens。
混元生图：
新用户专享资源包：50次免费体验额度。
1千次资源包：自购买之日起一年内有效，400元/个。
1万次资源包：自购买之日起一年内有效，3500元/个。
10万次资源包：自购买之日起一年内有效，30000元/个。

其部分功能特点如下：

拥有超万亿参数规模，采用混合专家模型（moe）结构，在中文表现尤其是文本生成、数理逻辑和多轮对话上性能表现卓越，最大支持256k 上下文，长文输入场景中大海捞针指标达到99.9%，能覆盖数学、编程、网络安全和搜索等多个领域。
具备丰富的语义理解能力，可准确理解各种自然语言文本的含义。
具有文本生成能力，能生成连贯、有意义的文本内容用于创作文章、故事、新闻稿等，也可生成摘要、评论和建议等。
拥有跨模态处理能力，不仅可以处理纯文本数据，还能处理包含图像、音频等多模态的数据。
会不断进行优化和更新，以适应新的语言现象和任务需求。
注重用户数据的安全性和隐私保护，采取一系列措施确保数据安全，防止数据泄露和滥用。

腾讯混元大模型已通过互联网信息服务算法备案系统备案，在“模型开发”和“模型能力”两个重要领域的综合评价获得了当前测试范围内的最高分，并获取由信息处理产品标准符合性检测中心颁发的大规模预训练模型测试证书。同时，腾讯在人工智能领域拥有众多专利，是中国人工智能发明专利 top1。

资讯来源：豆包AI