OpenAI 发布迷你 AI 模型 GPT-4o mini,有什么特点?

9 个月前 语言模型 118

OpenAI刚刚发布的GPT-4o mini 迷你 AI 模型,具有以下特点:

  • 性能超越 GPT-3.5 Turbo:在文本智能和多模态推理方面的基准性能超越了 GPT-3.5 Turbo,在 LMSYS“聊天机器人对战”排行榜上的表现也强过 GPT-4(0125 版本);在 MMLU(大规模多任务语言理解测试)测试中得分82%,于文本和视觉推理任务的 MMLU 中得分为 82.0%,数学推理的 MGSM 中得分为 87.0%,编码性能测试 HumanEval 中拿下 87.2%,多模态推理的 MMMU 中得分为 59.4%,相比之下,Gemini 1.5 Flash 在这些测试中的得分分别为 77.9%、75.5%、71.5%和 56.1%,Claude 3 Haiku 的得分分别为 73.8%、71.7%、75.9%和 50.2%。
  • 支持长上下文窗口:支持 128K Token 的长上下文窗口,以及每个请求最多 16K Token 的输出,能够记忆比 GPT-3.5 Turbo 长得多的内容和对话,并在单次输出更长的回答。
  • 高性价比:价格较为低廉,每百万个输入 Token 的定价是 15 美分(约合人民币 1.09 元),每百万个输出 Token 的定价是 60 美分(约合人民币 4.36 元),比 GPT-3.5 Turbo 便宜超过 60%。
  • 适用多任务:低成本、低延迟的优点显著扩展了其基于 AI 的应用范围,为包括多 API 调用、大规模上下文处理、实时客户互动等多种任务提供了一个经济高效的解决方案。
  • 支持多种输入类型:目前 GPT-4o mini 已支持文本和视觉输入,未来将扩展至音视频。其知识库更新至 2023 年 10 月,并且由于与 GPT-4o 共享改进的分词器,使其处理非英语文本的成本效益更高。
  • 安全防护:继承了 GPT-4o 同等严格的安全防护机制,在预训练阶段过滤掉不良信息,采用强化学习与人工反馈(RLHF)等技术,使模型行为更加符合安全策略。作为首个应用 OpenAI 指令层次结构方法的模型,它在 API 中展现出更强的防御能力,有效抵御越狱攻击、即时注入及系统即时提取等风险。

目前,GPT-4o mini 已免费上线 ChatGPT,预计逐步替代 GPT-3.5。它现已作为文本和视觉模型在 Assistants API、Chat Completions API 和 Batch API 中可用,并将在未来几天内推出微调功能。企业用户也将在下周开放使用。

需要注意的是,虽然 GPT-4o mini 具有诸多优势,但对于不同用户和任务,其实际表现可能会有所差异。在使用时,需根据具体需求进行评估和选择。同时,模型的性能也可能会随着时间推移和更多数据的训练而有所提升和改进。


资讯来源:豆包AI

相关资讯