MultiOn 发布了号称 “目前最强” 的 AI Agent Q

8 个月前 国际 151

初创公司 MultiOn 发布了号称 “目前最强” 的 AI Agent Q,在真实的预订任务中可以达到 95.4% 的成功率。

它结合了搜索、自我反思和强化学习,能够进行规划和自我修复,解决了此前大语言模型训练技术的局限性,其性能是 llama3 基线零样本性能的 3.4 倍。

例如在模拟订餐任务中,agentQ 将 llama-3 的零样本成功率从 18.6% 提升至 81.7%,加入在线的蒙特卡罗树搜索后,成功率能进一步提高到 95.4%。

相关资讯