2023 年发布的智能体 Agent Q, 其研发和发布公司是美国初创企业MultiOn。它是一种具有自主性的人工智能 “代理”。它能够在复杂的环境中进行多步骤推理,自主理解、规划决策并执行复杂任务。
AgentQ 结合了引导式蒙特卡洛树搜索(MCTS)、AI 自我批评和直接偏好优化(DPO)等技术,拥有规划、推理能力和自我修复功能。
多步推理与规划决策:可以通过自我规划和执行多个步骤来完成目标任务,而不是简单地根据输入生成回答。例如在网页预订等需要多个步骤的任务中表现出色。
自我学习与进化:能够在没有明确训练数据的情况下,通过自主数据收集和学习,快速提高在新任务中的表现。
自我评估与调整:在执行任务的每一步都会进行自我评估,并根据反馈调整自己的行为。这种自愈能力使得它能够在遇到错误或障碍时自行纠正,避免陷入不利的决策路径。
有效适应动态环境:可以灵活调整策略以适应不断变化的情况,在动态环境中做出有效决策。
AgentQ 是一种具有自主性、反应性、社会性、认知性、思辨性等特征的智能“代理”,能够自主理解、规划决策、执行复杂任务等。它可以应用在多种需要进行复杂交互和决策的领域,例如:
在线预订:在官方发布的演示 demo 中,AgentQ 能够完成预订餐厅、会议、机票等任务,涉及多步的规划、推理、决策以及与各种应用程序的交互。
智能客服:可以处理客户的各种咨询和请求,通过自主理解和规划,为客户提供准确的信息和解决方案。
行程安排:帮助用户规划和安排行程,包括预订交通工具、酒店等。
信息检索与整合:从大量信息中搜索并整合用户所需的内容,例如查询特定商品的信息等。
随着技术的发展和完善,其应用领域可能会进一步扩展。但需要注意的是,目前 AgentQ 还未完全开放使用,其性能和具体应用场景可能还需要在实际使用中进一步验证和探索。
免责声明:本网站仅提供网址导航服务,对链接内容不负任何责任或担保。8 个月前
AgentQ结合了搜索、自我批评和强化学习,以创建可以计划和自我修复的最先进的自主 Web 代理。
8 个月前
初创公司 MultiOn 发布了号称 “目前最强” 的 AI Agent Q,在真实的预订任务中可以达到 95.4% 的成功率。 它结合了搜索、自我反思和强化学习,能够进行规划和自我修复,解决了此前大语言模型训练技术的局限性,其性能是 llama3 基线零样本性能的 3.4 倍。 例如在模拟订餐任务中,agentQ 将 llama-3 的零样本成功率从 18.6% 提升至 81.7%,加入在线的蒙特卡罗树搜索后,成功率能进一步提高到 95.4%。