在2024英伟达日本峰会上,黄仁勋和日本软银孙正义探讨了AI在日本的重要性。孙正义说,未来人人都会有自己的AI Agent。怎么理解孙正义所提出的人人都有的AI Agent?
AI Agent中文称为人工智能代理,是一种能够自主进行决策和行动的计算机程序 。孙正义所说的未来人人都会拥有自己的AI Agent,可以从以下几个方面来理解:
(图片来源:yicai.com)
1 个月前
根据《Nature》最新发表的研究,非营利研究机构METR发现了一项被称为“智能体摩尔定律”的规律,即AI智能体(Agent)在完成长期任务方面的能力每7个月翻一番。这一发现揭示了AI在任务完成时间跨度上的指数级增长趋势,并提出了“50%-任务完成时间跨度”这一新指标来衡量AI的能力变化。 核心发现 能力翻倍周期:自2019年以来,AI智能体完成任务的时间跨度每7个月翻一番。这意味着,如果2019年AI完成某项任务所需时间对应人类需要10分钟,那么7个月后,这一时间将缩短至20分钟。 加速趋势:2024年,AI能力的增长速度进一步加快,部分最新模型的能力每3个月翻一番。 未来预测:按照这一趋势,预计5年后(即2030年左右),AI将能够完成许多当前需要人类花费一个月时间才能完成的任务。 研究方法 METR团队通过以下步骤验证了这一规律: 任务设计:设计了170个多样化任务,涵盖软件工程、机器学习、网络安全等领域,并测量人类专家完成这些任务所需的时间,建立“人类基准线”。 指标引入:提出了“50%-任务完成时间跨度”指标,即AI在50%成功率下完成任务的时间长度。这一指标对数据分布的微小变化具有鲁棒性。 模型评估:评估了2019年至2025年间发布的13个前沿AI模型(如GPT系列、Sonnet 3.7等),通过逻辑回归分析计算每个模型的时间跨度。 验证与外部实验 为了验证结果的可靠性,研究团队进行了多项外部实验,包括: 回溯预测:使用2023-2025年数据验证趋势一致性。 任务混乱度分析:评估任务复杂性对AI性能的影响,发现AI在复杂任务上的提升速度与简单任务相似。 基准测试:在SWE-bench等数据集上验证了类似的指数增长趋势。 意义与影响 技术进步:这一发现标志着AI在执行长期任务能力上的显著进步,可能推动AI在软件开发、研究等领域的广泛应用。 劳动力市场影响:AI能力的快速提升可能对劳动力市场产生深远影响,未来或替代部分人类工作,尤其是重复性和耗时任务。 社会挑战:研究提醒社会各界需关注AI技术进步带来的就业和经济挑战,并提前制定应对策略。 未来展望 METR团队预测,按照当前趋势,AI可能在2028年11月达到一个月的任务时间跨度,保守估计则在2031年2月实现。尽管研究存在任务局限性和未来不确定性,但团队确信AI能力每年有1~4倍的增长趋势。 这项研究为AI技术的发展提供了新的量化标准,同时也引发了对AI未来应用和影响的深入思考。
1 个月前
阿里推出新夸克,集成AI对话、深度搜索、深度执行等功能,标志着其从搜索引擎向AI Agent的转型。 新夸克接入通义系列模型,用户规模超2亿,DAU达3430万,位居AI应用榜首。
1 个月前
2025 年 3 月 12 日消息,OpenAI 发布 Agent 工具包,推出一组新的 API 和工具以简化 Agent 应用程序开发,包括新的 Responses API、网络搜索、文件搜索、计算机使用工具和 Agents SDK 等,还计划在接下来的几周和几个月内发布其他工具和功能。
2 个月前
高盛报告:阿里巴巴领衔AI基建,腾讯主导AI应用领域 2月14日,高盛发布最新研究报告,揭示了中国互联网行业在人工智能(AI)技术快速发展背景下的新格局。报告指出,行业正逐渐分化为两大阵营:AI基础设施建设和AI应用开发。阿里巴巴凭借其强大的云服务基础设施,成为AI基建领域的关键力量;而腾讯则依托其在消费者端(C端)应用的广泛生态和卓越用户体验,成为AI应用领域的核心推动者。 报告详细分析了两家公司的优势:阿里巴巴作为中国最大的云服务提供商,其规模优势在AI基础设施建设中占据重要地位,预计在2026财年将实现14倍的预期市盈率。腾讯则凭借其微信超级应用的潜在AI代理功能和闭环交易能力,在2025财年预期市盈率达到16倍,同时腾讯云在中国公共云市场中也稳居前三。 报告进一步预测,随着中国AI模型的灵活性和计算成本效率的显著提升,超级应用如微信和抖音将继续深化在电子商务和本地服务等交易领域的应用。此外,随着开源模型的兴起和计算成本的降低,AI的采用率将进一步提高,特别是在支持多年云和数据中心需求增长的企业端(B端)场景中。 高盛特别强调,腾讯通过其强大的C端生态和用户体验,将AI技术深度融入日常生活。报告以元宝为例,指出其快速崛起是腾讯在AI应用领域实力的体现。元宝集成了DeepSeek-R1模型的强大推理能力和腾讯云的AI推理基础设施,不仅提供了更智能的交互体验,还通过微信生态的独特内容支持,实现了更精准的信息推送和更高效的任务执行。 报告最后指出,集成R1后的元宝在用户体验上实现了质的飞跃,用户可以通过多轮对话和深度思考模式,快速获取微信公众号、视频号等生态内的丰富内容,进一步巩固了腾讯在AI应用领域的领先地位。
2 个月前
随着人工智能技术的飞速发展,像DeepSeek这样的大模型正在以前所未有的方式改变我们的生活、工作和社会。这些先进的AI工具不仅服务于企业和专家,也为普通人提供了前所未有的机会,让他们能够突破传统限制,实现自我提升和价值创造。以下是DeepSeek等大模型为普通人带来的十大新机遇: 1. 教育平权:个性化学习让知识触手可及 在知识经济时代,教育是个人发展的基石。然而,传统的教育资源分配往往存在不均衡的问题。DeepSeek 的“自适应学习系统”通过分析用户的学习习惯和目标,提供量身定制的学习计划,帮助职场人士高效备考职业资格考试(如CPA、CFA),或快速掌握新技能(如编程、数据分析)。这种技术降低了学习门槛,让更多人享受到高质量的教育资源,从而实现教育公平。 2. 就业革命:人机协作提升职场竞争力 面对日益激烈的就业市场,DeepSeek 的“智能工作台”成为职场人的得力助手。无论是自由职业者还是全职员工,都可以通过DeepSeek 自动化完成重复性任务(如撰写报告、代码调试),并获得实时建议以优化工作成果。此外,DeepSeek 还能分析市场需求,推荐高价值项目,助力用户提升收入水平。这种人机协作模式不仅提高了工作效率,还让普通人在职场中更具竞争力。 3. 创业加速:智能化管理降低创业风险 对于许多普通人来说,创业是一条充满挑战的道路。DeepSeek 的智能管理系统为创业者提供了全方位支持,包括市场调研、趋势预测、运营优化以及客户关系管理等功能。即使是零技术背景的用户,也能借助DeepSeek 快速开发产品原型、制定营销策略,并吸引投资。这项技术显著降低了创业门槛,让更多人有机会将梦想变为现实。 4. 医疗普惠:个性化健康管理改善生活质量 慢性病管理一直是全球医疗体系的一大难题。DeepSeek 的健康助手通过整合用户的基因信息、生活习惯和体检数据,生成个性化的健康管理方案。它不仅能预警疾病风险,还能动态监测健康状况,减少不必要的线下复诊次数。这项技术不仅提升了医疗服务的可及性,还大幅降低了患者的医疗成本,真正实现了“科技造福民生”。 5. 财富升级:智慧钱包助力财富增值 理财对大多数人而言是一项复杂且耗时的任务。DeepSeek 的“智慧钱包”通过大数据分析和算法优化,为用户提供专业的投资建议。无论是风险评估、资产配置还是动态调仓,DeepSeek 都能根据用户的具体情况量身定制方案,帮助他们在不确定的市场环境中实现财富增值。这项技术让普通人无需具备专业金融知识,也能轻松管理自己的财务未来。 6. 社交赋能:提升人际交往能力 良好的社交能力是职场成功和个人幸福的重要因素之一。DeepSeek 的社交辅助功能可以帮助用户分析对话中的语气和情感,提供实时反馈,避免沟通失误。同时,它还能根据对方兴趣点生成有趣的话题,缓解社交焦虑。通过DeepSeek,普通人可以更自信地参与社交活动,建立更广泛的人脉网络。 7. 文化创作:激发创意潜能 无论是写作、绘画还是音乐创作,DeepSeek 都可以成为艺术家和爱好者的创意助手。它可以自动生成故事大纲、诗歌或剧本初稿,提供语言润色建议;也可以根据用户描述生成图像或设计草图,甚至协助创作旋律和编曲。这项技术极大地降低了艺术创作的技术门槛,让每个人都能轻松表达自己的创意想法。 8. 电商优化:精准营销提升销售业绩 DeepSeek 在电商领域的应用为普通人开辟了新的商业机会。通过分析用户行为数据和市场趋势,DeepSeek 可以帮助小型商家优化产品页面、制定定价策略,并生成高效的广告文案。此外,它还能自动推荐适合的促销活动,吸引更多潜在客户。这项技术让普通人即使没有丰富的营销经验,也能轻松运营自己的线上店铺,实现可观的经济收益。 9. 数据变现:挖掘数据价值创造收入 在数字化时代,数据已经成为一种重要的资产。DeepSeek 提供的数据分析工具可以帮助普通人从日常生活中收集的数据中提取有价值的信息,并将其转化为经济收益。例如,通过分析社交媒体互动、购物记录或旅行偏好,DeepSeek 可以为企业提供定制化的市场洞察报告。这项服务不仅让普通人能够参与到数据经济中,还能从中获得额外收入。 10. 内容创作:打造个人品牌实现流量变现 DeepSeek 的内容生成能力为普通人提供了全新的创收途径。无论是撰写博客文章、制作短视频还是设计在线课程,DeepSeek 都能提供强大的支持。它可以根据用户需求生成高质量的内容素材,并优化标题、关键词和排版,提高内容的吸引力和传播效果。通过持续输出优质内容,普通人可以逐步建立起自己的个人品牌,并通过广告合作、付费订阅等方式实现流量变现。 结语 DeepSeek 等大模型的出现,标志着AI技术从实验室走向了大众生活。它们不仅改变了教育、就业、创业、医疗、理财等领域,还在电商优化、数据变现和内容创作等方面为普通人带来了新的经济收益机会。无论你是学生、职场人、创业者还是普通市民,都可以借助这些强大的工具找到属于自己的逆袭之路。在未来,DeepSeek 等AI技术将继续拓展边界,为每个人创造更加美好的生活。
2 个月前
Replit Agent 是由 Replit 2024年9月推出的一款基于人工智能的编程工具,旨在通过自然语言提示帮助用户自动构建应用程序。它覆盖了从代码编写、开发环境配置到调试和部署的整个软件开发流程,极大地简化了开发过程,尤其适合从零开始构建 Web 应用程序原型。以下是关于 Replit Agent 的详细介绍: 1. 核心功能 Replit Agent 的主要功能包括: 自然语言生成代码:用户可以通过输入详细的自然语言提示(如“创建一个待办事项应用”),Replit Agent 会自动选择适当的编程语言、框架和技术栈,并生成代码原型。这一功能大大降低了编程门槛,即使是没有编程经验的用户也能快速上手。 开发环境配置:Replit Agent 能够自动设置开发环境,安装所需的依赖项,避免了繁琐的手动配置过程。 项目协作助手:在项目构建过程中,用户可以与 Replit Agent 互动,提供 API 密钥、反馈或方向指导,Agent 会根据这些信息调整和优化项目。 快速原型开发:Replit Agent 特别擅长从零到一构建 Web 应用程序原型,能够在几分钟内生成可交互的应用原型,例如创建一个类似 Wordle 的小游戏或一个优惠券生成器。 迭代与测试:用户可以对生成的开发计划进行修改、删除或重新生成,并实时跟踪开发进度,进行应用的测试和调试。 跨平台支持:除了 Web 端,Replit Agent 还支持通过 Replit 移动应用使用,方便用户随时随地进行开发。 部署支持:项目完成后,用户可以直接通过 Replit 的部署功能将应用程序上线,实现开发与部署的无缝对接。 2. 适用场景 Replit Agent 适用于多种开发场景: 快速原型制作:初创企业或个人开发者可以利用 Replit Agent 快速生成产品原型,验证创意可行性。 个性化应用开发:从简单的优惠券生成器到复杂的 3D 游戏,Replit Agent 都能在短时间内完成开发并部署上线。 教育领域:Replit Agent 为编程教育提供了直观的工具,学生可以通过自然语言输入快速看到代码生成效果,降低学习门槛。 自动化工作流:用户可以用 Replit Agent 替代昂贵的自动化工具(如 Zapier),构建自定义的工作流解决方案。 3. 技术特点 自然语言接口:Replit Agent 支持自然语言输入,用户无需掌握复杂的编程语法即可启动项目。 多语言支持:支持多种主流编程语言,如 JavaScript、Python、Node.js 等,能够满足不同类型的开发需求。 自动化程度高:从环境配置到代码生成再到部署,Replit Agent 能够自动化处理整个开发流程,显著提升开发效率。 沙盒环境:提供安全的代码评估环境,支持新功能的测试和验证。 4. 使用方式 Replit Agent 目前仅对 Replit Core 和 Teams 订阅用户开放早期访问。使用步骤如下: 登录 Replit 账号:确保已订阅 Replit Core 或 Teams 计划。 创建项目:在 Replit 主页或移动应用中输入自然语言提示,描述想要构建的应用。 生成原型:Replit Agent 会根据提示自动生成代码和开发计划。 迭代与测试:用户可以修改开发计划,跟踪进度,并进行测试。 部署应用:完成开发后,通过 Replit 的部署功能将应用上线。 5. 优势与不足 优势: 降低开发门槛:即使是初学者也能通过自然语言提示快速构建应用。 快速开发:从想法到部署只需几分钟,适合快速验证创意。 全流程自动化:覆盖从环境配置到部署的整个开发流程,节省时间和精力。 不足: 访问受限:目前仅对 Replit Core 和 Teams 用户开放,普通用户无法使用。 功能局限性:对于复杂项目或高度定制化的需求,Replit Agent 可能表现不足。
3 个月前
腾讯两大智能体平台:腾讯元器和 AppAgent。
3 个月前
Anthropic 于2024年12月发布的文章《Building effective agents》详细探讨了如何构建高效的大语言模型(LLM)代理系统。Anthropic 与数十个团队合作构建了跨行业的大语言模型(LLM) agent。最成功的实现往往不是使用复杂框架或专门库,而是采用简单、可组合的模式。本文分享Anthropic 的经验和实用建议: 1. 代理(Agents)的定义与分类 代理的定义: 代理可以被定义为完全自主的系统,能够在较长时间内独立运行,使用各种工具完成复杂任务。 也可以指遵循预定义工作流程的系统,这些系统通过预定义的代码路径协调LLM和工具。 工作流(Workflows)与代理(Agents)的区别: 工作流:通过预定义的代码路径编排LLM和工具,适合任务明确、步骤固定的场景。 代理:LLM动态指导自身的流程和工具使用,保持对任务完成方式的控制,适合需要灵活性和模型驱动决策的场景。 2. 何时使用代理 适用场景: 当任务复杂且需要灵活性和模型驱动的决策时,代理是更好的选择。 代理适合处理开放性问题,尤其是难以预测步骤或无法硬编码固定路径的任务。 不适用场景: 对于任务明确、步骤固定的场景,工作流提供更高的可预测性和一致性。 对于许多应用,优化单个LLM调用(配合检索和上下文示例)通常已足够。 3. 框架的使用建议 常用框架: LangGraph(LangChain)、Amazon Bedrock的AI Agent框架、Rivet(拖放式GUI工具)、Vellum(复杂工作流构建工具)。 使用建议: 开发者应优先直接使用LLM API,许多模式只需几行代码即可实现。 如果使用框架,需理解底层代码,避免因框架的抽象层增加调试难度和复杂性。 4. 构建模块与工作流模式 基础构建模块:增强型LLM 增强型LLM通过检索、工具使用和记忆等功能扩展能力,能够生成搜索查询、选择工具并保留重要信息。 核心工作流模式: 提示链(Prompt chaining):将任务分解为一系列步骤,每个LLM调用处理前一步的输出。适用于可分解为固定子任务的场景,如生成营销文案并翻译。 路由(Routing):对输入分类并引导至专门的后续任务。适用于复杂任务,如客户服务查询的分类处理。 并行化(Parallelization):将任务拆分为并行子任务或多次运行以获得多样化输出。适用于需要多视角或高置信度结果的场景。 编排者-执行者(Orchestrator-workers):中央LLM动态分解任务并分配给执行者LLM。适用于无法预测子任务的复杂场景,如编程任务。 评估者-优化者(Evaluator-optimizer):一个LLM生成响应,另一个提供评估和反馈。适用于需要迭代优化的任务,如文学翻译或复杂搜索。 5. 代理的实现与应用 代理的工作流程: 代理通过用户指令或交互明确任务,独立规划并执行,必要时向用户寻求反馈。 代理在每个步骤中从环境中获取“基准事实”(如工具调用结果)以评估进展。 适用场景: 编码代理:解决SWE-bench任务,根据任务描述编辑多个文件。 计算机使用代理:Claude通过计算机完成任务,如数据处理或信息检索。 6. 核心原则与总结 核心原则: 简单性:从简单设计开始,逐步增加复杂性。 透明性:明确展示代理的规划步骤。 工具设计:通过完善的文档和测试设计代理-计算机接口(ACI)。 总结: 成功的关键在于构建适合需求的系统,而非最复杂的系统。 框架可帮助快速启动,但在生产环境中应减少抽象层,使用基础组件构建。 7. 附录:代理的实际应用 客户支持:结合聊天机器人界面与工具集成,适用于开放式代理场景。 编码代理:在软件开发中,代理通过自动化测试验证代码解决方案,并迭代优化。 这篇文章为开发者提供了构建高效代理系统的实用指南,强调了简单性、透明性和工具设计的重要性,并通过丰富的案例展示了代理系统的实际应用价值。
4 个月前
在建筑行业中,AI工具的应用正在逐渐普及,尤其是在成本核算和造价管理方面,这些工具能够显著提高效率、减少错误并优化资源分配。以下是一些主流的建筑成本核算和造价AI工具: 1. Beam AI 功能:自动化工程量清单计算,支持混凝土、钢筋、机电、管道等多个专业的工程量计算。 优势:节省90%的计算时间,提高30%的估算准确度,自动识别图纸信息,生成高精度计算结果。 2. Kreo 功能:基于云的智能建筑工程量清单和造价估算解决方案,支持PDF和CAD文件的精确测量。 优势:自动生成工程量清单和成本估算报告,支持团队实时协作,减少手动工作量。 3. CostGPT AI 功能:智能化项目成本估算工具,涵盖软件项目的成本、时间、功能等规划。 优势:简化项目规划流程,提供详细成本预估,支持技术栈推荐和功能列表生成。 4. 智多星造价AI 功能:包含“清单智能组价”和“真材实价材价助手”两大功能,支持自动化组价和材价匹配。 优势:基于GPT语义识别技术,大幅提升组价和套价效率,适用于招标工程量清单编制。 5. 软件造价喵 功能:国内首个注册即用的软件造价AI评估SaaS平台,支持信息化项目成本估算。 优势:整合多项国家标准和地方标准,提升成本估算的精准度和效率。 6. BuildKeeper 功能:一体化施工管理软件,支持预算管理、发票创建、费用跟踪和任务管理。 优势:通过AI驱动的功能简化施工管理流程,适合小型建筑企业。 7. 智诚建筑的AI测算方法 功能:基于大数据的工程造价AI测算,使用支持向量回归(SVR)模型进行成本预测。 优势:提高测算的准确性和效率,适用于复杂工程项目的成本控制。 8. Workorb AI 功能:针对建筑、工程和施工(AEC)行业的AI平台,支持提案撰写、项目信息检索和文档解析。 优势:简化非计费工作流程,提高生产效率。 9. Rooftops AI 功能:AI屋顶分析和房产数据智能平台,提供即时屋顶分析和房产数据洞察。 优势:生成全面报告,涵盖屋顶尺寸、坡度和太阳能潜力等关键信息。 这些工具在建筑成本核算和造价管理中各有侧重,用户可以根据具体需求选择合适的工具。
4 个月前
DeepSeek(深度求索)是一家专注于大语言模型(LLM)和相关技术研发的创新型科技公司,成立于2023年7月,由知名量化私募巨头幻方量化创立。DeepSeek的AI产品主要包括以下几类: 语言模型 DeepSeek-LLM:如包含67亿参数的DeepSeek-67b-base模型,基于海量的中英文token数据集训练,可用于多种自然语言处理任务. DeepSeek-Coder:是代码语言模型,如DeepSeek-Coder-v2-instruct在代码特定任务中性能可比肩GPT-4 Turbo,可辅助编程及代码相关的自然语言处理任务. DeepSeek-Math:旨在提升数学推理能力,例如DeepSeek-Math-7b-instruct等模型,可解决数学问题、进行数学相关的文本生成和问答等. DeepSeek-Prover: 主要用于定理证明,通过优化训练和推理过程,为相关领域的研究和应用提供支持. 多模态模型 DeepSeek-VL:是开源的视觉-语言模型,可用于真实世界的视觉和语言理解应用,如视觉问答、图像字幕生成等. 应用平台 乾坤圈(AI Agent智能体平台):基于深擎自研的流程引擎研发,能够基于海量的大模型组件进行极速灵活编排,满足大模型场景快速搭建能力需求,内置了20多个工作流最佳实践、50多项金融领域的特色处理组件以及30多款应用场景,主要应用于金融行业. Janus:是统一的多模态理解和生成模型,可应用于多种需要多模态交互的场景. 内容产品与服务 个性化推荐引擎:如穿云箭,依托智能算法模型,基于用户的浏览行为,实现精准的内容推荐,帮助金融机构了解客户需求. 内容服务平台:如风火轮,整合各大财经资讯和自媒体内容,通过SaaS模式分发给客户,让信息获取及时可靠;白羽扇智能内容处理中心则进一步提高了内容分发的个性化和实时性,对投资标的、财经事件进行动态打标,优化客户体验.