比GraphRAG更懂“思考”,微软又开源PIKE-RAG:主打复杂私域知识理解和推理
继GraphRAG之后,微软又发布PIKE-RAG,主打在复杂企业场景中私域知识提取、推理和应用能力,PIKE-RAG 已在工业制造、采矿、制药等领域进行了测试,显著提升了问答准确率。报告、代码、demo均已开源。

6 小时前
在2026年开发AI产品时,搭建一个生产级(production-grade)RAG系统已经不再是“简单接个向量数据库就行”,而是需要系统性工程化思维。以下是从0到1再到生产可用的完整路径,按实际优先级和踩坑顺序组织。 一、生产级RAG ≠ Demo级RAG 的本质区别(2025-2026共识) 维度 Demo级(常见教程) 生产级(真正能上线赚钱) 为什么重要 文档量 几MB ~ 几百页 几万 ~ 几百万文档 / 多模态 / 每天增量更新 决定了分块、索引、召回策略完全不同 召回准确率 60-75% 目标88-95%+(视场景) 差10%召回率,用户体验天差地别 延迟 2-8秒随便 <1.5秒(p95),理想<800ms 用户流失率与延迟呈指数关系 幻觉控制 看运气 需要多重机制把幻觉率压到<5% 企业客户最怕胡说八道 可维护性 脚本跑一遍就行 需要数据质量pipeline、版本控制、监控告警 半年后没人敢碰代码 成本 不care embedding + LLM + vectorDB 每月几千到几十万刀 直接影响商业模式能否跑通 二、2026年主流生产级RAG搭建完整路径(推荐路线) Phase 0:先别写代码,先做这两件事(很多人跳过直接失败) 明确业务成功标准(最重要一步) 准确率目标:≥88%(RAGAS faithfulness & answer relevancy) 幻觉率:<5% 响应时间:p95 < 2秒(或按产品定位) 支持的文档类型:PDF/Word/Excel/网页/Markdown/扫描件/表格/图片? 更新频率:实时 / 每天 / 每周? 用户问题类型:单轮 / 多轮 / 带表格 / 需要推理? 准备评估集(金标准) 至少200-500条 真实用户问题 + 人工标注的完美答案 后续所有优化都拿这个集子打分 Phase 1:数据摄入与预处理(决定天花板,占60%工作量) 现代顺序(2025-2026主流做法): 文档清洗与质量分级(最被低估的一步) 运行一个轻量文档质量打分模型(或规则+小型LLM) 分三类:Clean / Decent / Garbage Garbage类直接人工干预或低权重处理 结构化解析(别直接喂Unstructured) PDF:用Marker / PyMuPDF + table detection(Marker 2025年后很强) Word/Excel:python-docx / pandas 保留层级:标题 → 段落 → 表格 → 图片说明 → 元数据 高级Chunk策略(2026年最核心差异化点) 策略 Chunk大小 适用场景 召回提升 Fixed-size 512 token 快速验证 baseline Semantic 200-800 主流生产 +15-25% Hierarchical 父子chunk 长文档、合同、手册 +20-35% Proposition-based 小粒度命题 法律/医疗/技术文档 +30%+ 推荐起步组合:Semantic + 父子索引 + 100-200 token重叠 Phase 2:Embedding 与 向量存储(2026主流选型) Embedding模型推荐(2026.2月时点性价比排序): bge-m3 / Snowflake Arctic Embed(开源王者) voyage-3-large / Cohere embed-v4(闭源但效果顶尖) text-embedding-3-large(稳定但已被超越) 向量数据库主流选择: 场景 首选数据库 次选 备注 < 100万向量 Chroma / Qdrant本地 PGVector 开发快 100万-1亿 Qdrant / Milvus Weaviate Qdrant 2025-2026口碑最佳 亿级 + 高并发 Pinecone serverless Zilliz Cloud 省心但贵 极致私有化 pgvector + pgvectorscale Milvus standalone 强烈建议:hybrid search(dense + sparse / BM25)几乎成为2026标配。 Phase 3:检索与后处理(拉开差距的关键层) 现代检索流水线(2026主流): 用户问题 ↓ Query分类与改写(是否需要检索?多意图拆分?) ↓ 多路召回(vector + BM25 + 知识图谱等) ↓ 初筛 top-30~100 ↓ 重排序(Cohere Rerank3 / bge-reranker-v2 / flashrank) ↓ 上下文压缩 / 抽取(LLM summarize top-8) ↓ 最终给LLM的上下文(带清晰source引用) Phase 4:生成与防幻觉 Prompt工程模板(必须有): 强制要求:只用提供的内容回答 / 不知道就说不知道 / 标注来源 结构化输出(JSON)便于下游解析 防幻觉组合拳: Self-Check / Self-RAG Corrective RAG Groundedness check(RAGAS / TruLens) 后置事实核查(小模型或规则) Phase 5:评估、监控、迭代闭环(生产级灵魂) 必须上的指标: Retrieval:Recall@K, MRR, NDCG Generation:Faithfulness, Answer Relevancy, Context Precision/Recall End-to-End:用户打分 / A/B测试 / 业务指标(解决率、CSAT) 推荐工具组合(2026主流): 评估:RAGAS / DeepEval / TruLens / Phoenix 监控:LangSmith / Helicone / Phoenix / PromptLayer Orchestration:LangGraph / LlamaIndex Workflows / Haystack / Flowise(低代码) 三、2026年推荐最小可用生产技术栈(性价比最高) 极简但能上线(适合小团队) 解析 → Marker / LlamaParse 向量化 → bge-m3 或 voyage-3 向量库 → Qdrant (docker) 召回+重排 → Qdrant + bge-reranker-v2 框架 → LlamaIndex 或 LangGraph LLM → DeepSeek-R1 / Qwen2.5-72B-Instruct / Claude-3.5-Sonnet (根据预算) 评估 → RAGAS + 人工golden set 进阶企业级(已验证可支撑十万+文档) 加:混合检索 + 父子索引 + query分解 + 多路召回 + 上下文压缩 + corrective RAG + 在线监控 一句话总结2026年RAG哲学: “70%的效果提升来自于数据质量、切块策略和检索后处理;20%来自embedding和重排序模型;只有10%靠换个更强的LLM。” 先把前70%做好,后面自然水到渠成。 ( Grok )

13 天前
AI Agent 的真正智能,来自于知识获取(RAG) + 协作协议(MCP) + 执行能力(SKILLS)的统一协同,而不是单一大模型孤立输出。

10 个月前
2025年3月31日,在2025年汉诺威工业博览会上,一台罗尔斯-罗伊斯(Rolls-Royce)的飞机发动机被展示在微软的展台上。这家发动机制造商利用微软的人工智能技术进行数据管理和数据分析。 人工智能(AI)是汉诺威工业展2025年的核心主题。这场全球最重要的工业博览会将于3月31日至4月4日在德国汉诺威举行,届时将展示人工智能如何为工业带来革命性变革。以下是为何这一年对工业界如此重要的原因。 人工智能成为竞争力的关键 人工智能不再是科幻电影中的概念,而是已成为工业领域的现实。2025年的汉诺威工业展将展示人工智能如何通过优化生产流程、提升效率和推动创新来增强企业的竞争力。例如,人工智能助手可以支持工厂车间的日常工作,而基于数据的预测性维护则能减少停机时间。 微软等科技巨头将在展会上展示其最新的人工智能解决方案。例如,微软推出的“工厂运营代理”(Factory Operations Agent)是一种人工智能助手,旨在优化工厂车间的流程。它能让工人通过自然语言查询分析机器数据,帮助管理者改进生产过程并快速识别和解决问题。 一项调查显示,82%的企业认为人工智能对德国工业的竞争力至关重要。然而,46%的企业担心德国工业可能会错过人工智能革命的机遇。这使得2025年的汉诺威工业展成为展示最新技术并推动其实施的关键平台。 加拿大作为伙伴国:人工智能与可持续发展的结合 2025年的伙伴国是加拿大,该国以“未来已来”(The future's here)为主题,展示其在自动化、能源、数字化转型和绿色技术领域的优势。加拿大拥有超过200家参展企业,致力于推动绿色、数字化和可持续的工业未来。人工智能在其中扮演着重要角色,例如通过优化能源使用和支持可再生能源技术实现更可持续的生产方式。 加拿大财政部长弗朗索瓦-菲利普·尚帕涅(François-Philippe Champagne)表示:“我们很高兴能继续国际合作,并在汉诺威工业展上展示超过200家代表绿色、数字化和可持续未来的加拿大企业。”这不仅加强了德加之间的经济联系,也为全球工业的未来发展指明了方向。 人工智能的具体应用 汉诺威工业展2025将展示人工智能在工业中的多种实际应用,包括: 自动化和机器人技术:人工智能驱动的自主机器人能够执行复杂任务,提高生产效率。 预测性维护:通过分析机器数据,人工智能可以预测潜在故障,从而减少意外停机。 质量控制:人工智能系统可以通过图像识别技术快速检测产品缺陷。 供应链优化:人工智能帮助企业更好地管理库存和物流,降低成本。 这些应用不仅提高了效率,还为中小企业提供了利用尖端技术的机会。展会上还将特别设立面向中小企业的展区,展示专为这一群体设计的可负担的人工智能解决方案。 人工智能的挑战与机遇 尽管人工智能潜力巨大,但其推广也面临挑战。例如,数据隐私和人工智能系统的透明度问题引起了广泛关注。欧盟即将推出的《人工智能法案》(AI Act)将为人工智能的使用设定严格标准,这可能会影响其在欧洲的推广速度。 与此同时,人工智能也带来了巨大机遇。它不仅能提升生产力,还能加速新产品和服务的开发。例如,在制药行业,人工智能可以缩短药物研发时间,从而更快地将新药推向市场。 汉诺威工业展:通往未来的桥梁 汉诺威工业展不仅是技术的展示平台,也是全球工业界交流的中心。超过4000家来自60多个国家的参展商将在展会上展示他们的创新成果。今年的展会预计将吸引超过13万名观众,与2023和2024年的参观人数相当。 对于德国工业而言,2025年可能是决定性的一年。人工智能的广泛应用可能标志着工业4.0的新阶段,即通过数字化和智能化实现更高效、更可持续的生产方式。正如微软德国公司总经理艾格尼丝·赫夫特伯格(Agnes Heftberger)所言:“人工智能已走出试验阶段,正在工业中大规模应用。” 结语 汉诺威工业展2025将是人工智能在工业中全面展示其潜力的一年。从优化生产到推动可持续发展,人工智能正在改变工业的面貌。对于企业来说,这既是挑战也是机遇——抓住这一趋势的企业将在未来占据领先地位。 (资讯:德国商报;图片:根据现场照片豆包AI再次生成)

10 个月前
人工智能是汉诺威工业展上的主导主题 微软正在推出创新助手,旨在显著简化工厂的工作流程。在近日开幕的2025汉诺威工业博览会上,微软展示了可广泛应用于工业领域的具有人工智能的创新虚拟助手。该软件公司在此次展会上展示的新产品之一是“工厂运营代理”(Factory Operations Agent)。 据该公司介绍,这是一个人工智能助手,旨在优化工厂车间的流程。例如,该解决方案使工人能够通过使用自然语言查询来分析机器的数据。 “负责任的经理”将能够优化制造流程。人工智能助手还可以比以前更轻松地识别错误来源并解决问题。 微软德国公司董事总经理阿格尼丝·赫夫伯格在汉诺威工业博览会开幕式上表示,人工智能已经走出了测试和实验阶段,正在工业领域得到广泛应用。 “我们必须毫不犹豫地引入人工智能,否则德国将在国际竞争中落后。我们必须让数据宝藏为人工智能所用。” 德国人工智能已经存在 根据德国数字协会Bitkom的一项代表性调查,42%的德国工业企业已经在生产中使用人工智能,另有三分之一(35%)有相应计划。其中包括机器的监控、机器人和车辆的控制以及能源消耗的优化:这项调查是在德国 552 家拥有 100 名或更多员工的工业制造公司中进行的。82%的公司认同人工智能的使用对于德国工业的竞争力至关重要。 然而,近一半(46%)的人认为德国工业界可能会错过人工智能革命。微软与谷歌、Meta、亚马逊并列成为全球领先的人工智能系统提供商,部分原因是微软首席执行官萨蒂亚·纳德拉早期投资数十亿美元与加州人工智能初创公司OpenAI及其开发的聊天机器人ChatGPT进行全面合作。 (资讯来源: tagesschau.de)

12 个月前
AI 国际简讯 2025年02月18日 微软发布OmniParser V2.0工具,用于识别和解析屏幕上的可交互图标,新版本提升交互图标解析能力。 Meta Reality Labs 的研究团队推出"Pippo"模型,可从普通照片生成1K分辨率的多视角视频。 苹果将在Vision Pro头戴设备中推出Apple Intelligence系统,提供书写工具、Genmojis表情和图像功能。 JetBrains更新"AI Assistant"应用,支持本地大语言模型调用,可直接使用DeepSeek等离线模型。

1 年前
VBA(Visual Basic for Applications)是一种事件驱动的编程语言,由微软开发,主要用于其Office套件中的应用程序自动化。它允许用户编写宏来扩展Office软件的功能,比如Excel、Word、PowerPoint和Access等。下面我将详细介绍VBA的一些核心概念和如何在Excel中创建简单的VBA代码。 VBA的基本概念 对象模型:每个Office应用程序都有一个对象模型,它定义了该程序的对象层次结构。例如,在Excel中,顶层对象是Application,它可以包含多个Workbook对象,而每个Workbook又可以包含多个Worksheet对象。 模块:在VBA中,代码被组织成模块。模块可以是标准模块、类模块或窗体模块。标准模块是最常用的,它们用于存储独立的过程和函数。 过程与函数:过程(Subroutine 或简称 Sub)是一段执行某些操作但不返回结果的代码块;而函数(Function)则是一段执行操作并返回一个值的代码块。两者都可以接受参数,并且可以在其他过程中调用。 如何在Excel中创建VBA代码 启用开发者选项卡 首先,你需要确保Excel的“开发者”选项卡已经启用: 打开Excel。 点击文件 > 选项 > 自定义功能区。 在右侧列表中勾选“开发者”复选框。 点击确定。 打开VBA编辑器 点击“开发者”选项卡中的“Visual Basic”按钮,或者按快捷键Alt + F11来打开VBA编辑器。 创建一个简单的VBA程序 假设我们要创建一个简单的VBA程序,该程序会在用户点击一个按钮时显示一条消息: Sub HelloWorld() MsgBox "Hello, World!" End Sub 这个例子展示了如何使用MsgBox函数来显示一个对话框。你可以通过插入一个按钮到工作表上,并将其关联到上述的HelloWorld子程序来触发这段代码的执行。 实际应用示例 如果你想要自动完成一些日常任务,例如为选定的数据区域添加边框,你可以编写如下代码: Sub AddBordersToSelection() Dim rng As Range Set rng = Selection With rng.Borders .LineStyle = xlContinuous .Weight = xlThin End With End Sub 在这个例子中,我们定义了一个名为rng的变量来表示当前选中的单元格区域,并给这个区域的所有边框设置了连续线条样式和细线宽。 以上只是对VBA的一个简要介绍,实际的VBA编程可以非常复杂,包括处理数据、操作文件系统、与其他应用程序交互等高级功能。对于更深入的学习,建议参考官方文档或其他学习资源。

1 年前
据微软 2024 年 12 月 19 日发布的博文,Microsoft Edge 浏览器在 2024 年通过内置的 Copilot 功能,用户进行了超过 100 亿次的 AI 对话。 这凸显了用户对 AI 驱动工具的广泛接受和日益增长的依赖。这一里程碑表明: 用户对 AI 辅助工具的高接受度:越来越多的用户在日常浏览和工作中依赖 AI 工具进行搜索、内容生成和任务自动化。 AI 技术的成熟和普及:Copilot 功能显然已经在帮助用户更高效地获取信息和完成任务。 Edge 浏览器的市场竞争力:这一数据也反映出 Edge 浏览器在与其他浏览器的竞争中取得了一定的优势。

1 年前
微软研究院表示,现在的AI具备更强的推理能力,AI模型很快将能够处理更复杂的任务。未来将比ChatGPT等传统的聊天机器人更强大,微软正在利用AI代理来连接整个组织的员工,而且透过硬体升级AI将变得更加节能。 周四OpenAI也表示,将推出高价版的聊天机器人ChatGPT Pro新订阅服务,专门为工程和研究板块设计,月费达到200美元。 AI应用持续往前推动,华尔街方面也正密切关注硅谷,在AI上的巨额投资能否带来营收增长。
Minimax(海螺AI)已由大模型名Minimax替换原海螺AI。现海螺AI为Minimax视频生成产品名。
海螺AI