
Proma 是一款由开发者 Erlich Liu 自主打造的新一代 AI 软件,它主要面向 通用智能 Agents 工作流操作和自动化处理,目标是把前沿的 AI Agents 能力变成真实可用的产品,而不是只是模型展示或简单聊天体验。
Proma 是以 Flow Agents 为核心的 AI 桌面工具,能把整理资料、生成文书等多步骤任务自动化成可复用工作流并直接产出可交付结果。
它的初始版本是 v0.3.0,官方在 2026 年 1 月正式发布。Proma 有网页端、Windows 和 macOS 版本,支持跨平台体验。截止2026年2月15日,版本已经更新至 v0.4.18。
Proma 的对话不仅仅是聊天,它内置了 Flow Agents(流程代理) 模式:
与文件系统深度结合,可直接处理文件,会根据需求自动完成:
Flow Agents 的关键价值:不是简单对话,而是把“指令 + 文件 + AI 智能推理”组合成可执行的工作流。
Proma 内置了云端存储功能:
Proma 不只是一款 “聊天式 AI 工具”:
它未来的定位是 基础设施平台:
平台将为 Agents 提供:
🔹 自动整理公司文书资料
你只需要把资料放进一个文件夹,告诉 Proma 需要什么内容,它可以:
🔹 复杂的数据分析
例如:
🔹 深度研究和联网搜索
Proma 可以:
概括来说 Proma 的目标有三点:
不局限于简单聊天
— 而是真正能执行任务、完成流程、实现自动化。
连接你的数据和业务场景
— 它可以直接处理文件、文本和数据库。
可生成可复用的智能工作流组件/Skill
— 也就是“自动化的可执行逻辑”,而不仅是模型输出。
| 传统聊天 AI | Proma |
|---|---|
| 只能回答文本 | 可以理解业务、执行实际任务 |
| 无流程自动化 | 内置 Flow Agents 工作流 |
| 不持久存储 | 云端同步跨设备 |
| 少文件交互 | 强文件 + 数据库 + API 支持 |
Proma 开发者提出的未来设想包括:
这意味着 Proma 最终可能从个人自动化工具成长为AI App 平台。
Proma 是一款面向实际生产与深入自动化的 AI 工具,它用通用 Agents 工作流把“智能推理 + 文件/数据 + 自动化执行”结合在一起,是比普通聊天系统更接近“智能助手/工作机器人”的新一代 AI 平台。
免责声明:本网站仅提供网址导航服务,对链接内容不负任何责任或担保。
6 小时前
在2026年开发AI产品时,搭建一个生产级(production-grade)RAG系统已经不再是“简单接个向量数据库就行”,而是需要系统性工程化思维。以下是从0到1再到生产可用的完整路径,按实际优先级和踩坑顺序组织。 一、生产级RAG ≠ Demo级RAG 的本质区别(2025-2026共识) 维度 Demo级(常见教程) 生产级(真正能上线赚钱) 为什么重要 文档量 几MB ~ 几百页 几万 ~ 几百万文档 / 多模态 / 每天增量更新 决定了分块、索引、召回策略完全不同 召回准确率 60-75% 目标88-95%+(视场景) 差10%召回率,用户体验天差地别 延迟 2-8秒随便 <1.5秒(p95),理想<800ms 用户流失率与延迟呈指数关系 幻觉控制 看运气 需要多重机制把幻觉率压到<5% 企业客户最怕胡说八道 可维护性 脚本跑一遍就行 需要数据质量pipeline、版本控制、监控告警 半年后没人敢碰代码 成本 不care embedding + LLM + vectorDB 每月几千到几十万刀 直接影响商业模式能否跑通 二、2026年主流生产级RAG搭建完整路径(推荐路线) Phase 0:先别写代码,先做这两件事(很多人跳过直接失败) 明确业务成功标准(最重要一步) 准确率目标:≥88%(RAGAS faithfulness & answer relevancy) 幻觉率:<5% 响应时间:p95 < 2秒(或按产品定位) 支持的文档类型:PDF/Word/Excel/网页/Markdown/扫描件/表格/图片? 更新频率:实时 / 每天 / 每周? 用户问题类型:单轮 / 多轮 / 带表格 / 需要推理? 准备评估集(金标准) 至少200-500条 真实用户问题 + 人工标注的完美答案 后续所有优化都拿这个集子打分 Phase 1:数据摄入与预处理(决定天花板,占60%工作量) 现代顺序(2025-2026主流做法): 文档清洗与质量分级(最被低估的一步) 运行一个轻量文档质量打分模型(或规则+小型LLM) 分三类:Clean / Decent / Garbage Garbage类直接人工干预或低权重处理 结构化解析(别直接喂Unstructured) PDF:用Marker / PyMuPDF + table detection(Marker 2025年后很强) Word/Excel:python-docx / pandas 保留层级:标题 → 段落 → 表格 → 图片说明 → 元数据 高级Chunk策略(2026年最核心差异化点) 策略 Chunk大小 适用场景 召回提升 Fixed-size 512 token 快速验证 baseline Semantic 200-800 主流生产 +15-25% Hierarchical 父子chunk 长文档、合同、手册 +20-35% Proposition-based 小粒度命题 法律/医疗/技术文档 +30%+ 推荐起步组合:Semantic + 父子索引 + 100-200 token重叠 Phase 2:Embedding 与 向量存储(2026主流选型) Embedding模型推荐(2026.2月时点性价比排序): bge-m3 / Snowflake Arctic Embed(开源王者) voyage-3-large / Cohere embed-v4(闭源但效果顶尖) text-embedding-3-large(稳定但已被超越) 向量数据库主流选择: 场景 首选数据库 次选 备注 < 100万向量 Chroma / Qdrant本地 PGVector 开发快 100万-1亿 Qdrant / Milvus Weaviate Qdrant 2025-2026口碑最佳 亿级 + 高并发 Pinecone serverless Zilliz Cloud 省心但贵 极致私有化 pgvector + pgvectorscale Milvus standalone 强烈建议:hybrid search(dense + sparse / BM25)几乎成为2026标配。 Phase 3:检索与后处理(拉开差距的关键层) 现代检索流水线(2026主流): 用户问题 ↓ Query分类与改写(是否需要检索?多意图拆分?) ↓ 多路召回(vector + BM25 + 知识图谱等) ↓ 初筛 top-30~100 ↓ 重排序(Cohere Rerank3 / bge-reranker-v2 / flashrank) ↓ 上下文压缩 / 抽取(LLM summarize top-8) ↓ 最终给LLM的上下文(带清晰source引用) Phase 4:生成与防幻觉 Prompt工程模板(必须有): 强制要求:只用提供的内容回答 / 不知道就说不知道 / 标注来源 结构化输出(JSON)便于下游解析 防幻觉组合拳: Self-Check / Self-RAG Corrective RAG Groundedness check(RAGAS / TruLens) 后置事实核查(小模型或规则) Phase 5:评估、监控、迭代闭环(生产级灵魂) 必须上的指标: Retrieval:Recall@K, MRR, NDCG Generation:Faithfulness, Answer Relevancy, Context Precision/Recall End-to-End:用户打分 / A/B测试 / 业务指标(解决率、CSAT) 推荐工具组合(2026主流): 评估:RAGAS / DeepEval / TruLens / Phoenix 监控:LangSmith / Helicone / Phoenix / PromptLayer Orchestration:LangGraph / LlamaIndex Workflows / Haystack / Flowise(低代码) 三、2026年推荐最小可用生产技术栈(性价比最高) 极简但能上线(适合小团队) 解析 → Marker / LlamaParse 向量化 → bge-m3 或 voyage-3 向量库 → Qdrant (docker) 召回+重排 → Qdrant + bge-reranker-v2 框架 → LlamaIndex 或 LangGraph LLM → DeepSeek-R1 / Qwen2.5-72B-Instruct / Claude-3.5-Sonnet (根据预算) 评估 → RAGAS + 人工golden set 进阶企业级(已验证可支撑十万+文档) 加:混合检索 + 父子索引 + query分解 + 多路召回 + 上下文压缩 + corrective RAG + 在线监控 一句话总结2026年RAG哲学: “70%的效果提升来自于数据质量、切块策略和检索后处理;20%来自embedding和重排序模型;只有10%靠换个更强的LLM。” 先把前70%做好,后面自然水到渠成。 ( Grok )

1 天前
Node.js 和 Git 是支持 AI Agent 开发、依赖管理和协作的基础工具。

14 天前
作者: Augusto Marietti(Kong CEO & 联合创始人)、YJ Lu(Teachers’ Venture Growth 总监)、Yiran Wu(Teachers’ Venture Growth 投资分析师) 背景:上下文是新的算力 过去几年,AI 以史无前例的速度发展。从传统机器学习系统跃迁到能写作、编程、推理的生成式 AI 模型,这一变化彻底改变了我们与 AI 的互动方式。但旅程并未结束。 我们正进入一个新的阶段:具备上下文理解与自主行动能力的 Agentic AI(代理式 AI)。它们能自主设定目标、执行任务,并且几乎不需要人工干预。 支撑这一转变的核心是 Model Context Protocol(MCP)模型上下文协议 —— 一个新兴标准,用于将基于提示的生成式 AI 模型连接到真实世界的数据、工具与操作。 上一阶段的问题:缺失的上下文(404) 直到最近,大多数前沿大模型都运行在“围墙花园”中: 它们能理解用户提示并生成文本,但无法标准化地访问个人或企业数据、内部工具、API 或其他关键上下文来源。 企业若想让模型具备上下文能力,只能构建昂贵、脆弱且难以维护的定制集成(“胶水代码”)。 2024 年 11 月,Anthropic 推出开源框架 MCP,旨在通过通用协议将上下文引入 LLM,使其能发现、调用并认证外部系统的 API。 MCP 很快成为行业标准,被 OpenAI、Google 等巨头采用。 随着生态成熟,AI 系统将能在不同工具之间保持上下文,实现可持续的架构。 MCP 如何工作? 在 MCP 之前,每个 LLM 都有自己的插件格式,需要为每个工具写独立的集成代码,形成 N × M 的复杂矩阵。 MCP 将这一矩阵折叠为一个供应商中立的系统,通过定义清晰的角色(host、client、server),让工具能以一致方式被发现与调用。 只需为每个上下文源构建一个 MCP server,任何兼容 MCP 的 AI 助手都能像使用工具箱一样使用它。 流程如下: 用户输入提示 模型解析意图 模型不再“猜测”,而是向 真实上下文 请求信息 MCP client 将意图转为标准化请求 MCP server 执行 API 调用并返回结构化结果 模型基于真实数据生成上下文感知的输出 最重要的是:不再需要 N × M 的胶水代码。 承API之踵,拓更阔之路 科技行业并非第一次需要通用标准来实现规模化。 API 曾是软件互联的关键: 它定义了软件之间如何交流、返回什么、如何安全交换信息。 API 真正爆发是在 REST、JSON、OAuth 等标准化之后,开发者终于能以可移植、可预测的方式构建软件。 这催生了 Stripe、Twilio、Plaid 等“API 即业务”的公司。 MCP 正在走类似的道路: 标准化模型访问工具与数据的方式。 随着 MCP 采用率提升,我们将看到 API 生态曾经出现的配套设施: 注册表、可观测性、审批系统、策略引擎、更好的工具链等。 我们的判断:上下文 + API + 工作流 = Agentic AI 我们押注两个方向: Anthropic 的 MCP 正成为连接 LLM 与工具/数据的行业标准,为代理式工作流与多代理系统(A2A)奠定基础。 Kong 将其在 API 管理领域的领先地位扩展到 AI 连接层,成为企业系统与新一代 AI 代理之间的“连接组织”。 Anthropic Anthropic 推出 MCP,是因为 AI 的未来不仅在于更大的模型,还在于将模型连接到正确的上下文。 2025 年 5 月,Anthropic 发布 Integrations,将 MCP 支持扩展到 Claude API,使 Claude 能无代码连接任何远程 MCP server。 未来路线图从单一代理转向多代理协作(A2A): 一个代理获取客户数据 一个代理做投资组合分析 一个代理生成合规报告 全部通过 MCP 与 A2A 无缝协调 AI 将从单一助手变成专业代理网络。 Kong Kong 正将其 API 管理平台扩展到 AI 连接层,推出: AI Gateway:将 LLM/MCP/API 调用视为 API 流量进行路由、安全、监控与优化 MCP Server for Konnect:将企业系统(API、服务、分析等)通过 MCP 暴露给 AI 代理,使其能用自然语言查询并获取洞察 Kong 的愿景是: “没有 API,就没有 AI。” MCP 的下一章:Linux 基金会托管 2025 年 12 月,Anthropic 将 MCP 捐赠给 Linux 基金会旗下的新机构 Agentic AI Foundation(AAIF)。 AAIF 由 Anthropic、Block、OpenAI 共同创立,并获得 Google、Microsoft、AWS、Cloudflare、Bloomberg 支持。 MCP 的开源治理模式类似 Linux、Kubernetes、Node.js、PyTorch 等项目,预计将加速其采用。 目前 MCP 已实现: 每月 9700 万+ SDK 下载 1 万+ 活跃服务器 深度集成到 Claude、ChatGPT、Gemini 等产品 MCP 正从开发者框架走向下一代 AI 工作流的关键基础设施。 未来的机会 MCP 通过提供一个中立、通用的语言,让模型能访问工具、数据与系统,从而降低摩擦、提升互操作性。 随着采用率提升,我们将看到类似 API 生态的爆发: 新商业模式 新工具链 新应用类别 但机会伴随风险: 工具滥用 数据暴露 安全治理需求 生态必须在开放与安全之间取得平衡。 标准本身不会改变世界,生态系统才会。 如果成功,MCP 将成为未来几十年 AI 智能如何被封装、共享与扩展的基础设施。 (文章来源otpp.com )

14 天前
Agent是具备自主决策、工具调用与状态感知的智能体概念,LangGraph则是LangChain生态下的图驱动有状态Agent编排框架,专门解决复杂Agent的状态管理、循环分支与持久执行问题,是构建生产级Agent的核心基础设施。二者是“概念-实现”的强绑定关系,LangGraph为Agent提供图建模、状态持久化、人机协作等关键能力,适配ReAct、多智能体协作等复杂场景。 核心关联逻辑:概念与实现的分层 层级 定位 核心内容 概念层(Agent) 自主决策执行单元 LLM+Tools+自主循环(Thought→Action→Observation),解决非预定义复杂任务 实现层(LangGraph) 图驱动Agent框架 以有向图建模Agent流程,通过State/Nodes/Edges/Checkpointing支撑复杂逻辑 生态层 LangChain全家桶 LangGraph无缝集成LangChain的LLM/Tools/Prompt与LangSmith调试能力,降低开发门槛 LangGraph为Agent解决的核心痛点 有状态执行:用State统一管理对话历史、工具输出、中间结果,支持跨轮次上下文与长期记忆,避免“失忆”。 复杂流程编排:将Agent步骤拆为Nodes(LLM调用、工具执行、决策判断),用Edges(含条件分支)定义路径,原生支持循环(如ReAct迭代)与并行执行。 持久化与容错:Checkpointing自动保存每步状态,任务中断后可恢复,适配长时间运行场景(如多轮调研、项目管理)。 人机协作可控:支持执行中人工干预状态、审批工具调用,解决Agent“黑盒操作”风险。 多Agent协同:将不同功能Agent作为节点,通过图结构实现任务拆分与结果聚合,适配复杂团队协作流程。 典型实现范式:ReAct Agent的图建模 定义State:封装消息、工具结果、思考记录等,用TypedDict/Pydantic统一管理。 配置Nodes:LLM节点(推理决策)、工具节点(执行调用)、路由节点(判断是否继续)。 连接Edges:按条件分支(如“有工具调用则执行工具,否则结束”)构建循环路径。 启用Checkpointing:保存每步状态,支持断点恢复与调试追踪。 部署与监控:用LangSmith可视化执行路径,快速定位逻辑问题。 与传统Agent实现的差异 对比项 LangGraph驱动Agent LangChain基础Pipe 普通云端Agent 状态管理 原生持久化,跨轮次记忆 无内置状态,需手动维护 依赖会话缓存,易丢失 复杂逻辑 支持循环、条件分支、并行 线性流程,扩展有限 多为单步/固定链,灵活度低 容错能力 Checkpointing断点恢复 无容错,中断需重跑 云端依赖,故障难恢复 可控性 执行中人工干预 固定流程,干预困难 操作透明性差 关键使用场景 单Agent复杂任务:市场调研(搜索→数据清洗→报告生成)、财务对账(多系统数据拉取→交叉校验→异常告警)。 多Agent协作:产品开发(需求Agent→设计Agent→开发Agent→测试Agent)、跨境电商(选品→翻译→投放→售后)。 长期运行任务:客户成功跟进(多轮问题诊断→方案生成→效果复盘)、内容系列创作(选题→素材→撰写→发布)。 快速上手建议 用create_react_agent快速搭建基础Agent,绑定LLM与Tools,验证核心流程。 自定义State结构,覆盖任务类型、工具结果、历史对话等关键字段。 拆分Nodes与Edges,添加条件判断(如“金额>1000需审批”),提升流程可控性。 启用Checkpointing并接入LangSmith,监控执行路径与状态变化。

16 天前
命令优先,而非图形界面。

19 天前
原名 Clawdbot 的灵感来自 Claude 模型加载时出现的那个“Clawd”小龙虾/爪子吉祥物。

19 天前
奥地利最知名的独立开发者 Steinberger 是全球最热的“一人公司”/“vibe-coding”代表人物之一。

11 个月前
根据《Nature》最新发表的研究,非营利研究机构METR发现了一项被称为“智能体摩尔定律”的规律,即AI智能体(Agent)在完成长期任务方面的能力每7个月翻一番。这一发现揭示了AI在任务完成时间跨度上的指数级增长趋势,并提出了“50%-任务完成时间跨度”这一新指标来衡量AI的能力变化。 核心发现 能力翻倍周期:自2019年以来,AI智能体完成任务的时间跨度每7个月翻一番。这意味着,如果2019年AI完成某项任务所需时间对应人类需要10分钟,那么7个月后,这一时间将缩短至20分钟。 加速趋势:2024年,AI能力的增长速度进一步加快,部分最新模型的能力每3个月翻一番。 未来预测:按照这一趋势,预计5年后(即2030年左右),AI将能够完成许多当前需要人类花费一个月时间才能完成的任务。 研究方法 METR团队通过以下步骤验证了这一规律: 任务设计:设计了170个多样化任务,涵盖软件工程、机器学习、网络安全等领域,并测量人类专家完成这些任务所需的时间,建立“人类基准线”。 指标引入:提出了“50%-任务完成时间跨度”指标,即AI在50%成功率下完成任务的时间长度。这一指标对数据分布的微小变化具有鲁棒性。 模型评估:评估了2019年至2025年间发布的13个前沿AI模型(如GPT系列、Sonnet 3.7等),通过逻辑回归分析计算每个模型的时间跨度。 验证与外部实验 为了验证结果的可靠性,研究团队进行了多项外部实验,包括: 回溯预测:使用2023-2025年数据验证趋势一致性。 任务混乱度分析:评估任务复杂性对AI性能的影响,发现AI在复杂任务上的提升速度与简单任务相似。 基准测试:在SWE-bench等数据集上验证了类似的指数增长趋势。 意义与影响 技术进步:这一发现标志着AI在执行长期任务能力上的显著进步,可能推动AI在软件开发、研究等领域的广泛应用。 劳动力市场影响:AI能力的快速提升可能对劳动力市场产生深远影响,未来或替代部分人类工作,尤其是重复性和耗时任务。 社会挑战:研究提醒社会各界需关注AI技术进步带来的就业和经济挑战,并提前制定应对策略。 未来展望 METR团队预测,按照当前趋势,AI可能在2028年11月达到一个月的任务时间跨度,保守估计则在2031年2月实现。尽管研究存在任务局限性和未来不确定性,但团队确信AI能力每年有1~4倍的增长趋势。 这项研究为AI技术的发展提供了新的量化标准,同时也引发了对AI未来应用和影响的深入思考。
Minimax(海螺AI)已由大模型名Minimax替换原海螺AI。现海螺AI为Minimax视频生成产品名。
海螺AI