Open Deep Research 是一个开源的 AI 研究助手项目,旨在通过结合网络数据提取、搜索和推理模型,完成复杂的多步骤研究任务。该项目是 OpenAI 的 Deep Research 实验的开源复现版本,但不依赖于 OpenAI 的 o3 微调模型,而是使用 Firecrawl 的搜索和提取功能,结合多种语言模型(如 OpenAI、Anthropic、Cohere 等)进行数据分析和推理。

核心功能

  1. 数据提取与搜索

    • 使用 Firecrawl 从多个网站实时抓取数据,并将其结构化处理,为后续推理提供基础信息。
    • 支持多源数据整合,从不同类型的网页中提取关键信息,确保数据的多样性和丰富性。
  2. 推理与分析

    • 基于强大的推理模型(如 OpenAI 的 GPT-4o、DeepSeek-R1 等),对提取的数据进行深度分析和推理,生成综合性的结论。
    • 支持多维度分析,包括文本内容理解、数据关联分析和趋势预测。
  3. 模型灵活性

    • 提供统一的 API,支持切换多种语言模型(如 OpenAI、Anthropic、Cohere、DeepSeek 等),用户可以根据需求选择合适的模型进行推理。
    • 支持自定义推理模型配置,例如通过设置 REASONING_MODEL 环境变量选择特定模型。
  4. 技术架构

    • 前端基于 Next.js 框架,结合 React Server Components 和 Server Actions,实现高效的服务器端渲染和动态用户界面。
    • 数据持久化使用 Vercel Postgres 和 Vercel Blob,支持结构化数据存储和大文件高效访问。
  5. 应用场景

    • 文献综述:帮助研究人员快速收集和整理相关领域的文献资料,生成文献综述报告。
    • 行业分析:分析特定行业的市场动态、竞争格局和发展趋势,生成行业分析报告。
    • 投资研究:分析公司财务报表、行业动态和市场情绪,为投资决策提供数据支持。

技术原理

  • 数据提取与搜索技术
    使用 Firecrawl 模拟浏览器行为,从目标网站提取网页内容并结构化处理为 JSON 或其他格式,通过 API 实时传输到 AI 模型进行分析。

  • AI 推理模型
    基于先进的语言模型(如 OpenAI 的 GPT 系列)作为核心推理引擎,用户可以通过 AI SDK 灵活调用不同模型。

  • 前端与后端集成
    使用 Next.js 框架实现高效的前后端集成,结合 AI SDK 提供的统一 API 接口,方便前端调用后端服务。

运行与配置

  1. 安装与运行

    • 安装依赖:pnpm install
    • 运行数据库迁移:pnpm db:migrate
    • 启动应用:pnpm dev,应用将在 localhost:3000 上运行。
  2. 模型配置

    • 通过设置 REASONING_MODEL 环境变量选择推理模型(如 deepseek-reasonerdeepseek-ai/DeepSeek-R1)。
    • 对于不支持 JSON 验证的模型,需在 .env 文件中设置 BYPASS_JSON_VALIDATION=true

Open Deep Research 是一个功能强大且灵活的开源研究工具,适用于多种复杂的研究场景,用户可以根据需求自定义模型和配置,实现高效的数据分析和推理。

免责声明:本网站仅提供网址导航服务,对链接内容不负任何责任或担保。