Open DeepResearch

开源研究工具，实现高效的数据分析和推理

学习网站

1 年前

8034

909

Open Deep Research 是一个开源的 AI 研究助手项目，旨在通过结合网络数据提取、搜索和推理模型，完成复杂的多步骤研究任务。该项目是 OpenAI 的 Deep Research 实验的开源复现版本，但不依赖于 OpenAI 的 o3 微调模型，而是使用 Firecrawl 的搜索和提取功能，结合多种语言模型（如 OpenAI、Anthropic、Cohere 等）进行数据分析和推理。

核心功能

数据提取与搜索
- 使用 Firecrawl 从多个网站实时抓取数据，并将其结构化处理，为后续推理提供基础信息。
- 支持多源数据整合，从不同类型的网页中提取关键信息，确保数据的多样性和丰富性。
推理与分析
- 基于强大的推理模型（如 OpenAI 的 GPT-4o、DeepSeek-R1 等），对提取的数据进行深度分析和推理，生成综合性的结论。
- 支持多维度分析，包括文本内容理解、数据关联分析和趋势预测。
模型灵活性
- 提供统一的 API，支持切换多种语言模型（如 OpenAI、Anthropic、Cohere、DeepSeek 等），用户可以根据需求选择合适的模型进行推理。
- 支持自定义推理模型配置，例如通过设置 REASONING_MODEL 环境变量选择特定模型。
技术架构
- 前端基于 Next.js 框架，结合 React Server Components 和 Server Actions，实现高效的服务器端渲染和动态用户界面。
- 数据持久化使用 Vercel Postgres 和 Vercel Blob，支持结构化数据存储和大文件高效访问。
应用场景
- 文献综述：帮助研究人员快速收集和整理相关领域的文献资料，生成文献综述报告。
- 行业分析：分析特定行业的市场动态、竞争格局和发展趋势，生成行业分析报告。
- 投资研究：分析公司财务报表、行业动态和市场情绪，为投资决策提供数据支持。

技术原理

数据提取与搜索技术
使用 Firecrawl 模拟浏览器行为，从目标网站提取网页内容并结构化处理为 JSON 或其他格式，通过 API 实时传输到 AI 模型进行分析。
AI 推理模型
基于先进的语言模型（如 OpenAI 的 GPT 系列）作为核心推理引擎，用户可以通过 AI SDK 灵活调用不同模型。
前端与后端集成
使用 Next.js 框架实现高效的前后端集成，结合 AI SDK 提供的统一 API 接口，方便前端调用后端服务。

运行与配置

安装与运行
- 安装依赖：pnpm install
- 运行数据库迁移：pnpm db:migrate
- 启动应用：pnpm dev，应用将在 localhost:3000 上运行。
模型配置
- 通过设置 REASONING_MODEL 环境变量选择推理模型（如 deepseek-reasoner 或 deepseek-ai/DeepSeek-R1）。
- 对于不支持 JSON 验证的模型，需在 .env 文件中设置 BYPASS_JSON_VALIDATION=true。