字节跳动开源深度研究框架 DeerFlow – Gemini Deep Research开源平替(LangChain力荐)

If You Like Our Meta-Quantum.Today, Please Send us your email.

引言

字节跳动近期开源了一款名为DeerFlow的深度研究框架,该框架结合了大语言模型和各类专业工具,能够显著提高研究效率和内容生成质量。DeerFlow建立在LangChain和LangGraph等优秀开源项目的基础上,通过多智能体协作和灵活的工具集成,为研究人员、内容创作者和数据分析师提供了一个强大的研究助手平台。本视频将介绍如何在本地部署DeerFlow,并通过一个实例展示其研报生成效果。

关于DeerFlow

DeerFlow是字节跳动最近开源的一个深度研究框架,它结合了大语言模型和各种专业工具,旨在提高研究效率和内容生成质量。以下是关于DeerFlow的主要信息:

核心特点

  • 多智能体协作:建立在LangChain和LangGraph等开源项目基础上,通过多个AI智能体的协作完成复杂研究任务
  • 灵活的工具集成:可以集成各种专业工具,扩展研究能力
  • 模型兼容性:支持多种大语言模型,包括豆包1.5 Pro、GPT-4o、Qwen Max、Gemini 2.0 Flash等
  • MCP服务器支持:通过PageMCP服务器可以使DeerFlow拥有更强大的工具和更丰富的数据来源

主要用途

DeerFlow主要面向以下用户群体:

  • 研究人员
  • 内容创作者
  • 数据分析师

它可以帮助这些用户高效地进行深度研究,生成高质量的研究报告,减少繁琐的数据收集和整理工作。

工作流程

  1. 用户提出研究需求
  2. DeerFlow生成研究执行计划
  3. 用户可以调整计划
  4. DeerFlow执行研究任务,包括搜索网络、读取内容、分析数据等
  5. 最终生成完整研究报告

技术架构

DeerFlow建立在多个开源项目之上,主要包括:

  • LangChain:提供大语言模型应用开发框架
  • LangGraph:提供智能体编排能力

通过这些技术,DeerFlow实现了复杂研究任务的自动化和智能化处理。

如果您有兴趣了解更多或想要尝试DeerFlow,可以访问其GitHub仓库获取更详细的安装和使用指南。

DeerFlow详细使用示例

以下是DeerFlow的详细使用示例,展示了从安装配置到实际应用的完整流程:

1. 安装与配置

环境准备

首先确保本地环境具备以下工具:

  • NVM 和 PNPM
  • Python 和 Node.js

安装步骤

# 克隆代码仓库
git clone <https://github.com/bytedance/deerflow.git>
cd deerflow

# 安装Python依赖
uv sync

# 复制并配置环境变量
cp .env.example .env

# 复制并配置模型
cp conf.yaml.example conf.yaml

环境变量配置

.env文件中需要配置:

  • 搜索引擎API(如Tavily或DuckDuckGo)
  • 可选的Jina API
  • 如需生成播客,配置火山引擎TTS

模型配置

conf.yaml文件中配置基础模型:

# 使用OpenAI的GPT-4o
base_url: "<https://api.openai.com/v1>"
model: "gpt-4o"
# 添加您的API密钥
api_key: "your-api-key"

Web UI安装(可选)

cd web
pnpm install

2. 启动DeerFlow

控制台方式

uv run main.py

Web UI方式(以macOS为例)

./bootstrap.sh -d

启动后,DeerFlow会运行在本地的3000端口,可通过浏览器访问http://localhost:3000

3. 实际应用示例:GitHub热门项目分析

使用步骤

  1. 提出研究需求 输入问题:”找找今天在GitHub上最流行的项目”
  2. 查看并确认执行计划 DeerFlow会提供一个执行计划,包括:
    1. 搜索GitHub热门项目
    2. 分析项目特点
    3. 整理研究报告

      此时可以点击”Edit Plan”进行调整,或直接点击”Start Research”开始研究
  3. 研究过程观察 在右侧的Activity标签中,可以看到DeerFlow执行的具体步骤:
    1. 使用搜索引擎进行多次搜索,调整关键词以获取更准确的信息
    2. 读取搜索结果网页内容
    3. 对获取的信息进行整理和分析
    4. 生成最终报告
  4. 研究结果 研究完成后,在Report标签中会显示一个完整的研究报告,包括:
    1. 报告日期
    2. 热门项目列表及其关键信息(项目名称、作者、编程语言、项目目的等)
    3. 项目链接
    4. 参考资料链接

实际输出示例

以下是一个实际的研究报告示例:

# GitHub热门项目分析报告
日期: 2025年5月9日

## 关键发现
今天GitHub上最热门的项目是:
1. Money Printer Turbo - 一个前沿的AI应用框架
2. Void Editor - 类似VSCode的开源编辑器替代品

## 详细信息

### Money Printer Turbo
- 作者: sshh12
- 编程语言: JavaScript
- 项目目的: 提供快速构建、部署和扩展AI产品的框架
- 项目链接: <https://github.com/sshh12/money-printer-turbo>

### Void Editor
- 作者: void-main-project
- 编程语言: TypeScript
- 项目目的: 提供一个开源的VSCode替代品
- 项目链接: <https://github.com/void-main-project/void>

## 参考资料
- GitHub Trending页面: <https://github.com/trending>
- Money Printer Turbo项目页: <https://github.com/sshh12/money-printer-turbo>
- Void Editor项目页: <https://github.com/void-main-project/void>

4. 增强功能:配置MCP服务器

配置步骤

  1. 点击DeerFlow界面右上角的配置按钮
  2. 点击MCP添加新服务器
  3. 添加GitHub Trending MCP配置:
    {
    "name": "GitHub Trending MCP",
    "base_url": "<https://example-mcp-server.com/api>",
    "tools": [
    {
    "name": "GitHub Trending Repositories",
    "description": "获取GitHub上当前最流行的代码仓库"
    },
    {
    "name": "GitHub Trending Developers",
    "description": "获取GitHub上当前最受欢迎的开发者"
    }
    ]
    }
  4. 点击Add完成配置

MCP增强效果

配置MCP服务器后,使用同样的问题”找找今天在GitHub上最流行的项目”,DeerFlow会:

  1. 直接调用GitHub Trending Repositories工具获取准确数据
  2. 减少搜索引擎使用次数
  3. 提供更高质量、更准确的研究报告

MCP版本的输出示例

# GitHub热门项目分析报告
日期: 2025年5月9日

## 关键发现
通过GitHub Trending API直接获取的数据显示,今天最热门的项目是:
1. Void Editor - 今日新增星标1,889个
2. Money Printer Turbo - 今日新增星标1,542个
3. Ladybird Browser - 今日新增星标990个

## 详细信息
(项目详情内容)

## 数据来源
- GitHub Trending API
- 项目官方页面

通过这个详细示例,您可以看到DeerFlow如何帮助用户快速获取、整理和分析信息,生成高质量的研究报告,以及如何通过配置MCP服务器进一步增强其功能。

关于DeerFlow视频:

视频内容摘要

DeerFlow项目简介

DeerFlow是字节跳动推出的开源深度研究框架,主要特点包括:

  • 结合大语言模型和专业工具,显著提高研究效率和内容生成质量
  • 建立在LangChain和LangGraph等开源项目之上
  • 通过多智能体协作和灵活的工具集成,为不同用户提供研究助手平台

本地部署步骤

  1. 克隆GitHub代码仓库
  2. 运行uv sync安装必要的Python包
  3. 复制.env.example生成.env文件,配置必要的环境变量
    1. 配置搜索引擎API(如Tavily或DuckDuckGo)
    2. 可选配置Jina API
    3. 如需生成播客,可配置火山引擎TTS
  4. 复制conf.yaml.example生成conf.yaml,配置基础模型
    1. 支持多种模型如豆包1.5 Pro、GPT-4o、Qwen Max等
  5. 可选安装Marp CLI支持PPT生成功能
  6. 可选安装Web UI依赖,进入项目的web子目录运行pnpm install

运行方式

DeerFlow提供两种运行方式:

  1. 控制台UI:直接运行uv run main.py
  2. Web UI:以macOS为例,运行根目录下的bootstrap.sh,并提供-d参数同时启动前后端

实际使用效果

用户可以通过界面与DeerFlow进行交互,提出研究需求后,DeerFlow会提供执行计划,用户可以调整计划后开始研究。

视频展示了一个实例,查询”GitHub上今天最流行的项目”:

  1. DeerFlow生成详细报告,包括项目名称、作者、编程语言和目的等
  2. 提供项目链接便于访问
  3. 研究过程中会多次使用搜索引擎,调整关键词组合获取更准确的信息

MCP服务器配置

DeerFlow支持MCP(Multi-agent Collaboration Protocol)服务器配置,通过PageMCP服务器可以使DeerFlow拥有更强大的工具和更丰富的数据来源。

配置步骤:

  1. 在DeerFlow界面点击右上角配置按钮
  2. 点击MCP添加新服务器
  3. 粘贴配置并点击Add完成

配置后可以使用GitHub Trending Repositories和GitHub Trending Developers等工具

结论

字节跳动开源的DeerFlow深度研究框架是一个强大的研究辅助工具,通过结合大语言模型和专业工具,能够高效生成高质量的研究报告。

五个关键要点

  1. DeerFlow通过结合大语言模型和专业工具,显著提高研究效率和内容生成质量
  2. 基于LangChain和LangGraph构建,通过多智能体协作和灵活工具集成为不同用户提供研究助手
  3. 支持多种大语言模型,如豆包1.5 Pro、GPT-4o、Qwen Max、Gemini 2.0 Flash等
  4. 提供控制台UI和Web UI两种运行方式,适应不同使用场景
  5. 支持MCP服务器配置,可扩展工具集和数据来源,提升研究能力

参考资源

Leave a Reply

Your email address will not be published. Required fields are marked *