Deep Agents 概览
构建能够规划任务、使用子 Agent 和利用文件系统处理复杂任务的 Agent。
Deep Agents 是构建 LLM 驱动的 Agent 和应用程序的最简单方式——自带任务规划、文件系统上下文管理、子 Agent 生成和长时记忆等内置能力。
Deep Agents 是一个 Agent 框架 (Harness)。它与其它 Agent 框架一样基于核心的工具调用循环,但内置了让 Agent 在实际任务中更可靠的能力:
- 在环境中执行操作 — 通过工具执行操作、读写文件、运行代码
- 连接你的数据 — 在适当时机加载记忆、技能和领域知识
- 管理增长的上下文 — 跨长任务时总结历史并卸载大量结果
- 并行化任务 — 委托给通用或专用的子 Agent,在隔离的上下文窗口中运行
- 保持人在环中 — 在关键决策点暂停等待人工审批
- 持续改进 — 基于实际使用更新记忆、技能和提示词
快速创建 Deep Agent
# pip install -qU deepagents langchain-openai
from deepagents import create_deep_agent
def get_weather(city: str) -> str:
"""获取指定城市的天气"""
return f"{city}今天天气晴朗!"
agent = create_deep_agent(
model="openai:gpt-4o",
tools=[get_weather],
system_prompt="你是一个乐于助人的助手",
)
# 运行 Agent
agent.invoke({
"messages": [{"role": "user", "content": "上海天气怎么样?"}]
})其他模型提供商:
Google Gemini
# pip install -qU deepagents langchain-google-genai
from deepagents import create_deep_agent
agent = create_deep_agent(
model="google_genai:gemini-2.5-flash",
tools=[get_weather],
system_prompt="你是一个乐于助人的助手",
)Anthropic Claude
# pip install -qU deepagents langchain-anthropic
agent = create_deep_agent(
model="anthropic:claude-sonnet-4-6",
tools=[get_weather],
)Ollama (本地)
# pip install -qU deepagents langchain-ollama
agent = create_deep_agent(
model="ollama:qwen2.5",
tools=[get_weather],
)架构
deepagents 是一个独立的库,构建在 LangChain 核心构建模块之上。它使用 LangGraph 运行时实现持久化执行、流式输出、人机协同等特性。
deepagents 仓库 包含:
- Deep Agents SDK — 用于构建能处理任何任务的 Agent 的包
- Deep Agents Code — 基于 Deep Agents SDK 构建的终端编码 Agent
- ACP 集成 — Agent 客户端协议连接器,用于在 Zed 等代码编辑器中调用 deep agents
核心能力
任务规划与分解
内置的 write_todos 工具让 Agent 将复杂任务分解为离散步骤,跟踪进度,并在新信息出现时调整计划。
上下文管理
内置的上下文压缩将大型工具输入和结果卸载到虚拟文件系统中,并对较旧的消息进行总结,使 Agent 在扩大会话中保持高效。
可插拔文件系统后端
通过可插拔后端交换虚拟文件系统:内存状态、本地磁盘、LangGraph 存储、复合路由或带有读写权限规则的自定义后端。
Shell 执行
支持 shell 的后端添加了 execute 工具,用于测试、构建、Git 操作和系统任务。
解释器
添加解释器在内存运行时中运行 JavaScript。解释器让 Agent 编程式地组合工具、编排子 Agent 和转换结构化数据。
子 Agent 生成
内置的 task 工具为子任务生成通用或专用子 Agent,实现上下文隔离。对于长时间运行或并行工作,异步子 Agent 在后台运行。
长时记忆
使用 LangGraph 的 Memory Store 跨线程和会话持久化记忆。
文件系统权限
声明式权限规则,控制 Agent 可以读取或写入哪些文件和目录。子 Agent 可以继承或覆盖父级的规则。
人机协同
使用 LangGraph 的中断能力,为敏感工具操作配置人工审批。
技能
使用提供专用工作流、领域知识和自定义指令的可复用技能扩展 Agent。
智能默认值
内置精心设计的系统提示词,教会模型在行动前规划、验证工作和管理上下文。