AI 快讯 编译自 nvidia_developer #Agent框架#深度研究#NVIDIA

NVIDIA 教你给 Agent 框架添加深度研究技能:Claude Code、Codex 等可扩展

NVIDIA 发布指南,教开发者如何为 Claude Code、Codex、LangChain Deep Agents 等 Agent 框架添加专门的深度研究技能,实现多文档综合、企业数据决策简报等复杂任务。本文拆解技术要点,并分析对中文开发者的实际意义。

编译发布 2026/05/24 原文发布 2026/05/20

一句话看懂

NVIDIA 发布技术指南,教你如何为 Claude Code、Codex、LangChain Deep Agents 等 Agent 框架添加专门的深度研究技能,实现多文档综合、企业数据决策简报等复杂任务。

详细发生了什么

Agent 框架(如 Claude Code、Codex、LangChain Deep Agents)擅长编排任务:管理会话、链式调用工具、执行代码、响应开发者意图。但当需要深度研究——比如多文档综合、基于企业数据的决策简报、带来源归因的长期分析——这些框架往往力不从心。

NVIDIA 在最新博客中提出,可以通过将深度研究封装为一个专门的“技能”(Skill)来扩展 Agent 框架的能力。核心思路是:

  1. 定义深度研究技能接口:包括输入(研究问题、约束条件、来源偏好)和输出(结构化报告、引用列表、置信度评分)。
  2. 利用 NVIDIA NeMo 等工具:实现检索增强生成(RAG)、多步推理、结果验证等子能力。
  3. 集成到现有 Agent 框架:通过 tool calling 或 sub-agent 模式,让主 Agent 在需要时调用深度研究技能。

博客还给出了一个示例:使用 LangChain Deep Agents 和 NVIDIA NeMo 构建一个“企业研究助手”,能够从内部文档库中综合信息,生成带引用的决策简报。

中文圈视角

对中文开发者来说,这个指南非常实用,原因有三:

  1. 主流 Agent 框架在国内都能用:Claude Code、Codex、LangChain 在国内均可访问(部分需代理),且都有中文社区支持。NVIDIA NeMo 也有中文文档。
  2. 国产平替方案:如果不想用国外框架,可以类比到国内产品:比如用 Dify 或 FastGPT 作为 Agent 框架,结合百度文心或阿里通义的 RAG 能力,也能实现类似功能。NVIDIA 的设计思路是通用的。
  3. 企业场景刚需:国内企业做知识库问答、竞品分析、合规审查时,经常需要多文档综合和来源归因。这个技能正好填补了现有 Agent 框架的空白。

一个值得注意的盲点:国内很多开发者只关注 Agent 框架的对话能力,忽略了深度研究这种“慢思考”技能。NVIDIA 的指南提醒我们,Agent 不只能聊天,还能做研究。

几条值得记住的细节

  • 深度研究技能需要支持多轮检索、多文档对比和来源归因,不是简单 RAG 能搞定的。
  • NVIDIA 建议使用 NeMo 的“推理时计算”功能来提升研究质量。
  • 示例代码展示了如何用 LangChain 的 tool calling 机制注册深度研究技能。
  • 该技能可复用:同一个技能可以挂接到 Claude Code、Codex 等不同框架。
  • 博客提到,深度研究技能的输出格式建议为 Markdown 或 JSON,便于后续处理。

一句话总结

给你的 Agent 框架加上深度研究技能,它就能从“对话助手”升级为“研究分析师”。