AI 快讯 编译自 the_decoder #AI代理#代码生成#DeepSeek

综述论文:代码是AI代理的思维与行动方式,而不仅是产出,DeepSeek已组建“Harness”团队

一篇新综述论文指出,自主AI代理的真正瓶颈不是语言模型本身,而是围绕模型的软件层(工具、记忆、测试、权限边界)。DeepSeek已在北京组建专门的“Harness”团队,验证了“模型+Harness=AI代理”的核心公式。本文解读该观点对中文开发者和AI应用的意义。

编译发布 2026/05/29 原文发布 2026/05/29

一句话看懂

一篇综述论文提出,AI代理的智能不来自模型本身,而来自包裹模型的代码层(Harness);DeepSeek已在北京组建专门团队实践这一理念。

详细发生了什么

一篇新发表的综述论文认为,当前自主AI代理(AI Agent)发展的真正瓶颈并非大语言模型(LLM)的能力,而是围绕模型构建的软件层——即“Harness”。论文指出,工具调用(tool calling)、记忆管理(memory)、测试框架(testing)和权限边界(permission boundaries)等组件,才将一个无状态的模型转化为能实际工作的代理。

DeepSeek已经在内部验证了这一观点。据The Decoder报道,DeepSeek在北京组建了一个专门的“Harness”团队,其核心公式为:模型 + Harness = AI代理。这意味着,未来AI代理的竞争焦点可能从模型本身转向如何设计更高效、更安全的软件层。

中文圈视角

这篇论文的观点对中文AI开发者有直接启示。目前国内许多团队(如智谱、Kimi、百度)都在开发AI代理,但往往过度关注模型参数和基准分数,忽视了代理系统的工程化设计。DeepSeek组建Harness团队表明,国内头部玩家已意识到:代理的可靠性、可调试性和安全性,取决于代码层的质量。

对中文用户而言,这意味着:

  • 开发工具链将升级:未来可能出现更成熟的代理开发框架(类似LangChain但更聚焦Harness),国内开发者可关注ModelScope等平台上的相关开源项目。
  • 应用场景更务实:代理的“思考”和“行动”通过代码实现,意味着写作、编程、办公等场景的自动化将更依赖代码逻辑而非模型幻觉。
  • 监管合规新维度:权限边界(permission boundaries)的设计直接影响数据安全和内容合规,国内开发者需提前考虑如何将监管要求嵌入Harness层。

目前中文社区对此讨论较少,多数文章仍聚焦模型能力,而这篇论文提供了一个更工程化的视角。

几条值得记住的细节

  • 论文核心论点:AI代理的瓶颈是软件层(Harness),而非模型本身。
  • Harness包含:工具调用、记忆管理、测试框架、权限边界。
  • DeepSeek已在北京组建专门的“Harness”团队,公式为:模型 + Harness = AI代理。
  • 该观点可能改变AI代理的研发重心,从模型竞赛转向工程化设计。
  • 论文发表于2026年5月,由The Decoder报道。

一句话总结

AI代理的未来不在模型大小,而在包裹模型的代码层——Harness将成为新战场。