综述论文：代码是AI代理的思维与行动方式，而不仅是产出，DeepSeek已组建“Harness”团队

一句话看懂

一篇综述论文提出，AI代理的智能不来自模型本身，而来自包裹模型的代码层（Harness）；DeepSeek已在北京组建专门团队实践这一理念。

详细发生了什么

一篇新发表的综述论文认为，当前自主AI代理（AI Agent）发展的真正瓶颈并非大语言模型（LLM）的能力，而是围绕模型构建的软件层——即“Harness”。论文指出，工具调用（tool calling）、记忆管理（memory）、测试框架（testing）和权限边界（permission boundaries）等组件，才将一个无状态的模型转化为能实际工作的代理。

DeepSeek已经在内部验证了这一观点。据The Decoder报道，DeepSeek在北京组建了一个专门的“Harness”团队，其核心公式为：模型 + Harness = AI代理。这意味着，未来AI代理的竞争焦点可能从模型本身转向如何设计更高效、更安全的软件层。

中文圈视角

这篇论文的观点对中文AI开发者有直接启示。目前国内许多团队（如智谱、Kimi、百度）都在开发AI代理，但往往过度关注模型参数和基准分数，忽视了代理系统的工程化设计。DeepSeek组建Harness团队表明，国内头部玩家已意识到：代理的可靠性、可调试性和安全性，取决于代码层的质量。

对中文用户而言，这意味着：

开发工具链将升级：未来可能出现更成熟的代理开发框架（类似LangChain但更聚焦Harness），国内开发者可关注ModelScope等平台上的相关开源项目。
应用场景更务实：代理的“思考”和“行动”通过代码实现，意味着写作、编程、办公等场景的自动化将更依赖代码逻辑而非模型幻觉。
监管合规新维度：权限边界（permission boundaries）的设计直接影响数据安全和内容合规，国内开发者需提前考虑如何将监管要求嵌入Harness层。

目前中文社区对此讨论较少，多数文章仍聚焦模型能力，而这篇论文提供了一个更工程化的视角。

几条值得记住的细节

论文核心论点：AI代理的瓶颈是软件层（Harness），而非模型本身。
Harness包含：工具调用、记忆管理、测试框架、权限边界。
DeepSeek已在北京组建专门的“Harness”团队，公式为：模型 + Harness = AI代理。
该观点可能改变AI代理的研发重心，从模型竞赛转向工程化设计。
论文发表于2026年5月，由The Decoder报道。

一句话总结

AI代理的未来不在模型大小，而在包裹模型的代码层——Harness将成为新战场。