AI 快讯 编译自 aws_ml_blog #工具调用#Amazon Bedrock#编程式工具调用

Amazon Bedrock 三种方式实现编程式工具调用(PTC):自建 Docker 沙箱、托管 Code Interpreter 与 Anthropic

AWS 发布 Amazon Bedrock 编程式工具调用(PTC)实现指南,提供三种部署方案:自托管 ECS Docker 沙箱、托管 Bedrock AgentCore Code Interpreter 以及 Anthropic SDK 兼容代理。PTC 通过让模型一次性生成 Python 代码并在沙箱中执行,大幅降低多工具调用场景的延迟与 token 消耗。本文详解架构、系统提示词…

编译发布 2026/05/24 原文发布 2026/05/19

一句话看懂

AWS 发布三种编程式工具调用(PTC)实现方案,让模型一次性生成 Python 代码执行多工具调用,减少延迟与 token 消耗,适用于数据处理、数值计算等场景。

详细发生了什么

传统工具调用中,模型每调用一个工具就需要一次完整推理往返:调用工具、接收结果、推理、再调用下一个。对于需要多次工具调用的工作流(如“哪些工程团队成员 Q3 差旅超支?”),这种模式会带来累积延迟和大量 token 消耗——每个中间结果都要进入模型 context window。

编程式工具调用(PTC)改变了这一模式:模型只采样一次,生成一段 Python 代码,代码在沙箱环境中执行,通过 asyncio.gather() 并行调用工具、在 Python 中进行过滤和聚合,最终只将处理后的结果返回给模型 context window。例如,上述差旅审计场景中,传统方式需要 20+ 次工具调用、2000 条原始记录进入 context,而 PTC 只需两次模型采样(生成代码 + 解释输出),中间数据不接触模型。

AWS 在博客中详细介绍了三种实现方式:

  1. 自托管方案:基于 Amazon ECS 的 Docker 沙箱,提供最大控制权,支持 Bedrock 上所有模型(Claude、Qwen、Llama 等),可自定义 Python 包和安全策略。
  2. 托管方案:使用 Amazon Bedrock AgentCore Code Interpreter,无需管理基础设施。
  3. Anthropic SDK 兼容代理:通过代理层为偏好 Anthropic SDK 的团队提供熟悉的开发体验。

核心在于系统提示词设计:将工具定义注入 system prompt,指导模型生成单块、异步、带 print() 输出的 Python 代码。

中文圈视角

国内用户能用吗? 可以。Amazon Bedrock 已在新加坡、东京等亚太区域可用,但中国大陆用户需通过 AWS 全球账号或合规渠道访问。对于已使用 AWS 的出海企业或科研机构,PTC 能显著降低多工具调用场景的 API 成本。

国产平替与对比:国内类似服务如阿里云百炼、百度千帆、华为云盘古均支持工具调用(function calling),但尚未公开提供类似 PTC 的编程式执行沙箱。开发者可参考 AWS 的自托管思路,在国产云上搭建 Docker 沙箱 + 国产模型(如 Qwen、DeepSeek)实现类似效果。

对中文用户的具体场景

  • 数据处理:金融报表、电商订单分析等需要多步过滤聚合的任务,PTC 可减少 80%+ 的 API 调用次数。
  • 编程辅助:模型生成完整脚本而非逐步骤对话,适合自动化测试、批量文件处理。
  • 隐私合规:原始数据在沙箱内处理,不进入模型 context,对数据出境敏感的企业更有吸引力。

盲点:国内讨论多集中在 function calling 的“工具定义”层面,较少关注“模型写代码执行”这一范式。PTC 本质是代码生成 + 沙箱执行,与 OpenAI Code Interpreter 类似,但更轻量、可定制。

几条值得记住的细节

  • PTC 核心:模型只采样两次(生成代码 + 解释输出),中间工具调用在沙箱内完成,无额外推理。
  • 自托管方案:使用 ECS Docker 沙箱,支持 Bedrock 上所有模型(Claude、Qwen、Llama、Nova 等),可自定义 Python 包。
  • 托管方案:Amazon Bedrock AgentCore Code Interpreter 无需管理基础设施,适合快速集成。
  • 系统提示词关键:必须指导模型使用 await 异步调用、print() 输出结果,且所有操作在单代码块内完成。
  • 适用场景:大规模数据处理、精确数值计算、多步骤流程编排、隐私敏感场景。

一句话总结

如果你在 AWS 上构建多工具调用应用,PTC 能大幅降低延迟和成本,值得优先尝试自托管或托管方案。