先看 Anthropic 把 Claude 放进了什么运行时

Anthropic 这次公开的,不只是“Claude 可以自己调工具”这种能力说明,而是一套正式的运行时抽象。OverviewQuickstart 两篇文档把边界讲得很清楚:Claude Managed Agents 由 AgentEnvironmentSessionEvents 四个核心概念组成。

这四个词其实分别对应四个工程问题。Agent 负责定义模型、system prompt、tools、MCP servers 和 skills;Environment 负责定义容器环境、依赖和网络访问;Session 负责承接一次真正运行中的 agent 实例;Events 负责承接你与这个运行中实例的交互、状态变化和结果流。

只要这四层一摆出来,Claude Managed Agents 的定位就很清楚了。它不是“给 Messages API 再补一层包装”,而是一套托管式 agent harness。Anthropic 开始正式接住 agent loop、容器环境和会话生命周期。

四个核心对象里,Session 才是这套架构的中心

表面上看,四个对象并列;真正转起来以后,Session 才是这套系统的中心。

原因很简单。真正的 agent 工作不会停在一次请求里。它需要持续运行、执行工具、收发事件、保留上下文、暴露状态、接凭据,还要允许你在运行中继续发消息或者查询日志。Anthropic 把这些都围绕 Session 组织起来,本质上是在把“长任务实例”从一次 HTTP 调用里剥离出来。

这也是为什么这套架构更适合异步和长任务。你不是每次都把完整上下文塞回模型,而是先创建或引用一个 agent,启动一个 session,再通过事件流驱动它继续往下走。对开发者来说,这意味着你可以把 agent 当成持续工作的运行中对象,而不是一串你自己维护的 prompt loop。

Environment 决定它更像托管运行时,而不是轻量 SDK

Environment 这个概念很关键。它说明 Anthropic 并没有把 Managed Agents 做成一个纯逻辑层,而是把容器环境也拉进了架构核心。

一旦 environment 进入核心抽象,很多事情都会跟着变化。依赖安装、网络边界、文件挂载、可执行能力和基础镜像,不再只是你自己在外部部署时顺手处理的细节,而是运行时定义的一部分。Anthropic 不是只在卖一个“聪明一点的 Claude”,而是在卖“Claude 在一个受控环境里持续做事”的能力。

这也是它和完全自定义 agent loop 的最大区别。自己用 Messages API 搭系统,灵活性最高,但 agent loop、状态机、工具执行和环境管理都得自己承担。Claude Managed Agents 则是用更少的自由度,换更完整的官方运行时。

Memory、Vaults、Tracing 和 Prompt Versioning 是外围四层

如果说 Agent / Environment / Session / Events 是主骨架,那么 MemoryVaultsSession tracingPrompt versioning 更像这套骨架外面长出来的四层运行时部件。

Memory 解决的是跨运行周期的信息延续。Vaults 解决的是第三方凭据如何按 session 和最终用户维度安全接入。Session tracing 解决的是 agent 运行中到底做了什么、哪里出错、花了多少 token。Prompt versioning and rollback 则把 prompt 从临时字符串提升成了可比较、可回滚、可灰度的生产资产。

这四层放在一起看,Anthropic 的思路其实非常完整。它没有把 agent 当成“模型多走几步”,而是把 agent 当成一个需要长期运行、需要凭据、需要观察、需要版本管理的生产系统。这就是为什么我会把它理解成官方运行时,而不是一次功能营销。

这套架构适合谁,不适合谁

Claude Managed Agents 很适合两类场景:一类是长任务和异步任务,另一类是你不想自己再维护整套 agent harness 的团队。

如果你的重点是快速获得一套可托管、可观察、带环境和会话抽象的 agent 运行时,这套架构很对路。你会少掉很多框架层和平台层的重复建设,尤其是在 session 管理、observability、vaults 和 prompt versioning 这些地方。

但它也不是通用答案。如果你的系统极度依赖自定义 agent loop、自定义状态机、自定义工具调度和自建治理层,那么 Managed Agents 带来的同时也是边界。它帮你接走很多运行时工程负担,也意味着你接受 Anthropic 对运行时模型的官方抽象。

所以我对 Claude Managed Agents 的结论是:它不是为了替代一切 agent 架构,而是把一套最常见、最值钱、也最费工程的运行时骨架做成了官方平台能力。理解这一点,才知道什么时候该直接用它,什么时候该继续自己搭。