Anthropic 今天发布了 Claude Managed Agents,进入公开测试。

如果你只看产品本身,它是一个托管式 Agent 部署平台:你定义任务和工具,Anthropic 帮你把 Agent 跑起来,基础设施全包。听上去很常规。

但仔细想想,这件事的意义远不止"又发了个新产品"。

Twitter 上有位开发者 Yuchen Jin 一句话点破了关键:

"Anthropic wants to sell agents, not only the models. It's a huge market, and it will change the pricing structure away from tokens."

(Anthropic 想卖的不只是模型了,而是 Agent。这是一个巨大的市场,定价逻辑将从按 Token 计费彻底转向。)

这才是今天这条新闻真正值得关注的地方。

过去几年,大模型公司的商业模式基本一致:训练模型,开放 API,按 Token 收费。你调一次接口,我收一次钱。本质上是卖原材料

问题是,原材料生意有天花板。Token 价格一直在降,各家互相打价格战,利润空间越来越薄。光靠卖 API 调用,撑不起 Anthropic 那 615 亿美金的估值。

Managed Agents 代表了一种新的思路:不只卖模型调用,而是卖完整的 Agent 运行服务

你不再需要自己搭沙箱、管状态、处理凭证、写容错逻辑。Anthropic 把这些全做了,你按 Agent 任务付费。这就像云计算的演进路径:先卖虚拟机(EC2),再卖托管服务(Lambda)。现在 Anthropic 要做的,就是 Agent 领域的 Lambda。

这个转变的商业价值显而易见。Agent 服务的客单价远高于裸 API 调用,而且客户粘性更强。一旦企业把业务流程构建在你的 Agent 平台上,迁移成本极高。


Anthropic 官方发推时用了一个很有意思的说法:

"Building Managed Agents meant solving an old problem in computing: how to design a system for 'programs as yet unthought of.'"

(构建 Managed Agents 意味着解决计算领域的一个老问题:如何为"尚未被想到的程序"设计系统。)

这句话信息量很大。传统软件部署,你知道程序要干什么,提前分配好资源就行。但 Agent 不一样,它的行为是动态的、不可预测的。你不知道它会调用哪些工具,会运行多久,会消耗多少资源。

Anthropic 工程团队给出的解法是把 Agent 拆成三个独立的层

大脑层:Claude 模型加上 Harness(执行框架),负责思考和决策。它不关心工具在哪里运行,只管发出指令。

执行层:沙箱容器、MCP 服务器、外部 API,所有"干活的"都在这里。一个 Agent 可以同时操控多个执行环境,就像一个人同时操作多台电脑。

记忆层:独立的事件流存储,记录 Agent 做过的每一步。跟大脑和执行层完全解耦,任何一个组件挂了,记忆都不会丢失。

这个设计最精妙的地方在于:三层可以独立扩展。大脑层是无状态的,随时可以水平扩容;执行层按需分配,不用的时候不占资源;记忆层持久化存储,支持随时回溯。

实测数据也证明了这个架构的威力。Anthropic 给出的数字是:**首 Token 响应延迟 p50 下降 60%,p95 下降超过 90%**。在生产环境中,这个级别的性能提升意味着用户体验的质变。


从 Anthropic 公布的界面截图来看,Managed Agents 提供了一套模板化的创建流程。进入平台后,你会看到一个"What do you want to build?"的引导页面,预置了多种 Agent 模板:

  • Deep research:多步骤的网络研究与信息综合,自动整理来源

  • RAG retrieval:从向量数据库或文档集合中检索相关内容

  • Structured extraction:从非结构化数据中提取符合预定义 schema 的信息

  • Intent router:根据用户意图分类并路由到合适的子 Agent

  • Draft generator:生成结构化初稿,邮件、文档、报告都行

  • Reflection loop:对产出进行迭代式自我评估和优化

  • Task planner:把大目标分解为有序的子任务列表

  • Summarizer:长文档压缩和历史对话摘要

你也可以从空白开始构建,上传已有的文档作为上下文,添加子 Agent,或者让 Claude 通过对话帮你设计 Agent 结构。

这些模板覆盖了企业场景中最常见的 Agent 用途。对于大多数团队来说,选一个模板改改参数就能上线,真正实现了"几天内从原型到生产"。


做企业级产品,安全是绕不过去的话题。Managed Agents 在这方面下了不少功夫。

最核心的原则是:所有凭证都存储在沙箱之外的安全保险库中

比如 Git 集成场景,仓库令牌在沙箱初始化时注入到本地 git remote 配置中,Agent 在沙箱内执行 git 操作时不需要直接接触令牌。MCP 工具的 OAuth 令牌也是类似的机制,通过专用的安全通道注入。

这意味着即使攻击者通过提示注入获得了沙箱内的代码执行权限,也拿不到任何真实的凭证信息。对于那些需要 Agent 访问内部系统的企业来说,这个设计是选择托管平台而非自建方案的重要理由。


Managed Agents 不是一个刚做出来就发布的产品,Anthropic 已经跟一批企业客户做了深度合作:

Notion 把它集成到了自定义 Agent 功能中,支持并行运行几十个任务,涵盖代码交付和内容生成。

Rakuten(乐天) 用了不到一周就部署了覆盖五个部门的企业级 Agent,接入了 Slack 和 Teams。

Asana 基于它构建了"AI 队友",直接在项目管理流程中与人类协作。

Sentry 用调试 Agent 加补丁 Agent 的组合,实现了从 bug 发现到 PR 提交的全自动化流水线。

这些案例有一个共同特点:部署周期极短。传统方案搭建同等能力的 Agent 系统需要几个月,这里缩短到了几天到几周。


回过头来看 Anthropic 最近的动作,脉络越来越清晰了。

上个月发布 Claude Opus 4.6,把模型能力拉到顶;前几天封杀第三方 Harness 对消费者 auth 的调用,清理了灰色地带;现在推出 Managed Agents,给出官方的生产级方案。

每一步都在指向同一个方向:Anthropic 正在从模型公司转型为 Agent 平台公司

OpenAI 有 Assistants API 和 GPT Store,Google 有 Vertex AI Agent Builder。但 Anthropic 的路径更激进,它不是在现有平台上加一个 Agent 功能,而是把整个 Agent 运行时都托管了。

对开发者来说,这是好事。基础设施的复杂度被平台吸收了,你可以把精力放在 Agent 的业务逻辑上。

但对于 Agent 编排领域的创业公司来说,日子会越来越难过。当模型供应商自己提供了从模型到运行时到基础设施的全栈方案,中间层的价值就被大幅压缩了。

Managed Agents 目前还在公开测试阶段,多 Agent 协调和自评估功能需要申请研究预览权限。产品离完全成熟还有距离,但方向已经不可逆了。

AI 行业的下半场,不再是比谁的模型更聪明,而是比谁能让 Agent 更快、更稳地跑在生产环境里。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐