想象一下,你脑子里冒出一个超级实用的AI想法——比如让它自动帮你监控代码、修复bug、或者每天把销售数据拉进来分析完直接生成报告。

以前呢?光是搭服务器、管状态、处理错误重试、扩容监控这些破事,就能把你折腾几个月。在这里插入图片描述

现在Anthropic直接甩出Claude Managed Agents(公测刚上线一天),把最头疼的基础设施全打包好了。你就负责告诉它“想干啥”,剩下的事它云端全管,几天就能从原型冲到真正能扛大规模生产的代理。听起来像做梦?
今天咱们就聊聊怎么上手用,一步步、实打实讲清楚,绝不云里雾里。
在这里插入图片描述

Claude Managed Agents 到底啥玩意儿?

一句话:Anthropic给你现成的“生产级AI代理托管工厂”。它把Claude当大脑,再配上预调优的agent骨架(harness)和全托管的基础设施(沙箱、会话、工具执行),你不用自己写循环、管容器、愁状态持久化,直接API调用就行。

不是普通的聊天API,也不是让你自己从零搭agent loop的SDK,而是专门干“长任务、异步、自主执行”这种重活的托管服务。

官方对比超清楚:

项目 Messages API(普通聊天) Claude Managed Agents(托管代理)
适合场景 简单对话、一次性任务 长时序自主任务、需要持久运行
你要自己搞 全部(循环、状态、错误处理) 几乎不用,只定义规则和环境
上线速度 自己扛基础设施 几天就生产级

核心四个东西(记住就行)

  1. Agent(代理):你定义好用哪个Claude模型、系统提示、能用哪些工具。一次建好,后面反复调用,还能版本管理。
  2. Environment(环境):云端沙箱容器,预装Python/Node/Go,支持文件、网络规则,完全隔离安全。
  3. Session(会话):真正跑起来的实例,带持久化文件系统和完整事件历史,能跑好几天不掉线。
  4. Events(事件):所有交互记录(你发消息、工具结果、Claude思考),全存在服务器端,随时拉历史、不怕上下文爆。

技术上为啥牛?

Anthropic把代理拆成“大脑”(Claude+harness)和“手脚”(沙箱+工具),完全解耦。Session是追加日志,不塞进Claude上下文;Harness自动管循环、重试、扩容;沙箱里就算Claude被prompt injection,也拿不到真实密钥。结果:首次响应快了60%以上,安全性拉满,坏了直接重启,不用你手动救火。

内置工具超实用:Bash命令、文件读写编辑、Web搜索、MCP外部工具对接,还支持prompt缓存、自动压缩上下文。
在这里插入图片描述

怎么用?超具体上手指南

公测期所有Claude Platform账户默认开通,零门槛
分两种玩法:
控制台点点点(适合小白试水),或者API/SDK(推荐生产用)。

前置准备(2分钟搞定)
  • Claude Platform 登录/注册账号,拿到API Key。
  • 在请求里加 beta header:anthropic-beta: managed-agents-2026-04-01(官方Python/TypeScript SDK会自动帮你加)。
  • 安装SDK(推荐):
    pip install anthropic   # Python
    # 或者 npm install @anthropic-ai/sdk  # TypeScript
    
完整上手流程(5步)
  1. 创建Agent(定义大脑)
    在控制台点“Managed Agents” → “Create Agent”,或者API调用:

    • 指定模型(claude-opus-4.5 或 sonnet-4.5都行)
    • 写系统提示(比如“你是一个代码审查专家,遇到bug就自动修复”)
    • 勾选可用工具(Bash、文件操作、Web搜索等)
  2. 创建Environment(准备手脚)
    控制台新建环境模板,选择运行时(Python/Node),设置CPU/内存、网络权限、挂载目录。安全沙箱自动隔离。

  3. 启动Session(让它真正跑起来)
    API示例(Python,伪代码风格,实际复制就能跑):

    import anthropic
    client = anthropic.Anthropic(api_key="你的key")
    
    # 启动会话
    session = client.managed_agents.sessions.create(
        agent_id="你的agent-id",
        environment_id="你的env-id",
        initial_prompt="开始帮我审查这个GitHub仓库的PR,找到bug就直接改代码并提PR"
    )
    print("Session启动了!ID是:", session.id)
    
  4. 通过SSE流式接收事件 + 让它干活
    Claude会自动思考、调用工具,你用Server-Sent Events实时监听:

    for event in client.managed_agents.sessions.stream(session.id):
        if event.type == "tool_call":
            print("它正在执行工具:", event.tool_name)
        elif event.type == "message":
            print("Claude说:", event.content)
    

    它跑着跑着遇到工具结果会自动继续,你中途还能发新事件“插话”干预(比如client.managed_agents.sessions.send_event(session.id, {"type": "user_message", "content": "暂停一下,先检查安全漏洞"}))。

  5. 监控、中断、继续

    • 随时用get_events()拉完整历史。
    • 想停就中断,想恢复直接wake session。
    • 生产环境建议用WebSocket长连接,事件全持久化。

小贴士(真实开发者踩过的坑):

  • 先用控制台点点点测试,别一上来就写代码。
  • Session可以跑很久,但别让它无限循环,加个max_turns限制。
  • 工具权限要谨慎,沙箱里密钥永远不暴露。
  • 公测速率:创建操作60次/分钟,读取600次/分钟,够用了。

几行代码+几次点击,代理就上线了。官方说很多企业从原型到生产就花了2-3天。

定价 & 注意事项(公测期)

在这里插入图片描述

  • 按Tokens(正常模型价)+ Session运行时长收费。
  • 部分高级功能(如多代理协作)还在申请预览。
  • 对外只能叫“Claude Agent”或“Powered by Claude”。
    在这里插入图片描述

想看完整文档:

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐