Claude 官方 Harness 发布——从 LLM 到 Agent 一次理清 AI 设施概念层次
摘要:Harness是Anthropic推出的托管智能体运行框架,它重新定义了AI应用开发方式。作为连接LLM与现实世界的"操作系统",Harness解决了传统Agent开发中80%的基础设施构建难题,包括工具调用、状态管理、异常处理等。系统包含四大核心概念:Agent(配置定义)、Environment(运行容器)、Session(任务实例)和Events(通信单元)。通过与
导读:
什么是 Harness?重新定义"脚手架"
Claude Managed Agents:托管运行时全貌
四大核心概念:Agent / Environment / Session / Events
MCP 是什么,与 Harness 如何协作
LLM、Agent、Harness、MCP 的层次关系
架构总览与选型建议
什么是 Harness?
Harness = 让 AI 变成 Agent 的“操作系统”
以前 AI 只是一个“会思考的大脑”,
现在 Harness 给了它“身体 + 工具 + 行动能力”。
这里的 Harness,本质上是一个预构建的 Agent 运行框架,它解决的是一个经典工程问题:
当你把一个 LLM 接入现实世界的工具链时,你需要大量胶水代码——循环调用模型、解析工具调用请求、执行工具、把结果反馈给模型、处理超时、管理上下文长度……这些"样板代码"合在一起,就叫做 Agent Loop(智能体循环)。
Harness 就是这个 Agent Loop 的封装与托管版本。你不再需要手写这套循环,Anthropic 已经替你写好了、优化好了、并运行在他们的云基础设施上。

为什么会出现 Harness?
我们先看一个现实问题。
如果你自己做过 Agent(比如 AutoGPT、LangChain),你一定会踩这些坑:
-
要自己写 agent loop(思考 → 行动 → 再思考)
-
要处理 tool calling
-
要搞执行环境(跑代码、调用 API)
-
要管理 memory / session
-
还要处理异常、重试、状态恢复
最后的结果是:
-
80% 时间在写“基础设施”,
-
20% 才是在做真正的业务逻辑。
这就是问题所在。
用一个类比理解 Harness
想象你要驾驭一匹烈马:马本身是 LLM,强大但难以直接使用。马具(Harness)是连接骑手与马的工程系统——缰绳、鞍具、踏镫。它不是马,也不是骑手,而是让两者能够协同工作的控制层与运行框架。
在 Managed Agents 的语境下,Harness 具体包含:
-
自动管理多轮对话的 上下文窗口(含 Compaction 压缩)
-
内置 Prompt Caching 减少延迟和 Token 开销
-
工具调用的解析与执行循环
-
运行于隔离容器中的安全沙箱
-
支持长时任务的异步执行与 SSE 事件流
-
对话历史的服务端持久

Claude Managed Agents 全貌
Anthropic 为开发者提供了两条路径来使用 Claude:
维度 MESSAGES API CLAUDE MANAGED AGENTS 本质 直接调用模型推理 预构建 Agent Harness + 托管基础设施 适合场景 自定义 Agent 循环、精细控制 长时任务、异步工作、自主执行 工具执行 由你的代码负责 Harness 自动处理 基础设施 你自己管理 Anthropic 托管容器 状态持久化 你自己实现 Session 自动持久化
简而言之:Messages API 给你"零件",Managed Agents 给你"成品车间"。前者灵活,后者开箱即用。
四大核心概念
AGENT智能体定义:
模型 + 系统提示 + 工具集 + MCP 服务器 + Skills 的配置集合。创建一次,通过 ID 复用于多个 Session。
ENVIRONMENT 运行环境:
预装软件包(Python / Node / Go)、网络访问规则、挂载文件的云容器模板。
SESSION 执行会话:
Agent + Environment 的运行实例,对应具体任务,产生输出结果,拥有持久化的对话历史。
EVENTS 事件流:
应用与 Agent 之间的通信单元:用户消息、工具结果、状态更新,通过 SSE 实时推送。
工作流程
-
定义 Agent:配置模型、系统提示、可用工具、MCP 服务器和 Skills,获得 Agent ID。
-
创建 Environment:选择预装软件包、网络规则(允许哪些域名)、预挂载哪些文件。
-
启动 Session:引用 Agent + Environment,启动隔离容器,Claude 开始在其中工作。
-
发送 Events / 流式接收结果:向 Session 发送用户消息,Claude 自主调用工具并通过 SSE 流式返回执行结果。
-
干预或中断:可随时发送新 Event 引导执行方向,或完全中断任务。

MCP 是什么?与 Harness 如何协作
MCP(Model Context Protocol)是 Anthropic 提出的一个开放协议,用于标准化 LLM 与外部工具/数据源之间的通信格式。它解决的核心问题是:如何让不同厂商的工具被不同 AI 模型以统一方式调用?
MCP 本身不是运行环境,也不是 Agent,它更像是工具接入的 USB 标准——定义了插头和插座的形状,让任何符合规范的工具都能被接入。
类比:MCP 是"电源插座标准",Harness 是"电网基础设施",LLM 是"用电设备"。插座标准决定设备如何接入,电网决定电怎么来,设备决定能做什么。
在 Managed Agents 中,MCP 服务器作为 Agent 的一项配置被声明,Harness 负责在执行时调用对应的 MCP 端点并把结果反馈给 Claude。两者是配置关系而非竞争关系:MCP 扩展了 Agent 能调用的工具范围,Harness 负责实际的调用执行。
Harness 做了什么?
Claude 的 Managed Agents 直接给你一个“现成的 Agent 系统”。
你不用再自己拼了,它已经帮你做好了
工具调用(Tools)AI 可以直接:
执行 Bash 命令 读写文件 调用外部工具 接入 MCP 工具生态
执行环境(Sandbox)
云端隔离环境(类似容器) 可以安全运行代码 有权限控制
长时间运行能力
传统 AI:一问一答,秒级结束 现在: 可以跑几分钟甚至更久 支持多步骤任务 从“聊天工具” → “任务执行器”
记忆 & 状态管理
自动记录执行过程 支持中断 / 恢复 有持续上下文
自动优化(隐藏但关键)
prompt caching 上下文压缩 性能优化

LLM、Agent、Harness、MCP 的层次关系
这四个概念常常被混用,但它们处于完全不同的抽象层次:
概念 层次 核心职责 类比 LLM 大语言模型 认知层 理解语言、推理、生成文本 大脑 Agent 智能体 行为层 感知-决策-行动的闭环主体 完整的工作者 Harness 运行框架 基础设施层 管理 Agent Loop、工具执行、状态持久化 办公室 + 设备 MCP 协议 通信层 规范工具接入的数据格式与交互标准 通用接口规范
一句话总结:LLM 是能力的来源,Agent 是行为的主体,Harness 是运行的场所,MCP 是工具接入的语言。四者层层叠加,构成一个完整的 AI 自主执行系统。
架构总览与选型建议
基于以上分析,以下是选择架构路径时的参考:
选择 Messages API(自建 Harness) 的情形:
-
对 Agent 循环有极度精细的控制需求(自定义重试、日志、监控)
-
已有成熟的工具执行基础设施不想迁移
-
任务轻量,单次对话即可完成
选择 Claude Managed Agents(内置 Harness) 的情形:
-
任务需要运行数分钟乃至数小时,涉及大量工具调用
-
希望快速上线,不想维护沙箱和 Agent Loop 代码
-
需要安全隔离的代码执行环境
-
任务天然是异步的(如后台数据处理、自动化报告生成)
目前 Claude Managed Agents 处于 Beta 阶段,所有请求需携带 managed-agents-2026-04-01 Beta Header。Outcomes、多 Agent 协同、Memory 等功能为 Research Preview,需要单独申请访问权限。
Harness 的概念,不只属于 Anthropic 的产品术语——它代表了整个 AI 工程领域正在发生的一次重要演进:从"我用 API 调一个模型",到"我部署一套有自主执行能力的托管智能体系统"。
理解这一层次结构,是构建下一代 AI 应用的基础认知。Harness 不是一个工具,而是 AI 进入“能执行任务时代”的底层基础设施。
更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:人工智能研究Suo, 启示AI科技
动画详解transformer 在线视频教程


更多推荐



所有评论(0)