Claude 官方 Harness 发布——从 LLM 到 Agent 一次理清 AI 设施概念层次

摘要：Harness是Anthropic推出的托管智能体运行框架，它重新定义了AI应用开发方式。作为连接LLM与现实世界的"操作系统"，Harness解决了传统Agent开发中80%的基础设施构建难题，包括工具调用、状态管理、异常处理等。系统包含四大核心概念：Agent（配置定义）、Environment（运行容器）、Session（任务实例）和Events（通信单元）。通过与

人工智能研究所

458人浏览 · 2026-04-17 08:00:00

人工智能研究所 · 2026-04-17 08:00:00 发布

导读：

什么是 Harness？重新定义"脚手架"

Claude Managed Agents：托管运行时全貌

四大核心概念：Agent / Environment / Session / Events

MCP 是什么，与 Harness 如何协作

LLM、Agent、Harness、MCP 的层次关系

架构总览与选型建议

什么是 Harness？

Harness = 让 AI 变成 Agent 的“操作系统”
以前 AI 只是一个“会思考的大脑”，
现在 Harness 给了它“身体 + 工具 + 行动能力”。

这里的 Harness，本质上是一个预构建的 Agent 运行框架，它解决的是一个经典工程问题：

当你把一个 LLM 接入现实世界的工具链时，你需要大量胶水代码——循环调用模型、解析工具调用请求、执行工具、把结果反馈给模型、处理超时、管理上下文长度……这些"样板代码"合在一起，就叫做 Agent Loop（智能体循环）。

Harness 就是这个 Agent Loop 的封装与托管版本。你不再需要手写这套循环，Anthropic 已经替你写好了、优化好了、并运行在他们的云基础设施上。

为什么会出现 Harness？

我们先看一个现实问题。

如果你自己做过 Agent（比如 AutoGPT、LangChain），你一定会踩这些坑：

要自己写 agent loop（思考 → 行动 → 再思考）
要处理 tool calling
要搞执行环境（跑代码、调用 API）
要管理 memory / session
还要处理异常、重试、状态恢复

最后的结果是：

80% 时间在写“基础设施”，
20% 才是在做真正的业务逻辑。

这就是问题所在。

用一个类比理解 Harness

想象你要驾驭一匹烈马：马本身是 LLM，强大但难以直接使用。马具（Harness）是连接骑手与马的工程系统——缰绳、鞍具、踏镫。它不是马，也不是骑手，而是让两者能够协同工作的控制层与运行框架。

在 Managed Agents 的语境下，Harness 具体包含：

自动管理多轮对话的上下文窗口（含 Compaction 压缩）
内置 Prompt Caching 减少延迟和 Token 开销
工具调用的解析与执行循环
运行于隔离容器中的安全沙箱
支持长时任务的异步执行与 SSE 事件流
对话历史的服务端持久

Claude Managed Agents 全貌

Anthropic 为开发者提供了两条路径来使用 Claude：

维度 MESSAGES API CLAUDE MANAGED AGENTS
本质 直接调用模型推理 预构建 Agent Harness + 托管基础设施
适合场景 自定义 Agent 循环、精细控制 长时任务、异步工作、自主执行
工具执行 由你的代码负责 Harness 自动处理
基础设施 你自己管理 Anthropic 托管容器
状态持久化 你自己实现 Session 自动持久化

简而言之：Messages API 给你"零件"，Managed Agents 给你"成品车间"。前者灵活，后者开箱即用。

四大核心概念

AGENT智能体定义：

模型 + 系统提示 + 工具集 + MCP 服务器 + Skills 的配置集合。创建一次，通过 ID 复用于多个 Session。

ENVIRONMENT 运行环境：

预装软件包（Python / Node / Go）、网络访问规则、挂载文件的云容器模板。

SESSION 执行会话：

Agent + Environment 的运行实例，对应具体任务，产生输出结果，拥有持久化的对话历史。

EVENTS 事件流：

应用与 Agent 之间的通信单元：用户消息、工具结果、状态更新，通过 SSE 实时推送。

工作流程

定义 Agent：配置模型、系统提示、可用工具、MCP 服务器和 Skills，获得 Agent ID。
创建 Environment：选择预装软件包、网络规则（允许哪些域名）、预挂载哪些文件。
启动 Session：引用 Agent + Environment，启动隔离容器，Claude 开始在其中工作。
发送 Events / 流式接收结果：向 Session 发送用户消息，Claude 自主调用工具并通过 SSE 流式返回执行结果。
干预或中断：可随时发送新 Event 引导执行方向，或完全中断任务。

MCP 是什么？与 Harness 如何协作

MCP（Model Context Protocol）是 Anthropic 提出的一个开放协议，用于标准化 LLM 与外部工具/数据源之间的通信格式。它解决的核心问题是：如何让不同厂商的工具被不同 AI 模型以统一方式调用？

MCP 本身不是运行环境，也不是 Agent，它更像是工具接入的 USB 标准——定义了插头和插座的形状，让任何符合规范的工具都能被接入。

类比：MCP 是"电源插座标准"，Harness 是"电网基础设施"，LLM 是"用电设备"。插座标准决定设备如何接入，电网决定电怎么来，设备决定能做什么。

在 Managed Agents 中，MCP 服务器作为 Agent 的一项配置被声明，Harness 负责在执行时调用对应的 MCP 端点并把结果反馈给 Claude。两者是配置关系而非竞争关系：MCP 扩展了 Agent 能调用的工具范围，Harness 负责实际的调用执行。

Harness 做了什么？

Claude 的 Managed Agents 直接给你一个“现成的 Agent 系统”。

你不用再自己拼了，它已经帮你做好了

工具调用（Tools）AI 可以直接：

执行 Bash 命令
读写文件
调用外部工具
接入 MCP 工具生态

执行环境（Sandbox）

云端隔离环境（类似容器）
可以安全运行代码
有权限控制

长时间运行能力

传统 AI：一问一答，秒级结束
现在：
可以跑几分钟甚至更久
支持多步骤任务
从“聊天工具” → “任务执行器”

记忆 & 状态管理

自动记录执行过程
支持中断 / 恢复
有持续上下文

自动优化（隐藏但关键）

prompt caching
上下文压缩
性能优化

LLM、Agent、Harness、MCP 的层次关系

这四个概念常常被混用，但它们处于完全不同的抽象层次：

概念 层次 核心职责 类比
LLM 大语言模型 认知层 理解语言、推理、生成文本 大脑
Agent 智能体 行为层 感知-决策-行动的闭环主体 完整的工作者
Harness 运行框架 基础设施层 管理 Agent Loop、工具执行、状态持久化 办公室 + 设备
MCP 协议 通信层 规范工具接入的数据格式与交互标准 通用接口规范

一句话总结：LLM 是能力的来源，Agent 是行为的主体，Harness 是运行的场所，MCP 是工具接入的语言。四者层层叠加，构成一个完整的 AI 自主执行系统。

架构总览与选型建议

基于以上分析，以下是选择架构路径时的参考：

选择 Messages API（自建 Harness）的情形：

对 Agent 循环有极度精细的控制需求（自定义重试、日志、监控）
已有成熟的工具执行基础设施不想迁移
任务轻量，单次对话即可完成

选择 Claude Managed Agents（内置 Harness）的情形：

任务需要运行数分钟乃至数小时，涉及大量工具调用
希望快速上线，不想维护沙箱和 Agent Loop 代码
需要安全隔离的代码执行环境
任务天然是异步的（如后台数据处理、自动化报告生成）

目前 Claude Managed Agents 处于 Beta 阶段，所有请求需携带 managed-agents-2026-04-01 Beta Header。Outcomes、多 Agent 协同、Memory 等功能为 Research Preview，需要单独申请访问权限。

Harness 的概念，不只属于 Anthropic 的产品术语——它代表了整个 AI 工程领域正在发生的一次重要演进：从"我用 API 调一个模型"，到"我部署一套有自主执行能力的托管智能体系统"。

理解这一层次结构，是构建下一代 AI 应用的基础认知。Harness 不是一个工具，而是 AI 进入“能执行任务时代”的底层基础设施。

更多transformer，VIT，swin tranformer
参考头条号：人工智能研究所
v号：人工智能研究Suo, 启示AI科技

动画详解transformer 在线视频教程

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

Agent 工具权限失控：从 PRD 清单到生产事故的工程复盘

DeepSeek技术社区

Golden set 评测：为什么跨模型指标可能误导你的技术选型

DeepSeek技术社区

DeepSeek 路由策略下的 A/B 测试设计：用户分层与会话一致性的工程权衡

DeepSeek技术社区

所有评论(0)

查看更多评论

人工智能研究所

@weixin_44782294

已为社区贡献13条内容

Claude 官方 Harness 发布——从 LLM 到 Agent 一次理清 AI 设施概念层次

人工智能研究所

什么是 Harness？

为什么会出现 Harness？

Claude Managed Agents 全貌

四大核心概念

工作流程

MCP 是什么？与 Harness 如何协作

Harness 做了什么？

LLM、Agent、Harness、MCP 的层次关系

架构总览与选型建议

所有评论(0)

温馨提示：您尚未绑定手机号

人工智能研究所