导读:

什么是 Harness?重新定义"脚手架"

Claude Managed Agents:托管运行时全貌

四大核心概念:Agent / Environment / Session / Events

MCP 是什么,与 Harness 如何协作

LLM、Agent、Harness、MCP 的层次关系

架构总览与选型建议

什么是 Harness?

Harness = 让 AI 变成 Agent 的“操作系统”
以前 AI 只是一个“会思考的大脑”,
现在 Harness 给了它“身体 + 工具 + 行动能力”。

这里的 Harness,本质上是一个预构建的 Agent 运行框架,它解决的是一个经典工程问题:

当你把一个 LLM 接入现实世界的工具链时,你需要大量胶水代码——循环调用模型、解析工具调用请求、执行工具、把结果反馈给模型、处理超时、管理上下文长度……这些"样板代码"合在一起,就叫做 Agent Loop(智能体循环)。

Harness 就是这个 Agent Loop 的封装与托管版本。你不再需要手写这套循环,Anthropic 已经替你写好了、优化好了、并运行在他们的云基础设施上。

图片

为什么会出现 Harness?

我们先看一个现实问题。

如果你自己做过 Agent(比如 AutoGPT、LangChain),你一定会踩这些坑:

  • 要自己写 agent loop(思考 → 行动 → 再思考)

  • 要处理 tool calling

  • 要搞执行环境(跑代码、调用 API)

  • 要管理 memory / session

  • 还要处理异常、重试、状态恢复

最后的结果是:

  • 80% 时间在写“基础设施”,

  • 20% 才是在做真正的业务逻辑。

这就是问题所在。

用一个类比理解 Harness

想象你要驾驭一匹烈马:马本身是 LLM,强大但难以直接使用。马具(Harness)是连接骑手与马的工程系统——缰绳、鞍具、踏镫。它不是马,也不是骑手,而是让两者能够协同工作的控制层与运行框架。

在 Managed Agents 的语境下,Harness 具体包含:

  1. 自动管理多轮对话的 上下文窗口(含 Compaction 压缩)

  2. 内置 Prompt Caching 减少延迟和 Token 开销

  3. 工具调用的解析与执行循环

  4. 运行于隔离容器中的安全沙箱

  5. 支持长时任务的异步执行与 SSE 事件流

  6. 对话历史的服务端持久

图片

Claude Managed Agents 全貌

Anthropic 为开发者提供了两条路径来使用 Claude:

维度 MESSAGES API CLAUDE MANAGED AGENTS
本质 直接调用模型推理 预构建 Agent Harness + 托管基础设施
适合场景 自定义 Agent 循环、精细控制 长时任务、异步工作、自主执行
工具执行 由你的代码负责 Harness 自动处理
基础设施 你自己管理 Anthropic 托管容器
状态持久化 你自己实现 Session 自动持久化

简而言之:Messages API 给你"零件",Managed Agents 给你"成品车间"。前者灵活,后者开箱即用。

四大核心概念

AGENT智能体定义:

模型 + 系统提示 + 工具集 + MCP 服务器 + Skills 的配置集合。创建一次,通过 ID 复用于多个 Session。

ENVIRONMENT 运行环境:

预装软件包(Python / Node / Go)、网络访问规则、挂载文件的云容器模板。

SESSION 执行会话:

Agent + Environment 的运行实例,对应具体任务,产生输出结果,拥有持久化的对话历史。

EVENTS 事件流:

应用与 Agent 之间的通信单元:用户消息、工具结果、状态更新,通过 SSE 实时推送。

工作流程

  • 定义 Agent:配置模型、系统提示、可用工具、MCP 服务器和 Skills,获得 Agent ID。

  • 创建 Environment:选择预装软件包、网络规则(允许哪些域名)、预挂载哪些文件。

  • 启动 Session:引用 Agent + Environment,启动隔离容器,Claude 开始在其中工作。

  • 发送 Events / 流式接收结果:向 Session 发送用户消息,Claude 自主调用工具并通过 SSE 流式返回执行结果。

  • 干预或中断:可随时发送新 Event 引导执行方向,或完全中断任务。

图片

MCP 是什么?与 Harness 如何协作

MCP(Model Context Protocol)是 Anthropic 提出的一个开放协议,用于标准化 LLM 与外部工具/数据源之间的通信格式。它解决的核心问题是:如何让不同厂商的工具被不同 AI 模型以统一方式调用?

MCP 本身不是运行环境,也不是 Agent,它更像是工具接入的 USB 标准——定义了插头和插座的形状,让任何符合规范的工具都能被接入。

类比:MCP 是"电源插座标准",Harness 是"电网基础设施",LLM 是"用电设备"。插座标准决定设备如何接入,电网决定电怎么来,设备决定能做什么。

在 Managed Agents 中,MCP 服务器作为 Agent 的一项配置被声明,Harness 负责在执行时调用对应的 MCP 端点并把结果反馈给 Claude。两者是配置关系而非竞争关系:MCP 扩展了 Agent 能调用的工具范围,Harness 负责实际的调用执行。

Harness 做了什么?

Claude 的 Managed Agents 直接给你一个“现成的 Agent 系统”。

你不用再自己拼了,它已经帮你做好了

工具调用(Tools)AI 可以直接:

执行 Bash 命令
读写文件
调用外部工具
接入 MCP 工具生态

执行环境(Sandbox)

云端隔离环境(类似容器)
可以安全运行代码
有权限控制

长时间运行能力

传统 AI:一问一答,秒级结束
现在:
可以跑几分钟甚至更久
支持多步骤任务
从“聊天工具” → “任务执行器”

记忆 & 状态管理

自动记录执行过程
支持中断 / 恢复
有持续上下文

自动优化(隐藏但关键)

prompt caching
上下文压缩
性能优化

图片

LLM、Agent、Harness、MCP 的层次关系

这四个概念常常被混用,但它们处于完全不同的抽象层次:

概念 层次 核心职责 类比
LLM 大语言模型 认知层 理解语言、推理、生成文本 大脑
Agent 智能体 行为层 感知-决策-行动的闭环主体 完整的工作者
Harness 运行框架 基础设施层 管理 Agent Loop、工具执行、状态持久化 办公室 + 设备
MCP 协议 通信层 规范工具接入的数据格式与交互标准 通用接口规范

一句话总结:LLM 是能力的来源,Agent 是行为的主体,Harness 是运行的场所,MCP 是工具接入的语言。四者层层叠加,构成一个完整的 AI 自主执行系统。

架构总览与选型建议

基于以上分析,以下是选择架构路径时的参考:

选择 Messages API(自建 Harness) 的情形:

  • 对 Agent 循环有极度精细的控制需求(自定义重试、日志、监控)

  • 已有成熟的工具执行基础设施不想迁移

  • 任务轻量,单次对话即可完成

选择 Claude Managed Agents(内置 Harness) 的情形:

  • 任务需要运行数分钟乃至数小时,涉及大量工具调用

  • 希望快速上线,不想维护沙箱和 Agent Loop 代码

  • 需要安全隔离的代码执行环境

  • 任务天然是异步的(如后台数据处理、自动化报告生成)

目前 Claude Managed Agents 处于 Beta 阶段,所有请求需携带 managed-agents-2026-04-01 Beta Header。Outcomes、多 Agent 协同、Memory 等功能为 Research Preview,需要单独申请访问权限。

Harness 的概念,不只属于 Anthropic 的产品术语——它代表了整个 AI 工程领域正在发生的一次重要演进:从"我用 API 调一个模型",到"我部署一套有自主执行能力的托管智能体系统"。

理解这一层次结构,是构建下一代 AI 应用的基础认知。Harness 不是一个工具,而是 AI 进入“能执行任务时代”的底层基础设施。

更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:人工智能研究Suo, 启示AI科技

 动画详解transformer  在线视频教程 

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐