在这里插入图片描述
前言:

2026 年,Agent 的竞争已从“提示词工程”全面转向“系统架构设计”。最近 Claude Code 流出的源码细节,为我们揭示了顶级 Agent 如何在长周期、高复杂度的工程任务中,维持逻辑不掉线、成本不爆炸。

以下是拆解出的 6 个核心架构真相。


真号一:AutoDream—— Agent 的“语义蒸馏”与慢波睡眠

【技术原理】

Agent 在运行中会产生大量冗余的 Token(如工具调用的原始输出、重复的确认)。AutoDream 并非简单的删除,而是利用异步的“背景进程”对记忆进行语义蒸馏

【架构描述】

系统会在检测到闲暇(Idle)时触发,将“原始对话”转化为“结构化事实”。

【Mermaid 流程图:AutoDream 记忆固化算法】

Yes

对话流堆积

闲暇时间检测?

启动 AutoDream 实例

Orient: 提取本轮决策关键点

Gather: 识别 3 天以上或失效信息

Consolidate: 语义聚合, 消除逻辑矛盾

Prune: 物理剪枝与持久化

高质量长期记忆库


真相二:不可推导原则(Non-derivable)—— 记忆系统的克制艺术

【技术原理】

生产级 Agent 的记忆系统不应是“垃圾桶”。Claude Code 遵循:凡是可以通过工具(如 ls, cat, git log)实时获取的信息,绝对不存入长期记忆。

【分类逻辑】

  • 可推导(不存):代码目录结构、文件内容、Git 提交历史。

  • 不可推导(必存):用户的审美偏好、对某个 Bug 的特殊修正说明、项目为什么选择方案 A 而非 B 的决策背景。

【Mermaid 思维导图:闭合记忆分类体系】

非可推导记忆

User
编程习惯/角色目标

Feedback
纠正反馈/风格偏好

Project
架构决策/业务逻辑快照

Reference
外部文档/三方库链接

动态推导项: 禁止存储

文件树

运行时日志

Git 变更记录


真相三:六层级联记忆栈——从全局策略到本地微调

【技术原理】

为了平衡“团队规范”与“个人自由”,Claude Code 设计了类似 Linux 权限系统的层级结构。每一层 CLAUDE.md 都会在 Context 组装阶段进行“合并与覆盖”。

【安全性增强】

系统会显式排除 projectSettings 等敏感路径,通过白名单机制防止 Agent 被诱导读取 .ssh.env 文件。

【Mermaid 堆栈图:层级化 Context 注入顺序】

继承范围: 自上而下共享

优先级: 自下而上覆盖

1. 组织全局策略 /CLAUDE.md

2. 项目根目录 ./CLAUDE.md

3. 项目特定规则 .claude/rules/

4. 用户全局配置 ~/.claude/CLAUDE.md

5. 本地覆盖文件 ./CLAUDE.local.md

6. 自动化实例记忆 Auto Memory


真相四:Perfect Forking——利用 Prompt Cache 降本增效

【技术原理】

Agent 需要在后台进行自我总结,但这不能阻塞用户的对话。Perfect Forking 允许系统分叉出一个“只读权限”的 Agent。

【硬核细节】

由于前缀(Prefix)与主进程完全一致,Forked Agent 可以 100% 命中 Prompt Cache(提示词缓存),不仅响应时间缩短至毫秒级,且成本通常只有主请求的 1/10。

【Mermaid 时序图:并发提取与缓存复用】

记忆文件 后台进程 (Forked Agent) KV 提示词缓存 主进程 (Main Agent) 记忆文件 后台进程 (Forked Agent) KV 提示词缓存 主进程 (Main Agent) 触发分叉逻辑 更新索引, 主对话无感知 写入对话上下文 1 完成任务输出 2 读取相同前缀 (Cache Hit!) 3 提取记忆片段 (只读模式) 4 更新 MEMORY.md (限制 25KB) 5

真相五:三级上下文压缩—— Agent 的“熔断”机制

【技术原理】

当对话进入第 100 轮,Token 接近模型上限时,传统的“滑动窗口”会丢失关键信息。Claude Code 采用三级防御:

  1. MicroCompact(微压缩):实时剔除无效工具调用中间结果。

  2. AutoCompact(自动压缩):在预留 13K 缓冲时触发,将历史对话转为摘要。

  3. FullCompact(深度重构):触发熔断,只保留当前任务状态快照,强制清空冗余。

【Mermaid 状态图:上下文压力自适应切换】

Token < 50%

持续监控

清理工具垃圾

Token > 80% (约 20K 消耗)

历史对话摘要化

极高压力 (熔断)

重建状态快照 (50K 预算重置)

Healthy

MicroCompact

AutoCompact

FullCompact


真相六:MCP 协议—— Agent 的标准化“工业接口”

【新增技术点】

在源码中,Claude Code 并不直接操作文件,而是通过 Model Context Protocol (MCP)

【架构意义】

这实现了模型与环境的解耦。Agent 无需知道它是运行在 Windows 还是 Linux,只需向 MCP Server 发送标准请求。这正是构建“可落地 Agent 系统”的精髓所在——用标准化的 Harness(线束)约束 Agent 的行为。

【Mermaid 架构图:基于 MCP 的 Agent 交互模型】

资源层 (Resources)

控制层 (Harness)

智能核心 (Brain)

协议握手

权限受限

实时上报

Claude Model

Claude Code CLI

MCP Client

Local FS Server

GitHub Server

Sentry/Log Server


结语:工程架构是 Agent 的第一生产力

这 51.2 万行代码告诉我们:Agent 的未来不在于你能写出多精妙的 Prompt,而在于你能否构建一个能自我整理记忆、能高效利用缓存、能层级化管理配置的系统架构。

“造好 Harness(系统线束),Agent 才能完成剩下的工作。”

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐