今天我们深挖 Claude Code 源码解读第四弹:上下文管理与压缩 🧠。

只要做过长对话 AI、多轮 Agent、金融投研助手,一定被Token 不够用、上下文溢出、对话断掉折磨过。Claude Code 直接给出了工业级标准答案—— 四层压缩,从轻到重,让对话永远不崩👇


一、先讲痛点:上下文窗口到底有多脆?💥

大模型都有 “短期记忆上限”,Claude 约 20 万 Token,看起来很大,实则非常容易爆:

  • 读几篇财报 → 占掉 5 万
  • 查一波行情 → 占掉 3 万
  • 跑几轮工具 → 占掉 10 万
  • 再聊几句 → 直接超限报错

普通 AI:爆了就崩,对话作废 ❌Claude Code:自动压缩,无限续杯


二、四层压缩机制:从轻到重,层层守护🛡️

Claude Code 设计了4 级递进压缩,不到万不得已,不用最强力手段,体验丝滑到极致。

1️⃣ 第一层:工具结果预算(最轻、最快)⚡

专门解决:单个工具返回内容太大

  • 行情、日志、文件内容动辄上万行
  • 直接塞进上下文必爆

做法:

  • 给每个工具设 maxResultSizeChars 上限
  • 超出部分写入磁盘 / 数据库
  • 对话里只保留:摘要 + 文件路径
  • AI 想看完整内容再去读取

一句话:超大结果不占内存,存起来用指针引用。


2️⃣ 第二层:MicroCompact 微压缩🧹

专门解决:旧工具结果没用了还占位置

  • AI 已经用过的工具返回,几轮后根本不会再看
  • 但它们还死占上下文空间

做法:

  • 纯机械操作,不调用 AI
  • 把旧工具结果替换成:[Old tool result content cleared]
  • 速度极快、零成本、不破坏对话

一句话:用完就清,轻量瘦身。


3️⃣ 第三层:AutoCompact 自动全量压缩(核心最强)🔥

触发条件:上下文快到极限(阈值严格计算)

plaintext

有效窗口 = 总窗口 - 输出预留空间(2万)
压缩阈值 = 有效窗口 - 安全缓冲(1.3万)

做法:调用 AI 生成9 章节结构化摘要,把几百轮对话浓缩成一段:

  1. 用户主要请求与目标
  2. 关键技术 / 业务概念
  3. 涉及文件 / 数据 / 标的
  4. 遇到的错误与修复
  5. 任务执行过程
  6. 用户原始消息
  7. 待完成任务
  8. 进行中工作
  9. 下一步计划

压缩后:

  • 旧消息全部替换
  • 只保留摘要 + 最近几轮原文
  • AI 无感知继续干活

一句话:把一本书变成一页大纲。


4️⃣ 第四层:PartialCompact 局部压缩✂️

场景:前面内容不重要了,但最近几轮必须保留原文

做法:

  • 只压缩早期内容
  • 最近 N 轮完整保留
  • 拼接成:摘要 + 最新原文
  • 细节不丢,体积大减

一句话:保留关键近期记忆,压缩老旧记忆。


三、压缩提示词为什么这么 “凶”?⚠️

你去看源码会发现:压缩提示词超级强硬

plaintext

CRITICAL: 只输出文字!不许调用任何工具!
Do NOT use Read/Bash/Grep/Edit!
Tool calls will be REJECTED!
You have only ONE turn!

很多人疑惑:为啥不直接开个不带工具的模型?

答案只有两个字:** 缓存!**💰

真相在这里:

  1. 压缩必须复用主 Agent 的系统提示词
  2. 必须带完全一样的工具列表
  3. 才能命中 Prompt Cache,几万 Token 几乎免费
  4. Sonnet 4.6 自主思考太强,忍不住调用工具
  5. 压缩是单轮调用,一调用工具直接失败

所以:用最强提示词约束,换最高缓存性价比。这是大厂才懂的工程权衡 ✅


四、两个神级配套机制:记忆 + 恢复🧩

1️⃣ 会话记忆(Session Memory)🧠

  • 自动提取用户偏好、规则、关键事实
  • 存入独立文件
  • 对话被压缩了,关键记忆还在
  • 下次会话自动注入

2️⃣ 压缩后文件恢复(Post-Compact Restore)📄

  • 压缩完后,AI 容易 “忘记刚才在看什么”
  • 系统自动重新注入最近 5 个最重要文件
  • 每个最多 5000 Token
  • 让 AI 无缝继续工作

五、金融场景必抄:这套压缩直接救命📈

金融场景上下文压力比代码场景大 10 倍

  • 行情 K 线、逐笔数据
  • 财报 PDF、年报原文
  • 历史持仓、交易记录
  • 多轮分析、策略推演

直接照搬 3 条:

  1. 工具结果预算:行情 / 财报大数据存库,只传摘要 + ID
  2. 结构化摘要:按固定 9 章节总结投研内容
  3. 会话记忆:保存用户风险偏好、常用标的、投资风格

用上这套,你的金融 Agent能聊一整天不崩


六、本章总结✨

Claude Code 上下文压缩,是长对话 Agent 的基建天花板

  • 四层递进:轻→重,体验最优
  • 缓存优先:成本压到最低
  • 强约束提示词:保证压缩稳定执行
  • 记忆 + 恢复:AI 永远不 “断片”

一句话总结:不会压缩的 Agent,只能玩 demo;会压缩的 Agent,才能商用落地。Claude Code 把长对话做到了真正工业化 🔥


下一篇讲解:MCP 工具集成 ——AI 即插即用的 USB 标准

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐