Claude Code是如何管理长MEM的
完整语音输入系统,Push-to-talk模式,音频通过WebSocket流式传输至私有STT端点,支持macOS CoreAudio、Linux ALSA原生捕获,回退至SoX;通过Anthropic API同步配置与记忆,基于时间戳的last-write-wins策略,搭配本地缓存与增量同步,解决冲突问题。的agent团队系统,每个teammate对应JSON邮箱文件,通过读写邮箱通信,文件锁
TL;DR
从session管理角度看
| 层级 | 机制 | 触发时机 | 作用 |
|---|---|---|---|
| 实时提取 | Session Memory | 对话token达到10000后,每增长5000token且满足工具调用条件时 | 总结当前会话关键信息 |
| 跨会话整合 | Auto-Dream | 距上次整理≥24小时,且积累≥5个新会话 | 回顾、合并、修剪记忆文件 |
| 永驻日志 | KAIROS Daily Log | 助手模式下持续运行 | append-only日志+夜间蒸馏 |
从session内的管理角度
Claude Code的记忆分为4种类型:用户偏好(user)、反馈修正(feedback)、项目信息(project)、外部引用(reference)。每种类型有独立的存储文件和触发条件。
AI聊久了token会爆。Claude Code采用9段式结构化记忆术:
- Primary Request and Intent(用户的原始需求)
- All user messages(用户的所有原话——不许遗漏!)
- Key Technical Concepts(关键技术概念)
- Files and Code Sections(文件和代码片段——必须附代码!)
- Errors and fixes(犯了什么错、怎么修的)
- Problem Solving(问题解决过程)
- Pending Tasks(待办事项)
- Current Work(当前进度)
- Optional Next Step(下一步计划)
硬性要求:必须保留代码片段、必须保留用户的所有原话;搭配<analysis>标签作为AI"草稿纸",完成后剥离仅保留<summary>。
以下来自转载内容
从Claude Code源码看Anthropic的产品野心
原创 rumorrumor | 李rumor 2026年4月1日 09:18 北京
卷友们好,我是rumor。
昨天Claude Code ”开源”了,我手速飞快去下载了源码。50万行TypeScript,1900个文件——用AI读完之后我发现,这东西远比表面看到的要野得多。
大量功能被feature flag锁住,编译时直接从npm包里物理删除,你反编译都看不到。但源码一摊开,Anthropic的野心藏不住了:他们不是在做一个编程工具,而是在孵化一个有记忆、能自主行动、会团队协作的AI agent平台。
今天我们就沿着这条演进主线,对源码里的设计进行拆解。
记忆
记忆是整个演进的基石。没有记忆,AI就是一个每次对话都从零开始的陌生人。Claude Code在记忆上的投入远超预期——不是简单的"把对话存下来",而是一套有分类、有提取、有整合、有遗忘的记忆生命周期管理系统。
四类记忆:正面反馈也要记
Claude Code的记忆分为4种类型:用户偏好(user)、反馈修正(feedback)、项目信息(project)、外部引用(reference)。每种类型有独立的存储文件和触发条件。
其中最有意思的设计在feedback类型上。大多数AI系统只记"负反馈",但Claude Code的prompt里明确要求正面反馈也要记:
Record from failure AND success: if you only save corrections, you will avoid past mistakes but drift away from approaches the user has already validated, and may grow overly cautious.
如果只记批评不记表扬,时间长了模型就会趋向保守——不敢做决定、不敢主动行动,事事请示。Prompt还特别提醒:“批评很容易注意到;肯定更安静——要主动留意。”
三层记忆架构
记忆的写入不是一次性的,而是分三层逐步沉淀:
| 层级 | 机制 | 触发时机 | 作用 |
|---|---|---|---|
| 实时提取 | Session Memory | 对话token达到10000后,每增长5000token且满足工具调用条件时 | 总结当前会话关键信息 |
| 跨会话整合 | Auto-Dream | 距上次整理≥24小时,且积累≥5个新会话 | 回顾、合并、修剪记忆文件 |
| 永驻日志 | KAIROS Daily Log | 助手模式下持续运行 | append-only日志+夜间蒸馏 |
Session Memory触发逻辑:对话足够长才总结,基于token增长量更新,需满足工具调用次数或自然停顿条件;提取由专属subagent完成,仅可编辑对应记忆文件。
上下文压缩:有限窗口里的记忆术
AI聊久了token会爆。Claude Code采用9段式结构化记忆术:
- Primary Request and Intent(用户的原始需求)
- Key Technical Concepts(关键技术概念)
- Files and Code Sections(文件和代码片段——必须附代码!)
- Errors and fixes(犯了什么错、怎么修的)
- Problem Solving(问题解决过程)
- All user messages(用户的所有原话——不许遗漏!)
- Pending Tasks(待办事项)
- Current Work(当前进度)
- Optional Next Step(下一步计划)
硬性要求:必须保留代码片段、必须保留用户的所有原话;搭配<analysis>标签作为AI"草稿纸",完成后剥离仅保留<summary>。
DreamTask:AI在你睡觉时"做梦"
Claude Code设计DreamTask后台进程,AI会像人类做梦一样回顾整理记忆,分四阶段执行:
- Phase 1 — Orient(定位):扫描已有记忆,防止创建重复
- Phase 2 — Gather(采集):扫描日志目录,按需提取会话细节
- Phase 3 — Consolidate(整合):合并重复、修正矛盾、转换日期、删除旧事实
- Phase 4 — Prune(修剪):更新索引,控制体积,解决矛盾
触发条件:距上次整理超24小时,且积累≥5个新会话;配有文件锁并发控制,失败可回滚重试。
自主性
有了记忆,AI可主动发现和执行有价值的工作,由KAIROS全家桶支撑实现。
tick心跳+Sleep
通过claude assistant启动助手模式,系统周期性发送<tick>心跳提示,AI评估后主动推进工作或调用SleepTool休眠。
SleepTool提示:prompt cache 5分钟后过期,AI需权衡唤醒频率,平衡资源消耗。本质是事件驱动的agent运行时。
强制工具化输出
助手模式下,AI所有用户可见输出必须通过SendUserMessage(BriefTool)工具发送,普通文本不可见,实现"思考过程"与"用户沟通"分离,用户可通过/brief查看进度。
外部消息唤醒
通过MCP Channel协议,Discord、Slack、SMS等外部消息可推入会话,包装为XML标签入队,SleepTool1秒内检测唤醒;AI可通过channel向人类请求工具执行权限,配套结构化权限协议。
定时任务:本地 + 云端双引擎
- 本地:CronScheduler,支持标准cron表达式,预装任务自动启用
- 云端:通过
/scheduleskill创建云端定时agent,最小间隔1小时,支持Git仓库、工具白名单、MCP连接器配置
GitHub PR订阅
通过SubscribePRTool订阅GitHub PR事件,实时推送至会话,实现AI持续监控代码库。
多Agent协作
源码中存在三套多agent系统,针对不同场景设计,src/utils/swarm/目录下有20+个文件。
Swarm/Teammate:文件邮箱团队系统
基于文件邮箱的agent团队系统,每个teammate对应JSON邮箱文件,通过读写邮箱通信,文件锁保障并发安全。
支持两种后端:同进程模式(共享连接)、分屏模式(独立进程);权限管理复用邮箱基础设施,Worker向leader发起审批请求。
Coordinator:不许偷懒的项目经理
开启后Claude变为"项目经理",仅3个工具:Agent(派活)、SendMessage(继续)、TaskStop(叫停)。
配套369行system prompt,定义四阶段工作流:Research → Synthesis → Implementation → Verification,核心铁律:
Coordinator必须自己理解问题,不能偷懒委派理解,需给出具体到文件行号的方案。
Workers间设共享草稿目录(Scratchpad),无需审批即可共享知识。
Fork子agent:字节级缓存优化
Fork模式解决多子agent共享prompt cache问题:复制父agent消息,替换tool_use结果为相同占位符,仅追加不同指令,实现字节级别前缀一致,最大化缓存命中率。
UDS_INBOX:跨实例通信
通过Unix Domain Socket实现多Claude Code实例发现与通信,支持本地(uds:/path/to.sock)与远程(bridge:session_id)消息传输。
云端:突破本地边界
Claude Code具备本地-云端混合架构,延伸AI能力边界。
Bridge:四种远程控制模式
- Headless:无UI后台运行,适配CI/CD集成
- Remote MCP:作为MCP服务器暴露给其他客户端
- Teleport:浏览器与终端间"传送"会话
- Full Remote:完整远程Claude Code实例
支持会话恢复、状态同步、跨设备切换。
Ultraplan:用最强模型当军师
复杂任务触发Ultraplan,启动远程服务器,用Opus 4.6做深度规划:
- 用户描述任务 → 本地创建远程会话
- Opus 4.6进入Plan Mode深度思考
- 浏览器审批/修改方案
- 方案传回本地执行
配有防递归设计,支持"传送回终端"执行。
Settings Sync:跨设备记忆同步
通过Anthropic API同步配置与记忆,基于时间戳的last-write-wins策略,搭配本地缓存与增量同步,解决冲突问题。
交互
聚焦人机交互的自然性与情感连接。
Buddy:编程工具里的宠物精灵
Claude Code内置完整桌面宠物系统,代号BUDDY:
- 18个物种:鸭子、鹅、果冻、猫、龙、章鱼等
- 5个稀有度:Common → Uncommon → Rare → Epic → Legendary
- 6种眼睛、8种帽子、5项属性值(调试力、耐心、混沌、智慧、毒舌)
按userId+固定盐值生成唯一精灵,1%概率闪光,支持/buddy pet互动;骨骼数据不持久化,防止伪造稀有度。
预热窗口:2026年4月1-7日,愚人节彩蛋后正式上线。
Voice Mode:按住说话,松开执行
完整语音输入系统,Push-to-talk模式,音频通过WebSocket流式传输至私有STT端点,支持macOS CoreAudio、Linux ALSA原生捕获,回退至SoX;原生音频模块懒加载,优化冷启动。
Prompt Suggestion + 推测性执行
每轮对话后,subagent预测用户下一步输入,过滤无效建议;触发推测性执行,沙箱预执行操作,用户确认则直接使用,否则丢弃,类似CPU分支预测。
终极观察
这不是在做产品迭代,是在做物种进化
Anthropic的清晰进化链:
工具 → 助手 → 同事 → 伙伴
编程工具 长期助手 AI同事 AI伙伴
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
│ 你问它答 │ → │ 它主动做 │ → │ 它管项目 │ → │ 它有感情 │
│ Read/Write│ │ KAIROS │ │Coordinator│ │ BUDDY │
│ Bash/Edit │ │ DreamTask│ │ Ultraplan │ │ 宠物精灵 │
│ │ │ Sleep/ │ │ 多Agent │ │ 记住你的 │
│ │ │ Tick心跳 │ │ 协作 │ │ 夸奖 │
└──────────┘ └──────────┘ └──────────┘ └──────────┘
已发布 灰度中 即将上线 远期愿景
Anthropic不是在迭代编程工具,而是在孵化一个新物种:会写代码、会做梦、主动干活、管理团队、云端定时执行、语音交互,还能带来情感陪伴。
转载自 https://mp.weixin.qq.com/s/xnT-HVP3f-l9w0P4ZAWJSA
更多推荐



所有评论(0)