Claude Code是如何管理长MEM的

完整语音输入系统，Push-to-talk模式，音频通过WebSocket流式传输至私有STT端点，支持macOS CoreAudio、Linux ALSA原生捕获，回退至SoX；通过Anthropic API同步配置与记忆，基于时间戳的last-write-wins策略，搭配本地缓存与增量同步，解决冲突问题。的agent团队系统，每个teammate对应JSON邮箱文件，通过读写邮箱通信，文件锁

taoqick

36人浏览 · 2026-04-05 13:39:27

taoqick · 2026-04-05 13:39:27 发布

TL;DR

从session管理角度看

层级	机制	触发时机	作用
实时提取	Session Memory	对话token达到10000后，每增长5000token且满足工具调用条件时	总结当前会话关键信息
跨会话整合	Auto-Dream	距上次整理≥24小时，且积累≥5个新会话	回顾、合并、修剪记忆文件
永驻日志	KAIROS Daily Log	助手模式下持续运行	append-only日志+夜间蒸馏

从session内的管理角度

Claude Code的记忆分为4种类型：用户偏好（user）、反馈修正（feedback）、项目信息（project）、外部引用（reference）。每种类型有独立的存储文件和触发条件。

AI聊久了token会爆。Claude Code采用9段式结构化记忆术：

Primary Request and Intent（用户的原始需求）
All user messages（用户的所有原话——不许遗漏！）
Key Technical Concepts（关键技术概念）
Files and Code Sections（文件和代码片段——必须附代码！）
Errors and fixes（犯了什么错、怎么修的）
Problem Solving（问题解决过程）
Pending Tasks（待办事项）
Current Work（当前进度）
Optional Next Step（下一步计划）

硬性要求：必须保留代码片段、必须保留用户的所有原话；搭配<analysis>标签作为AI"草稿纸"，完成后剥离仅保留<summary>。

以下来自转载内容

从Claude Code源码看Anthropic的产品野心

原创 rumorrumor | 李rumor 2026年4月1日 09:18 北京

卷友们好，我是rumor。

昨天Claude Code ”开源”了，我手速飞快去下载了源码。50万行TypeScript，1900个文件——用AI读完之后我发现，这东西远比表面看到的要野得多。

大量功能被feature flag锁住，编译时直接从npm包里物理删除，你反编译都看不到。但源码一摊开，Anthropic的野心藏不住了：他们不是在做一个编程工具，而是在孵化一个有记忆、能自主行动、会团队协作的AI agent平台。

今天我们就沿着这条演进主线，对源码里的设计进行拆解。

记忆

记忆是整个演进的基石。没有记忆，AI就是一个每次对话都从零开始的陌生人。Claude Code在记忆上的投入远超预期——不是简单的"把对话存下来"，而是一套有分类、有提取、有整合、有遗忘的记忆生命周期管理系统。

四类记忆：正面反馈也要记

其中最有意思的设计在feedback类型上。大多数AI系统只记"负反馈"，但Claude Code的prompt里明确要求正面反馈也要记：

Record from failure AND success: if you only save corrections, you will avoid past mistakes but drift away from approaches the user has already validated, and may grow overly cautious.

如果只记批评不记表扬，时间长了模型就会趋向保守——不敢做决定、不敢主动行动，事事请示。Prompt还特别提醒：“批评很容易注意到；肯定更安静——要主动留意。”

三层记忆架构

记忆的写入不是一次性的，而是分三层逐步沉淀：

层级	机制	触发时机	作用
实时提取	Session Memory	对话token达到10000后，每增长5000token且满足工具调用条件时	总结当前会话关键信息
跨会话整合	Auto-Dream	距上次整理≥24小时，且积累≥5个新会话	回顾、合并、修剪记忆文件
永驻日志	KAIROS Daily Log	助手模式下持续运行	append-only日志+夜间蒸馏

Session Memory触发逻辑：对话足够长才总结，基于token增长量更新，需满足工具调用次数或自然停顿条件；提取由专属subagent完成，仅可编辑对应记忆文件。

上下文压缩：有限窗口里的记忆术

AI聊久了token会爆。Claude Code采用9段式结构化记忆术：

Primary Request and Intent（用户的原始需求）
Key Technical Concepts（关键技术概念）
Files and Code Sections（文件和代码片段——必须附代码！）
Errors and fixes（犯了什么错、怎么修的）
Problem Solving（问题解决过程）
All user messages（用户的所有原话——不许遗漏！）
Pending Tasks（待办事项）
Current Work（当前进度）
Optional Next Step（下一步计划）

硬性要求：必须保留代码片段、必须保留用户的所有原话；搭配<analysis>标签作为AI"草稿纸"，完成后剥离仅保留<summary>。

DreamTask：AI在你睡觉时"做梦"

Claude Code设计DreamTask后台进程，AI会像人类做梦一样回顾整理记忆，分四阶段执行：

Phase 1 — Orient（定位）：扫描已有记忆，防止创建重复
Phase 2 — Gather（采集）：扫描日志目录，按需提取会话细节
Phase 3 — Consolidate（整合）：合并重复、修正矛盾、转换日期、删除旧事实
Phase 4 — Prune（修剪）：更新索引，控制体积，解决矛盾

触发条件：距上次整理超24小时，且积累≥5个新会话；配有文件锁并发控制，失败可回滚重试。

自主性

有了记忆，AI可主动发现和执行有价值的工作，由KAIROS全家桶支撑实现。

tick心跳+Sleep

通过claude assistant启动助手模式，系统周期性发送<tick>心跳提示，AI评估后主动推进工作或调用SleepTool休眠。

SleepTool提示：prompt cache 5分钟后过期，AI需权衡唤醒频率，平衡资源消耗。本质是事件驱动的agent运行时。

强制工具化输出

助手模式下，AI所有用户可见输出必须通过SendUserMessage（BriefTool）工具发送，普通文本不可见，实现"思考过程"与"用户沟通"分离，用户可通过/brief查看进度。

外部消息唤醒

通过MCP Channel协议，Discord、Slack、SMS等外部消息可推入会话，包装为XML标签入队，SleepTool1秒内检测唤醒；AI可通过channel向人类请求工具执行权限，配套结构化权限协议。

定时任务：本地 + 云端双引擎

本地：CronScheduler，支持标准cron表达式，预装任务自动启用
云端：通过/schedule skill创建云端定时agent，最小间隔1小时，支持Git仓库、工具白名单、MCP连接器配置

GitHub PR订阅

通过SubscribePRTool订阅GitHub PR事件，实时推送至会话，实现AI持续监控代码库。

多Agent协作

源码中存在三套多agent系统，针对不同场景设计，src/utils/swarm/目录下有20+个文件。

Swarm/Teammate：文件邮箱团队系统

基于文件邮箱的agent团队系统，每个teammate对应JSON邮箱文件，通过读写邮箱通信，文件锁保障并发安全。

支持两种后端：同进程模式（共享连接）、分屏模式（独立进程）；权限管理复用邮箱基础设施，Worker向leader发起审批请求。

Coordinator：不许偷懒的项目经理

开启后Claude变为"项目经理"，仅3个工具：Agent（派活）、SendMessage（继续）、TaskStop（叫停）。

配套369行system prompt，定义四阶段工作流：Research → Synthesis → Implementation → Verification，核心铁律：

Coordinator必须自己理解问题，不能偷懒委派理解，需给出具体到文件行号的方案。

Workers间设共享草稿目录（Scratchpad），无需审批即可共享知识。

Fork子agent：字节级缓存优化

Fork模式解决多子agent共享prompt cache问题：复制父agent消息，替换tool_use结果为相同占位符，仅追加不同指令，实现字节级别前缀一致，最大化缓存命中率。

UDS_INBOX：跨实例通信

通过Unix Domain Socket实现多Claude Code实例发现与通信，支持本地（uds:/path/to.sock）与远程（bridge:session_id）消息传输。

云端：突破本地边界

Claude Code具备本地-云端混合架构，延伸AI能力边界。

Bridge：四种远程控制模式

Headless：无UI后台运行，适配CI/CD集成
Remote MCP：作为MCP服务器暴露给其他客户端
Teleport：浏览器与终端间"传送"会话
Full Remote：完整远程Claude Code实例

支持会话恢复、状态同步、跨设备切换。

Ultraplan：用最强模型当军师

复杂任务触发Ultraplan，启动远程服务器，用Opus 4.6做深度规划：

用户描述任务 → 本地创建远程会话
Opus 4.6进入Plan Mode深度思考
浏览器审批/修改方案
方案传回本地执行

配有防递归设计，支持"传送回终端"执行。

Settings Sync：跨设备记忆同步

通过Anthropic API同步配置与记忆，基于时间戳的last-write-wins策略，搭配本地缓存与增量同步，解决冲突问题。

交互

聚焦人机交互的自然性与情感连接。

Buddy：编程工具里的宠物精灵

Claude Code内置完整桌面宠物系统，代号BUDDY：

18个物种：鸭子、鹅、果冻、猫、龙、章鱼等
5个稀有度：Common → Uncommon → Rare → Epic → Legendary
6种眼睛、8种帽子、5项属性值（调试力、耐心、混沌、智慧、毒舌）

按userId+固定盐值生成唯一精灵，1%概率闪光，支持/buddy pet互动；骨骼数据不持久化，防止伪造稀有度。
预热窗口：2026年4月1-7日，愚人节彩蛋后正式上线。

Voice Mode：按住说话，松开执行

完整语音输入系统，Push-to-talk模式，音频通过WebSocket流式传输至私有STT端点，支持macOS CoreAudio、Linux ALSA原生捕获，回退至SoX；原生音频模块懒加载，优化冷启动。

Prompt Suggestion + 推测性执行

每轮对话后，subagent预测用户下一步输入，过滤无效建议；触发推测性执行，沙箱预执行操作，用户确认则直接使用，否则丢弃，类似CPU分支预测。

终极观察

这不是在做产品迭代，是在做物种进化

Anthropic的清晰进化链：

工具 → 助手 → 同事 → 伙伴
编程工具 长期助手 AI同事 AI伙伴
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
│ 你问它答 │ → │ 它主动做 │ → │ 它管项目 │ → │ 它有感情 │
│ Read/Write│ │ KAIROS   │ │Coordinator│ │ BUDDY    │
│ Bash/Edit │ │ DreamTask│ │ Ultraplan │ │ 宠物精灵 │
│          │ │ Sleep/   │ │ 多Agent   │ │ 记住你的 │
│          │ │ Tick心跳 │ │ 协作      │ │ 夸奖     │
└──────────┘ └──────────┘ └──────────┘ └──────────┘
已发布     灰度中     即将上线    远期愿景

Anthropic不是在迭代编程工具，而是在孵化一个新物种：会写代码、会做梦、主动干活、管理团队、云端定时执行、语音交互，还能带来情感陪伴。

转载自 https://mp.weixin.qq.com/s/xnT-HVP3f-l9w0P4ZAWJSA