Claude code源码分析

夏花冬拾

627人浏览 · 2026-04-10 20:46:28

夏花冬拾 · 2026-04-10 20:46:28 发布

Claude code源码学习

1、参考文章

1.1、程序员鱼皮的文章《刚刚 Claude Code 源码泄露！我扒出了 11 个隐藏秘密》

1.2、鱼友9771的文章《Claude Code 源码架构深度解析：1884 个文件背后的 AI 编程工具设计哲学》

1.3、孤飞的文章《Claude Code 源码泄露深度剖析：Anthropic AI 编程助手的架构全解密》

1.4、JackKlk的文章《Claude Code 源码分析笔记》

1.5、Claude 中文 - Claude Al 开发技术社区的文章《源码分析》

1.6、返回主页warm3snow的文章《Claude Code 源码泄露全复盘：51.2 万行代码裸奔，Anthropic 在同一个坑里摔了两次》

1.7、量子位的文章《Claude Code源码泄露7小时：8大新功能/26个隐藏指令/6级安全架构，全被扒光了》

1.8、AGlHunt的文章《Claude Code 源码泄露，全面剖析【长文】》

1.9、潜龙勿用的文章《我用Claude Code深度解读51万行Claude Code源码》

1.10、Al进化论-花生的Bilibili视频《Claude Code源码泄露！首发解读51万行代码！》

1.11、唐国梁Tommy的Bilibili视频《Claude Code源码曝光底层技术硬核拆解：1884个文件背后，Anthropic如何构建Agent Runtime？》

1.12、秋芝2046的Bilibili视频《51万行源码泄露！Claude Code 里面到底藏了什么？》

2、完整架构

图1、Claude Code完整架构拆解

图2、Agent 主循环

3、细节上的刨析

3.1、Command,Tool,Skill

图3、Command,Tool,Skill

3.2、三层记忆架构

图4、三层记忆架构

第一层：热数据（全局索引常驻加载）

MEMORY.md 类似于一本常驻上下文的目录，为了防止其过度挤占 AI 的有效窗口，系统对其施加了“行数 + 字节数”的双重严格限制（最多 200 行且不超过 25KB）。当内容超限时，截断逻辑会精准切分在最后一个换行符处以防文本断裂，并自动追加一条 WARNING 提示 AI 该索引未加载完整。这种极致的细节把控，确保了核心记忆既轻量又安全。

第二层：温数据（话题文件按需召回）

对于架构约定、用户偏好和历史“踩坑”记录等细节文件，系统会在新对话时利用 Sonnet 小模型智能挑选最多 5 个高度相关的文件加载。其召回提示词极其巧妙：若用户正使用某工具，则跳过基础说明，专门加载该工具的已知问题和陷阱。更关键的是，记忆库中绝不直接存储代码，只记录判断与偏好，需要事实时永远去源码实时读取，从根源上彻底消灭了代码更新导致的“缓存不一致”Bug。

第三层：冷数据（历史对话离线搜索）

早期或久远的冗长历史对话会被统一打包归档为 .jsonl 格式的冷数据，完全剥离出日常上下文，仅在需要溯源时通过 Grep 关键词进行精准搜索。这种“热数据常驻、温数据按需、冷数据搜索”的分级管理机制，完美平衡了 AI 长期记忆的广度与 Token 计算的性能开销，堪称企业级 AI 应用存储架构的典范。

打个比方：你的桌子上有一本必看的“项目总目录”（热数据 MEMORY.md）；你背后的书架上放了几十本你平时做笔记的“错题本和备忘录”（温数据话题文件）；更远处的仓库里堆着你以前聊天的“流水账记录”（冷数据 .jsonl 历史）。