Claude code源码学习

1、参考文章

1.1、程序员鱼皮的文章《刚刚 Claude Code 源码泄露!我扒出了 11 个隐藏秘密

1.2、鱼友9771的文章《Claude Code 源码架构深度解析:1884 个文件背后的 AI 编程工具设计哲学

1.3、孤飞的文章《Claude Code 源码泄露深度剖析:Anthropic AI 编程助手的架构全解密

1.4、JackKlk的文章《Claude Code 源码分析笔记

1.5、Claude 中文 - Claude Al 开发技术社区的文章《源码分析

1.6、返回主页warm3snow的文章《Claude Code 源码泄露全复盘:51.2 万行代码裸奔,Anthropic 在同一个坑里摔了两次

1.7、量子位的文章《Claude Code源码泄露7小时:8大新功能/26个隐藏指令/6级安全架构,全被扒光了

1.8、AGlHunt的文章《Claude Code 源码泄露,全面剖析【长文】

1.9、潜龙勿用的文章《我用Claude Code深度解读51万行Claude Code源码

1.10、Al进化论-花生的Bilibili视频《Claude Code源码泄露!首发解读51万行代码!

1.11、唐国梁Tommy的Bilibili视频《Claude Code源码曝光 底层技术硬核拆解:1884个文件背后,Anthropic如何构建Agent Runtime?

1.12、秋芝2046的Bilibili视频《51万行源码泄露!Claude Code 里面到底藏了什么?

2、完整架构

1

图1、Claude Code完整架构拆解


1

图2、Agent 主循环

3、细节上的刨析

3.1、Command,Tool,Skill

1

图3、Command,Tool,Skill

3.2、三层记忆架构

1

图4、三层记忆架构

第一层:热数据(全局索引常驻加载)

MEMORY.md 类似于一本常驻上下文的目录,为了防止其过度挤占 AI 的有效窗口,系统对其施加了“行数 + 字节数”的双重严格限制(最多 200 行且不超过 25KB)。当内容超限时,截断逻辑会精准切分在最后一个换行符处以防文本断裂,并自动追加一条 WARNING 提示 AI 该索引未加载完整。这种极致的细节把控,确保了核心记忆既轻量又安全。

第二层:温数据(话题文件按需召回)

对于架构约定、用户偏好和历史“踩坑”记录等细节文件,系统会在新对话时利用 Sonnet 小模型智能挑选最多 5 个高度相关的文件加载。其召回提示词极其巧妙:若用户正使用某工具,则跳过基础说明,专门加载该工具的已知问题和陷阱。更关键的是,记忆库中绝不直接存储代码,只记录判断与偏好,需要事实时永远去源码实时读取,从根源上彻底消灭了代码更新导致的“缓存不一致”Bug。

第三层:冷数据(历史对话离线搜索)

早期或久远的冗长历史对话会被统一打包归档为 .jsonl 格式的冷数据,完全剥离出日常上下文,仅在需要溯源时通过 Grep 关键词进行精准搜索。这种“热数据常驻、温数据按需、冷数据搜索”的分级管理机制,完美平衡了 AI 长期记忆的广度与 Token 计算的性能开销,堪称企业级 AI 应用存储架构的典范。

打个比方: 你的桌子上有一本必看的“项目总目录”(热数据 MEMORY.md); 你背后的书架上放了几十本你平时做笔记的“错题本和备忘录”(温数据 话题文件); 更远处的仓库里堆着你以前聊天的“流水账记录”(冷数据 .jsonl 历史)。

3.3、…

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐