这个工具让 AI 读代码不再像翻字典

优雅的吐司

7人浏览 · 2026-06-28 20:32:31

优雅的吐司 · 2026-06-28 20:32:31 发布

向量搜索在代码里的静默失败

大多数工程师第一次给 AI 工具接入自己代码库，都会选向量 RAG——把代码文件切块、embedding、存进向量库，查询时用语义相似度检索。逻辑上说得通，实际上到处是坑。

第一个问题：语义相似不等于结构相关。

processPayment() 函数调用了 validateCard()，这是一个确定的结构关系。但在 embedding 空间里，这两个函数不一定挨着——它们的文本描述可能差得很远。你问「支付流程里的校验逻辑是什么」，向量搜索返回的是语义上和「校验」相近的所有代码块，而不是和 processPayment 调用链直接相关的那些。

第二个问题：切块破坏上下文。

代码不是文章，不能随意切块。一个函数必须带着它的签名、类型声明、调用的依赖一起理解。把 200 行的 Go 文件切成 50 行一块，一个函数可能横跨两个 chunk，LLM 拿到半截代码只能硬猜另一半在干什么。

第三个问题：跨文件依赖是盲区。

A 文件的接口定义在 B 文件实现，C 文件调用了 A 的接口但只 import 了接口类型——这条依赖链，向量相似度根本追不到。结果就是：AI 给你回答「这个接口怎么用」，但它不知道真正的实现在哪。

最近有篇 arxiv 论文（Chinthareddy, 2026）专门对比了三种代码检索方案：纯向量 RAG、LLM 生成的知识图谱、以及 AST 确定性图谱。结论很直接：纯向量 RAG 在架构级查询上的幻觉率最高，而 AST 确定性图谱在多跳依赖查询上的准确性最好，且构建成本远低于 LLM 生成的图谱。

实测数据是：LLM 生成方案在 Shopizer 项目上漏掉了 377 个文件的索引，而 AST 确定性方案覆盖率几乎是 100%。

向量 RAG 与 AST 知识图谱的代码理解方式对比

图：向量 RAG 把代码当文本，图谱把代码当结构——两种范式下 AI 理解代码库的本质差异

Understand-Anything 在做什么

Understand-Anything 的技术思路不复杂，但工程细节讲究。

它的核心是一个 7 Agent 串行流水线，每个 Agent 负责一层理解：

project-scanner → file-analyzer → architecture-analyzer →
tour-builder → graph-reviewer → domain-analyzer → article-analyzer

第一层（project-scanner）：发现文件树，识别语言和框架。这一步决定后续 Agent 用什么解析策略。

第二层（file-analyzer）：这是最关键的一层。用 Tree-sitter 对每个文件做确定性 AST 解析——提取函数、类、import、export、调用关系，生成图的节点和边。注意：这一步是确定性的，同样的代码解析结果永远一样，没有 LLM 幻觉。

第三层（architecture-analyzer）：识别架构层次——API 层、Service 层、Data 层、UI 层、Utility 层。这是从结构信息里推导出语义分类，不是靠文件名猜。

第四层（tour-builder）：生成依赖顺序的学习路径。新人第一天开始读代码库，应该从哪里读起——这个问题有了图谱之后就有确定性答案了。

第五层（graph-reviewer）：验证图谱完整性，确保没有孤立节点和断裂边。

第六/七层：domain-analyzer 抽取业务工作流（代码结构 → 业务语义），article-analyzer 处理 wiki 知识库文档。

最终输出是 .understand-anything/knowledge-graph.json——一个普通的 JSON 文件，包含所有节点和边。Dashboard 独立运行，不依赖 LLM，查询图谱不消耗任何 token。

v2.7.3（2026 年 5 月 19 日发布）把节点类型从 13 种扩展到了 21 种，边类型增加到 35 种，覆盖结构关系、行为关系、数据流、语义关系等六个维度。

Understand-Anything 7 Agent 流水线架构图

图：7 Agent 串行流水线——前三层做结构解析，中间两层做质量保障，后两层做语义提升

图谱 vs 向量：工程本质差异在哪里

我见过两种典型场景，让这个差异特别清楚。

场景一：「改这个函数，会影响哪些地方？」

用向量搜索：找到和这个函数名相似的代码段，大致猜出可能的调用者。准确率取决于命名一致性，leaky abstraction 一多就废了。

用图谱：impact_radius(function_id) 一次图遍历，返回所有直接和间接调用者，确定性的，没有漏网之鱼。CodeGraph 在 VS Code 代码库上的测试数据是：回答「Extension Host 和主进程的通信机制」，向量方案需要 52 次工具调用，图谱方案需要 3 次。

场景二：「这个模块的业务含义是什么？」

代码里有个叫 UserSessionManager 的类，向量搜索能找到它，但不知道它在整体架构里的位置。图谱知道：它属于 Service 层，被 API 层的 5 个 handler 调用，依赖 Data 层的 2 个 repository，是整个鉴权流程的核心节点。

这里有个架构决策值得说一下：Understand-Anything 选择把确定性解析（Tree-sitter）和语义理解（LLM）分两层做，而不是全部用 LLM 做。原因是分层之后，结构层的结果可以缓存、可以增量更新——只有改动的文件需要重新解析。v2.7.x 的 --auto-update 就是基于这个：结构指纹变了才重新跑对应文件，没变的直接复用。

相比之下，纯 LLM 知识图谱方案每次都是全量重建，而且 LLM 每次抽取的结果还可能不一致。

一个容易被忽略的工程细节：graph reviewer 那一步不是装饰。我们内部维护过一个运行了三年的 Java 服务，代码里充斥着命名混乱的 util 类和没有文档的内部接口。纯向量索引这类代码库，结果就是一堆不相关的 chunk 被聚合在一起。图谱方案会暴露这种混乱——孤立节点多、调用链断裂多，某种程度上也是代码质量的显示器。

和 CodeGraph 的定位差异

GitHub 上另一个做类似事情的工具是 CodeGraph（20,300 Star），值得放在一起说。

两者都用 Tree-sitter 做 AST 解析，但产品定位完全不同：

Understand-Anything 的目标是「人和代码的交互」——可视化仪表盘、guided tour、业务域映射，图谱提交到 repo 之后团队共享，新人第一天就能用。核心用户是需要理解陌生代码库的人。

CodeGraph 的目标是「AI Agent 和代码的交互」——作为 MCP Server 给 Claude Code、Cursor 这些工具提供精确的结构查询，减少 Agent 的工具调用次数和 token 消耗。核心用户是想降低 AI 编程成本的人。实测数据：在大型仓库上平均节省 59% token、70% 工具调用次数。

这两个工具不是竞争关系，而是在同一个问题的不同截面上各自深挖。Understand-Anything 生成的图谱可以通过它的 API 给 AI Agent 用，CodeGraph 生成的图同样能给人看。

如果你的诉求是「我要看懂这个老项目的架构」，Understand-Anything 更合适。如果你的诉求是「我要降低 AI 编程的 token 成本」，CodeGraph 更直接。

维度	Understand-Anything	CodeGraph
核心产品形态	可视化 Dashboard + JSON 图谱	MCP Server
主要用户	需要理解代码库的工程师	使用 AI 编程工具的工程师
图谱节点类型	21 种（含业务域、文档）	函数/类/模块/调用关系
增量更新	✅ `--auto-update` 结构指纹	✅ OS 文件事件监听
AI Agent 集成	支持，非核心	核心，MCP 原生
token 节省	未公布	59% 平均
团队协作	✅ 图谱提交到 repo 共享	本地运行
GitHub Stars	22,600	20,300

图谱有哪些真实局限

不吹不黑，说几个实际会遇到的问题。

动态语言是噩梦。 Python 的 duck typing、JavaScript 的 prototype chain——静态 AST 解析追不到运行时的动态绑定。你的 processOrder 函数在代码里调用了 this.handler.process()，AST 只能知道调用了 .process()，不知道运行时 this.handler 到底是哪个类的实例。这个问题在强类型语言（TypeScript、Java、Go）里小很多，在 Python 动态代码里很严重。

命名混乱会传导进图谱。 如果代码库里有大量命名不一致的 util 函数（handleData、processData、dealWithData）做着同样的事，图谱只能忠实反映这种混乱，不会帮你整理。Understand-Anything 自己的文档也承认：「如果代码库命名一片混乱，生成的图谱也会是一片混乱。」

大型代码库的初始构建时间。 20 万行代码的 monorepo，哪怕并发处理 5 个文件，首次构建也要几分钟。增量更新之后这个问题基本消失，但首次接入的等待是真实的。

LLM 调用费用由你承担。 构建图谱时的语义摘要、架构分类这些步骤需要 LLM。图谱构建完之后的查询和浏览不再消耗 token，但初始构建是有成本的。

动手接入：从安装到第一次查询（5 分钟）

本文环境： macOS/Linux · Claude Code v1.x · 前置条件：项目目录里有代码，已配置 LLM API Key

第一步：安装插件

Claude Code 原生安装（推荐）：

/plugin marketplace add Lum1104/Understand-Anything
/plugin install understand-anything

macOS / Linux 通用安装：

curl -fsSL https://raw.githubusercontent.com/Lum1104/Understand-Anything/main/install.sh | bash

Windows PowerShell：

iwr -useb https://raw.githubusercontent.com/Lum1104/Understand-Anything/main/install.ps1 | iex

Cursor 和 VS Code + Copilot 会在克隆含 .understand-anything/ 目录的仓库后自动发现，无需额外安装。

第二步：首次构建知识图谱

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

从“解题机器”到“研究伙伴”：自主数学研究时代的来临

本文基于 Google DeepMind 的论文，深度解读了数学研究智能体 Aletheia。该系统以 Gemini Deep Think 为基座，通过“生成—验证—修订”循环与工具使用，首次在算术几何的 eigenweights、Erdős 开放问题及 FirstProof 研究级引理等任务上展现出论文级贡献。然而，大规模评估显示其成功率仍然有限：在 700 个 Erdős 问题中仅 6.5%

DeepSeek技术社区

Claude Code for VS Code 使用教程

# Claude Code for VS Code 使用教程Claude Code 是 Anthropic 推出的一款编程工具，也被称为世界最强编程 Agent 之一。Claude Code 的 VS Code 扩展提供了原生的图形化界面，是在 VS Code 中使用 Claude Code 的推荐方式。本文档主要介绍如何通过 Ace Data Cloud 的代理服务，在 VS Code