claude-context API详解：如何自定义和扩展功能

claude-context是一个强大的代码搜索MCP（Model Context Provider）工具，它能够将整个代码库转化为任何编码代理的上下文。本文将详细介绍claude-context的API，帮助开发者了解如何自定义和扩展其功能，以满足特定的开发需求。## 核心架构概览claude-context采用模块化设计，主要包含嵌入（Embedding）、向量数据库（Vector D

魏真权

690人浏览 · 2026-04-22 07:17:08

魏真权 · 2026-04-22 07:17:08 发布

claude-context API详解：如何自定义和扩展功能

【免费下载链接】claude-context Code search MCP for Claude Code. Make entire codebase the context for any coding agent. 项目地址: https://gitcode.com/GitHub_Trending/co/claude-context

claude-context是一个强大的代码搜索MCP（Model Context Provider）工具，它能够将整个代码库转化为任何编码代理的上下文。本文将详细介绍claude-context的API，帮助开发者了解如何自定义和扩展其功能，以满足特定的开发需求。

核心架构概览

claude-context采用模块化设计，主要包含嵌入（Embedding）、向量数据库（Vector Database）、代码分割（Splitter）和同步（Sync）等核心模块。这种架构使得各个组件可以独立扩展和定制。

主要模块及其职责

嵌入模块：负责将文本转换为向量表示，支持多种嵌入服务
向量数据库：处理向量的存储和检索，支持混合搜索
代码分割器：将代码分割为适合嵌入的块，支持AST和LangChain两种策略
同步器：保持代码库与向量数据库的同步

自定义嵌入服务

claude-context的嵌入系统基于抽象基类Embedding设计，这使得添加新的嵌入服务变得简单。

Embedding基类

Embedding基类定义在packages/core/src/embedding/base-embedding.ts中，包含以下核心方法：

export abstract class Embedding {
    // 预处理文本
    protected preprocessText(text: string): string;
    
    // 检测嵌入维度
    abstract detectDimension(testText?: string): Promise<number>;
    
    // 生成单个文本嵌入
    abstract embed(text: string): Promise<EmbeddingVector>;
    
    // 批量生成文本嵌入
    abstract embedBatch(texts: string[]): Promise<EmbeddingVector[]>;
    
    // 获取嵌入维度
    abstract getDimension(): number;
    
    // 获取服务提供商名称
    abstract getProvider(): string;
}

创建自定义嵌入类

要添加新的嵌入服务，只需创建一个继承自Embedding的类并实现所有抽象方法。例如，现有的OpenAIEmbedding实现：

export class OpenAIEmbedding extends Embedding {
    private config: OpenAIEmbeddingConfig;
    private dimension: number | null = null;
    
    constructor(config: OpenAIEmbeddingConfig) {
        super();
        this.config = config;
    }
    
    // 实现所有抽象方法...
}

支持的嵌入服务

claude-context已内置支持多种嵌入服务：

OpenAIEmbedding：OpenAI的嵌入服务
GeminiEmbedding：Google Gemini嵌入服务
OllamaEmbedding：本地Ollama模型
VoyageAIEmbedding：Voyage AI嵌入服务

扩展向量数据库支持

向量数据库是claude-context的核心组件，负责存储和检索代码向量。系统通过VectorDatabase接口实现了数据库无关性。

VectorDatabase接口

VectorDatabase接口定义了所有向量数据库实现必须遵循的契约：

export interface VectorDatabase {
    // 创建集合
    createCollection(collectionName: string, dimension: number, description?: string): Promise<void>;
    
    // 插入文档
    insert(collectionName: string, documents: VectorDocument[]): Promise<void>;
    
    // 搜索相似向量
    search(collectionName: string, queryVector: number[], options?: SearchOptions): Promise<VectorSearchResult[]>;
    
    // 混合搜索
    hybridSearch(collectionName: string, searchRequests: HybridSearchRequest[], options?: HybridSearchOptions): Promise<HybridSearchResult[]>;
    
    // 删除文档
    delete(collectionName: string, ids: string[]): Promise<void>;
    
    // 其他必要方法...
}

实现自定义向量数据库

目前系统已实现MilvusVectorDatabase和MilvusRestfulVectorDatabase。要添加新的数据库支持，只需实现VectorDatabase接口。

混合搜索功能

claude-context支持高级混合搜索功能，允许结合不同类型的向量进行搜索：

// 混合搜索请求示例
const searchRequests: HybridSearchRequest[] = [
    {
        data: denseVector,
        anns_field: "vector",
        param: { nprobe: 10 },
        limit: 20
    },
    {
        data: sparseVector,
        anns_field: "sparse_vector",
        param: { nprobe: 10 },
        limit: 20
    }
];

// 混合搜索选项
const options: HybridSearchOptions = {
    rerank: {
        strategy: "rrf",
        params: { k: 60 }
    },
    limit: 10
};

const results = await vectorDB.hybridSearch("my_collection", searchRequests, options);

自定义代码分割策略

代码分割是将代码库分解为适合嵌入的小块的关键步骤。claude-context提供了灵活的代码分割机制。

Splitter接口

Splitter接口定义了代码分割器的基本契约：

export interface Splitter {
    split(code: string, language: string, filePath?: string): Promise<CodeChunk[]>;
    setChunkSize(chunkSize: number): void;
    setChunkOverlap(chunkOverlap: number): void;
}

AST代码分割器

AstCodeSplitter是claude-context的核心分割器，它使用抽象语法树（AST）进行智能代码分割：

// 支持的语言和节点类型
const SPLITTABLE_NODE_TYPES = {
    javascript: ['function_declaration', 'arrow_function', 'class_declaration', ...],
    typescript: ['function_declaration', 'arrow_function', 'class_declaration', 'interface_declaration', ...],
    python: ['function_definition', 'class_definition', 'decorated_definition', ...],
    // 其他语言...
};

AstCodeSplitter根据代码的语法结构进行分割，保留逻辑上完整的代码单元（如函数、类、方法等）。

创建自定义代码分割器

要创建自定义代码分割器，只需实现Splitter接口。例如，可以创建一个基于正则表达式的简单分割器：

export class RegexCodeSplitter implements Splitter {
    private chunkSize: number;
    private chunkOverlap: number;
    
    constructor(chunkSize: number = 2500, chunkOverlap: number = 300) {
        this.chunkSize = chunkSize;
        this.chunkOverlap = chunkOverlap;
    }
    
    async split(code: string, language: string, filePath?: string): Promise<CodeChunk[]> {
        // 实现基于正则表达式的分割逻辑
        // ...
    }
    
    setChunkSize(chunkSize: number): void {
        this.chunkSize = chunkSize;
    }
    
    setChunkOverlap(chunkOverlap: number): void {
        this.chunkOverlap = chunkOverlap;
    }
}

文件同步与Merkle树

claude-context使用Merkle树来高效同步代码库的更改，只更新修改过的文件。

文件同步器

FileSynchronizer负责管理代码库与向量数据库之间的同步：

export class FileSynchronizer {
    // 同步文件系统更改到向量数据库
    async sync(options: SyncOptions): Promise<SyncResult>;
    
    // 强制重新索引所有文件
    async reindexAll(options: SyncOptions): Promise<SyncResult>;
    
    // 仅同步指定文件
    async syncFiles(filePaths: string[], options: SyncOptions): Promise<SyncResult>;
}

Merkle DAG实现

MerkleDAG类实现了Merkle有向无环图，用于高效检测文件更改：

export interface MerkleDAGNode {
    path: string;
    hash: string;
    children: MerkleDAGNode[];
    isFile: boolean;
    mtime: number;
    size: number;
}

export class MerkleDAG {
    // 从目录构建Merkle DAG
    async buildFromDirectory(rootPath: string): Promise<MerkleDAGNode>;
    
    // 比较两个Merkle DAG，找出差异
    findDifferences(other: MerkleDAGNode): string[];
}

实际应用示例

自定义嵌入示例

以下是如何使用自定义嵌入服务的示例：

import { Embedding, EmbeddingVector } from 'claude-context/core/embedding';

class CustomEmbedding extends Embedding {
    protected maxTokens: number = 8192;
    private apiKey: string;
    
    constructor(apiKey: string) {
        super();
        this.apiKey = apiKey;
    }
    
    async embed(text: string): Promise<EmbeddingVector> {
        // 调用自定义嵌入API
        const response = await fetch('https://api.example.com/embed', {
            method: 'POST',
            headers: {
                'Content-Type': 'application/json',
                'Authorization': `Bearer ${this.apiKey}`
            },
            body: JSON.stringify({ text })
        });
        
        const data = await response.json();
        return {
            vector: data.embedding,
            dimension: data.dimension
        };
    }
    
    // 实现其他必要方法...
}

// 在Context中使用自定义嵌入
const context = new Context({
    embedding: new CustomEmbedding('your-api-key'),
    vectorDB: new MilvusVectorDatabase({/* 配置 */}),
    splitter: new AstCodeSplitter()
});

自定义文件包含规则

claude-context允许自定义文件包含规则，控制哪些文件应该被索引：

可以在同步时指定包含和排除模式：

const syncResult = await synchronizer.sync({
    includePatterns: ['**/*.ts', '**/*.tsx'],
    excludePatterns: ['node_modules/**', 'dist/**'],
    onProgress: (file) => console.log(`正在处理: ${file}`)
});