整理一下 Claude Code、Cursor、Aider 三个工具切换自定义 API 端点的配置方法。这几个工具都支持 OpenAI 兼容端点,配置本身不难,但有些细节容易踩坑,写出来给大家参考。


为什么要换端点

AI 编程工具按量付费的成本增长很快。特别是 Claude Code,做大范围重构或者读整个项目上下文时,据我自己观察,一次对话的 token 消耗量很惊人。
换自定义端点的核心收益有两个:一是通过大模型网关拿到优势价格,二是可以在同一个端点下按任务类型灵活切换模型。日常补全可以上便宜的,复杂推理上最强的,做一个按需选择。
下面的配置示例以 TikHub AI(ai.tikhub.io)的端点为例,其他 OpenAI 兼容的网关服务配置方式基本一致。


Claude Code

两个环境变量,加到 .bashrc.zshrc

export ANTHROPIC_BASE_URL=https://ai.tikhub.io
export ANTHROPIC_API_KEY=your-key

重启终端生效。验证:

echo $ANTHROPIC_BASE_URL
# 输出 https://ai.tikhub.io 说明配置正确

临时切回官方端点:unset ANTHROPIC_BASE_URL


Cursor

设置路径:SettingsModelsOpenAI API Key,填入 Key,然后在 Override OpenAI Base URL 填:

https://ai.tikhub.io/v1

Cursor 支持按场景手动选模型,日常补全用 GPT-4.1,复杂任务切 Claude Opus。


Aider

环境变量方式:

export OPENAI_API_BASE=https://ai.tikhub.io/v1
export OPENAI_API_KEY=your-key

aider --model gpt-4.1

或者写 .aider.conf.yml 持久化配置:

openai-api-base: https://ai.tikhub.io/v1
openai-api-key: your-key
model: gpt-4.1

按任务选模型

换端点之后可以灵活调配模型,这里分享一下实际用下来的搭配经验:

任务 模型 理由
日常补全、小改动 GPT-4.1 mini 响应快,成本几乎可以忽略
代码重构 Claude Sonnet 上下文理解准确
架构设计、复杂调试 Claude Opus 推理最强,复杂任务值得用
写测试、样板代码 GPT-4.1 够用且便宜

大概 70% 的日常工作用中低档模型完全够,只有复杂任务才需要上 Opus。这样整体成本大概能压到之前的 40-50%。


踩坑记录

Streaming 兼容:Claude Code 默认走 streaming,大部分兼容端点没问题,但偶尔会遇到 SSE 格式的微小差异导致输出卡住。碰到这个情况先确认端点的 streaming 实现是否完整。

模型名称:不同端点对同一个模型的命名可能不一样。比如 Claude Sonnet 4 在官方 API 是 claude-sonnet-4-20250514,有些端点接受简写 claude-sonnet-4。建议先查端点的模型列表确认准确名称。

上下文长度:通过代理调用时,上下文限制取决于底层模型本身。如果端点默认限制了 max_tokens,需要手动调高,否则 Claude Opus 的 200K 上下文优势发挥不出来。

网络延迟:多了一层代理转发,延迟会增加 50-150ms 左右。对 streaming 场景影响不大(首 token 慢一点但后续 token 流畅),但如果你对延迟极度敏感,需要评估一下。


配置很简单,通过改环境变量就可以在实际用起来之后按任务合理分配模型,做到大幅度降低成本。有问题欢迎和我交流。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐