小米 Token Plan 接入 Claude Code 完整指南:配置与优化详解
本文介绍了如何通过小米Token Plan使用Claude Code的详细教程和成本优化策略。主要内容包括:小米Token Plan的特点(按量付费、价格透明、兼容Claude);环境配置步骤(安装Claude Code、使用CC-Switch工具或手动配置);以及10项经过验证的Token优化方法,如排除无关文件、编写CLAUDE.md固化知识、使用压缩命令等,可显著降低使用成本。文末还提供了常
本文手把手教你如何在不订阅 Claude 官方的情况下,通过小米 Token Plan 使用 Claude Code,并给出经过验证的 Token 优化策略,帮你有效控制成本。
一、小米 Token Plan 简介
小米 MiMo 开放平台近期推出了 Token Plan 预付费套餐,允许开发者按量付费调用 MiMo 系列模型(包括 mimo-v2.5-pro、mimo-v2.5、mimo-v2-flash 等)。相比官方 Claude 订阅,Token Plan 的特点:
- 无需固定月费:用多少扣多少,适合间歇性使用。
- 价格透明:1M token 输入最低 0.7 元(根据上下文长度阶梯计价)。
- 兼容 Claude Code:通过修改 API 端点即可无缝接入。
新用户福利:通过邀请码注册可得 ¥10 体验金(有效期 40 天)。
- 邀请码:
U8X436 - 注册链接:https://platform.xiaomimimo.com?ref=U8X436

注册后进入控制台 → API 密钥管理 → 创建密钥,保存好。
二、环境准备:安装 Claude Code 与配置工具
2.1 安装 Claude Code
npm install -g @anthropic-ai/claude-code
验证安装:claude --version
2.2 安装 CC-Switch(推荐,方便多模型切换)
CC-Switch 是图形化工具,可一键切换 API 供应商,避免手动改配置。
- 下载地址:GitHub 搜索
CC-Switch,选择对应操作系统的最新 release。 - 安装后打开,切换到「Claude Code」标签页。
点击「+ 添加供应商」→ 搜索「Xiaomi MiMo」→ 填入 API Key。模型映射按如下填写:
| Claude Code 内部角色 | 推荐 MiMo 模型 | 说明 |
|---|---|---|
| 主模型 | mimo-v2.5-pro |
旗舰模型,能力最强 |
| Sonnet 默认模型 | mimo-v2.5 |
主力模型,性价比最高 |
| Haiku 默认模型 | mimo-v2.5 |
轻量任务也用这个,够用且便宜 |
| Opus 默认模型 | mimo-v2.5-pro |
复杂推理用旗舰 |
保存后,CC-Switch 会自动修改 Claude Code 的配置文件。
2.3 手动配置(不用 CC-Switch 的情况)
找到 Claude Code 的全局配置文件:
- Windows:
%USERPROFILE%\.claude\settings.json - macOS/Linux:
~/.claude/settings.json
如果不存在则新建。写入以下内容(替换 YOUR_API_KEY):
{
"env": {
"ANTHROPIC_BASE_URL": "https://api.xiaomimimo.com/anthropic",
"ANTHROPIC_AUTH_TOKEN": "YOUR_API_KEY",
"ANTHROPIC_MODEL": "mimo-v2.5-pro",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "mimo-v2.5",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "mimo-v2.5",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "mimo-v2.5-pro"
}
}
保存,重启 Claude Code 生效。
2.4 绕过官方 API 验证的底层原理与补充技巧
Claude Code 官方版本强制要求通过 Anthropic 的 OAuth 登录才能使用。要绕过这一限制,本质是 让 Claude Code 以为自己在与官方 API 通信,实际上将请求转发给第三方兼容端点。以上两种配置(CC-Switch / 手动)已经做到了这一点。但若仍遇到 /login 提示,可按以下步骤彻底解决:
✅ 确认关键配置项
ANTHROPIC_BASE_URL 必须设置为小米的端点(如 https://api.xiaomimimo.com/anthropic),不能留空或指向 Anthropic 官方地址。
ANTHROPIC_AUTH_TOKEN 必须填写以 tp- 开头的小米 API Key。
hasCompletedOnboarding 必须为 true。
⚠️ 消除残留登录状态
如果之前运行过 Claude Code 并登录过 Anthropic 官方账号,需要删除缓存文件:
Windows:删除 %USERPROFILE%.claude\oauth.json 和 %USERPROFILE%.claude\credentials.json
macOS/Linux:删除 ~/.claude/oauth.json 和 ~/.claude/credentials.json
🔄 使用 claude-code-router 实现更彻底的“欺骗”(可选)
对于追求极致稳定性的用户,可以部署一个本地中转服务,让 Claude Code 的所有请求先经过一个代理,再由代理转发给小米 API。这样即使 Claude Code 更新后加强了检查,中转层依然有效。
bash
npm install -g @musistudio/claude-code-router
创建 ~/.claude-code-router/config.json:
json
{
“Providers”: [
{
“name”: “xiaomi-mimo”,
“api_base_url”: “https://api.xiaomimimo.com/anthropic/v1/messages”,
“api_key”: “tp-你的Key”,
“models”: [“mimo-v2.5-pro”]
}
],
“Router”: {
“default”: “xiaomi-mimo,mimo-v2.5-pro”
}
}
启动中转:claude-code-router。然后将 Claude Code 的 settings.json 中 ANTHROPIC_BASE_URL 改为 http://127.0.0.1:3030,ANTHROPIC_AUTH_TOKEN 可随意填写。此时 Claude Code 连接的是本地中转,中转再连接小米,完全屏蔽了官方检测。
🧪 验证绕过是否成功
运行 claude,如果直接进入对话界面而不弹出 /login 提示,即表示成功。也可以发送一条消息,观察是否有正常回复。
三、Token 优化策略(详细版)
以下策略适用于任何 API 后端,能显著降低输入/输出 token 消耗。
3.1 排除无关文件:.claude/ignore
Claude Code 在探索项目时,会自动扫描目录树。如果包含 node_modules、venv、__pycache__ 等大目录,会浪费大量 token。
操作步骤:
- 在项目根目录创建
.claude/ignore文件。 - 按以下模板填写(可根据项目类型增减):
# 依赖与缓存
node_modules/
venv/
.venv/
__pycache__/
*.pyc
*.pyo
# 构建输出
dist/
build/
.out/
.output/
*.egg-info/
# 日志与临时文件
*.log
*.tmp
*.swp
.DS_Store
Thumbs.db
# 大文件(避免意外读取)
*.zip
*.tar.gz
*.png
*.jpg
*.mp4
# 敏感配置
.env
.env.*
*.pem
*.key
- 保存后,Claude Code 会自动忽略这些路径。
效果:大型前端项目可减少 80% 扫描 token。
3.2 编写 CLAUDE.md:固化项目知识
每次新会话,Claude 需要了解项目结构、技术栈、编码规范。如果每次都手动说明,既麻烦又浪费 token。CLAUDE.md 可以解决这个问题。
操作步骤:
在项目根目录创建 CLAUDE.md,写入以下内容(根据实际修改):
# 项目名称:学生管理系统
## 技术栈
- Python 3.10
- FastAPI
- SQLAlchemy 2.0 (异步)
- MySQL
## 目录结构
- app/main.py - 入口
- app/api/ - 路由
- app/core/ - 配置、数据库、日志
- app/models/ - SQLAlchemy 模型
## 编码规范
- 所有数据库操作使用 async/await
- 函数必须有 docstring
- 使用类型注解
## 常用命令
- 启动:uvicorn app.main:app --reload
- 测试:pytest
- 迁移:alembic upgrade head
Claude Code 会在每次会话开始时自动读取该文件,无需重复说明。
注意:CLAUDE.md 本身会计入输入 token,但有缓存机制(如果 API 支持),多次会话中只计费一次。
3.3 手动压缩对话:/compact 命令
长时间对话会累积大量历史,导致后续请求的输入 token 急剧增加。/compact 可将历史智能摘要,丢弃冗余信息。
使用时机:
- 对话超过 30 轮。
- 感觉 Claude 开始重复之前说过的话。
- 完成一个子任务,准备进入下一个子任务。
操作:直接在 Claude Code 会话中输入 /compact。
效果:后续请求的输入 token 减少 30%~50%,且几乎不影响回答质量。
3.4 限制输出长度:maxOutputTokens
模型有时会输出过长内容,包含不必要的解释或重复。通过限制单次回答的最大 token 数,可以强制模型更精炼。
配置方法:在 settings.json 中添加:
{
"maxOutputTokens": 4096
}
建议值:
2048:适合简单问答、代码片段。4096:适合中等复杂度的函数生成。8192:适合长篇文档或复杂重构(但输出成本更高)。
3.5 设置自动压缩阈值:autoCompactThreshold
当对话历史超过一定 token 数时,自动触发 /compact,避免手动忘记。
配置:
{
"autoCompactThreshold": 80000
}
表示当累积 token 超过 80k 时自动压缩。如果不希望自动压缩,可设置为一个很大的值(如 999999)并养成手动压缩习惯。
3.6 清空会话:/clear 命令
当任务完全切换(例如从修 bug 切换到写文档),旧的历史对话不再有用。此时使用 /clear 彻底清空上下文,比 /compact 更彻底。
操作:输入 /clear。
效果:开启一个全新的会话,但保留系统指令和 CLAUDE.md。
3.7 调整权限:防止意外读取大文件
默认情况下,Claude Code 可以自动读取文件。如果项目中有大文件(比如 10MB 的日志),可能会被意外读入,浪费 token。
配置:在 settings.json 中添加:
{
"permissions": {
"read": "ask",
"write": "ask",
"bash": "ask"
},
"maxFileSizeBytes": 50000
}
read: "ask":每次读取文件前询问。maxFileSizeBytes:超过此大小的文件不会自动读取,需要手动指定行数范围。
3.8 启用 Prompt Caching(如果 API 支持)
Prompt Caching 可以让重复的系统指令(如 CLAUDE.md 内容)只计费一次。小米 API 尚未明确公开支持,但可以尝试开启,无效也无副作用。
{
"enablePromptCaching": true
}
3.9 模型分级:让简单任务用便宜模型
根据任务复杂度选择不同模型:
| 任务类型 | 推荐模型 | 价格(输入/百万) |
|---|---|---|
| 简单问答、格式化、注释生成 | mimo-v2.5 |
0.7 元 |
| 常规编码、单元测试、小范围重构 | mimo-v2.5 |
0.7 元 |
| 复杂架构设计、全项目重构、疑难 Bug | mimo-v2.5-pro |
1.4 元 |
在 CC-Switch 中,已经通过模型映射自动做了分配(Haiku/Sonnet → v2.5,Opus → v2.5-pro)。你也可以在对话中临时使用 /model mimo-v2.5 手动切换。
3.10 监控与分析:定期查看用量
- 小米控制台提供 Token 使用明细,按模型、时间维度展示。
- 在 Claude Code 中输入
/stats可查看当前会话的 token 统计(部分 API 支持)。
建议每周检查一次,找出消耗大户,针对性优化。
四、常见问题与排查
Q1:配置后 Claude Code 报错 401 Unauthorized
- 检查 API Key 是否正确,有无多余空格。
- 确认小米账户余额或 Token Plan 额度充足。
- 重新生成 API Key 并更新配置。
Q2:Claude Code 显示 1.2M token,但小米后台显示 50M 消耗
这是正常现象,原因:
- 小米后台统计的是 Credits,包含模型倍率(Pro 模型消耗更高)。
- Claude Code 发送的请求中携带了系统指令、工具定义等框架成本,这些在客户端统计中可能不全。
- 缓存未命中或写入时有一次性的高开销。
建议:以小米后台实际扣费为准,并通过上述优化策略降低原始 token 消耗。
Q3:如何确认配置已生效?
在 Claude Code 中输入:
/stats
如果能正常显示 token 信息(或至少没有报错),说明配置成功。也可以发一条简单消息,观察是否正常回复。
Q4:CC-Switch 需要一直开着吗?
不需要。CC-Switch 只在切换模型时修改配置文件,修改完成后可以关闭。如需使用本地代理模式(高级功能),则需要保持运行。
五、总结
通过小米 Token Plan 接入 Claude Code,你可以:
- 无需订阅 Claude 官方,按实际使用量付费。
- 利用小米 MiMo 模型的 Agent 优化特性,获得较高的性价比。
- 通过
.claude/ignore、/compact、CLAUDE.md、maxOutputTokens等优化手段,进一步降低 Token 开销。
快速上手命令速查表:
| 目的 | 命令/配置 |
|---|---|
| 排除大文件 | 项目根目录创建 .claude/ignore |
| 固化项目知识 | 创建 CLAUDE.md |
| 手动压缩对话 | /compact |
| 清空会话 | /clear |
| 查看统计 | /stats |
| 切换模型 | /model <模型名> |
| 限制输出长度 | settings.json 中 maxOutputTokens |
| 自动压缩阈值 | settings.json 中 autoCompactThreshold |
邀请码:U8X436
注册链接:https://platform.xiaomimimo.com?ref=U8X436
理性选择工具,按需优化,让 AI 编程真正提升效率而不是增加负担。
本文配置与优化方法已在 Windows 11 + Claude Code 0.5.x + 小米 MiMo API 环境下验证通过。如有变动,请以官方最新文档为准。
更多推荐



所有评论(0)