1. 基础介绍

在这里插入图片描述

这里的 200K 指的是当前模型(Sonnet 4.6)的 最大上下文窗口(context window)= 200,000 tokens。

👉 这个聊天最多可以装 200,000 个 token 的内容
👉 包括:你发的所有内容

  • Cursor 自动读的代码文件
  • AI 回答的内容
  • 历史上下文

如果到 200K

  • 模型会开始「丢弃最早的对话」

  • 或者报 context 超限错误

  • 或回答质量下降

2. 如何更高效使用token

应用场景: 我现在需要Cursor帮我分析一个功能模块,后续我要根据它分析的功能模块结果去新增我需要写的内容,但是第一步Cursor分析的时候已经占用掉了我大概 148k、咨询了下AI给出的建议是:

把“分析”变成“压缩知识

2.1 第一步:让它帮你做一次“结构压缩

在当前聊天里输入:

请把刚才对这个模块的分析,
整理成:
1. 模块职责
2. 核心数据结构
3. 关键流程
4. 重要依赖关系
5. 潜在风险点

要求:
- 精简
- 不要重复废话
- 控制在 2000 token 内
- 用结构化 bullet point

目的:
👉 把 50K token 的分析
👉 压缩成 3~5K token 的“知识摘要”

这一步非常关键。

2.2 第二步:复制这个“压缩总结”

👉 开一个新聊天
👉 把压缩总结贴进去
👉 再说:

基于以上模块结构,
现在我要实现 XXX 功能
要求:
- 不破坏原架构
- 保持现有风格
- 给出完整代码

这样做的效果是: 上下文干净、token 使用极少、推理更精准、不会丢早期信息

❌ 千万不要做的事
❌ 继续在 150K 上下文里写代码

因为:每次回复都会重新读 150K、成本指数级增加、响应变慢、容易出现 “幻觉改动”

🚀 更高级做法(推荐)

如果你长期开发一个项目,建议采用:

「分析线程」和「实现线程」分离

线程 用途
聊天A 专门做架构分析
聊天B 专门写代码
聊天C 专门写测试

每个线程都: 用压缩总结作为起点、不共享历史长对话、这才是专业用法。

🧠 一句话核心思维

分析 = 一次性
实现 = 多次迭代
不要把“一次性分析上下文”带入“多次实现对话”。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐