手撕Claude Code:那些官方文档打死不说的骚操作
最近社区争议挺大的。有用户发现Claude Code的思考深度从1月底的约2200字符,到2月下旬骤降到720字符,降幅67%。更惨的是“读改比”——从优质期的6.6掉到了退化期的2.0,模型研究投入减少了70%。AMD AI部门的Stella Laurenzo公开吐槽,团队已经暂停把它用于硬件调试和内核级开发。我自己也确实感受到了这种变化。有一段时间它开始跟我说“你该去睡觉了”“太晚了今天就到这
手撕Claude Code:那些官方文档打死不说的骚操作
作为一个从去年就开始折腾Claude Code的老油条,我可以负责任地说一句话:这东西用好了是真香,用砸了是真疼。今天就掏心窝子聊聊我这大半年跟Claude Code斗智斗勇攒下来的那些坑和招,顺便吐槽一下最近让它变得又懒又笨的更新。
别迷信一上来就让AI写代码
大多数新人犯的第一个错误,就是打开终端敲个claude然后甩一句“帮我写个电商网站”。Claude Code确实很强大,但你不能把它当成阿拉丁神灯。
我的第一个建议是:先用/init命令。 这货会扫描你整个项目的文件结构和代码,在项目根目录下生成一个.claude/文件夹和CLAUDE.md文件。很多老手觉得这一步可有可无,但2026年社区共识很明确:CLAUDE.md已经跟.gitignore一样重要了。
具体怎么填这个文件?不是越多越好。有个黄金法则:对于每一行,问自己“删掉这行会不会让Claude犯错?”如果不会,就删掉。比如你不需要告诉它JavaScript的基本语法,但一定要告诉它你项目里奇怪的那套构建流程、独特的代码规范、还有那些谁都搞不清楚的环境变量配置。
我自己习惯在CLAUDE.md里放这些东西:常用命令(npm run dev还是bun start)、测试命令怎么写、PR命名规范、还有那些团队文档里不会写但大家心知肚明的潜规则。
一个任务,一个Session,别指望它陪你过夜
这是血的教训。Claude Code的长对话会慢慢“变质”——随着上下文越来越长,它的回复质量肉眼可见地往下掉。
我现在的工作流是:每开始一个新任务,就开一个新的会话。 然后给这个会话一个清晰的目标:“完成用户登录模块的单元测试”。做完就退出来,下一个任务重新开。这样既能保证每次对话的上下文干净利落,也能让你的token消耗更容易控制——说到token,最近有个大坑后面会讲。
Sub-agent是我用过最爽的玩法
单次给Claude扔一个大而全的任务,说“帮我重构代码、找bug、写测试、顺便解释一下逻辑”,结果基本是一地鸡毛。
解决方案就是Sub-agent——给AI分配专门的角色,每个只干一件事。我现在常驻了几个:
- 重构专家:规则很明确——不能动业务逻辑,只改可读性和命名,去除重复。
- Bug分析员:专门对付那种“应用有时候会崩溃”的模糊报告,必须找出复现路径。
- 测试生成器:专门写测试代码,覆盖边界条件和正反场景。
- 安全审查:凡是涉及认证的代码,推之前必跑一遍。
就像组建了一个AI小分队,每个人都有明确分工,输出质量稳定多了。之前有一段时间我发现代码审查的质量突然上来了,后来一看才发现是自己顺手在review prompt里加了个“你是一位资深工程师”的前缀,效果立竿见影。
从“理解代码”到“跑通代码”——心态的转变
Claude Code有一个被很多人忽略的核心转变:它不再满足于“看懂你的代码”,而是转向了“跑通你的代码”。
这是什么意思?以前我们用AI辅助编程,逻辑是:让AI理解代码结构,然后生成修改方案。但Claude Code采用了“终端调试范式”——以执行反馈驱动多轮试错。
举个例子:你说“修复登录页面的这个bug”,以前的AI会读代码、分析、给你改好。Claude Code会直接执行npm run dev,看控制台报什么错,然后根据真实错误信息去调试,甚至自动运行测试来验证修复是否有效。
这带来的好处是显而易见的:AI不再是纸上谈兵,而是真的在“干活”。坏处是你得做好心理准备——它可能会执行一些你意想不到的命令。
别怕权限,也别完全不管
说到执行命令,就不得不提Claude Code的权限系统。
一开始用的时候,每次AI要执行一个shell命令都得停下来问我要不要授权,简直烦死了。后来我试了“危险跳过权限”,有一次它差点把我整个项目删了。
2026年3月Anthropic推出了自动模式(Auto Mode) ,算是中间路线。它会在执行工具调用前先过一个分类器,检查是不是危险操作(比如大量删除文件),安全的自动执行,危险的会被阻止。
我现在就这么用——安全性和效率基本能平衡。但说句实话,不管用什么模式,定期备份永远是真理。
云上跑Routines:睡觉也能干活
这是2026年4月刚上线的新功能,我体验了一周,只能说“牛逼”。Routines就是把提示词、代码仓库、连接器打包,存下来,然后Claude在Anthropic的云上按时间表或GitHub事件自动执行。
我最常用的场景是:每晚凌晨2点,让Claude从Linear拉一个优先级最高的bug,尝试修复,然后开一个draft PR。 第二天上班直接review就行。
另一个用法是让Routines盯着某个敏感目录,比如/auth-provider模块的任何PR改动,自动总结并发布到Slack频道。这样一来,团队里再也不用追着人问“这个PR改了啥”了。
安全层面有个默认设置值得注意:Routines默认只能推到claude/前缀的分支,不会直接动main。这个护栏建议保留,除非你的review流程非常完善。
Token优化不是玄学
用Claude Code最肉疼的就是token消耗。有用户反映一周的配额一上午就烧掉一半。我踩过的坑和总结的经验:
第一,模型选择要分层。90%的编码任务用Sonnet就够了。只有需要深度推理的复杂架构、或者安全分析这种不能漏掉的场景才上Opus。探索和搜索任务用Haiku,快、便宜、够用。
第二,用CLI+Skills替代MCP。很多MCP(比如GitHub MCP、Supabase MCP)其实可以用CLI命令替代,MCP只是外面包了一层,还占上下文窗口。实测把几个不常用的MCP换成CLI+Skills后,token消耗降了不少。
第三,小心那个“Extra Usage”的坑。最近有人逆向发现了Claude Code的一个bug:一旦你进入超额付费模式,缓存时长会从1小时偷偷降为5分钟。这意味着你只要停5分钟以上,就会触发一次完整的上下文重建,费用直接从Extra Usage里扣。而且5分钟缓存的费用比1小时缓存贵1.8倍。作者验证过,服务器是愿意给1小时缓存的,是客户端自己降级的。
最后,说点扎心的大实话
最近社区争议挺大的。有用户发现Claude Code的思考深度从1月底的约2200字符,到2月下旬骤降到720字符,降幅67%。更惨的是“读改比”——从优质期的6.6掉到了退化期的2.0,模型研究投入减少了70%。AMD AI部门的Stella Laurenzo公开吐槽,团队已经暂停把它用于硬件调试和内核级开发。
我自己也确实感受到了这种变化。有一段时间它开始跟我说“你该去睡觉了”“太晚了今天就到这吧”,一开始我还以为是不小心让它知道了我的deadline。还有人说Claude Code变得“又懒又笨”,不读代码就编辑、不完成就停止、用最简单的修复而非正确方案。
但说实话,这并没有让我放弃用它。只是使用策略变了——以前我敢让它自己跑一个下午,现在我每个关键步骤都要人工确认。
核心心态就一句话:把Claude Code当成杠杆,不是魔法。在你试错成本低的地方大胆用,在犯错成本高的地方保守一点。用对了是10倍效率神器,用错了是钱包收割机。目前来看,它依然是我用过最强的AI编程Agent。
更多推荐



所有评论(0)