大家好,我是苍一,一个干了13年的后端开发,正在探索AI编程,从产品到开发的全生命周期最佳实践,如果您感兴趣,欢迎关注👇,看我如何自我革命。

背景:从Claude转向Codex

过去一年多一直是Claude重度用户,从Sonnet 3.5到Opus 4.6每一代都在用,连续充了十几个月的200美元。转折发生在最近,GPT-5.5搭配Codex App使用,体验让我意外。从20美元升级到100美元,再到200美元,决策过程本身就说明了问题。

一个具体的对比测试

某天凌晨两点,100美元档位Codex用完了5小时额度。犹豫要不要升200美元,决定先用Claude顶一段。

任务很简单:优化一个带分组和子菜单的下拉菜单组件。

1️⃣ Claude的表现

方案存在几个明显问题。反复询问确认,沟通效率低。最终产出的代码设计不符合产品直觉,可读性一般。这是我做vibe coding以来少数几次直接回滚的情况。

2️⃣ Codex的表现

同样需求原封不动喂给Codex,两轮对话就完成了。代码干净,结构清晰,连细节都理解到位。不需要反复沟通,结果拿来就能用。

付费策略的调整

对比之后把Claude从200美元降到100美元,下个月再降到20美元。回顾Anthropic在AI编程领域的积累,从Sonnet 3.5开始就领跑,但到了Opus 4.7,至少在我的使用场景里出现了明显退步。

产品设计层面的差距

3️⃣ 交互设计

Claude App把功能拆成Chat、Cowork、Code三个板块。Codex没有这种拆分,用起来更直觉。

4️⃣ Session管理

Codex把Archive作为一级交互,操作路径短。Claude App的Session管理依赖右键菜单,操作层级深。表面上是按钮放哪的问题,实际上反映的是两个团队对Agent管理的理解深度不同。

5️⃣ 基础功能

Claude App连基本的Rewind操作都做不好,和Claude CLI的体验完全是两个水平。同一个公司的产品差距大到不像一家人做的。

GPT-5.5带来的变化

GPT-5.5的模型能力确实强。不是泛泛的"更强",而是在具体编程任务中理解需求更准确,生成代码更干净,沟通成本更低。这种差距在简单任务上不明显,但在复杂需求中会放大。

写作场景的不同

公平地说,Claude在非编程场景下依然有优势。写文章、做内容生成这类任务质量在线。问题集中在代码生成和产品级UI实现上。

总结

从200美元月付降到20美元,背后是一年多的使用体验积累。Anthropic在AI编程领域曾经是标杆,但Opus 4.7的表现让我不得不重新评估。Codex加GPT-5.5的组合在编程场景中确实更实用。不是说Claude不行了,而是竞争格局在变化。建议两个都试试,用自己的实际任务做对比。

如果嫌文章太长、怕后面走丢,可以关注下面的ima知识号,让这篇文章成为你的知识顾问,随时随地等候你的提问。

知识号中内容会以笔记形式分享,可以根据大家反馈和实测情况,实时更新,保证最新方案的稳定、可用。

【ima 知识库】

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐