codex可以100%正式接管所有编程工作了吗?
不过最近在用codex分析codex的源码,感觉还是有不小的几率在胡说八道,特别是有些看不懂的代码让codex解释全局的设计思路和思想。能肉眼可见的bug增加,但是有些数据还是比较好看的,比如你出去说你公司代码80%都是ai写的,就很高端。以前很多人是没能力去做这些事情的,现在我不用花太多功夫,他们有ai协助,人的成长是更快的。反正有事就说ai写的。有了ai后学习非常快,以前做一个东西要学到80分
反正测试做的太简单了,项目大一些的话,很容易失控。code review 也是不可持续的,大脑review 速度远远跟不上gpu吐token速度
codex现在我设置的是读上下文扔给opus,opus不允许读上下文而是等着codex喂,有输入后根据输入出计划以及设计拆解任务。
执行层面的事情扔回给codex,纯前端委派给gemini3.1p(复杂逻辑还是codex),最后opus再根据codex给的结果出文档。
opus贵到我只能这样用了,还是codex便宜好用,可惜就是慢
我做第一个功能的时候只有个简易文档,没接口设计和美术设计,结果花的时间比我自己从头做还慢。后来改进了一下尽量后置前端工作,尽可能等美术策划完善他们的东西再动手,效率已经比我自己做要快一些了,而且思考比我全面。但我们的工作节奏没办法每次都这样,这是让我最难受的。
第一步(你已经在做):pytest-cov → 覆盖率报告 → 补测试 第二步(该加的) :mutmut → 变异测试 → 验证测试质量 第三步(未来的) :CI 门禁 → 覆盖率+变异存活率双指标卡合并 我问AI让我这么做的到底对不对?
实际上应该要尽力做到AI闭环完成写代码-测试,人只进行初始的方向把控和最终验收。这样尽量减少人的context swtich,并且减少人拖慢AI进度(尽量减少AI等人,提升throughput)。
Generation is cheap 也是非常重要的insight。我之前一直有旧思维—让AI改代码而不是重新生成—这样其实效率非常低下,因为要大量人工介入。目前正在尝试怎么实践这一点。
我现在在用oh-my-opencode插件做任务分发。opus先做plan拆任务、分配独立任务到子agents,总结文档。codex做所有逻辑性的代码,gemini 3p仅做前端界面与css。
codex最大的问题就是总结性文档写起来不像是给人类看的,opus就好很多。
哈基米3pro这模型真的很奇怪,幻觉比另外两个要多很多,前端代码最好也得是那种一次性生成的,上下文稍微长一点它就喝醉了。
在AI Native时代,需求高速迭代的情况下,agent.md该如何高效维护呢,这块有什么想法嘛,如果每一个迭代都需要更新的话我个人感觉反而失去了agent.md本身的意义
一朋友公司他们vibe coding后工作量增加,只能一直应付,现在连codereview都不做了,也是ai做。梳理流程也应付了事。反正有事就说ai写的。
能肉眼可见的bug增加,但是有些数据还是比较好看的,比如你出去说你公司代码80%都是ai写的,就很高端。比如你以前一个月修出10个bug修10,现在出50个BUG修50个,工作效率提升5倍....
目前看来,指导AI干活跟指导他们没什么两样,只不过:
1 不用付多人工资了,只需付订阅Max的月费
2 AI最大的缺点是记不住,得反复唠叨,最大的优点是听话,从来不反驳。
如果不懂的话,最好先跟gemini之类的头脑风暴下,自己写简单demo测试下
有了ai后学习非常快,以前做一个东西要学到80分估计要半年,现在估计两三天就能学到60分,但是你想学到80分也得一两周,越往后ai的提效效果越不明显
so,问题来了
1、大型项目中多人合作开发,特别是开发使用ai的水平不一,如何协调彼此之间的代码风格和进行code review?是都采用同一个大模型和项目维护同一套提示词开发吗?
2、如果有人离职之后,代码交接和需求整理都是由ai负责?那需要一个超大的项目记忆库来记录?
3、既然有了ai,是不是可以定期对项目进行重构,减少屎山代码的出现。
不过最近在用codex分析codex的源码,感觉还是有不小的几率在胡说八道,特别是有些看不懂的代码让codex解释全局的设计思路和思想。不过在我明确知道要怎么做,要去哪里看代码的情况下codex的理解力是非常不错的。
我把任务交给其他人之前会结对plan一遍,他们跟着走一遍,相当于提高高强度开发,提升也快了。以前很多人是没能力去做这些事情的,现在我不用花太多功夫,他们有ai协助,人的成长是更快的。
要相信一点,认真做事情的人,总能在做事中提升。。。
更多推荐



所有评论(0)