本文首发于2026年5月7日,基于最新版Codex实测

背景:最近OpenAI发布了Codex的重大更新,整个程序员圈子都在讨论。有人说"以后不需要程序员了",也有人说"AI还是不行"。我花了整整3天,把Codex的所有功能都测了一遍,给大家一个真实的答案。


前言:我为什么要做这个测评?

先交代一下我的背景:35岁老程序员,去年被裁,现在靠AI接副业单子。

最近Codex更新刷屏了,朋友圈一半人在吹"AI要取代程序员了",另一半人在说"AI还是垃圾,写的代码根本不能用"。

我花了3天时间,用最新版Codex做了:

  • ✅ 10个真实项目需求

  • ✅ 从简单脚本到复杂系统

  • ✅ 对比了Cursor、Claude、GPT-4o

  • ✅ 算了一笔账:普通人靠AI编程到底能赚多少钱

全文5000字,没有虚的,全是干货。


一、先看结果:Codex 2026到底有多强?

测试1:简单Python脚本(入门级)

需求:写一个批量重命名图片的脚本,按日期排序,支持多种格式


# 我只输入了一句话:"写一个批量重命名文件夹中图片的脚本,按创建日期排序,支持jpg/png/webp,文件名格式:日期_序号.扩展名"



# 然后Codex输出了这个:

import os

from datetime import datetime



def batch_rename_images(folder_path):

    """

    批量重命名文件夹中的图片文件

    按创建日期排序,命名格式:YYYYMMDD_HHMMSS_序号.扩展名

    """

    # 支持的图片格式

    image_extensions = {'.jpg', '.jpeg', '.png', '.webp', '.gif', '.bmp'}

    

    # 获取所有图片文件

    images = []

    for filename in os.listdir(folder_path):

        ext = os.path.splitext(filename)[1].lower()

        if ext in image_extensions:

            file_path = os.path.join(folder_path, filename)

            create_time = os.path.getctime(file_path)

            images.append((create_time, filename, ext))

    

    # 按创建日期排序

    images.sort(key=lambda x: x[0])

    

    # 重命名

    renamed_count = 0

    for index, (create_time, filename, ext) in enumerate(images, 1):

        date_str = datetime.fromtimestamp(create_time).strftime('%Y%m%d_%H%M%S')

        new_name = f'{date_str}_{index:03d}{ext}'

        old_path = os.path.join(folder_path, filename)

        new_path = os.path.join(folder_path, new_name)

        

        # 避免重名

        counter = 1

        while os.path.exists(new_path):

            new_name = f'{date_str}_{index:03d}_{counter}{ext}'

            new_path = os.path.join(folder_path, new_name)

            counter += 1

        

        os.rename(old_path, new_path)

        renamed_count += 1

        print(f'重命名成功: {filename} -> {new_name}')

    

    print(f'\n完成!共重命名 {renamed_count} 个文件')



if __name__ == '__main__':

    folder = input('请输入文件夹路径:').strip()

    if os.path.isdir(folder):

        batch_rename_images(folder)

    else:

        print('文件夹路径无效!')

测评结论: ✅ 100分

  • 有完整的注释

  • 有异常处理(文件名重复怎么办)

  • 有用户友好的交互

  • 代码风格规范,符合PEP8

人类程序员写这个需要多久? 大概30分钟。

Codex写这个需要多久? 17秒。


测试2:Flask后端接口(进阶级)

需求:写一个用户注册登录的Flask接口,包含JWT认证,密码加密,参数校验

这个需求我给了10个程序员朋友做,平均耗时:2小时。

Codex耗时:2分17秒

输出了什么?

  1. ✅ 完整的项目结构(路由、模型、工具类分开)

  2. ✅ bcrypt密码加密

  3. ✅ JWT token生成和验证

  4. ✅ pydantic参数校验

  5. ✅ 统一的响应格式

  6. ✅ 错误处理

  7. ✅ README文档,包含启动命令、测试用例

我实际跑了一下:

  • 改了2个小bug(导入路径问题)

  • 加了数据库连接配置(它用的是SQLite,我换成MySQL)

  • 总共花了15分钟就能用了

测评结论: ✅ 95分

  • 扣5分是因为导入路径需要根据实际项目调整

  • 整体架构、思路、实现都非常好

  • 一个中级程序员的水平


测试3:React前端页面(高级)

需求:写一个任务管理的React页面,包含增删改查,拖拽排序,数据持久化

这个需求的复杂度:

  • 前端UI框架 + 状态管理

  • 拖拽交互

  • 本地存储持久化

  • 响应式布局

Codex耗时:5分42秒

输出结果:

  • ✅ 使用React 18 + TypeScript

  • ✅ 使用dnd-kit做拖拽(不是老的react-dnd,跟上了技术趋势)

  • ✅ localStorage持久化

  • ✅ Tailwind CSS样式

  • ✅ 完整的CRUD操作

我实际跑了一下:

  • 直接就能跑!几乎没改什么

  • 样式还挺好看的

  • 拖拽流畅,没有bug

测评结论: ✅ 90分

  • 真的惊到我了,写得比很多初级前端还好

  • 代码组织清晰,命名规范

  • 可以直接用到真实项目中


测试4:完整的全栈项目(专家级)

需求:做一个简单的博客系统,包含:

  • 后端:FastAPI + PostgreSQL

  • 前端:React + TypeScript

  • 功能:文章CRUD、用户认证、评论、搜索

  • 部署:Docker-compose一键启动

这个需求的人类开发时间: 高级程序员1-2天,中级3-5天。

Codex耗时:23分钟

输出了什么?


blog-system/

├── backend/

│   ├── app/

│   │   ├── __init__.py

│   │   ├── main.py          # FastAPI入口

│   │   ├── models.py        # SQLAlchemy模型

│   │   ├── schemas.py       # Pydantic schema

│   │   ├── crud.py          # 数据库操作

│   │   └── auth.py          # JWT认证

│   ├── requirements.txt

│   └── Dockerfile

├── frontend/

│   ├── src/

│   │   ├── components/      # 组件

│   │   ├── pages/           # 页面

│   │   ├── services/        # API调用

│   │   └── App.tsx

│   ├── package.json

│   └── Dockerfile

├── docker-compose.yml

└── README.md

我实际测试:

  • docker-compose up -d 直接就能跑起来

  • 前端后端都没问题

  • 功能基本完整,我加了一些样式优化就可以用了

测评结论: ✅ 85分

  • 扣15分是因为:有些边缘情况没考虑到,比如异常处理、边界条件

  • 但整体架构、思路、实现都是对的

  • 一个中级程序员2天的工作量,它23分钟搞定了


二、对比其他工具:谁才是最好的AI编程工具?

我同时测了4个工具:

  1. OpenAI Codex(最新版)

  2. Cursor 3.0(内置Claude)

  3. GPT-4o(通用大模型)

  4. Claude 3 Opus(Anthropic的大模型)

测试维度:代码质量、速度、理解能力、bug率

对比维度 Codex Cursor GPT-4o Claude 3
代码质量 95分 85分 80分 88分
生成速度 100分 80分 85分 70分
需求理解 90分 92分 85分 95分
bug率 5% 12% 15% 8%
上下文长度 128k 200k 128k 200k
综合得分 92分 87分 83分 89分

结论:

  • 纯写代码:Codex > Claude 3 > Cursor > GPT-4o

  • 沟通需求:Claude 3 > Cursor > Codex > GPT-4o

  • 长代码项目:Cursor(Claude)> Codex > GPT-4o

我的建议:

  • 写单个函数/小脚本:用Codex,又快又好

  • 做复杂项目/长代码:用Cursor(Claude 3),上下文够长

  • 需求不清晰,需要沟通:用Claude 3,理解能力最强


三、灵魂拷问:普通人还能靠AI编程赚钱吗?

这是大家最关心的问题,我直接给答案:

能,但不是你想的那种方式。

误区1:靠AI写完整项目,接单赚钱

❌ 不现实

为什么?

  1. 客户的需求永远是模糊的,AI无法独立跟客户沟通

  2. 复杂项目需要架构设计能力,AI还差得远

  3. 出了bug需要人来排查,AI只能辅助

现实情况: 你还是需要懂编程,AI只是提升你的效率。


误区2:学会用AI,就可以当程序员了

❌ 也不现实

为什么?

  • AI写的代码你需要能看懂

  • 出了bug你需要能排查

  • 你需要知道什么是好代码,什么是坏代码

  • 你需要理解业务逻辑,把需求翻译成代码

现实情况: AI把"会写代码"的门槛降低了,但"会写好代码"的门槛反而更高了。


✅ 普通人靠AI编程赚钱的3个正确姿势

姿势1:成为"AI编程prompt工程师"

帮别人写高质量的prompt,让AI产出更好的代码。

收费标准: 500-2000元/个prompt

适合人群: 懂编程,但不想天天写代码的人

收入预期: 月入5000-20000元

姿势2:做"代码定制化"服务

用AI快速生成代码,然后帮客户做定制化修改、部署、维护。

收费标准: 2000-10000元/个小项目

适合人群: 有一定编程基础,能看懂改代码的人

收入预期: 月入10000-50000元

姿势3:做SaaS工具,靠AI放大

用AI快速开发一个小工具,然后靠订阅赚钱。

收费标准: 99-299元/人/年

适合人群: 有产品思维,能找到痛点的人

收入预期: 月入10000-100000+元


💰 我自己的真实数据

我现在靠AI接副业单子,真实收入:

月份 接单数量 总收入 平均每单 实际工作时间
3月 3个 8500元 2800元 15小时
4月 5个 16800元 3360元 22小时
5月(到今天) 2个 7600元 3800元 8小时

关键变化:

  • 以前做一个单子要3-5天

  • 现在用AI,1-2天就能搞定

  • 效率提升了3倍,收入自然也提升了

核心不是AI替你干活,而是AI让你效率提升3-10倍。


四、AI编程时代,程序员会失业吗?

我的答案:80%的初级程序员会失业,但20%的高级程序员会赚得更多。

哪些人会被淘汰?

  1. 只会写CRUD的程序员 - AI写CRUD比你快10倍,bug还少

  2. 不学习新工具的程序员 - 别人用AI一天干你一周的活,你怎么比?

  3. 只会写代码不会沟通的程序员 - 未来最值钱的是把需求翻译成代码的能力


哪些人会更值钱?

  1. 架构师 - AI能写代码,但不会做系统架构

  2. 问题解决者 - 能快速定位问题、解决bug的人

  3. 产品思维程序员 - 懂业务、懂产品,能把需求变成代码的人

  4. 会用AI的程序员 - 用AI把自己的效率放大10倍的人


五、给普通人的建议:现在开始学AI编程,晚不晚?

我的答案:不晚,恰恰是最好的时候。

给新手的3个建议

1️⃣ 不要从头学编程了,先学用AI写代码
  • 以前:先学Python基础 → 数据结构 → 算法 → 框架 → 做项目

  • 现在:先学怎么让AI帮你写代码 → 做项目 → 遇到不懂的再补基础

顺序反过来了!

2️⃣ 找一个小项目,边做边学

不要看了100个教程还没写过一行代码。

找一个简单的需求,比如:

  • 批量重命名文件(就是我测试的第一个)

  • 爬取某个网站的数据

  • 做一个简单的待办清单

用AI帮你写,边写边学,遇到不懂的就查。

3️⃣ 建立你的"AI编程工具箱"
  • Codex:写单个函数/小脚本

  • Cursor:做复杂项目/长代码

  • Claude 3:沟通需求/理解业务

  • GitHub Copilot:IDE内补全

每个工具都有它擅长的地方,组合使用效率最高。


六、总结:AI编程的未来

最后说几句心里话:

  1. Codex很强,但还不能取代程序员 - 它是最好的副驾驶,但不是司机

  2. 效率提升是真的 - 以前一周的活,现在1-2天就能干完

  3. 真正赚钱的人,是会用AI的人,不是AI本身 - AI是工具,工具不会赚钱,人会赚钱

  4. 不要焦虑,也不要轻视

    • 焦虑没用,AI不会因为你焦虑就停下来

    • 轻视也没用,AI真的会淘汰那些不学习的人

  5. 最好的时机就是现在

    • 5年前开始做AI的人,现在都是大神了

    • 现在开始做AI的人,5年后也会是大神

    • 总比5年后再后悔"当年我怎么没学AI"强


后记

写完这篇测评,我最大的感受是:

AI不是来取代程序员的,它是来让那些真正会用它的程序员,赚到以前10倍的钱。

以前你一个月只能做2个项目,赚2万。

现在你用AI,一个月能做10个项目,赚10万。

这就是AI的价值。

它不是来抢你饭碗的,它是来帮你把饭碗做大的。

当然,前提是你愿意学习,愿意改变。


💡 觉得有用的话,欢迎点赞、收藏、评论交流!

你用AI写代码了吗?效率提升了多少?欢迎在评论区分享!

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐