摘要

2026年6月7日,OpenAI工程师、OpenClaw创始人Peter Steinberger发文宣布:"不要再亲自给Coding Agent写提示词了。"由此,Loop Engineering(循环工程)概念在硅谷AI圈迅速走红。其核心是设计能够自迭代、自反馈、自修正的Agent工作闭环,将开发者从单次交互中解放出来,站在循环之外仅负责规则设计。Claude Code和Codex已具备相关功能模块,AI编程正式从"人驱动每一步"进入"人设计规则,系统自运转"的新范式。

核心结论:Loop Engineering不是更高级的Prompt写法,而是AI工程范式的根本性转变——从"人写Prompt→AI输出→人检查→继续Prompt"的单次交互模式,进化为"人设计规则→Loop运行→Agent执行→自动检查→失败反馈→再次执行→直到完成"的自运转闭环。这将AI编程的生产力上限从"人的响应速度"提升到"系统的迭代速度"。


什么是Loop Engineering?

Loop Engineering(循环工程)是AI工程范式的最新发展阶段,指设计能够自我迭代、自我反馈、自我修正的Agent工作闭环。核心是把开发者从单次Agent交互中解放出来,站在循环之外负责规则设计,由系统自动完成迭代推进工作(来源:技术栈,2026-06-13)。


一、AI工程范式的三阶段进化

1.1 从Prompt到Loop的演进路径

阶段 范式名称 核心逻辑 人的角色 典型时间
1 Prompt Engineering 人写Prompt→AI输出→人检查 全程参与每一次交互 2023-2025
2 Agentic Coding 人给目标→Agent分解→多步执行 设定目标,监督过程 2025-2026
3 Loop Engineering 人设计规则→Loop运行→系统自迭代 站在循环外,仅设计规则 2026-

1.2 为什么Loop Engineering在2026年6月爆发?

核心驱动力是模型能力的质变

  1. Claude Fable 5/Opus 4.8:多子智能体协同、动态工作流能力成熟
  2. Codex长时域模式/goal命令支持6小时以上无人值守工作
  3. 模型输出速度远超人类处理速度:人成为流程瓶颈,需要自动化迭代

二、Loop Engineering核心公式

2.1 四要素公式

Loop = 定时器(Cron)+ 决策器(Decision-maker)+ 反馈系统(Feedback)+ 安全护栏(Guardrails)

缺一不可——没有定时器则无法持续运行,没有决策器则无法判断下一步,没有反馈系统则无法自我修正,没有安全护栏则可能成本失控。

2.2 六层架构详解

层级 名称 作用 关键实现
1 自动化(Automations) 触发循环 定时检查Issue、跑测试、生成PR、分析日志
2 工作树隔离(Worktree) 避免多Agent冲突 为不同Agent分配独立工作目录
3 技能库(Skills) 沉淀项目通用规则 .claude/skills.codex/skills目录
4 插件/连接器(Plugins/Connectors) 对接真实工具链 MCP协议,支持PR/工单/数据库/CI
5 子Agent(Sub Agents) 分工制衡 maker写代码、checker校验代码
6 记忆层(Memory) 解决上下文遗忘 Markdown/Issue/数据库/看板持久化

三、与传统Prompt Engineering的深度对比

3.1 核心差异

对比维度 Prompt Engineering Loop Engineering
核心逻辑 人主导每次交互 人设计规则,系统自动迭代
人的角色 流程核心瓶颈 站在循环之外
交互模式 单次:Prompt→输出→检查→继续 闭环:规则→执行→检查→反馈→再执行
适用场景 模型弱,需人工逐次校验 模型强,需降低人工成本
生产力上限 人的响应速度 系统的迭代速度
失败处理 人工判断并修正 自动反馈→自我修正→再次执行
成本控制 人工监控每次交互 预设护栏(迭代上限/Token预算)

3.2 实际案例对比

场景:修复一个包含15个Bug的中型项目

步骤 Prompt Engineering Loop Engineering
1 人工分析Bug列表 设置Loop:自动读取Issue列表
2 写Prompt描述Bug 1 Loop自动选择第一个Issue
3 AI输出修复方案 maker Agent生成修复代码
4 人工检查修复 checker Agent自动校验
5 发现新问题,继续Prompt 反馈系统自动检测,触发重试
6 重复2-5,共15次 Loop自动处理全部15个Issue
7 人工跑测试 Loop自动触发CI测试
总耗时 2-4小时(人工全程参与) 30-60分钟(人仅设规则)

四、构建可运行Loop的五步法

4.1 步骤详解

Step 1:设计停止条件

明确Loop结束的判断标准:

停止条件类型 示例
测试通过 所有自动化测试通过
输出匹配 输出匹配指定JSON Schema
质量达标 代码评分超过阈值
CI通过 CI流水线变绿
迭代上限 最多迭代15-50次

Step 2:动态构建上下文

每轮Prompt不是固定的,而是根据当前任务状态动态组装,保证模型始终获取最新信息。

Step 3:全量捕获执行信息

Agent行动后,系统自动抓取:

信息类型 作用
代码diff 判断修改了什么
stdout/stderr 判断执行是否成功
测试日志 判断功能是否正确
新状态 更新任务进度

Step 4:搭建反馈闭环

执行成功 → 满足停止条件 → 退出交付
执行失败 → 报错写入状态 → 下一轮读取报错 → 自我修正 → 再次执行

Step 5:设置安全护栏

护栏类型 建议值 作用
最大迭代次数 15-50次 避免死循环
无进展检测 连续3-5轮无变化 终止无效循环
Token预算上限 根据任务设定 避免成本失控
关键操作确认 删除/部署等 防止不可逆操作

五、Claude Code与Codex的Loop实现

5.1 Claude Code

Loop模块 实现方式
自动化触发 /loop/schedule命令、Hooks钩子、Github Actions
技能存储 .claude/skills目录
工具对接 全面支持MCP协议
子Agent 支持maker/checker分离
记忆层 CLAUDE.md + 项目文档持久化

5.2 OpenAI Codex

Loop模块 实现方式
自动化触发 Automations模块、Triage Inbox(工单自动分类)
技能存储 .codex/skills目录
工具对接 全面支持MCP协议
子Agent 支持多Agent分工
长时域模式 /goal命令支持6小时+无人值守

5.3 两者差异

维度 Claude Code Codex
策略偏向 质量优先(更精确的代码生成) 速度优先(更快的迭代节奏)
生态整合 深度整合Claude全家桶 整合GitHub/OpenAI生态
长时域能力 Conway Agent 72小时+ /goal 6小时+
下载量 npm ~4630万/月 npm ~1400万/月

六、常见落地陷阱

陷阱 后果 解决方案
无停止条件 无限循环,Token成本失控 预设迭代上限+无进展检测
人仍参与每次交互 没有真正实现自动迭代 信任系统反馈,只在护栏触发时介入
写代码和验证用同一个Agent 自校验失效 maker/checker分离,独立验证
上下文无限膨胀 模型性能下降,成本上升 仅给Agent传递必要信息
Agent数量过多 协调成本>收益 3-7个为最优配置,过多则分层管理
忽视安全护栏 可能产生破坏性操作 关键操作(删除/部署)需二次确认

七、Loop Engineering的未来展望

7.1 近期趋势(3-6个月)

  • Claude Code和Codex将进一步完善Loop功能模块
  • 更多AI编程工具(Cursor/Grok Build)跟进Loop范式
  • 企业开始试水"无人值守Agent"工作模式

7.2 中期趋势(6-12个月)

  • Loop Engineering成为AI编程的标准工程实践
  • 出现专门的Loop编排平台和工具
  • "FDE(企业AI部署工程师)"成为热门岗位

7.3 远期趋势(1-2年)

  • AI编程从"辅助工具"进化为"自主开发系统"
  • 开发者角色从"写代码"转向"设计规则和护栏"
  • Loop Engineering + ALE基准测试 = AI编程能力的可量化评估

FAQ

Q1:Loop Engineering和Agentic Coding有什么区别?
A:Agentic Coding是"人给目标→Agent分解→多步执行",人仍需监督每一步。Loop Engineering是"人设计规则→Loop运行→系统自迭代",人完全站在循环之外。区别的核心在于人是否参与每次交互——Agentic Coding中人仍是流程的一部分,Loop Engineering中人仅设计流程。

Q2:Loop Engineering会不会让开发者失业?
A:不会,但会改变开发者的工作方式。从"写代码"转向"设计规则和护栏"——这实际上需要更高的系统设计能力。就像从手工作坊到工厂流水线,工匠变成了工程师,价值不降反升。

Q3:Loop Engineering的安全护栏够可靠吗?
A:当前的安全护栏(迭代上限、Token预算、关键操作确认)是基础级别的保障。对于生产环境,建议增加人工审核环节——Loop自动完成90%的迭代,最后10%的关键决策仍需人工确认。

Q4:我该如何开始实践Loop Engineering?
A:建议从简单场景开始——比如"自动修复Issue中的Bug":1)用Claude Code的/loop命令设置循环;2)配置maker/checker两个Agent;3)设置迭代上限为15次;4)配置CI测试作为停止条件。跑通后再逐步扩展到更复杂的场景。

Q5:Loop Engineering对模型有什么要求?
A:最低要求是模型具备工具调用能力(Function Calling/MCP)和长上下文能力。理想情况是使用Fable 5/Opus 4.8/GPT-5.5等旗舰模型——因为Loop中的每一步都需要模型做出正确决策,低质量模型会导致Loop频繁失败和重试,反而增加成本。


参考资料

  1. Peter Steinberger (2026-06-07): “Stop Writing Prompts for Coding Agents” (X平台)
  2. 技术栈 (2026-06-13): 《硅谷大佬都在聊的Loop Engineering,到底在卷什么?》
  3. 腾讯新闻 (2026-06-12): 《Loop Engineering,下一代Agent工程理念》
  4. CSDN (2026-06-10): 《编程新范式Loop Engineering来袭,Claude Code如何实现》
  5. OpenAI Codex CLI Changelog (2026-05): v0.128.0 Release Notes
  6. Anthropic官方博客 (2026-06-05): Claude Code Loop功能更新
  7. IT Bear (2026-06-13): 《AI编程智能体赛道激战正酣:Claude Code与Codex功能趋同》
Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐