往期热门文章:
1、工作六年,看到这样的代码,内心五味杂陈...
2、聊聊Mybatis-Plus中的10个坑!
3、为什么 Claude Code 没有一句废话?扒光它的底层提示词,我悟了!
4、面试官尬笑:你说半天就能读完一个开源项目源码,不就是用 AI 吗?我说:是用 DeepWiki,而且是 Codemap 模式!
5、Claude Code、Cursor 和 Codex,到底选哪个?

Prompt 已死,GPT-5.5 官方新的提示词指南发布!

最近流行这样一句话,只要你学的慢,就什么都不用学了。因为,知识落后的太快了。

回想一下 AI 发展初期的盛况,Prompt 提示词盛行,还有不少大佬站台,现在已经很少再听到提示词的声音了。

最近,GPT-5.5 发布后,官方还发布了一个提示词指南https://developers.openai.com/api/docs/guides/prompt-guidance。这份指南的核心信息非常明确:GPT-5.5 不是 GPT-5.4 的“更强版本”,而是一个需要重新调优的“新模型家族”

下面,我们就来一起看看这份指南透露着哪些秘密。

强调从零开始,反对直接迁移

OpenAI 在指南开头就给出了一个强烈警告。

To get the most out of GPT-5.5, treat it as a new model family to tune for, not a drop-in replacement for gpt-5.2 or gpt-5.4. Begin migration with a fresh baseline instead of carrying over every instruction from an older prompt stack.

这意味着,以前你花几个月精心调优的 prompt,直接搬到 GPT-5.5 上可能表现更差。

结果导向,而非过程导向

告诉它要什么而不是怎么做。过去用 AI 模型,很多人习惯写一长串步骤,手把手教模型该先查什么、再比什么、最后怎么输出。OpenAI 在指南里直接说了,这套玩法过时了。GPT-5.5 的推理能力够强,你只需要描述清楚想要的结果、成功的标准和限制条件,剩下的让它自己规划路径。

指南原话的意思是:以前的模型比较笨,需要你教它每一步怎么走,但对 GPT-5.5 来说,这些啰嗦的指令反而成了干扰,会缩小它的搜索空间,让输出变得死板

对开发者来说,这意味着需要重新审视手头积攒的提示词模板。以前管用的“保姆式”写法,现在可能适得其反。

旧 prompt 常写“第一步做 X,第二步做 Y”,新指南建议改为描述目标状态、成功标准、约束条件和可用证据,让模型自己选择路径。

旧风格:First inspect A, then inspect B, then compare every field...
新风格:Resolve the customer's issue end to end. Success means: [标准]. Constraints: [限制].

推崇最小有效提示

指南还建议从能维持产品功能的最短 prompt 开始,然后逐步调优。旧模型需要 500+ 字的系统提示来“引导”行为,而 GPT-5.5 的推理能力更强,过长的提示反而会成为噪音,限制模型的搜索空间。

明确的停止规则和检索预算

指南强调要给模型设定何时停止搜索、何时放弃、何时询问用户的规则,避免过度推理和无限工具调用。

Use the minimum evidence sufficient to answer correctly, cite it precisely, then stop.

这相当于给 AI 装上性格和刹车,指南中也花了不少篇幅讲这两件事。

  • 一是怎么给模型设定性格(语气、态度、合作方式)

  • 二是怎么让它知道什么时候该停

性格设定分两层。一层是“听起来像什么人”,比如热情还是干练、直接还是委婉。另一层是“怎么干活”,比如什么时候该主动提问、什么时候可以自己做主。OpenAI 建议两层都写短,几句话就够。

停止条件可能更实用。指南建议给搜索行为设定“检索预算”,明确告诉模型:搜到什么程度就收手。比如第一次搜索如果已经能回答问题,就别再搜了。只有在核心问题没被回答、缺少关键事实、或用户要求穷尽所有情况时,才允许发起下一次搜索。

这对做客服、做知识问答产品的团队很有参考价值。搜索次数直接关联 Token 消耗和成本,设好预算能省不少钱。

引入新的可控参数

  • reasoning_effort:控制推理深度(low/medium/high/xhigh),这是迁移中最关键的调优点。多数场景下 low 配合精简 prompt 效果最好。

  • text.verbosity:控制输出冗长度,设为 low 可获得比 GPT-5.4 更简洁的回复。

流式响应的前置更新模式

对于多步骤或工具密集型任务,指南建议在调用工具前先发送 1-2 句话的用户可见更新,说明已收到请求并告知第一步做什么。这能显著改善“模型是不是卡住了”的感知体验。

说白了,GPT-5.5 在开始输出文字之前,可能会在后台默默花时间推理和规划。用户盯着空白屏幕等待的体验很差。指南建议让模型在正式干活之前,先输出一两句话,告诉用户“收到了,我先做这个”。

这不会让任务真的变快,但能让用户觉得响应快了。做过产品的人都知道,感知速度有时候比实际速度更重要

Prompt 正在贬值

这份指南透露了什么信息?看下面这个表格吧。

信号

解读

模型行为发生质变

GPT-5.5 的推理引擎更激进,对提示词的响应机制与旧模型有本质不同,不是简单的"更大更强"

Prompt Engineering 正在贬值

旧时代的技巧(角色扮演、重复强调、一步步思考、few-shot 示例)不再有效,甚至有害。模型不再需要哄骗和引导

OpenAI 在推自动驾驶范式

指南鼓励用户描述目的地而非画路线图,配合 reasoning_effort 参数,说明 OpenAI 希望模型承担更多自主决策

Agentic 工作流成为核心场景

大量篇幅讨论工具调用、多轮状态管理、phase 值、长运行工作流,说明 GPT-5.5 的设计重心是 Agent 而非聊天

Codex 是官方推荐的迁移工具

OpenAI 提供了 $openai-docs migrate this project to gpt-5.5 命令,让 AI 自动帮你重写 prompt,这本身就说明了迁移的复杂性和必要性

旧 prompt 已死

现在回想一下,我开头提到的那句话。如果我们没学过提示词,那现在也不需要再学了。模型的推理已经足够智能。

这样带来的好处是,我们不需要再写复杂的“咒语”了。直接说清你要什么、给谁看、什么格式,模型就能给出稳定、一致的结果。

需要注意的是,模型对模糊指令的处理变了,以前它会“猜”,现在更可能直接问你。想要创意空间,需要明确授权

但是,如果你是API 开发者用户,指南建议你必须重新评估所有生产环境的 prompt。最高风险的是那些依赖“越狱式框架”、过度角色扮演、链式思维引导或重复约束的 prompt。

指南给出的迁移 checklist 如下所示。

  • 删除冗余目标陈述,只写一次

  • 删除 think step by step 等链式思维引导

  • 删除重复约束,每个约束只说一次

  • 将语气/人格指令移到 system prompt

  • 用 Structured Outputs 代替 prompt 里的输出格式定义

  • 用 reasoning_effort 和 verbosity 参数替代 prompt 里的行为控制

如果你是Prompt Engineer,指南也给出了如下建议。

  • 职业内涵在转变:从“写更复杂的 prompt 来补偿模型缺陷”转向“写更精简的 prompt 来定义目标和约束”。Prompt Engineering 正在从“技巧”变成“工程规范”。

  • 新核心能力:设计清晰的成功标准、约束边界、停止规则和检索预算,而不是堆砌示例和角色设定。

如果你管理AI 产品/团队,指南建议关注下面两点。

  • 成本结构会变:GPT-5.5 的 token 效率更高(更少重试),但 API 价格更高(输入  ,输出 30/1M)。精简 prompt + 合理设置 reasoning_effort 是控制成本的关键。

  • 需要建立新的评估基线:旧模型的 eval 数据不能直接套用,需要针对 GPT-5.5 重新跑基准测试。

总结

这份指南释放了一个清晰的信号,大模型正在从“需要手把手教的实习生”变成“可以托付任务的高级同事”。你的 prompt 应该从操作手册变成“项目 brief”,定义目标、标准和边界,然后让模型自己找路径。

对于我们使用者来说,这既是好消息(更简单、更稳定),也是挑战(旧经验可能失效,需要重新学习)。最务实的做法是,听 OpenAI 的建议,从最小 prompt 开始,用 Codex 自动迁移工具辅助,针对代表性样本重新调优

总之,这一切的一切看起来是,有了 Harness Engineering 之后,AI 迎来了全新范式。

往期热门文章:

1、GitHub 榜首竟是个 Markdown 文件,还狂揽 4.5 万 Star

2、强烈建议大家使用 Linux 做开发?

3、Cursor被扒底裤!Claude Code套壳实锤,500亿估值全靠Ctrl+H?

4、Git 诞生 21 周年,1000+ 命令的它是如何变臃肿的?

5、一张图带你搞懂AI圈的那些“黑话”

6、开源 10 天就飙到 4 万星,这个项目收集了 58 个知名网站样式。

7、面试中被嘲笑Token放在Redis里,怎么应对?

8、2小时5万Star!敲10句话去睡觉,AI连夜干出51万行代码霸榜GitHub

9、线上问题定位神器:Arthas,已接入MCP
10、Txt、Word 等用了 30 年,AI 为什么首选 Markdown?

图片

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐