如何激发出大模型的推理能力？详解两种思维链(CoT)技术

今天的大模型分为推理模型和非推理模型，且推理模型的回答质量往往好于非推理模型。我们来回顾一下大模型的推理能力到底是怎么激发出来的？今天的大模型能力非常强都具备推理能力，我们得回到gpt3时代（2020年），大模型还没有太多推理能力的时代。

Lifeng66666666

1033人浏览 · 2025-06-27 21:04:01

Lifeng66666666 · 2025-06-27 21:04:01 发布

今天的大模型分为推理模型和非推理模型，且推理模型的回答质量往往好于非推理模型。我们来回顾一下大模型的推理能力到底是怎么激发出来的？

今天的大模型能力非常强都具备推理能力，我们得回到gpt3时代（2020年），大模型还没有太多推理能力的时代。

GPT3的问题

结合少样本示例的GPT3虽已展示强大能力,但对于复杂问题还力不从心，如图1左边示例所示：

在让gpt3回答问题前，先给一个回答示例：问：罗杰又5个网站…A：答案是11.（为什么要在输入中给出回答示例？因为这样的话gpt3的性能会大幅提高。示例也可以去掉只是性能会降低）

再给出自己的问题：食堂有23个苹果…他们现在有多少

最后gpt3回答27，答案错误。

这样的表现和GPT3的强大文本理解能力是不匹配的，GPT3像一个强大的文本生成器却不具备逻辑思考能力，问题出在哪里，如何激发出它应该具备的推理能力？

思维链提示(CoT)

也许GPT3只是还还不理解提问者的问题，它可能认为这是一个文本续写问题而不是数学推理问题。如果能提示清楚让它知道这是个数学推理问题，需要推理解决，相信GPT3就能回答对。

在这里插入图片描述

如何激发出大模型的推理能力？思维链提示CoT（《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》 ) 就回答了这一问题，而且解决方法很简单：只需在模型输入中明确加入思维链（推理过程）提示，如图1右边所示，相比原始输入，在给出答案示例前增加了推理过程：“A：罗杰一开始有5个球…6个网球…答案是11”，而不是仅仅是只给出“答案是11”这个答案。

这个加入推理过程提示的方法就是原始CoT的核心了，虽然简单却实实在在可以提高大模型的性能。

研究者在数学，常识和符号推理方面做了实验，以此证明CoT的有效性。

研究者使用如下提示词，再不同数据集上进行实验：

在这里插入图片描述