思维链(Chain-of-Thought):让模型「先把话说清楚再算」
一、背景
你有没有试过:直接问模型一道稍绕的应用题,它张口就错;你在提示里加一句 「请一步一步推理」,正确率就上去了。这种 显式写出中间步骤 再给出最终答案的技巧,常被叫作 思维链(Chain-of-Thought, CoT)。
做 数学、逻辑、代码调试、复杂业务规则 类需求时,CoT 往往是 零成本先试 的利器——不用训模型,只改提示。它和 Agent 里的规划步骤、RAG 里的分步检索 也能自然组合:先把问题拆清,再决定查什么、调什么工具。
二、核心概念和核心原理(详细解答+通俗解释)
(一)核心概念(先通俗,再详细)
**1. CoT——中间推理步骤作为「草稿纸」**通俗解释:不让模型直接跳答案,而是先输出 Step1、Step2…,最后 Therefore…。详细解答:自回归模型在生成步骤时,后续 token 以 前面步骤 为条件,相当于 扩大有效计算深度;对需要多跳推理的任务往往有效。
2. Zero-shot CoT vs Few-shot CoT通俗解释:Zero-shot 只加一句「Let's think step by step」类指令;Few-shot 在提示里给 带推理过程的例题。详细解答:例题要和 目标任务同构,否则模型会抄错套路;语言也要一致(中文题配中文链)。
(二)核心原理(通俗拆解,一步一步讲清楚)
第一步:注意力能「看见」自己刚写的推理通俗解释:前面写出来的步骤会进上下文,后面生成时 能引用,减少跳步错误。详细解答:步骤太长会 挤占窗口 或 漂移,需要 摘要或分阶段。
**第二步:不是万能,简单题可能「想太多」**通俗解释:分类、短提取类任务,硬 CoT 反而慢、还可能引入胡编步骤。详细补充:任务路由——简单走直连,复杂再走 CoT。
第三步:忠实度问题通俗解释:步骤看起来合理,最后结论仍可能错——要校验(工具、代码执行、单元测试)。详细解答:CoT + 自我验证(再检查一遍)是常见增强。
三、补充进阶知识点(易懂不晦涩,适配新手进阶)
1. Tree-of-Thought / 多路径探索通俗解释:不只一条链,而是 分支尝试,再选最优;成本高,适合难谜题。简单补充:Agent 场景里常见 重试与回溯。
2. 与结构化输出结合通俗解释:要求 JSON 里单独字段存 reasoning 和 answer,方便日志审计与前端展示。简单补充:解析失败要有 fallback。
3. 和之前知识点的关联CoT 吃 Token,和 上下文窗口强相关;提示工程 决定 CoT 格式;幻觉 可能体现在 胡编步骤——关键结论仍要验证。
四、文章知识总结
- 背景:多步推理任务上,CoT 常显著提升正确率,且 只改提示 即可试。
- 核心概念:中间步骤当条件;Zero-shot / Few-shot 两路。
- 核心原理:扩大有效推理深度;注意长度与忠实度。
- 进阶:简单任务别硬上;可结构化输出;难任务结合工具验证。
- 核心逻辑:复杂题先拆步,再下结论——和人做题一样。
总结:CoT 是 推理类 Prompt 的标配工具;和 RAG、工具调用叠在一起,才接近「能干活」的助手,而不是只会一句最终答案的聊天框。