思维链（Chain-of-Thought）：让模型「先把话说清楚再算」

更新: 4/11/2026 字数: 0 字时长: 0 分钟

一、背景

你有没有试过：直接问模型一道稍绕的应用题，它张口就错；你在提示里加一句 「请一步一步推理」，正确率就上去了。这种 显式写出中间步骤 再给出最终答案的技巧，常被叫作 思维链（Chain-of-Thought, CoT）。

做 数学、逻辑、代码调试、复杂业务规则 类需求时，CoT 往往是 零成本先试 的利器——不用训模型，只改提示。它和 Agent 里的规划步骤、RAG 里的分步检索 也能自然组合：先把问题拆清，再决定查什么、调什么工具。

**1. CoT——中间推理步骤作为「草稿纸」**通俗解释：不让模型直接跳答案，而是先输出 Step1、Step2…，最后 Therefore…。详细解答：自回归模型在生成步骤时，后续 token 以 前面步骤 为条件，相当于 扩大有效计算深度；对需要多跳推理的任务往往有效。
2. Zero-shot CoT vs Few-shot CoT通俗解释：Zero-shot 只加一句「Let's think step by step」类指令；Few-shot 在提示里给 带推理过程的例题。详细解答：例题要和 目标任务同构，否则模型会抄错套路；语言也要一致（中文题配中文链）。

第一步：注意力能「看见」自己刚写的推理通俗解释：前面写出来的步骤会进上下文，后面生成时 能引用，减少跳步错误。详细解答：步骤太长会 挤占窗口 或漂移，需要 摘要或分阶段。
**第二步：不是万能，简单题可能「想太多」**通俗解释：分类、短提取类任务，硬 CoT 反而慢、还可能引入胡编步骤。详细补充：任务路由——简单走直连，复杂再走 CoT。
第三步：忠实度问题通俗解释：步骤看起来合理，最后结论仍可能错——要校验（工具、代码执行、单元测试）。详细解答：CoT + 自我验证（再检查一遍）是常见增强。

1. Tree-of-Thought / 多路径探索通俗解释：不只一条链，而是 分支尝试，再选最优；成本高，适合难谜题。简单补充：Agent 场景里常见 重试与回溯。
2. 与结构化输出结合通俗解释：要求 JSON 里单独字段存 reasoning 和 answer，方便日志审计与前端展示。简单补充：解析失败要有 fallback。
3. 和之前知识点的关联CoT 吃 Token，和 上下文窗口强相关；提示工程 决定 CoT 格式；幻觉可能体现在 胡编步骤——关键结论仍要验证。

总结：CoT 是 推理类 Prompt 的标配工具；和 RAG、工具调用叠在一起，才接近「能干活」的助手，而不是只会一句最终答案的聊天框。