news 2026/4/3 6:14:20

AI核心知识56——大语言模型之ToT(简洁且通俗易懂版)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI核心知识56——大语言模型之ToT(简洁且通俗易懂版)

Tree of Thoughts (ToT / 思维树)是提示工程(Prompt Engineering)中一种高级且强悍的推理框架

如果说Chain of Thought (CoT / 思维链)是让 AI“一条路走到黑”地线性思考,那么ToT就是让 AI 学会像人类大师一样“深思熟虑、多步推演、甚至回头重来”

它是目前解决高难度复杂推理问题(如数学证明、创意写作、复杂代码架构)的最强手段之一。


1. 🌳 核心理念:从“线”到“树”的进化

为了理解 ToT,我们先看 AI 思考模式的进化史:

  1. Input-Output (IO / 直接问答)

    • 模式:问题 → 答案。

    • 缺陷:靠直觉瞎蒙,容易出错。

  2. Chain of Thought (CoT / 思维链)

    • 模式:问题 → 步骤1 → 步骤2 → 步骤3 → 答案。

    • 缺陷线性思维。一旦中间某一步走错了(比如步骤2算错了),后面就全错了,且 AI不知悔改,只会硬着头皮继续错下去。

  3. Tree of Thoughts (ToT / 思维树)

    • 模式:问题 → 步骤1 → {分支A, 分支B, 分支C} ...

    • 优势

      • 探索 (Exploration):在每一个节点,AI 会构思出多种可能得下一步(分支)。

      • 评估 (Evaluation):AI 会自我评估:“分支 A 看起来不太对,分支 B 更有希望”。

      • 回溯 (Backtracking):如果发现分支 B 走不通了,AI 会掉头回来,去走分支 C。

一句话总结:ToT 允许 AI 在脑子里进行“预演”,如果不通就换条路,直到找到最优解。


2. ⚙️ ToT 是如何工作的?(四个步骤)

在 PE 工程中,实施 ToT 通常需要通过代码(如 Python 脚本)配合 Prompt 来实现一个循环:

  1. 思维分解 (Decomposition)

    • 把一个大问题拆解成若干个小的思维步骤(Thought Steps)。

  2. 思维生成 (Thought Generation)

    • 在当前步骤,让 AI 生成k个可能的下一步。

    • 例子:玩 24 点游戏,手牌是4, 9, 10, 13。AI 生成:“4+9=13”, “13-10=3”, “10/4=2.5” 等几种可能。

  3. 状态评估 (State Evaluation)

    • 让 AI(或者外部评分器)给这几个可能的下一步打分。

    • 评估:“10/4=2.5 产生了小数,对于算 24 点可能不利,低分”;“4+9=13 看起来不错,保留”。

  4. 搜索算法 (Search Algorithm)

    • 使用BFS (广度优先搜索)DFS (深度优先搜索)来遍历这棵树。如果评估分数太低,就剪枝(Prune),不再继续往下想。


3. 🧠 经典案例:24点游戏

24 点游戏(用 4 个数字通过加减乘除算出 24)是测试 ToT 的经典考题。

  • CoT (思维链) 的表现

    • 它通常会试着算一下,如果第一步算错了(比如先算了 4+9=13,然后发现后面没法凑出 24),它就卡住了,最后强行胡编一个答案。

    • 成功率:约 4%(在 GPT-4 早期测试中)。

  • ToT (思维树) 的表现

    • 它列出所有第一步的可能性。

    • 它发现“先算 4+9”这条路走不通,于是回溯,尝试“先算 13-9”。

    • 经过多轮推演,它找到了路径。

    • 成功率:飙升至74%


4. ⚖️ 代价是什么?

虽然 ToT 强无敌,但它有一个巨大的缺点:贵且慢

  • Token 消耗巨大:CoT 只需要生成 1 次回答。ToT 可能需要生成 10 次、100 次甚至更多次(因为要探索很多分支),Token 消耗量是指数级增长的。

  • 延迟高:用户可能要等很久才能拿到答案。

因此,ToT 通常只用于那些“必须要对”、“逻辑极其复杂”且“不在乎时间成本”的任务(如数学证明、复杂代码架构设计、长篇小说大纲规划)。


总结

Tree of Thoughts (ToT)是 Prompt Engineering 从“话术技巧”迈向“算法工程”的标志。

它不仅仅是在写 Prompt,而是在用 Prompt 实现搜索算法。它让 AI 拥有了人类最宝贵的思维品质:深思熟虑自我纠错

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/21 23:35:30

vue和springboot框架开发的家庭医生预约服务软件设计_7mr4t5lr

文章目录具体实现截图主要技术与实现手段关于我本系统开发思路java类核心代码部分展示结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!具体实现截图 同行可拿货,招校园代理 vuespringboot_7mr4t5lr 框架开发的家庭医生预约服务…

作者头像 李华
网站建设 2026/4/1 10:44:34

PLC控制三相异步电机正反转控制

一、控制系统整体设计方案 PLC控制三相异步电机正反转系统旨在实现电机的平稳换向与安全运行,适用于机床、传送带、水泵等工业设备的方向控制场景。系统采用模块化设计,主要由四大核心部分组成:PLC控制核心、电机驱动模块、操作指令模块及保护…

作者头像 李华
网站建设 2026/3/27 8:50:17

AI驱动的水环境遥感:海量数据高效处理与智能解译实战

随着全球水资源日益紧缺与水环境问题日益严峻,传统的水体监测方法已难以满足大范围、高时效、精细化的管理需求。遥感技术凭借其覆盖广、周期短、信息丰富的优势,正逐渐成为水环境监测的核心手段。然而,面对海量多源的遥感数据,如…

作者头像 李华
网站建设 2026/3/30 0:20:16

任务5-3 分组汇总与排序

文章目录1. 实战概述2. 实战步骤2.1 聚合函数2.2 GROUP BY子句2.3 HAVING子句2.4 ORDER BY子句2.5 LIMIT子句3. 实战总结1. 实战概述 本实战围绕图书销售数据,系统运用 SQL 聚合函数(COUNT、SUM、AVG、MAX、MIN)、GROUP BY 分组、HAVING 筛选…

作者头像 李华
网站建设 2026/3/18 10:27:58

【必藏】大模型应用架构详解:安全过滤、提示工程到向量数据库的完整指南

大型语言模型(LLM)应用架构远比简单的输入输出复杂,包含安全过滤器、提示模板、示例选择器、Agent、模型编排、结构化输出、向量数据库、记忆系统和缓存等关键组件。这些组件共同确保了LLM应用的安全性、准确性和高效性,使系统能够处理复杂任务、保持上下…

作者头像 李华