大家好,我是Wise,一个在互联网行业写了 20 多年代码的老兵。
这两年 All In 智能体,我越做越确定一件事——所有能长期稳定运行的 Agent,本质上都是一台“状态机”。不是 LLM 决定系统是否可控,而是“状态管理”决定你能不能让它不发疯。这篇文章我想从工程角度讲清楚:为什么做着做着你会发现,不管你愿不愿意,你都得把状态机请回来。
一、我做智能体前,天真地以为:LLM已经不需要状态机
最开始写智能体时,我跟多数开发者一样天真的以为:
“LLM 会推理啊,为什么还要状态机?”
“没必要限制它,让它自己决定下一步做什么,不是更智能吗?”
“流程越开放,越像 AGI。”
结果现实给了我连续三个月的耳光。我做了一个看似简单的自动化任务:
“让 Agent 帮用户找信息、总结、判断是否满足需求、不满足再继续搜索。”
听起来只需要 LLM 推理就能完成。然后你就会看到某些非常“抽象”的行为:
明明只有两步任务,它能给你走出八步
明明已经完成了,它又回去重复第一步
明明失败了,它却说成功
明明应该继续,却突然开始写诗
明明一切都正常,它突然说“我无法访问互联网”
没有状态的 Agent,就像喝醉的外包团队:你永远不知道它现在处在哪一步,也不知道接下来会干什么。那段时间,我每天调试到凌晨,修着修着开始怀疑人生。直到有一个瞬间我终于醒了:LLM的“推理”是概率,不是确定逻辑。而软件系统唯一能依赖的,就是确定性。这两个东西天然冲突。
二、为什么真正的智能体,一定要“状态机”?
理由很现实,不玄学,我总结为三条:
LLM的推理没有“连续性”
今天它能理解你的约束,明天忽然忘了。 这不是模型“坏掉”,这是大语言模型的特性:
没有持久状态
没有执行上下文(超长对话也不行)
没有稳定的内部记忆
你今天把整个项目的逻辑都告诉它,明天它仍然可能告诉你“从第一步再来一次”。
而状态机是什么?把智能体的“注意力”锁定在只有一个状态。把可执行的动作收敛在有限的集合里。这就像把“发散思维”变成“工程思维”。
- 没有状态,Agent 的“行为边界”不可控
没有状态机的 Agent,会出现三种典型灾难:
行为漂移:突然做出没要求的动作
任务倒退:执行完第 3 步突然回到第 1 步
逻辑循环:因为模型随机性,永远无法结束任务
我试过加一些提示词约束,我甚至写过长达 1500 字的提示词规范。结果依旧会发疯。提示词永远无法保证行为边界。只有状态机能。
多智能体协作中,没有状态机根本走不通
很多人幻想多智能体协作:“让 Agent A、B、C 自己讨论,一个负责规划,一个执行,一个检查……”,现实是,只靠 LLM 推理,这玩意儿 5 分钟就失控:
他们会互相否定
会重复工作
会争抢同一个任务
会在一个无意义节点无限争论
最后你发现它们比人类更不擅长合作
为什么?因为缺少一个东西:
状态机 = 协作的“裁判” + “交通灯” + “秩序规则”
没有状态,你根本不知道:
A 到底执行完没有?
B 是否可以接手?
整个系统是否处于“规划中、执行中、检查中、等待输入、失败回滚”等哪种状态?
你看到的“混乱”,不是智能体的问题,本质是缺乏状态的系统注定混乱。
三、我最终定下的智能体架构:表面是LLM,本质是状态机
这两年做下来,我的结论越来越坚定:智能体不是“自由流动的思考系统”,它是“带概率推理模块的状态机”。我现在所有框架基本都变成以下模式:
StateMachine: - state: Idle → Planning → Executing → Reviewing → Finished - transition: 明确写死,可控,可观察 - LLM 作用:在限定状态中“生成动作”LLM是动作生成器,不是流程控制器。流程控制权永远掌握在人手中。我最喜欢的一句话:约束不是降低智能,而是让智能具备“可用性”。
四、为什么大厂、创业团队、开源社区都最终引入状态机?
你看到任何成熟系统:AutoGPT、LangGraph、CrewAI、Meta 的 JARVIS、多模态机器人系统……你会发现一个共同点:
workflow
graph pipeline
event loop
behavior tree
有限状态机 FSM
不同叫法,本质都是一样的:把智能体的生命过程分成“可控阶段”。为什么大家最终都会这么做?因为工程上只有两条路:
要么接受 AI 的随机性,不可控,不可复现
要么为 AI 加上结构,强约束,可观测,可调试
后者才是“能落地”的路线。
五、智能体状态机的未来:不仅是工程强制,还会演变成“行业标准”
GPT-5 出现以后,一个趋势非常明显:模型越来越强,但“控制层”越来越重要。未来智能体系统的竞争不是:
prompt 谁写得好
工具接口谁多
模型谁更大
而是:谁能把高智力的“概率机器”变成可控、可预测、可复现的生产系统。状态机,在这一层会成为默认架构组件。就像今天没有任何大型项目敢不用:
日志系统
CI/CD
API 网关
中间件
监控体系
未来也不会有人敢做一个无状态管理的智能体系统。因为那不是智能体,那是赌博机。如果你做智能体做到某一天突然想发脾气、突然怀疑人生、突然觉得模型在和你作对……恭喜你,你正走向成熟。因为你终于意识到——智能体不是智能的问题,是“工程”问题。工程的本质:让混乱变成秩序。而状态机,就是智能体世界的秩序。
如果你也正在构建多智能体系统、自动化流水线、RAG 工作流,那么请记住一句话:你不写状态机,迟早要被迫写一个。