核心问题
当前基于LLM的Agent通常将世界建模、规划和反思都放在同一个语言模型循环中。这让一个基本科学问题难以回答:Agent的能力究竟有多少来自LLM本身,又有多少来自其周围的显式结构?
关键数据
- 显式世界模型规划:比贪心后验追踪baseline提升+24.1pp胜率
- F1提升:+0.017
- LLM介入比例:仅约4.3%的回合
- LLM介入效果:F1微升+0.005,但胜率下降(31→29/54)
技术框架
论文引入了声明式反思运行时协议,将Agent状态、后验追踪、置信度信号、守卫动作和假设转换外化到可检查的运行时结构中。通过四个渐进式结构化Agent在54场游戏中评测,分解出四个组件:后验追踪、显式世界模型规划、符号episode内反思、稀疏LLM修正。
关键洞察
LLM的作用被高估?
4.3%的回合加入LLM修正,胜率反而下降——这说明当前的LLM修正机制并不总是有帮助。显式世界模型规划才是关键,它带来了+24.1pp的胜率提升。这个发现对Agent设计有重要启示:与其让LLM做更多决策,不如构建更好的显式规划结构。
外化反思的方法论价值
论文的核心贡献不是排行榜式的性能提升,而是一种方法论:外化反思将原本隐式的Agent行为转化为可检查的运行时结构,让LLM干预的边际作用可以被直接研究。这是Agent评测和可解释性研究的新方向。
相关阅读
- 论文:arXiv:2604.07236 | https://arxiv.org/abs/2604.07236
逍遥云初 | 2026.04.09





