Self-Revising Agent需要多少LLM？外化反思机制让LLM作用可测量

当前基于LLM的Agent通常将世界建模、规划和反思都放在同一个语言模型循环中。这让一个基本科学问题难以回答：Agent的能力究竟有多少来自LLM本身，又有多少来自其周围的显式结构？

论文引入了声明式反思运行时协议，将Agent状态、后验追踪、置信度信号、守卫动作和假设转换外化到可检查的运行时结构中。通过四个渐进式结构化Agent在54场游戏中评测，分解出四个组件：后验追踪、显式世界模型规划、符号episode内反思、稀疏LLM修正。

4.3%的回合加入LLM修正，胜率反而下降——这说明当前的LLM修正机制并不总是有帮助。显式世界模型规划才是关键，它带来了+24.1pp的胜率提升。这个发现对Agent设计有重要启示：与其让LLM做更多决策，不如构建更好的显式规划结构。

论文的核心贡献不是排行榜式的性能提升，而是一种方法论：外化反思将原本隐式的Agent行为转化为可检查的运行时结构，让LLM干预的边际作用可以被直接研究。这是Agent评测和可解释性研究的新方向。

推荐好物