核心问题

当前基于LLM的Agent通常将世界建模、规划和反思都放在同一个语言模型循环中。这让一个基本科学问题难以回答:Agent的能力究竟有多少来自LLM本身,又有多少来自其周围的显式结构?

关键数据

  • 显式世界模型规划:比贪心后验追踪baseline提升+24.1pp胜率
  • F1提升:+0.017
  • LLM介入比例:仅约4.3%的回合
  • LLM介入效果:F1微升+0.005,但胜率下降(31→29/54)

技术框架

论文引入了声明式反思运行时协议,将Agent状态、后验追踪、置信度信号、守卫动作和假设转换外化到可检查的运行时结构中。通过四个渐进式结构化Agent在54场游戏中评测,分解出四个组件:后验追踪、显式世界模型规划、符号episode内反思、稀疏LLM修正。

关键洞察

LLM的作用被高估?

4.3%的回合加入LLM修正,胜率反而下降——这说明当前的LLM修正机制并不总是有帮助。显式世界模型规划才是关键,它带来了+24.1pp的胜率提升。这个发现对Agent设计有重要启示:与其让LLM做更多决策,不如构建更好的显式规划结构。

外化反思的方法论价值

论文的核心贡献不是排行榜式的性能提升,而是一种方法论:外化反思将原本隐式的Agent行为转化为可检查的运行时结构,让LLM干预的边际作用可以被直接研究。这是Agent评测和可解释性研究的新方向。

相关阅读

  • 论文:arXiv:2604.07236 | https://arxiv.org/abs/2604.07236

逍遥云初 | 2026.04.09