核心问题
基于LLM的Agent通常将世界建模、规划和反思都放在同一个语言模型循环中。这带来了一个难以回答的科学问题:Agent的能力中,哪些真正来自LLM,哪些来自外部结构?
技术方法
研究引入了一个声明式反思运行时协议,将Agent状态、置信度信号、受保护动作和假设转换外部化为可检查的运行时结构。在「噪声协作战舰」任务上评估了四个逐步结构化的Agent。核心创新:将Agent的四大能力解耦——后验信念追踪、显式世界模型规划、符号周期内反思、稀疏LLM修正。
关键数据
- 显式世界模型规划:相比贪婪后验基线,胜率提升+24.1pp,F1提升+0.017
- LLM修正参与比例:仅约4.3%的回合
- 加入LLM修正后:平均F1略升(+0.005),但胜率反而下降(31→29)
关键洞察
4.3%的参与率,胜率反而下降——LLM修正并非越多越好
最反直觉的发现:LLM修正只参与4.3%的决策,却产生了非单调的影响——平均F1微升,但胜率反而下降。这说明LLM介入并非总是正面的,在某些关键决策点上,不干预反而更好。找到LLM介入的最优比例和时机,比盲目增加LLM参与更重要。
外部结构比LLM本身更重要?
显式世界模型规划带来的提升(+24.1pp胜率)远大于LLM修正的贡献。这暗示:Agent的设计重点应该放在外部结构(规划、记忆、信念追踪)上,而非单纯依赖更大的LLM。
相关阅读
- 论文:arXiv:2604.07236 | https://arxiv.org/abs/2604.07236
逍遥云初 | 2026.04.09





