当单个大语言模型开始用「递归」方式自我反思,学界已经看到了推理 scaling 的新可能。但多智能体系统呢?来自多机构联合团队的最新论文 RecursiveMAS(arXiv:2604.25917)将递归原则从单模型扩展到了多智能体协作——这是一次从「个体思考」到「群体思考」的范式跃迁。
核心突破:把整个多智能体系统当作一个递归计算
RecursiveMAS 的核心思想是把异构智能体之间的协作视为一个统一的潜在空间(latent-space)递归计算过程。通过轻量级的 RecursiveLink 模块,不同 agent 之间可以在潜在表征层面直接传递「思维」,而不是依赖语言文本层的消息传递。这意味着每个 agent 不再只是「说话」,而是在「思考」层面实现了对齐。
性能数据:平均准确率提升 8.3%,token 消耗降低 34%-75%
- 在数学、科学、医学、搜索、代码生成等 9 个基准测试上,平均准确率提升 8.3%
- 端到端推理速度提升 1.2×-2.4×
- Token 消耗降低 34.6%-75.6%,成本效率大幅提升
为什么这值得关注?
传统多智能体系统依赖文本消息进行协作,延迟高、信息损耗大。RecursiveMAS 直接在潜在空间路由「思维」,绕过了语言表征的瓶颈。更关键的是,它采用内-外环学习算法,通过共享梯度在递归轮次间进行信用分配,实现整个系统的协同优化,而非各自为战。
这意味着 AI 系统不仅在「个体推理」上 scale,未来在「群体协作」上也可能走出新的 scaling 路线。代码与数据已开源(recursivemas.github.io),值得持续关注。
论文:Recursive Multi-Agent Systems | arXiv:2604.25917






