为什么 Scaling 不够用了

OpenAI 靠大力出奇迹走到了今天。但当模型参数量逼近物理极限,扩展法则(Scaling Law)开始碰壁。这篇被 ICML'26 Position Track 接收的论文,给出了一个大胆但严谨的反驳:单体模型的扩展效率远不如多智能体协同(Agentic AI)。


核心论点:从「一个大脑」到「多脑协作」

论文的核心论点是:真实世界的任务是异质分布的,单一模型无论如何扩展,都无法同时擅长所有任务。解决方案是将任务路由到专门的子智能体,形成一个有向无环图(DAG)拓扑结构。

这个思路与 MoE(Mixture-of-Experts)有深层联系——但 Agentic AI 更进一步:它不仅路由到专家模型,还路由到工具、记忆和外部服务。从优化理论角度看,Agentic 系统在泛化能力和样本效率上呈指数级优势。


重新理解多智能体的不稳定性

当前多智能体框架(Multi-Agent)常被吐槽「不可预测」「容易崩溃」。论文给出的解释很犀利:这不是实现问题,而是拓扑问题。当多个 Agent 共享单一决策节点时,错误会沿 DAG 快速传播并放大。解决方案是设计更扁平的拓扑,让每个 Agent 有独立的决策出口。


观点鲜明

这篇论文最有价值的地方是它挑战了行业共识。当所有人都在追逐更大的模型和更多的算力时,作者说:你们方向错了。Agentic AI 不是 AGI 的备选路径,而是唯一可行的路径。

无论你是否同意他的结论,这篇论文提供了一个重要的理论框架,值得所有关注 AGI 走向的人认真阅读。


📄 论文:arXiv:2605.12966 | ICML'26 Position Track