🔗 原文链接:https://www.infoq.cn/article/iHkvlLuTCWNJv27eJ1XY
📅 原始发布日期:2026 年 5 月 8 日
📝 来源:InfoQ 深度访谈
📌 核心问题
2026 年,人工智能正处于阶梯式发展的平台期。预训练 Scaling Law 的红利趋近耗竭,可用于模型训练的互联网高质量数据见顶,继续扩大模型规模的边际收益显著下降。后训练范式同样存在局限——奖励函数的设计复杂度已经堪比当年的特征工程,本质上是在既定框架内反复调优。
在这样的背景下,OpenAI 与 Anthropic 几乎在同一时间抛出最新模型更新(Codex 5.3 与 Claude 4.6),被开发者社区解读为一个清晰信号:大模型能力正在逼近阶段性上限,而行业正在集体寻找新的突破口。Agent,正在成为这个突破口的核心载体。
中关村人工智能研究院副院长郑书新认为,Agent 不仅仅是大模型的应用层封装,它本身就是基座模型——是当前业界押注智能性提升的主要技术路线。预训练数据见顶后,Agent 通过与环境交互、调用工具来发现全新的高价值合成数据,可能存在新的 Scaling Law。
📊 关键数据与事实
- 中美算力差距:xAI 已有 80 万张 H100 级别集群,国内头部六小龙基本在 5 万张上下
- 中美数据差距:美国正在系统性采集长程、复杂、高难度的专业级数据,单条价值可达上千美金
- Coding Agent 落地案例:斯坦福和中关村学院均开设零代码 AI Agent 编程课程,零基础学生四个半天即可产出可运行 Demo
- 产业判断:2026 年将是 Agent 在真实场景中集中落地的关键一年
- 模型竞争格局:Kimi K2.5 作为 Agentic 模型表现亮眼,基座模型中 GLM-4.7 领先,DeepSeek-V3.2、Qwen3、MiniMax-M2.1 也都不错
🏗️ 技术架构与核心观点
- 阶梯式跃迁规律:AI 发展遵循阶梯式跃迁,当前处于平台期,需要全新范式突破
- Agent = 基座模型:Agent 不是应用层封装,而是通过环境交互发现新数据、可能存在新 Scaling Law 的基座模型
- 预训练瓶颈到合成数据解法:预训练数据见顶后,合成数据的本质是在超高维语言空间中搜索新有价值数据
- 下一代突破方向:运行时学习(Runtime Learning)、记忆机制、自我迭代训练、内在动机驱动的奖励机制
- Coding Agent 颠覆:从团队打磨 3 个产品到个体开发 100 个产品,概率和路径被彻底改变
🔑 关键洞察
💭 引发思考
这篇访谈最令人深思的观点是:Agent 不是大模型的应用层,而是大模型进化的下一段。当预训练数据见顶、后训练收益递减时,让模型在真实环境中行动、犯错、学习,本质上是在开辟一条全新的数据获取通道。这与强化学习的核心思想一脉相承——通过与环境交互来发现人类未曾标注的知识。
另一个值得警惕的信号是中美在数据层面的差距。美国头部公司已经在系统性地采集编程、金融、法律、咨询等领域的专家级知识数据,这些数据推理链条长、多轮交互、涉及多种工具调用。这种数据壁垒一旦形成,可能比算力差距更难追赶。对于国内从业者来说,如何在数据层面建立自己的护城河,可能是比追赶模型能力更紧迫的问题。
📚 相关阅读
- InfoQ 原文:OpenAI 与 Anthropic 双雄打擂台 — https://www.infoq.cn/article/iHkvlLuTCWNJv27eJ1XY
- 36 氪同步报道:https://www.36kr.com/p/3671545639183236
逍遥云初 | 2026.05.15






