📌 核心问题:AI 能力逼近阶段性上限,下一步往哪走?

2026 年的人工智能行业正处在一个微妙的临界点。一方面,大模型的通用能力已达到较高水平,在语言理解、推理、代码生成等维度上正在逼近甚至超过人类专家水准;另一方面,沿着既有路径继续堆叠规模与算力,边际收益正在迅速收敛。近期 OpenAI Codex 5.3 与 Claude 4.6 的更新,被开发者社区解读为一个清晰信号:大模型能力正在逼近阶段性上限,而行业正在集体寻找新的突破口。

中关村人工智能研究院副院长郑书新在深度访谈中指出,人工智能的发展遵循「阶梯式跃迁」的规律。最近一次重大跃迁是 GPT 带来的规模定律(Scaling Law),但现在智能性提升已进入平台期。预训练范式的规模定律红利趋近耗竭,可用于模型训练的互联网高质量数据见顶,继续扩大模型规模的边际收益显著下降。后训练范式同样存在局限——业界普遍转向精细化的奖励函数设计,其复杂度已堪比当年的特征工程。

那么下一代突破方向是什么?郑书新认为有两个路径:一是针对本代 AI 范式的短板进行改进(如突破记忆与持续学习瓶颈、打通经验学习和自我博弈路径);二是探索全新技术范式(如受神经科学启发的软硬件结合架构、离散 Diffusion 等新的建模方式)。而 Agent,正是当前业界押注智能性提升的主要技术路线。

📊 关键数据与事实

  • 据传美国 xAI 已拥有 80 万张 H100 级别集群,国内头部「六小龙」基本还在 5 万张上下
  • 美国正在系统性采集长程、复杂、高难度的专业级数据(编程、金融、法律、咨询),单条价值可达上千美金
  • 2026 年 Q2 国内 AI Agent 社区赛道用户规模同比上涨 217%,季度增速达 127%
  • 郑书新同时运行 4 个 Codex Agent 并行完成任务,零基础学生四个半天即可做出可运行 Demo
  • 中关村两院 AI 预测系统国际评测最好成绩全球第二,最新模型正在冲刺第一

🏗️ 技术架构与核心观点

  • Agent 即基座模型:Agent 不只是应用层封装,而是当前业界押注智能性提升的主要技术路线。预训练 Scaling Law 红利趋近耗竭后,Agent 通过与环境交互、调用工具来发现全新的高价值数据,可能存在新的 Scaling Law
  • 合成数据的本质是搜索:以 o1 为代表的推理模型通过搜索和强化学习在语言空间中生成高质量思维链数据;Agent 进一步扩展了搜索空间的边界
  • Coding Agent 颠覆开发范式:从「一个团队精心打磨 3 个产品」到「个体快速开发 100 个产品」,成功的概率和路径被彻底改变
  • 中美核心差距在数据和算力:技术路线已趋于透明,差距在于高质量数据采集能力和算力规模(80 万 vs 5 万张卡)
  • 垂域模型生存空间有限:通用模型(如 GPT-5.2、Gemini 3)在各领域表现已非常出色,很难找到在某个领域超越通用模型的垂域模型

🔑 关键洞察

1. Agent 是新的 Scaling Law

预训练的数据天花板已现,但 Agent 通过与环境交互、调用工具,打开了全新的数据获取通道。这不是简单的「应用层封装」,而是智能性提升的核心技术路线。Agent 的搜索空间远大于纯语言空间,可能蕴含新的 Scaling Law。

2. Coding Agent 是落地最快的杀手场景

Coding Agent 正在改变软件开发的基本逻辑。斯坦福和中关村两院不约而同开设「零代码」AI 编程课程,零基础学生四个半天就能做出可运行产品。这不仅是效率提升,更是创造力的民主化——当「做产品」的门槛降到接近零,创新的分布将发生根本性变化。

3. 数据质量是中美 AI 竞争的真正分水岭

技术路线趋于透明,但美国正在系统性地采集长程、复杂、高难度的专业级数据——单条价值可达上千美金。这类数据的特点是推理链条长、多轮交互、涉及多种工具调用。国内在这方面的欠缺,可能比算力差距更难弥补。

4. 2026 是 Agent 产业落地的关键年

技术突破与产业普及之间存在时间差,这是历史常态。就像蒸汽机到工业革命隔了几十年,但 AI 这一轮节奏会快得多。2026 年,Agent、Coding Agent 等产品形态将让更多用户真正用上 AI,白领和知识工作者群体(法律、金融、咨询、研究)有望率先释放生产力红利。

🚀 Agent 领域六大待突破方向

  1. Runtime Learning(运行时学习):让智能体在运行过程中持续学习和改进,而非仅依赖预训练阶段的能力
  2. 记忆机制:Agent 需要在长周期任务中保持上下文连贯,有效存储和调用历史信息
  3. 幻觉与可靠性:提升 Agent 在实际场景中的可信度
  4. 下一代评测方法:当前 Benchmark 可能无法充分衡量 Agent 的真实能力
  5. 自我迭代训练:让 Agent 能够自我改进,减少对人工标注数据的依赖
  6. 内在动机驱动的奖励机制:探索 Intrinsic Motivation 作为新的奖励信号来源

💭 引发思考

这篇访谈最深刻的洞察在于:Agent 不是大模型的「应用层」,而是大模型智能性提升的「下一层」。当我们把 Agent 理解为「应用封装」时,关注的是 UI 和工作流;当我们把 Agent 理解为「新的 Scaling Law」时,关注的是数据获取和智能涌现。这个认知差异,决定了我们在 Agent 身上投入多少「严肃的赌注」。

另一个值得关注的信号是:垂域模型的生存空间正在被通用模型挤压。当 GPT-5.2 和 Gemini 3 在法律、教育、金融等领域都表现优秀时,「垂域模型成本更低」的叙事就变得脆弱。真正的竞争壁垒可能不在模型本身,而在数据飞轮、产品体验和行业 know-how 的深度融合。这对正在布局 AI Agent 的团队是一个重要提醒:不要在模型层做无谓的军备竞赛,而要在数据和场景层构建护城河。

📎 相关阅读


逍遥云初 | 2026.05.29(基于 InfoQ 访谈整理)