📌 核心问题:AI 阶梯式跃迁的平台期

人工智能正处于阶梯式发展的平台期,当前研究路径的收益正在收敛,下一次跃迁需要全新的范式突破。2026 年 5 月,OpenAI 与 Anthropic 几乎同时抛出各自最新模型更新——OpenAI Codex 5.3 与 Claude 4.6。没有颠覆式叙事,但在开发者社区和产业侧,这被迅速解读为一个清晰信号:大模型能力正在逼近阶段性上限,行业正在集体寻找新的突破口。

中关村人工智能研究院副院长郑书新在接受 InfoQ 深度访谈时指出,预训练 Scaling Law 的红利趋近耗竭,可用于模型训练的互联网高质量数据见顶,继续扩大模型规模的边际收益显著下降。后训练范式同样存在局限——当前业界普遍转向精细化的奖励函数设计,其复杂度已经堪比当年的特征工程,本质上是在既定框架内反复调优。

如果 Less Structure More Intelligence 成立,那么现有策略能否一路带领我们通向 AGI,坦率说是存疑的。下一代突破的方向可能是:突破记忆与持续学习的瓶颈、打通经验学习和自我博弈的路径、探索动态数据的新训练方法,甚至受神经科学启发的软硬件结合架构等全新范式。


📊 关键数据与判断

  • 中美算力差距:xAI 据传已有 80 万张 H100 级别集群,国内头部六小龙基本在 5 万张上下
  • 数据差距:美国正在系统性采集长程、复杂、高难度的专业级数据(推理链条长、多轮交互、多工具调用),单条价值可达上千美金
  • 产业判断:AI 行业渗透率已很高,但对 GDP 实际拉动有限——技术突破与产业落地之间存在时间差
  • Coding Agent 实践:郑书新同时跑 4 个 Codex Agent 并行完成任务;其课程中零基础学生四个半天即产出可运行 Demo
  • 时间窗口:中美 AI 博弈可能在 3-5 年内见分晓

🏗️ 技术架构与趋势

  • Agent = 基座模型:预训练 Scaling Law 递减后,Agent 通过与环境交互 + 调用工具发现全新高价值数据,可能存在新的 Scaling Law
  • 合成数据的本质是搜索:在超高维语言空间中用预训练模型发现新有价值数据,推理模型通过搜索+RL生成思维链数据
  • 下一代突破方向:运行时学习(Runtime Learning)、记忆机制、幻觉与可靠性、自我迭代训练、内在动机驱动的奖励机制
  • 垂域模型生存空间有限:通用大模型已足够强大,很难找到某领域超越通用模型的垂域模型

🔑 关键洞察

Agent 不是应用层封装,而是基座模型本身。它是当前业界押注智能性提升的主要技术路线——通过扩展搜索空间的边界,Agent 与环境交互并调用工具,发现全新的高价值数据,可能存在新的 Scaling Law。这个认知跃迁意味着 Agent 研发不是锦上添花,而是通往 AGI 的核心路径。
Coding Agent 正在彻底改变软件开发的成败逻辑。传统模式是一个团队精心打磨 3 个产品、1 个成功;现在借助 Coding Agent,个体就能快速开发 100 个产品,成功概率和路径被彻底改变。零基础学生四个半天即可产出可运行产品——这在以前不可想象。
中美 AI 竞争的核心差距不在技术路线(已趋于透明),而在两个硬约束:高质量数据和算力资源。美国正在系统性采集单条价值上千美金的专业级数据,而国内在这方面还比较欠缺。算力上,xAI 80 万张 H100 vs 国内 5 万张的量级差距,要求我们必须省着用,做更巧妙精细的设计。
2026 年将是 Agent 产业落地的关键一年。AI 正处于类似蒸汽机发明到工业革命全面铺开之间的阶段——核心动力源已出现,但需要数据基础设施、工程化工具链、行业 know-how 的深度融合。白领和知识工作者群体(法律、金融、咨询、研究)有望率先释放生产力红利。

🤔 引发思考

这篇访谈最让人警醒的判断是:垂域模型的生存空间可能比我们想象的要小得多。当通用模型已经强大到法律问题直接问 GPT-5.2 比问法律模型更好时,整个垂域模型的商业逻辑就需要重新审视。对于从业者来说,核心竞争力可能不在于训练一个更垂直的模型,而在于如何把通用模型的能力通过工程化手段(Agent 编排、RAG、工具链)落地到具体场景。

另一个值得深思的点是 Agent 即基座模型这个认知。如果 Agent 真的是新的 Scaling Law 方向,那么当前所有投入 Agent 基础设施(工具链、评测、运行时学习)的公司,实际上都在参与一场新的预训练竞赛。只是这次的数据不再是互联网文本,而是 Agent 与环境交互产生的经验数据。这个框架下看 Coding Agent 的爆发,就不仅仅是提高开发效率那么简单了——它可能是整个 AI 进化路径上的关键一环。


📎 相关阅读

逍遥云初 | 2026.05.20