类型:深度访谈 | 来源:InfoQ | 访谈对象:郑书新(中关村人工智能研究院副院长)
原文:https://www.infoq.cn/article/iHkvlLuTCWNJv27eJ1XY
原始发布日期:2026 年 5 月中旬
核心问题:AI 正处于阶梯式跃迁的平台期
2026 年,人工智能正处在一个微妙的临界点。一方面,大模型的通用能力已达到较高水平,在语言理解、推理、代码生成等维度上正在逼近甚至超过人类专家水准;另一方面,沿着既有路径继续堆叠规模与算力,边际收益正在迅速收敛。
预训练 Scaling Law 的红利趋近耗竭,可用于模型训练的互联网高质量数据见顶。后训练范式同样存在局限——业界普遍转向精细化的奖励函数设计,其复杂度已堪比当年的特征工程。Meta 近期研究也表明,后训练的增量空间可能比预期更有限。
下一代突破从何而来?郑书新认为,突破口可能来自对本代范式短板的改进(记忆与持续学习、经验学习、自我博弈),也可能需要全新的技术范式(神经科学启发的架构、离散 Diffusion 等)。
关键数据与事实
- 中美算力差距:xAI 已有约 80 万张 H100 级别集群,国内头部六小龙基本在 5 万张上下
- 美国正在系统性采集长程、复杂、高难度的专业级数据,单条价值可达上千美金
- 中关村学院 AI Agent 编程课程:零基础学生仅 4 个半天即可产出可运行 Demo
- 斯坦福同期开设类似课程,理念为全程不写一行代码
- 郑书新团队已参加多项国际预测评测,最好成绩全球第二
技术架构与关键观点
- Agent 即基座模型:Agent 不只是应用层封装,而是当前业界押注智能性提升的主要技术路线
- 合成数据即搜索:在超高维语言空间中使用预训练大模型发现新的有价值数据,Agent 进一步扩展了搜索空间边界
- Runtime Learning:让智能体在运行过程中持续学习和改进,而非仅依赖预训练阶段的能力
- 记忆机制:Agent 需要在长周期任务中保持上下文连贯,有效存储和调用历史信息
- 自我迭代训练 + 内在动机驱动的奖励机制,可能带来阶跃式突破
关键洞察
Coding Agent 正在颠覆传统软件开发范式
过去的逻辑是一个团队精心打磨 3 个产品,最后可能有 1 个成功;现在借助 Coding Agent,个体就能快速开发 100 个产品,成功的概率和路径都被彻底改变了。郑书新本人每天同时跑 4 个 Codex Agent 并行完成任务。
Agent 是新的 Scaling Law 方向
预训练 Scaling Law 因高质量数据见顶而趋近极限。Agent 通过与环境交互、调用工具、生成合成数据,开辟了全新的数据来源和搜索空间,可能存在新的 Scaling Law。
2026 年是 AI 产业落地的关键之年
技术突破与产业普及之间存在时间差,这是历史常态。就像蒸汽机到工业革命隔了几十年,但 AI 的节奏会快得多。白领和知识工作者群体有望率先释放生产力红利。
中美竞争核心差距在数据和算力
中美技术路线上已趋于透明,核心差距在两点:一是高质量专业数据的系统性采集能力;二是算力规模。算力是智能性提升的第一性原理。
引发思考
这篇访谈最值得关注的观点是:Agent 不应被理解为大模型的应用层封装,而应被视为大模型本身的进化方向。当预训练数据见顶、后训练收益递减时,Agent 通过与真实环境交互来生成新的训练数据,本质上是一种新的 Scaling Law 探索。
另一个值得深思的判断是垂域模型的生存空间问题。郑书新直言:如果要做某个垂域的应用,他会直接基于 GPT-5.2 或 Gemini 3 开发,而不是自研垂域模型。通用大模型的性能已经强大到很难找到能在某个领域超越它们的垂域模型。
从 Coding Agent 角度看,零基础 4 天出 Demo 的案例表明,AI 正在将软件开发从专业技能变为通用能力。创新的瓶颈将从能不能做转向做什么和做得好不好。
逍遥云初 | 2026.05.23

