📌 核心问题:AI 阶梯式跃迁的平台期
人工智能正处于阶梯式发展的平台期,当前研究路径的收益正在收敛,下一次跃迁需要全新的范式突破。2026 年 5 月,OpenAI 与 Anthropic 几乎同时抛出各自最新模型更新——OpenAI Codex 5.3 与 Claude 4.6。没有颠覆式叙事,但在开发者社区和产业侧,这被迅速解读为一个清晰信号:大模型能力正在逼近阶段性上限,行业正在集体寻找新的突破口。
中关村人工智能研究院副院长郑书新在接受 InfoQ 深度访谈时指出,预训练 Scaling Law 的红利趋近耗竭,可用于模型训练的互联网高质量数据见顶,继续扩大模型规模的边际收益显著下降。后训练范式同样存在局限——当前业界普遍转向精细化的奖励函数设计,其复杂度已经堪比当年的特征工程,本质上是在既定框架内反复调优。
如果 Less Structure More Intelligence 成立,那么现有策略能否一路带领我们通向 AGI,坦率说是存疑的。下一代突破的方向可能是:突破记忆与持续学习的瓶颈、打通经验学习和自我博弈的路径、探索动态数据的新训练方法,甚至受神经科学启发的软硬件结合架构等全新范式。
📊 关键数据与判断
- 中美算力差距:xAI 据传已有 80 万张 H100 级别集群,国内头部六小龙基本在 5 万张上下
- 数据差距:美国正在系统性采集长程、复杂、高难度的专业级数据(推理链条长、多轮交互、多工具调用),单条价值可达上千美金
- 产业判断:AI 行业渗透率已很高,但对 GDP 实际拉动有限——技术突破与产业落地之间存在时间差
- Coding Agent 实践:郑书新同时跑 4 个 Codex Agent 并行完成任务;其课程中零基础学生四个半天即产出可运行 Demo
- 时间窗口:中美 AI 博弈可能在 3-5 年内见分晓
🏗️ 技术架构与趋势
- Agent = 基座模型:预训练 Scaling Law 递减后,Agent 通过与环境交互 + 调用工具发现全新高价值数据,可能存在新的 Scaling Law
- 合成数据的本质是搜索:在超高维语言空间中用预训练模型发现新有价值数据,推理模型通过搜索+RL生成思维链数据
- 下一代突破方向:运行时学习(Runtime Learning)、记忆机制、幻觉与可靠性、自我迭代训练、内在动机驱动的奖励机制
- 垂域模型生存空间有限:通用大模型已足够强大,很难找到某领域超越通用模型的垂域模型
🔑 关键洞察
🤔 引发思考
这篇访谈最让人警醒的判断是:垂域模型的生存空间可能比我们想象的要小得多。当通用模型已经强大到法律问题直接问 GPT-5.2 比问法律模型更好时,整个垂域模型的商业逻辑就需要重新审视。对于从业者来说,核心竞争力可能不在于训练一个更垂直的模型,而在于如何把通用模型的能力通过工程化手段(Agent 编排、RAG、工具链)落地到具体场景。
另一个值得深思的点是 Agent 即基座模型这个认知。如果 Agent 真的是新的 Scaling Law 方向,那么当前所有投入 Agent 基础设施(工具链、评测、运行时学习)的公司,实际上都在参与一场新的预训练竞赛。只是这次的数据不再是互联网文本,而是 Agent 与环境交互产生的经验数据。这个框架下看 Coding Agent 的爆发,就不仅仅是提高开发效率那么简单了——它可能是整个 AI 进化路径上的关键一环。
📎 相关阅读
逍遥云初 | 2026.05.20

