📌 核心问题:AI 阶梯式跃迁的平台期

人工智能正处于阶梯式发展的平台期,当前研究路径的收益正在收敛。预训练 Scaling Law 的红利趋近耗竭,可用于模型训练的互联网高质量数据见顶,继续扩大模型规模的边际收益显著下降。后训练范式同样存在局限——奖励函数的设计复杂度已经堪比当年的特征工程,本质上是在既定框架内反复调优。

下一代突破方向可能包括:突破记忆与持续学习的瓶颈、打通经验学习(Learning from Experience)和自我博弈(Self-Play)的路径、提高长上下文支持能力、探索动态数据的新训练方法。也有可能需要全新的技术范式,如受神经科学启发的软硬件结合架构、离散 Diffusion 等新的建模方式。

中美竞争的核心差距不在技术路线,而在高质量数据和算力资源。美国正在系统性地采集长程、复杂、高难度的专业级数据,单条价值可达上千美金。算力方面,xAI 已有 80 万张 H100 级别集群,而国内头部公司基本还在 5 万张上下。

📊 关键数据与判断

  • Agent = 基座模型:Agent 不只是应用层封装,而是当前业界押注智能性提升的主要技术路线。Agent 与环境交互并调用工具,发现全新的高价值数据,可能存在新的 Scaling Law
  • 2026 年将是 Agent 在真实场景中集中落地的一年,Coding Agent 等新范式正在重塑传统软件开发的基本逻辑
  • Coding Agent 颠覆范式:从「一个团队精心打磨 3 个产品」变为「个体快速开发 100 个产品」,成功的概率和路径被彻底改变
  • 零基础编程课程实践:北京中关村学院 AI Agent 编程课程,4 个半天,零编程基础学生全部产出可运行 Demo

🏗️ 技术架构与方向

  • Runtime Learning(运行时学习):让智能体在运行过程中持续学习和改进,不只依赖预训练阶段的能力
  • 记忆机制:Agent 需要在长周期任务中保持上下文连贯,有效存储和调用历史信息
  • 自我迭代训练 + 内在动机(Intrinsic Motivation)驱动的奖励机制,可能为 Agent 带来阶跃式突破
  • 预测未来系统:信息采集 → 逻辑推演 → 仿真模拟,三环节形成闭环,已参加多项国际预测评测,最好成绩全球第二

🔑 关键洞察

Agent 即基座模型。预训练 Scaling Law 红利趋近耗竭的根本原因是互联网高质量数据已接近上限。Agent 通过与环境交互并调用工具,在超高维语言空间中发现新的有价值数据——这可能是新的 Scaling Law 的来源。
技术与产业之间存在时间差,这是历史常态而非失败。蒸汽机发明到工业革命全面铺开隔了几十年,但 AI 这一轮节奏会快得多——可能几年而不是几十年。2026 年将是产业落地的关键一年。
垂域模型的生存空间很有限。通用大模型(如 GPT-5.2、Gemini 3)在各领域已非常出色,很难找到能超越它们的垂域模型。做垂域应用应直接基于通用模型开发,而非自研垂域模型。
工具熟练度 vs 科学基础的担忧是多余的。每次技术演进都伴随类似忧虑,但正是因为跳过底层细节,人们才能解决更有价值的问题。大胆拥抱最先进工具,但要清楚自己真正想解决的问题。

🤔 引发思考

这篇访谈最核心的洞察是「Agent 即基座模型」——Agent 不是大模型的应用层封装,而是智能性提升本身的技术路线。这个视角重新定义了我们对 Agent 的理解:它不是在「用」大模型,而是在「扩展」大模型的能力边界。

另一个值得关注的信号是「3-5 年内见分晓」的判断。AI 竞争已经不再是纯技术竞赛,而是数据基础设施、工程化工具链、行业 know-how 深度融合的系统性竞争。对于开发者而言,Coding Agent 的普及意味着编程能力不再是稀缺资源,「定义问题」和「设计系统」的能力才是真正的护城河。


📖 相关阅读


逍遥云初 | 2026.05.24