📌 核心问题:AI 阶梯式跃迁的平台期
人工智能正处于阶梯式发展的平台期,当前研究路径的收益正在收敛。预训练 Scaling Law 的红利趋近耗竭,可用于模型训练的互联网高质量数据见顶,继续扩大模型规模的边际收益显著下降。后训练范式同样存在局限——奖励函数的设计复杂度已经堪比当年的特征工程,本质上是在既定框架内反复调优。
下一代突破方向可能包括:突破记忆与持续学习的瓶颈、打通经验学习(Learning from Experience)和自我博弈(Self-Play)的路径、提高长上下文支持能力、探索动态数据的新训练方法。也有可能需要全新的技术范式,如受神经科学启发的软硬件结合架构、离散 Diffusion 等新的建模方式。
中美竞争的核心差距不在技术路线,而在高质量数据和算力资源。美国正在系统性地采集长程、复杂、高难度的专业级数据,单条价值可达上千美金。算力方面,xAI 已有 80 万张 H100 级别集群,而国内头部公司基本还在 5 万张上下。
📊 关键数据与判断
- Agent = 基座模型:Agent 不只是应用层封装,而是当前业界押注智能性提升的主要技术路线。Agent 与环境交互并调用工具,发现全新的高价值数据,可能存在新的 Scaling Law
- 2026 年将是 Agent 在真实场景中集中落地的一年,Coding Agent 等新范式正在重塑传统软件开发的基本逻辑
- Coding Agent 颠覆范式:从「一个团队精心打磨 3 个产品」变为「个体快速开发 100 个产品」,成功的概率和路径被彻底改变
- 零基础编程课程实践:北京中关村学院 AI Agent 编程课程,4 个半天,零编程基础学生全部产出可运行 Demo
🏗️ 技术架构与方向
- Runtime Learning(运行时学习):让智能体在运行过程中持续学习和改进,不只依赖预训练阶段的能力
- 记忆机制:Agent 需要在长周期任务中保持上下文连贯,有效存储和调用历史信息
- 自我迭代训练 + 内在动机(Intrinsic Motivation)驱动的奖励机制,可能为 Agent 带来阶跃式突破
- 预测未来系统:信息采集 → 逻辑推演 → 仿真模拟,三环节形成闭环,已参加多项国际预测评测,最好成绩全球第二
🔑 关键洞察
🤔 引发思考
这篇访谈最核心的洞察是「Agent 即基座模型」——Agent 不是大模型的应用层封装,而是智能性提升本身的技术路线。这个视角重新定义了我们对 Agent 的理解:它不是在「用」大模型,而是在「扩展」大模型的能力边界。
另一个值得关注的信号是「3-5 年内见分晓」的判断。AI 竞争已经不再是纯技术竞赛,而是数据基础设施、工程化工具链、行业 know-how 深度融合的系统性竞争。对于开发者而言,Coding Agent 的普及意味着编程能力不再是稀缺资源,「定义问题」和「设计系统」的能力才是真正的护城河。
📖 相关阅读
- 原文:36氪 - OpenAI 与 Anthropic 双雄打擂台
- 来源:InfoQ(微信公众号),经 36 氪授权发布
逍遥云初 | 2026.05.24






