📌 核心问题
2025 年 5 月,拾象团队发布了「2025 AI Best Ideas」,提出了 20 个关于 AI 行业格局与技术路径的关键预测。12 个月后的今天,他们交出了一份命中率高达 80% 的成绩单。这份复盘不仅是对过去一年 AI 行业的全景扫描,更是一份关于未来判断方法论的深度拆解。
从微软投资 Anthropic 到 Google Gemini 3 的王者归来,从 Coding Agent 率先落地到 RL Scaling 成为核心范式,这些预测的应验揭示了一个关键趋势:2025-2026 年的 AI 竞争已从「模型能力竞赛」升级为「Agent 生态系统之争」。而那些预测失败的部分(合成数据、Memory/Online Learning),恰恰指向了 AI 最需要长期攻坚的科学难题。
📊 关键数据
- 20 个预测中 14 个完全应验、4 个部分验证、2 个错误 — 总命中率 80%
- Cursor 2025 年 ARR 和估值分别增长 10x 以上,Claude Code ARR 突破 10 亿美金
- Waymo 每周付费行程从 2024 年底的 17.5 万次增至 2025 年底的 45 万次,翻了近一倍
- Salesforce AgentForce ARR 半年内从 1 亿增长到 5.4 亿美金,一半交易来自新客户
- NVIDIA 市值在 2025 年突破 5 万亿,美股核电板块最高超出 Nasdaq100 达 368 个百分点
- ChatGPT MAU 超 5 亿,年收入约 40 亿美金,但月活 ARPU 仅约 8 美元(Google/Meta 超 100 美元)
🏗️ 技术架构与核心判断
- 范式转移:从 Chatbot 到 Agent — Agent 引入 Tool,LLM 自主进行「调用-反馈-修正」循环,一条指令可数小时自主工作
- RL Scaling 取代 Pre-training 成为核心战场 — 算力投入从 Pre-training 转向 Post-training 的 RL Scaling
- Agent OS 之争 — MCP 是这个时代的 TCP/IP,Claude Skills 封装 SOP,OpenAI App SDK 试图复刻 iOS App Store
- Context Engineering 成为决定性因素 — 从技术细节上升为超越 Prompt Engineering 与 RAG 的核心方法论
- Agent 任务长度指数级增长 — METR 数据显示每 7 个月翻一倍,预计 2029 年可完成 1 个工作月的任务
🔑 关键洞察
洞察一:蒸馏之路断绝,RL 基建成为核心壁垒
🔑 从顶尖模型进行蒸馏已变得异常困难。巨头们不再提供原始思维链(CoT),仅提供总结版,甚至在数据中「投毒」。依赖蒸馏将导致与顶尖模型的差距越拉越大,构建自己的 RL 基建、数据和算法是唯一出路。
这是拾象预测中最具前瞻性的判断之一。后训练全面走向 RL 时代,SFT 变得越来越轻量化。由 OpenRLHF 定义的范式(vLLM/SGLang 推理 + DeepSpeed/FSDP/Megatron 训练 + Ray 调度)已成为行业标准。
洞察二:合成数据幻觉破灭,Expert Curated Data 崛起
🔑 模型在过度依赖自身生成的合成数据训练时,出现了明显的模式坍塌(Model Collapse)。真正的突破点不在「量」的合成上,而在「质」的筛选上 — 由高水平人类专家策划、标注和验证的 Expert Curated Data 才是 RL 学习中最稀缺的燃料。
信息熵的第一性原理决定了「左脚踩右脚」无法一直产生增量信息。Mercor 等平台之所以异军突起,正是因为它们提供了 RL 学习中最稀缺的精准 Reward Signal。
洞察三:Coding Agent 是第一个真正落地的 Agent 种类
🔑 Claude Code 的意义在于:AI Coding 的主流从 IDE 内联补全升级到「给需求、生成、甚至改造整个项目」的 Agentic 工作流。LLM 可以从「助理」进阶到真正创造经济价值、介入价值创造类任务。
Google 以「收购式招聘」截胡 Windsurf,模型大厂纷纷发力 Coding Agent。Proactive Agent(主动式 Agent)将是下一阶段的技术和产品重点。
洞察四:Memory 与 Continual Learning 是最难啃的骨头
🔑 Continual Learning 是 AI 的下一个技术范式,但需要先解决灾难性遗忘、记忆存储结构、高效 in-weights learning、Transfer Learning 和样本效率等前沿科学难题。这不是短期 milestone,而是需要长期探索的科学命题。
拾象团队坦承低估了技术实现难度。但这也意味着,一旦这些科学问题被解决,将开启 AI 基础架构变化和产品体验的新范式 — 真正的千人千面。
💡 引发思考
拾象的预测方法论值得深思。他们成功的预测有一个共同特征:都是基于「结构性变化」而非「技术突破」。微软解绑 OpenAI、Google 的 TPU+分发渠道组合优势、Coding Agent 的自然落地路径 — 这些都是可以通过产业链分析和商业逻辑推演出来的。而失败的两个预测(合成数据、Memory)则恰恰是依赖「技术突破」的判断,这类预测的不确定性天然更高。
对 AI 从业者而言,最值得关注的趋势信号是:Agent 的任务长度每 7 个月翻一倍,2029 年可完成 1 个工作月的任务。这意味着我们正处于 Agent 能力指数增长的早期阶段。谁能在 RL Scaling、Context Engineering 和 Agent Infra 三个方向上同时建立优势,谁就有可能成为下一个时代的平台级玩家。而那些仍在依赖蒸馏、忽视后训练投入的团队,可能会在这场范式转移中被彻底甩开。
📎 相关阅读
- The Era of Agent:拾象 AGI 投资洞察(2026.05.08)
- How To Play AI Beta:拾象 2026 AGI 投资思考开源(2026.02.02)
- 拾象 2026 AI Best Ideas:20 大关键预测(2026.01.01)
逍遥云初 | 2026.05.21

