拾象 2025 AI 预测复盘：命中率 80%，20 个预测背后的行业真知

📌 核心问题

2025 年 5 月，拾象团队发布了「2025 AI Best Ideas」，提出了 20 个关于 AI 行业格局与技术路径的关键预测。12 个月后的今天，他们交出了一份命中率高达 80% 的成绩单。这份复盘不仅是对过去一年 AI 行业的全景扫描，更是一份关于未来判断方法论的深度拆解。

从微软投资 Anthropic 到 Google Gemini 3 的王者归来，从 Coding Agent 率先落地到 RL Scaling 成为核心范式，这些预测的应验揭示了一个关键趋势：2025-2026 年的 AI 竞争已从「模型能力竞赛」升级为「Agent 生态系统之争」。而那些预测失败的部分（合成数据、Memory/Online Learning），恰恰指向了 AI 最需要长期攻坚的科学难题。

📊 关键数据

20 个预测中 14 个完全应验、4 个部分验证、2 个错误 — 总命中率 80%
Cursor 2025 年 ARR 和估值分别增长 10x 以上，Claude Code ARR 突破 10 亿美金
Waymo 每周付费行程从 2024 年底的 17.5 万次增至 2025 年底的 45 万次，翻了近一倍
Salesforce AgentForce ARR 半年内从 1 亿增长到 5.4 亿美金，一半交易来自新客户
NVIDIA 市值在 2025 年突破 5 万亿，美股核电板块最高超出 Nasdaq100 达 368 个百分点
ChatGPT MAU 超 5 亿，年收入约 40 亿美金，但月活 ARPU 仅约 8 美元（Google/Meta 超 100 美元）

🏗️ 技术架构与核心判断

范式转移：从 Chatbot 到 Agent — Agent 引入 Tool，LLM 自主进行「调用-反馈-修正」循环，一条指令可数小时自主工作
RL Scaling 取代 Pre-training 成为核心战场 — 算力投入从 Pre-training 转向 Post-training 的 RL Scaling
Agent OS 之争 — MCP 是这个时代的 TCP/IP，Claude Skills 封装 SOP，OpenAI App SDK 试图复刻 iOS App Store
Context Engineering 成为决定性因素 — 从技术细节上升为超越 Prompt Engineering 与 RAG 的核心方法论
Agent 任务长度指数级增长 — METR 数据显示每 7 个月翻一倍，预计 2029 年可完成 1 个工作月的任务

🔑 关键洞察

洞察一：蒸馏之路断绝，RL 基建成为核心壁垒

🔑 从顶尖模型进行蒸馏已变得异常困难。巨头们不再提供原始思维链（CoT），仅提供总结版，甚至在数据中「投毒」。依赖蒸馏将导致与顶尖模型的差距越拉越大，构建自己的 RL 基建、数据和算法是唯一出路。

这是拾象预测中最具前瞻性的判断之一。后训练全面走向 RL 时代，SFT 变得越来越轻量化。由 OpenRLHF 定义的范式（vLLM/SGLang 推理 + DeepSpeed/FSDP/Megatron 训练 + Ray 调度）已成为行业标准。

洞察二：合成数据幻觉破灭，Expert Curated Data 崛起

🔑 模型在过度依赖自身生成的合成数据训练时，出现了明显的模式坍塌（Model Collapse）。真正的突破点不在「量」的合成上，而在「质」的筛选上 — 由高水平人类专家策划、标注和验证的 Expert Curated Data 才是 RL 学习中最稀缺的燃料。

信息熵的第一性原理决定了「左脚踩右脚」无法一直产生增量信息。Mercor 等平台之所以异军突起，正是因为它们提供了 RL 学习中最稀缺的精准 Reward Signal。

洞察三：Coding Agent 是第一个真正落地的 Agent 种类

🔑 Claude Code 的意义在于：AI Coding 的主流从 IDE 内联补全升级到「给需求、生成、甚至改造整个项目」的 Agentic 工作流。LLM 可以从「助理」进阶到真正创造经济价值、介入价值创造类任务。

Google 以「收购式招聘」截胡 Windsurf，模型大厂纷纷发力 Coding Agent。Proactive Agent（主动式 Agent）将是下一阶段的技术和产品重点。

洞察四：Memory 与 Continual Learning 是最难啃的骨头

🔑 Continual Learning 是 AI 的下一个技术范式，但需要先解决灾难性遗忘、记忆存储结构、高效 in-weights learning、Transfer Learning 和样本效率等前沿科学难题。这不是短期 milestone，而是需要长期探索的科学命题。

拾象团队坦承低估了技术实现难度。但这也意味着，一旦这些科学问题被解决，将开启 AI 基础架构变化和产品体验的新范式 — 真正的千人千面。

💡 引发思考

拾象的预测方法论值得深思。他们成功的预测有一个共同特征：都是基于「结构性变化」而非「技术突破」。微软解绑 OpenAI、Google 的 TPU+分发渠道组合优势、Coding Agent 的自然落地路径 — 这些都是可以通过产业链分析和商业逻辑推演出来的。而失败的两个预测（合成数据、Memory）则恰恰是依赖「技术突破」的判断，这类预测的不确定性天然更高。

对 AI 从业者而言，最值得关注的趋势信号是：Agent 的任务长度每 7 个月翻一倍，2029 年可完成 1 个工作月的任务。这意味着我们正处于 Agent 能力指数增长的早期阶段。谁能在 RL Scaling、Context Engineering 和 Agent Infra 三个方向上同时建立优势，谁就有可能成为下一个时代的平台级玩家。而那些仍在依赖蒸馏、忽视后训练投入的团队，可能会在这场范式转移中被彻底甩开。

📎 相关阅读

The Era of Agent：拾象 AGI 投资洞察（2026.05.08）
How To Play AI Beta：拾象 2026 AGI 投资思考开源（2026.02.02）
拾象 2026 AI Best Ideas：20 大关键预测（2026.01.01）

逍遥云初 | 2026.05.21

拾象 2025 AI 预测复盘：命中率 80%，20 个预测背后的行业真知

📌 核心问题

📊 关键数据

🏗️ 技术架构与核心判断

🔑 关键洞察

洞察一：蒸馏之路断绝，RL 基建成为核心壁垒

洞察二：合成数据幻觉破灭，Expert Curated Data 崛起

洞察三：Coding Agent 是第一个真正落地的 Agent 种类

洞察四：Memory 与 Continual Learning 是最难啃的骨头

💡 引发思考

📎 相关阅读

推荐好物

相关文章

拾象 2025 AI 预测复盘：命中率 80%，20 个预测背后的行业真知

📌 核心问题

📊 关键数据

🏗️ 技术架构与核心判断

🔑 关键洞察

洞察一：蒸馏之路断绝，RL 基建成为核心壁垒

洞察二：合成数据幻觉破灭，Expert Curated Data 崛起

洞察三：Coding Agent 是第一个真正落地的 Agent 种类

洞察四：Memory 与 Continual Learning 是最难啃的骨头

💡 引发思考

📎 相关阅读

推荐好物

即时通信IM

鲜花

女装

相关文章

ETH Zurich：你的 AGENTS.md 可能让 AI Agent 变笨 3% 且多花 20% 算力

字节跳动加速自研CPU：2027年下半年量产，AI基建全面自主化

OpenAI AI 模型推翻 Erdős 单位距离猜想：80 年数学难题的 AI 解法