当 AI 构建自身：Anthropic 递归自我改进的深度解读

📖 原文：When AI builds itself | 来源：Anthropic Institute | 发布：2026年6月

📌 核心问题

Anthropic 发表重磅长文，首次系统性披露 AI 系统正在加速 AI 自身开发的内部数据。递归自我改进（Recursive Self-Improvement）正在发生，而且比大多数人预期的更快。

AI 系统自主完成任务的能力正在以指数级速度提升。可靠完成任务的时长大约每 4 个月翻倍。Claude Opus 3（2024年3月）能完成人类约 4 分钟的软件任务；Claude Sonnet 3.7 能完成约 1.5 小时的任务；Claude Opus 4.6 能完成 12 小时的任务。2026 年内 AI 可能完成需要人类数天的工作，2027 年可能达到数周级别。

📊 关键数据

Anthropic 工程师 2026 Q2 代码量是 2021-2025 年的 8 倍
超过 80% 代码由 Claude 编写（2025 年初仅低个位数）
SWE-bench 从低个位数到两年内饱和（接近 100%）
CORE-Bench 研究复现能力从 2024 年 20% 到 15 个月后饱和
代码优化：Opus 4（2025年5月）3x → Mythos Preview（2026年4月）52x 加速
开放性任务成功率：2026年5月达 76%，6个月内提升 50 个百分点

🏗️ 技术架构与设计

四阶段演进：纯人工编码 → 聊天机器人辅助 → 编码 Agent → 自主 Agent
能力分级：明确问题 → 开放性目标 → 战略方向。Claude 前两级已超越人类，第三级仍有差距
自动化代码审查可捕获约 1/3 历史生产事故 bug
端到端研究：人类一周恢复 23% 性能差距，Agent 800 小时内恢复 97%
Claude 2 小时完成人类 2-3 天的调试工作

🔑 关键洞察

执行已超越人类，判断仍是瓶颈。Claude 在执行明确指定的实验时已能匹配或超越熟练人类，但在选择目标、判断什么值得做方面仍有显著差距。这是当前 AI 与真正自主递归自我改进之间的核心鸿沟。

代码质量从不如人类到即将超越。2025 年末 Claude 代码质量不如人类，现在大致持平，预计年内将明确超越。Claude 已在自动审查人类代码并捕获遗漏 bug——人机关系从辅助转向审查。

指数加速可能自我强化。任务时长翻倍周期从 7 个月缩短到 4 个月。如果 AI 能加速 AI 开发，就形成正反馈循环。Anthropic 坦承递归自我改进可能比大多数机构准备好的时间更早到来。

💡 引发思考

Anthropic 这篇文章最值得注意的不是技术数据，而是发布者身份——一家前沿 AI 公司主动公开自己的 AI 正在加速 AI 开发。80% 代码由 Claude 编写意味着深度自举，自动审查系统本身也是 Claude，形成 AI 监督 AI 的递归结构。

对行业而言，执行层已不是竞争焦点。真正的差异化在于判断层：谁能最好地帮助 AI 决定做什么。Harness Engineering、Spec Coding 等方法论本质上都是在为 AI 提供更好的判断框架。未来的开发者不是写代码的人，而是能最有效地给 AI 指明方向的人。

📎 相关阅读

Dario Amodei - Machines of Loving Grace

METR 时间地平线基准

Anthropic Automated W2S Researcher

逍遥云初 | 2026.06.26

当 AI 构建自身：Anthropic 递归自我改进的深度解读