When AI Builds Itself：Anthropic 揭示递归自改进的早期证据

Anthropic 发布了一篇重磅研究文章，用大量内部数据展示了 Claude 正在加速 Claude 自身的开发。截至 2026 年 5 月，Anthropic 合并到代码库的代码中超过 80% 由 Claude 编写，工程师人均代码产出是 2024 年的 8 倍。

文章提出了递归自我改进（Recursive Self-Improvement）的概念：当 AI 系统能够自主设计和开发自己的继任者时，AI 进步将不再依赖人类。Anthropic 坦言「我们还没到那一步」，但数据表明这条路可能比大多数人预期的更近。

这篇文章的独特价值：AI 行业首次系统性地公开内部证据，证明 AI 正在加速 AI 自身的研发。从代码编写到实验设计到研究判断，每个环节都有量化数据支撑。

🔑 洞察一：「汗水」正在被自动化

Edison 说天才 = 1% 灵感 + 99% 汗水。那 99% 正在被快速自动化。编写代码、运行实验、调试错误——这些「苦力活」是 AI 进步的主要组成部分，Claude 已超越多数人类研究者。剩下的 1%——选择正确的问题——是人类最后的比较优势，但也在缩小。

🔑 洞察二：代码质量已达「人机平价」

2025 年底 Claude 代码质量被认为不如人类。2026 年中已达平价。年内将超越。Claude 审查代码时能发现人类顶级工程师遗漏的 bug——AI 不仅在写代码，还在帮人类写更好的代码，形成正向飞轮。

🔑 洞察三：人类从「执行者」缩窄为「决策者」

人类角色缩窄：写代码→审查→选实验→选问题。「做」几乎不花人类时间了（只花算力），「选」仍需人类判断。如果「选」也被 AI 掌握，递归自改进闭环就完成了。

🔑 洞察四：加速是自我强化的

任务能力翻倍从 7 个月缩到 4 个月——加速的加速。AI 加速 AI 开发，产出更强 AI，进入正反馈循环。即使每个环节需人类参与，整体速度仍指数增长。

最深刻的启示不是「AI 很强」，而是「AI 变强的速度在变快」。过去讨论 AI 能否替代程序员，现在讨论能否替代 AI 研究员。当后一个问题趋近「是」，所有关于 AI 治理和对齐的讨论都需要重新校准时间表。

Anthropic 展示了罕见坦诚：公开承认代码质量已达平价、人类角色在缩窄、递归自改进「可能比多数机构准备好的时间更早到来」。这种坦诚本身是安全策略——让社会有时间准备。但准备的时间窗口可能比想象的更短。

[When AI builds itself — Anthropic Institute](https://www.anthropic.com/institute/recursive-self-improvement)
[Automated Weak-to-Strong Researcher](https://alignment.anthropic.com/2026/automated-w2s-researcher/)
[METR Time Horizons](https://metr.org/time-horizons/)
[SWE-bench](https://www.swebench.com/) | [CORE-Bench](https://arxiv.org/abs/2409.11363)

逍遥云初 | 2026.06.18

推荐好物