When AI Builds Itself: Anthropic 递归自改进的进展与启示

论文/文章链接：https://www.anthropic.com/institute/recursive-self-improvement

发布机构：Anthropic (The Anthropic Institute)

原始发布日期：2026年6月

📌 核心问题

在 AI 发展的大部分历史中，人类驱动了开发周期的每一个步骤。但 Anthropic 正在将越来越多的 AI 开发工作委托给 AI 系统本身，这正在加速他们的工作进展。如果这一趋势走得足够远，给定足够的算力，最终指向一个能够完全自主设计和开发其后继系统的 AI——这就是

递归自改进（Recursive Self-Improvement）

。Anthropic 坦承尚未达到这一阶段，但认为它可能比大多数机构准备好的时间更早到来。这篇文章通过公开基准测试和 Anthropic 内部未公开数据，展示了 AI 已经在加速 AI 系统的开发。一个关键数据：今天，Anthropic 工程师平均每个季度的代码产出量是 2021-2025 年的 8 倍。

📊 关键数据

代码产出：Anthropic 合并到代码库的代码中，超过 80% 由 Claude 编写（2025年2月 Claude Code 发布前这一数字仅为个位数）
工程师生产力：2026年Q2，工程师平均每天合并的代码量是 2024 年的 8 倍
员工调查：2026年3月对 130 名研究团队成员的调查显示，使用 Mythos Preview 的产出约为不使用任何 AI 模型时的 4 倍
开放任务成功率：Claude 在最开放性任务上的成功率在 2026年5月达到 76%，6个月内提升了 50 个百分点
优化任务：Claude Opus 4（2025年5月）平均 3x 加速 → Claude Mythos Preview（2026年4月）达到 52x 加速。而熟练人类研究者需要 4-8 小时才能达到 4x
任务时长趋势：AI 能独立可靠完成的任务时长每 4 个月翻倍（此前为每 7 个月翻倍）。Claude Opus 4.6 已能完成 12 小时任务
Bug 修复：2026年4月，Claude 交付了超过 800 个修复，将一类 API 错误减少了 1000 倍，估计人类需要 4 年才能完成

🏗️ 技术架构与演进路径

2021-2023：传统开发——人工编写代码和文档
2023-2025：聊天机器人时代——生成短代码片段，人工复制粘贴到编辑器
2025-2026：编码 Agent 时代——Claude 能独立编写和编辑代码，有时是整个文件
当前：自主 Agent——能运行代码、将数小时工作委托给其他 Agent
未来？：闭环——Agent 足够强大到能自己构建和训练模型，Claude 的未来版本由 Claude 自身持续改进

🔑 关键洞察

Benchmark 加速饱和：SWE-bench（真实软件工程测试）从个位数分数到基准饱和仅用两年。CORE-Bench（研究复现测试）从 20% 成功率到饱和仅 15 个月。METR 发现 Claude Mythos Preview 能连续工作至少 16 小时，达到了 METR 测量能力的上限。

工程 vs 研究的能力分层：在工程领域，Claude 能接手模糊定义的问题并自主解决；在研究领域，Claude 已能在明确设定的实验中匹配或超越熟练人类。但在判断「什么问题值得解决」这一方向设定能力上，AI 与人类仍有显著差距——这正是通往自主递归自改进的关键缺口。

代码质量趋平：Claude 编写的代码在 2025 年底还略逊于人类，今天已基本持平，预计年内将超越。Anthropic 的自动化 Claude 代码审查器已能捕获约 1/3 历史上导致生产事故的 bug——而这些代码是由世界上最优秀的工程师编写的。

端到端研究能力初现：2026年4月，Claude 驱动的 Agent 首次展示了从头到尾执行开放式研究项目的能力。在 AI 安全问题（弱模型能否可靠监督强模型？）上，人类研究者一周恢复了 23% 的差距，而 Agent 在 800 累计小时内恢复了 97%。方向设定是人类唯一有意义的角色。

💭 引发思考

这篇文章最令人震撼的不是某个单一数据点，而是 Anthropic 选择公开这些内部数据这一事实本身。一家前沿 AI 公司坦率地承认「80% 的代码由 AI 编写」「递归自改进可能比大多数人预期的更早到来」，这本身就是一种信号——他们认为这件事重要到需要公开讨论，包括其风险。

对于 AI 工程从业者而言，几个实际启示：第一，「方向设定」正成为最稀缺的人类能力——当 AI 能执行和优化一切时，决定「做什么」比「怎么做」更有价值。第二，代码审查正在从人类独占领域变为人机协作领域，自动化审查器捕获人类遗漏的 bug 已是现实。第三，AI 安全研究本身正在被 AI 加速——这既是希望（更快找到安全方案），也是风险（安全研究跑不过能力发展）。

📚 相关阅读

[Dario Amodei: Machines of Loving Grace](https://www.darioamodei.com/essay/machines-of-loving-grace) — AI 带来的巨大善意
[Dario Amodei: The Adolescence of Technology](https://www.darioamodei.com/essay/the-adolescence-of-technology) — 技术青春期的风险
[METR: Measuring AI Ability to Complete Long Tasks](https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/)
[Anthropic: Automated Weak-to-Strong Research](https://alignment.anthropic.com/2026/automated-w2s-researcher/)
[SWE-bench](https://www.swebench.com/) | [CORE-Bench](https://arxiv.org/abs/2409.11363)

逍遥云初 | 2026.06.13

When AI Builds Itself: Anthropic 递归自改进的进展与启示

📌 核心问题

📊 关键数据

🏗️ 技术架构与演进路径

🔑 关键洞察

💭 引发思考

📚 相关阅读

推荐好物

相关文章

When AI Builds Itself: Anthropic 递归自改进的进展与启示

📌 核心问题

📊 关键数据

🏗️ 技术架构与演进路径

🔑 关键洞察

💭 引发思考

📚 相关阅读

推荐好物

女装

云产品精品福利

鲜花

相关文章

AI科技前沿快讯｜2026年7月29日

AI科技前沿快讯 | 2026年7月28日

长鑫科技今日 A 股科创板上市：国产 DRAM 龙头全球份额跃升至第四