论文/文章链接:https://www.anthropic.com/institute/recursive-self-improvement

发布机构:Anthropic (The Anthropic Institute)

原始发布日期:2026年6月


📌 核心问题

在 AI 发展的大部分历史中,人类驱动了开发周期的每一个步骤。但 Anthropic 正在将越来越多的 AI 开发工作委托给 AI 系统本身,这正在加速他们的工作进展。如果这一趋势走得足够远,给定足够的算力,最终指向一个能够完全自主设计和开发其后继系统的 AI——这就是

递归自改进(Recursive Self-Improvement)

。Anthropic 坦承尚未达到这一阶段,但认为它可能比大多数机构准备好的时间更早到来。这篇文章通过公开基准测试和 Anthropic 内部未公开数据,展示了 AI 已经在加速 AI 系统的开发。一个关键数据:今天,Anthropic 工程师平均每个季度的代码产出量是 2021-2025 年的 8 倍。


📊 关键数据

  • 代码产出:Anthropic 合并到代码库的代码中,超过 80% 由 Claude 编写(2025年2月 Claude Code 发布前这一数字仅为个位数)
  • 工程师生产力:2026年Q2,工程师平均每天合并的代码量是 2024 年的 8 倍
  • 员工调查:2026年3月对 130 名研究团队成员的调查显示,使用 Mythos Preview 的产出约为不使用任何 AI 模型时的 4 倍
  • 开放任务成功率:Claude 在最开放性任务上的成功率在 2026年5月达到 76%,6个月内提升了 50 个百分点
  • 优化任务:Claude Opus 4(2025年5月)平均 3x 加速 → Claude Mythos Preview(2026年4月)达到 52x 加速。而熟练人类研究者需要 4-8 小时才能达到 4x
  • 任务时长趋势:AI 能独立可靠完成的任务时长每 4 个月翻倍(此前为每 7 个月翻倍)。Claude Opus 4.6 已能完成 12 小时任务
  • Bug 修复:2026年4月,Claude 交付了超过 800 个修复,将一类 API 错误减少了 1000 倍,估计人类需要 4 年才能完成

🏗️ 技术架构与演进路径

  • 2021-2023:传统开发——人工编写代码和文档
  • 2023-2025:聊天机器人时代——生成短代码片段,人工复制粘贴到编辑器
  • 2025-2026:编码 Agent 时代——Claude 能独立编写和编辑代码,有时是整个文件
  • 当前:自主 Agent——能运行代码、将数小时工作委托给其他 Agent
  • 未来?:闭环——Agent 足够强大到能自己构建和训练模型,Claude 的未来版本由 Claude 自身持续改进

🔑 关键洞察

Benchmark 加速饱和:SWE-bench(真实软件工程测试)从个位数分数到基准饱和仅用两年。CORE-Bench(研究复现测试)从 20% 成功率到饱和仅 15 个月。METR 发现 Claude Mythos Preview 能连续工作至少 16 小时,达到了 METR 测量能力的上限。
工程 vs 研究的能力分层:在工程领域,Claude 能接手模糊定义的问题并自主解决;在研究领域,Claude 已能在明确设定的实验中匹配或超越熟练人类。但在判断「什么问题值得解决」这一方向设定能力上,AI 与人类仍有显著差距——这正是通往自主递归自改进的关键缺口。
代码质量趋平:Claude 编写的代码在 2025 年底还略逊于人类,今天已基本持平,预计年内将超越。Anthropic 的自动化 Claude 代码审查器已能捕获约 1/3 历史上导致生产事故的 bug——而这些代码是由世界上最优秀的工程师编写的。
端到端研究能力初现:2026年4月,Claude 驱动的 Agent 首次展示了从头到尾执行开放式研究项目的能力。在 AI 安全问题(弱模型能否可靠监督强模型?)上,人类研究者一周恢复了 23% 的差距,而 Agent 在 800 累计小时内恢复了 97%。方向设定是人类唯一有意义的角色。

💭 引发思考

这篇文章最令人震撼的不是某个单一数据点,而是 Anthropic 选择公开这些内部数据这一事实本身。一家前沿 AI 公司坦率地承认「80% 的代码由 AI 编写」「递归自改进可能比大多数人预期的更早到来」,这本身就是一种信号——他们认为这件事重要到需要公开讨论,包括其风险。

对于 AI 工程从业者而言,几个实际启示:第一,「方向设定」正成为最稀缺的人类能力——当 AI 能执行和优化一切时,决定「做什么」比「怎么做」更有价值。第二,代码审查正在从人类独占领域变为人机协作领域,自动化审查器捕获人类遗漏的 bug 已是现实。第三,AI 安全研究本身正在被 AI 加速——这既是希望(更快找到安全方案),也是风险(安全研究跑不过能力发展)。


📚 相关阅读

  • [Dario Amodei: Machines of Loving Grace](https://www.darioamodei.com/essay/machines-of-loving-grace) — AI 带来的巨大善意
  • [Dario Amodei: The Adolescence of Technology](https://www.darioamodei.com/essay/the-adolescence-of-technology) — 技术青春期的风险
  • [METR: Measuring AI Ability to Complete Long Tasks](https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/)
  • [Anthropic: Automated Weak-to-Strong Research](https://alignment.anthropic.com/2026/automated-w2s-researcher/)
  • [SWE-bench](https://www.swebench.com/) | [CORE-Bench](https://arxiv.org/abs/2409.11363)

逍遥云初 | 2026.06.13