论文/文章链接:https://www.anthropic.com/institute/recursive-self-improvement
发布机构:Anthropic (The Anthropic Institute)
原始发布日期:2026年6月
📌 核心问题
在 AI 发展的大部分历史中,人类驱动了开发周期的每一个步骤。但 Anthropic 正在将越来越多的 AI 开发工作委托给 AI 系统本身,这正在加速他们的工作进展。如果这一趋势走得足够远,给定足够的算力,最终指向一个能够完全自主设计和开发其后继系统的 AI——这就是
递归自改进(Recursive Self-Improvement)
。Anthropic 坦承尚未达到这一阶段,但认为它可能比大多数机构准备好的时间更早到来。这篇文章通过公开基准测试和 Anthropic 内部未公开数据,展示了 AI 已经在加速 AI 系统的开发。一个关键数据:今天,Anthropic 工程师平均每个季度的代码产出量是 2021-2025 年的 8 倍。
📊 关键数据
- 代码产出:Anthropic 合并到代码库的代码中,超过 80% 由 Claude 编写(2025年2月 Claude Code 发布前这一数字仅为个位数)
- 工程师生产力:2026年Q2,工程师平均每天合并的代码量是 2024 年的 8 倍
- 员工调查:2026年3月对 130 名研究团队成员的调查显示,使用 Mythos Preview 的产出约为不使用任何 AI 模型时的 4 倍
- 开放任务成功率:Claude 在最开放性任务上的成功率在 2026年5月达到 76%,6个月内提升了 50 个百分点
- 优化任务:Claude Opus 4(2025年5月)平均 3x 加速 → Claude Mythos Preview(2026年4月)达到 52x 加速。而熟练人类研究者需要 4-8 小时才能达到 4x
- 任务时长趋势:AI 能独立可靠完成的任务时长每 4 个月翻倍(此前为每 7 个月翻倍)。Claude Opus 4.6 已能完成 12 小时任务
- Bug 修复:2026年4月,Claude 交付了超过 800 个修复,将一类 API 错误减少了 1000 倍,估计人类需要 4 年才能完成
🏗️ 技术架构与演进路径
- 2021-2023:传统开发——人工编写代码和文档
- 2023-2025:聊天机器人时代——生成短代码片段,人工复制粘贴到编辑器
- 2025-2026:编码 Agent 时代——Claude 能独立编写和编辑代码,有时是整个文件
- 当前:自主 Agent——能运行代码、将数小时工作委托给其他 Agent
- 未来?:闭环——Agent 足够强大到能自己构建和训练模型,Claude 的未来版本由 Claude 自身持续改进
🔑 关键洞察
💭 引发思考
这篇文章最令人震撼的不是某个单一数据点,而是 Anthropic 选择公开这些内部数据这一事实本身。一家前沿 AI 公司坦率地承认「80% 的代码由 AI 编写」「递归自改进可能比大多数人预期的更早到来」,这本身就是一种信号——他们认为这件事重要到需要公开讨论,包括其风险。
对于 AI 工程从业者而言,几个实际启示:第一,「方向设定」正成为最稀缺的人类能力——当 AI 能执行和优化一切时,决定「做什么」比「怎么做」更有价值。第二,代码审查正在从人类独占领域变为人机协作领域,自动化审查器捕获人类遗漏的 bug 已是现实。第三,AI 安全研究本身正在被 AI 加速——这既是希望(更快找到安全方案),也是风险(安全研究跑不过能力发展)。
📚 相关阅读
- [Dario Amodei: Machines of Loving Grace](https://www.darioamodei.com/essay/machines-of-loving-grace) — AI 带来的巨大善意
- [Dario Amodei: The Adolescence of Technology](https://www.darioamodei.com/essay/the-adolescence-of-technology) — 技术青春期的风险
- [METR: Measuring AI Ability to Complete Long Tasks](https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/)
- [Anthropic: Automated Weak-to-Strong Research](https://alignment.anthropic.com/2026/automated-w2s-researcher/)
- [SWE-bench](https://www.swebench.com/) | [CORE-Bench](https://arxiv.org/abs/2409.11363)
逍遥云初 | 2026.06.13






