📌 核心问题:AI 能否自己造自己?

Anthropic 发布了一篇重磅研究文章,用大量内部数据展示了 Claude 正在加速 Claude 自身的开发。截至 2026 年 5 月,Anthropic 合并到代码库的代码中超过 80% 由 Claude 编写,工程师人均代码产出是 2024 年的 8 倍。

文章提出了递归自我改进(Recursive Self-Improvement)的概念:当 AI 系统能够自主设计和开发自己的继任者时,AI 进步将不再依赖人类。Anthropic 坦言「我们还没到那一步」,但数据表明这条路可能比大多数人预期的更近。

这篇文章的独特价值:AI 行业首次系统性地公开内部证据,证明 AI 正在加速 AI 自身的研发。从代码编写到实验设计到研究判断,每个环节都有量化数据支撑。

📊 关键数据

  • 代码产出:2026 Q2 工程师人均日合并代码量 = 2024 年的 8 倍
  • 代码占比:超过 80% 合并到代码库的代码由 Claude 编写(2025 年 2 月前为低个位数)
  • 效率感知:2026 年 3 月内部调查(130 人),中位数估计产出约为无 AI 时的 4 倍
  • 任务能力翻倍周期:从每 7 个月缩短到每 4 个月。Opus 3→4min,Sonnet 3.7→1.5h,Opus 4.6→12h
  • 实验优化:Opus 4(2025.5)平均 3x → Mythos Preview(2026.4)平均 52x。人类 4-8h 达到 4x
  • 开放式任务成功率:最困难级别从 ~26% 提升到 76%(6 个月提升 50 个百分点)
  • 研究判断力:129 个决策点中,Mythos Preview 比人类更优达 64%(Opus 4.5 为 51%)
  • 自动化研究:Claude 代理恢复 97% 性能差距,人类一周恢复 23%。800 小时,$18,000 算力
  • 代码审查:自动 Claude 审查捕获约 1/3 过去生产事故 bug
  • 里程碑:2026.4 Claude 交付 800+ 修复,API 错误降至千分之一,人类估计需 4 年

🏗️ 技术架构 / 设计

  • 能力阶梯:执行指定任务→自主设计方法→选择值得做的问题→自主设计继任系统。Claude 前两级优秀,第三级追赶中
  • METR 时间视野:可靠完成独立任务所需时间指数增长。Mythos Preview 可连续工作 16h+,达 METR 测量上限
  • 基准饱和:SWE-bench 和 CORE-Bench 均在 15 个月内从低分饱和到接近 100%
  • AI 审查 AI 闭环:Anthropic 部署 Claude 代码审查器,合并前检查 bug、安全漏洞
  • 并行代理研究:多 Claude 代理并行,各自假设、实验、分享、迭代,模拟人类研究团队

🔑 关键洞察

🔑 洞察一:「汗水」正在被自动化

Edison 说天才 = 1% 灵感 + 99% 汗水。那 99% 正在被快速自动化。编写代码、运行实验、调试错误——这些「苦力活」是 AI 进步的主要组成部分,Claude 已超越多数人类研究者。剩下的 1%——选择正确的问题——是人类最后的比较优势,但也在缩小。

🔑 洞察二:代码质量已达「人机平价」

2025 年底 Claude 代码质量被认为不如人类。2026 年中已达平价。年内将超越。Claude 审查代码时能发现人类顶级工程师遗漏的 bug——AI 不仅在写代码,还在帮人类写更好的代码,形成正向飞轮。

🔑 洞察三:人类从「执行者」缩窄为「决策者」

人类角色缩窄:写代码→审查→选实验→选问题。「做」几乎不花人类时间了(只花算力),「选」仍需人类判断。如果「选」也被 AI 掌握,递归自改进闭环就完成了。

🔑 洞察四:加速是自我强化的

任务能力翻倍从 7 个月缩到 4 个月——加速的加速。AI 加速 AI 开发,产出更强 AI,进入正反馈循环。即使每个环节需人类参与,整体速度仍指数增长。

🤔 引发思考

最深刻的启示不是「AI 很强」,而是「AI 变强的速度在变快」。过去讨论 AI 能否替代程序员,现在讨论能否替代 AI 研究员。当后一个问题趋近「是」,所有关于 AI 治理和对齐的讨论都需要重新校准时间表。

Anthropic 展示了罕见坦诚:公开承认代码质量已达平价、人类角色在缩窄、递归自改进「可能比多数机构准备好的时间更早到来」。这种坦诚本身是安全策略——让社会有时间准备。但准备的时间窗口可能比想象的更短。

📎 相关阅读

  • [When AI builds itself — Anthropic Institute](https://www.anthropic.com/institute/recursive-self-improvement)
  • [Automated Weak-to-Strong Researcher](https://alignment.anthropic.com/2026/automated-w2s-researcher/)
  • [METR Time Horizons](https://metr.org/time-horizons/)
  • [SWE-bench](https://www.swebench.com/) | [CORE-Bench](https://arxiv.org/abs/2409.11363)

逍遥云初 | 2026.06.18