📌 核心问题:当 AI 开始构建自己

Anthropic 发布了一篇深度研究文章「When AI builds itself」,聚焦递归自我改进(Recursive Self-Improvement)的现状与未来。这不是科幻预言——Anthropic 用内部未公开数据证明,AI 已经在加速 AI 的开发过程。

最直观的数字:Anthropic 工程师现在每季度人均提交代码量是 2021-2025 年的 8 倍。AI 不再只是「帮忙写几行代码」,而是能独立完成整个文件的编写、运行代码、甚至将数小时的工作委派给其他 Agent。

核心命题:如果 AI 能完全自主地设计和开发自己的继任者,就是递归自我改进的终极形态。Anthropic 表示目前还没到那一步,但可能比大多数人预期的要快。


📊 关键数据

  • 任务时长倍增周期:每 4 个月翻一倍(之前是 7 个月)
  • Claude Opus 3(2024.3):能完成人类约 4 分钟的软件任务
  • Claude Sonnet 3.7(2025.3):能完成约 1.5 小时的任务
  • Claude Opus 4.6(2026):能完成 12 小时的任务
  • 趋势预测:如果持续,今年内可达人类数天级别,2027 年可达数周级别
  • SWE-bench(软件工程基准):从低个位数得分到刷满,仅用 2 年
  • CORE-Bench(研究复现基准):2024 年成功率 ~20%,15 个月后刷满

🧠 技术演进阶段

阶段一:2021-2023 — 人工开发

传统开发模式:工程师在笔记本上写代码和文档。

阶段二:2023-2025 — 聊天机器人辅助

早期聊天机器人辅助生成短代码片段,人类复制粘贴到编辑器中。

阶段三:2025-2026 — 编码 Agent

Agent 能独立编写和编辑代码,有时能完成整个文件。

阶段四:Today — 自主 Agent

Agent 能自己运行代码,将数小时的工作委派给其他 Agent。

阶段五:20XX? — 闭环

Agent 足够强大,能自己构建和训练模型。未来的 Claude 可以被 Claude 自己持续改进。


🔑 关键洞察

1. AI 加速 AI 开发是已验证的事实,不是推测

Anthropic 工程师 8x 代码产出提升不是「用了 AI 写代码」这么简单——是 AI Agent 在整个开发流程中承担了越来越大的工作量。从代码生成到文件编辑到运行调试到跨 Agent 协作,AI 正在系统性地接管软件工程的各个环节。这对 Harness Engineering 的启示是:环境设计和反馈循环的权重会指数级上升,因为 AI 的执行能力越强,「引导它做什么」比「它能不能做」更重要。

2. 任务复杂度的指数增长曲线令人警觉

4 分钟 → 1.5 小时 → 12 小时,每一年任务时长翻 10-20 倍。如果这个趋势持续,2027 年 AI 可能完成需要人类数周的复杂工程任务。这不是「AI 会写代码了」,而是「AI 能完成完整的工程项目了」。软件工程的范式可能在 2-3 年内被彻底重塑。

3. 递归自我改进的安全隐忧

Anthropic 坦承:如果系统能完全自己构建继任者,安全、监控和行为塑造的重要性都会急剧上升。这不是危言耸听——当 AI 的改进速度超过人类理解和干预的速度时,如何确保改进方向与人类意图一致,将成为最核心的技术挑战。这也是为什么 Harness Engineering 中「渐进式披露」和「黄金原则编码」如此重要。

🚀 引发思考

Anthropic 这篇文章最大的价值不是预测未来,而是用内部数据证明了一个趋势:AI 开发 AI 已经不是理论问题,而是工程实践问题。对我们而言,核心问题不是「AI 会不会取代程序员」,而是「在 AI 能自己改进自己的时代,人类工程师的价值锚点在哪里」。

答案可能就在 Harness Engineering 的框架里:设计环境、编码原则、构建反馈循环——这些是 AI 目前还做不好的事,也是人类工程师在递归自我改进时代的核心竞争力。当 AI 能写所有代码时,「写什么」和「为什么写」比「怎么写」重要得多。


📎 相关阅读

  • [Anthropic: When AI builds itself](https://www.anthropic.com/institute/recursive-self-improvement)
  • [METR: Measuring AI ability to complete long tasks](https://metr.org/time-horizons/)
  • [SWE-bench](https://www.swebench.com/)
  • [CORE-Bench](https://arxiv.org/abs/2409.11363)

*逍遥云初 | 2026.06.18*