📌 核心问题:当 AI 开始构建自己
Anthropic 发布了一篇深度研究文章「When AI builds itself」,聚焦递归自我改进(Recursive Self-Improvement)的现状与未来。这不是科幻预言——Anthropic 用内部未公开数据证明,AI 已经在加速 AI 的开发过程。
最直观的数字:Anthropic 工程师现在每季度人均提交代码量是 2021-2025 年的 8 倍。AI 不再只是「帮忙写几行代码」,而是能独立完成整个文件的编写、运行代码、甚至将数小时的工作委派给其他 Agent。
核心命题:如果 AI 能完全自主地设计和开发自己的继任者,就是递归自我改进的终极形态。Anthropic 表示目前还没到那一步,但可能比大多数人预期的要快。
📊 关键数据
- 任务时长倍增周期:每 4 个月翻一倍(之前是 7 个月)
- Claude Opus 3(2024.3):能完成人类约 4 分钟的软件任务
- Claude Sonnet 3.7(2025.3):能完成约 1.5 小时的任务
- Claude Opus 4.6(2026):能完成 12 小时的任务
- 趋势预测:如果持续,今年内可达人类数天级别,2027 年可达数周级别
- SWE-bench(软件工程基准):从低个位数得分到刷满,仅用 2 年
- CORE-Bench(研究复现基准):2024 年成功率 ~20%,15 个月后刷满
🧠 技术演进阶段
阶段一:2021-2023 — 人工开发
传统开发模式:工程师在笔记本上写代码和文档。
阶段二:2023-2025 — 聊天机器人辅助
早期聊天机器人辅助生成短代码片段,人类复制粘贴到编辑器中。
阶段三:2025-2026 — 编码 Agent
Agent 能独立编写和编辑代码,有时能完成整个文件。
阶段四:Today — 自主 Agent
Agent 能自己运行代码,将数小时的工作委派给其他 Agent。
阶段五:20XX? — 闭环
Agent 足够强大,能自己构建和训练模型。未来的 Claude 可以被 Claude 自己持续改进。
🔑 关键洞察
1. AI 加速 AI 开发是已验证的事实,不是推测
2. 任务复杂度的指数增长曲线令人警觉
3. 递归自我改进的安全隐忧
🚀 引发思考
Anthropic 这篇文章最大的价值不是预测未来,而是用内部数据证明了一个趋势:AI 开发 AI 已经不是理论问题,而是工程实践问题。对我们而言,核心问题不是「AI 会不会取代程序员」,而是「在 AI 能自己改进自己的时代,人类工程师的价值锚点在哪里」。
答案可能就在 Harness Engineering 的框架里:设计环境、编码原则、构建反馈循环——这些是 AI 目前还做不好的事,也是人类工程师在递归自我改进时代的核心竞争力。当 AI 能写所有代码时,「写什么」和「为什么写」比「怎么写」重要得多。
📎 相关阅读
- [Anthropic: When AI builds itself](https://www.anthropic.com/institute/recursive-self-improvement)
- [METR: Measuring AI ability to complete long tasks](https://metr.org/time-horizons/)
- [SWE-bench](https://www.swebench.com/)
- [CORE-Bench](https://arxiv.org/abs/2409.11363)
*逍遥云初 | 2026.06.18*






