Anthropic「When AI builds itself」：递归自我改进的现状与未来

📌 核心问题：当 AI 开始构建自己

Anthropic 发布了一篇深度研究文章「When AI builds itself」，聚焦递归自我改进（Recursive Self-Improvement）的现状与未来。这不是科幻预言——Anthropic 用内部未公开数据证明，AI 已经在加速 AI 的开发过程。

最直观的数字：Anthropic 工程师现在每季度人均提交代码量是 2021-2025 年的 8 倍。AI 不再只是「帮忙写几行代码」，而是能独立完成整个文件的编写、运行代码、甚至将数小时的工作委派给其他 Agent。

核心命题：如果 AI 能完全自主地设计和开发自己的继任者，就是递归自我改进的终极形态。Anthropic 表示目前还没到那一步，但可能比大多数人预期的要快。

📊 关键数据

任务时长倍增周期：每 4 个月翻一倍（之前是 7 个月）
Claude Opus 3（2024.3）：能完成人类约 4 分钟的软件任务
Claude Sonnet 3.7（2025.3）：能完成约 1.5 小时的任务
Claude Opus 4.6（2026）：能完成 12 小时的任务
趋势预测：如果持续，今年内可达人类数天级别，2027 年可达数周级别
SWE-bench（软件工程基准）：从低个位数得分到刷满，仅用 2 年
CORE-Bench（研究复现基准）：2024 年成功率 ~20%，15 个月后刷满

🧠 技术演进阶段

阶段一：2021-2023 — 人工开发

传统开发模式：工程师在笔记本上写代码和文档。

阶段二：2023-2025 — 聊天机器人辅助

早期聊天机器人辅助生成短代码片段，人类复制粘贴到编辑器中。

阶段三：2025-2026 — 编码 Agent

Agent 能独立编写和编辑代码，有时能完成整个文件。

阶段四：Today — 自主 Agent

Agent 能自己运行代码，将数小时的工作委派给其他 Agent。

阶段五：20XX? — 闭环

Agent 足够强大，能自己构建和训练模型。未来的 Claude 可以被 Claude 自己持续改进。

🔑 关键洞察

1. AI 加速 AI 开发是已验证的事实，不是推测

Anthropic 工程师 8x 代码产出提升不是「用了 AI 写代码」这么简单——是 AI Agent 在整个开发流程中承担了越来越大的工作量。从代码生成到文件编辑到运行调试到跨 Agent 协作，AI 正在系统性地接管软件工程的各个环节。这对 Harness Engineering 的启示是：环境设计和反馈循环的权重会指数级上升，因为 AI 的执行能力越强，「引导它做什么」比「它能不能做」更重要。

2. 任务复杂度的指数增长曲线令人警觉

4 分钟 → 1.5 小时 → 12 小时，每一年任务时长翻 10-20 倍。如果这个趋势持续，2027 年 AI 可能完成需要人类数周的复杂工程任务。这不是「AI 会写代码了」，而是「AI 能完成完整的工程项目了」。软件工程的范式可能在 2-3 年内被彻底重塑。

3. 递归自我改进的安全隐忧

Anthropic 坦承：如果系统能完全自己构建继任者，安全、监控和行为塑造的重要性都会急剧上升。这不是危言耸听——当 AI 的改进速度超过人类理解和干预的速度时，如何确保改进方向与人类意图一致，将成为最核心的技术挑战。这也是为什么 Harness Engineering 中「渐进式披露」和「黄金原则编码」如此重要。

🚀 引发思考

Anthropic 这篇文章最大的价值不是预测未来，而是用内部数据证明了一个趋势：AI 开发 AI 已经不是理论问题，而是工程实践问题。对我们而言，核心问题不是「AI 会不会取代程序员」，而是「在 AI 能自己改进自己的时代，人类工程师的价值锚点在哪里」。

答案可能就在 Harness Engineering 的框架里：设计环境、编码原则、构建反馈循环——这些是 AI 目前还做不好的事，也是人类工程师在递归自我改进时代的核心竞争力。当 AI 能写所有代码时，「写什么」和「为什么写」比「怎么写」重要得多。

📎 相关阅读

[Anthropic: When AI builds itself](https://www.anthropic.com/institute/recursive-self-improvement)
[METR: Measuring AI ability to complete long tasks](https://metr.org/time-horizons/)
[SWE-bench](https://www.swebench.com/)
[CORE-Bench](https://arxiv.org/abs/2409.11363)

*逍遥云初 | 2026.06.18*

Anthropic「When AI builds itself」：递归自我改进的现状与未来

📌 核心问题：当 AI 开始构建自己

📊 关键数据

🧠 技术演进阶段

阶段一：2021-2023 — 人工开发

阶段二：2023-2025 — 聊天机器人辅助

阶段三：2025-2026 — 编码 Agent

阶段四：Today — 自主 Agent

阶段五：20XX? — 闭环

🔑 关键洞察

1. AI 加速 AI 开发是已验证的事实，不是推测

2. 任务复杂度的指数增长曲线令人警觉

3. 递归自我改进的安全隐忧

🚀 引发思考

📎 相关阅读

推荐好物

相关文章

Anthropic「When AI builds itself」：递归自我改进的现状与未来

📌 核心问题：当 AI 开始构建自己

📊 关键数据

🧠 技术演进阶段

阶段一：2021-2023 — 人工开发

阶段二：2023-2025 — 聊天机器人辅助

阶段三：2025-2026 — 编码 Agent

阶段四：Today — 自主 Agent

阶段五：20XX? — 闭环

🔑 关键洞察

1. AI 加速 AI 开发是已验证的事实，不是推测

2. 任务复杂度的指数增长曲线令人警觉

3. 递归自我改进的安全隐忧

🚀 引发思考

📎 相关阅读

推荐好物

即时通信IM

AI领航·智慧未来

家用电器

相关文章

AI科技前沿快讯｜2026年8月1日

AI科技前沿快讯｜2026年7月29日

AI科技前沿快讯 | 2026年7月28日