📄 论文信息
论文:The End of Software Engineering: How AI Agents Are Fundamentally Restructuring the Software Paradigm
作者:Zhenfeng Cao 等
提交日期:2026 年 6 月 4 日
论文链接:https://arxiv.org/abs/2606.05608
🎯 核心问题
半个世纪以来,软件工程建立在一个根本前提之上:人类工程师分解问题、将决策逻辑编码为静态代码、在需求变更时手动维护代码。这篇论文论证了一个核心观点:AI Agent 的崛起——以大语言模型作为主要推理引擎、动态生成和丢弃代码作为工具性资源的系统——不是渐进式改进,而是软件范式的根本性重构。
论文从复杂度缩放的第一性原理出发,形式化了传统软件(代码是决策逻辑的载体)与 Agent 系统(代码是 LLM 驱动推理循环的临时工具)之间的区别。这种转变堪比从模拟电路到存储程序计算机的跃迁。
更关键的是,论文追溯了从许可软件到 SaaS 再到 Agent-as-Service(AaaS)的历史弧线,证明每一次转变都将更多复杂性从终端用户身上转移出去。AaaS 的本质是:用户不再需要指定「怎么做」,只需说「要什么」。
📊 关键数据
- SWE-bench Verified:Lingma SWE-GPT 72B 解决了 30.20% 的 GitHub issue,接近 GPT-4o 的 31.80%,同时完全开源;7B 版本也解决了 18.20%,证明小模型在过程数据训练下也能完成有意义的自动软件工程
- 多 Agent 协调:LangChain 的企业级调试实验中,协调 Agent 系统将根因定位时间缩短 93%,单月节省超 200 工程小时
- Hermes Agent:Nous Research 开源框架,GitHub 179K+ star,实现了闭环学习——Agent 自主创建可复用「Skills」,并在使用中自动修补和改进
- Lingma SWE-GPT 7B vs Llama 3.1 405B:小 57 倍的模型实现 22.76% 的相对提升,证明过程数据训练比模型规模更重要
🏗️ 技术架构与设计
- 传统软件形式化定义:S=(C,D,E),其中 D 是静态决策规则集,在执行前必须由人类显式编写,所有逻辑都是预编程的
- Agent 系统形式化定义:A=(M,T,M,Π),M 为 LLM 推理引擎,T 为可执行工具集,M 为记忆子系统,Π 为规划机制,决策逻辑在运行时动态生成
- 复杂度缩放定理:n 个组件的系统,交互路径 P(n)∈Θ(2^n),人类认知容量 C_H 固定不变,而 LLM 有效容量 C_M 随训练算力指数增长
- 三次范式转移:Licensed Software → SaaS → AaaS,每次转移遵循同一模式——最能吸收复杂性的一方承担它,最不能管理的一方被解放
- Agentic Engineering 核心模块:感知模块(多模态输入)+ 记忆模块(语义/情景/程序性知识)+ 行动模块(内部推理 + 外部工具调用),由 LLM 推理核心统一编排
🔑 关键洞察
🤔 引发思考
这篇论文最深刻的洞察在于:软件工程的「本质复杂度」问题——Brooks 在 1975 年就指出的指数级交互爆炸——在传统范式下无解,但在 Agent 范式下有了新的可能性。人类认知容量是 O(1) 的,但 LLM 的有效容量随算力增长。这不是「AI 写代码更快」的叙事,而是「AI 能处理人类认知无法企及的复杂度」的叙事。
对于从业者而言,最值得警惕的是:论文定义的 Agentic Engineering 不是「更好的编程」,而是一个全新的学科。它的核心对象是 Agent 系统而非源代码,控制中心是 LLM 推理引擎而非人类工程师,产出单位是交付结果而非运行软件。那些还在争论「AI 会不会取代程序员」的人,可能问错了问题——真正的问题是:你准备好成为「意图架构师」了吗?
📎 相关阅读
- Karpathy, Software 2.0: https://karpathy.medium.com/software-2-0-a64152b37c35
- LangChain Agentic Engineering 定义(2026 年 4 月)
- Hermes Agent(Nous Research):https://github.com/NousResearch/hermes-agent
- SWE-bench Verified 基准测试
*逍遥云初 | 2026.06.08*



