📄 论文信息
论文:How AI Agents Are Restructuring the Software Paradigm 作者:Zhenfeng Cao et al. 提交日期:2026-06-04 (v2: 2026-06-10) 链接:arXiv:2606.05608
📌 核心问题
半个世纪以来,软件工程建立在一个基本前提之上:人类工程师分解问题、将决策逻辑编码为静态代码、手动维护代码演进。这篇论文提出了一个根本性论断——AI Agent 的兴起不是工具层面的增量改进,而是对"软件是什么"的范式重构。
论文的核心洞察在于区分两种软件形态:传统软件中,代码是预写决策逻辑的载体;而在 Agentic 软件中,Agent 本身就是软件,决策逻辑在运行时动态生成。当 LLM 能够理解任务、分解子任务、动态生成代码并执行、完成后丢弃代码时,代码的角色从"系统本身"变成了"推理的临时工具"。
这一转变的深远程度,堪比从模拟电路到存储程序计算机的跃迁。论文从第一性原理出发,论证了 Agentic 范式不是市场偏好,而是复杂度缩放定律的必然结果。
🔥 关键数据与 Benchmark
- SWE-bench Verified:Lingma SWE-GPT 72B 解决 30.20% 的 GitHub issues,接近 GPT-4o 的 31.80%。7B 变体解决 18.20%,比 Llama 3.1 405B(大 6 倍的模型)相对提升 22.76%
- 多 Agent 协调:LangChain 企业试点在 20+ 调试工作流中部署协调 Agent 群,展示了跨团队工作流编排的可行性
- 复杂度缩放:n 个组件的系统,可能的交互拓扑数为 2^(n choose 2),超指数增长。人类认知容量固定,而 LLM 有效容量随训练算力指数增长
🏗️ 技术架构与设计
- 形式化定义 Agentic 系统:A = (M, T, M, Pi) — M 为 LLM 推理引擎,T 为可执行工具集,M 为记忆子系统,Pi 为规划机制
- 三段历史范式转移:许可软件 -> SaaS -> Agent-as-a-Service (AaaS)。每次转移都将复杂性从用户端移走,AaaS 转移的不仅是运营复杂性,更是决策复杂性本身
- Agent = Software:"Agent -> Result" 模式取代 "AI -> Software -> Result"。Agent 同时是软件系统和执行引擎,消除了对独立静态编码产物的需求
- Agentic Engineering 学科定义:LangChain 2026 年 4 月正式提出——多 Agent 协调模型,Agent 作为数字团队成员
- Hermes Agent 实践案例:Nous Research 开源框架,闭环学习——Agent 完成任务后自主创建可复用 Skills,自动修补不足
🔑 关键洞察
🚀 引发思考
这篇论文最深层的启示是:软件工程的学科边界正在被重新定义。从 1968 年 NATO 会议定义"软件工程"以来,这个学科的核心对象一直是源代码。而 Agentic Engineering 的核心对象变成了 Agent 系统——动态的、自修改的、运行时生成决策逻辑的系统。这意味着未来最有价值的工程师不是写代码最快的人,而是能清晰表达意图、设计 Agent 协调架构、建立质量评估框架的人。
论文提出的四阶段路线图描绘了从单 Agent 辅助到自进化 Agent 生态系统的演进路径。但当前 Agentic 系统在精确计算、跨领域泛化、长期可靠性方面仍有显著局限。SWE-bench 上 30% 的解决率说明距离真正的自主软件工程还有很长的路。关键问题不是"Agent 能否取代程序员",而是"在 Agent 能力持续增长的曲线上,人类应该把精力投入到哪些不可替代的能力上"。
📎 相关阅读
- Wang et al. "A Survey on Large Language Model based Autonomous Agents" — LLM-based Agent 基础分类法
- Karpathy "Software 2.0" — 神经网络替代手写程序的早期论述
- LangChain "Agentic Engineering" (April 2026) — 多 Agent 协调模型的正式定义
- Hermes Agent (Nous Research) — 闭环学习 + 技能自创的开源 Agent 框架
逍遥云初 | 2026.06.21






