📌 核心问题

AI Coding Agent 到底能做什么?不能做什么?用两个月、50 个项目、烧掉 Claude Max 订阅费的代价,一位资深开发者总结了 10 条血泪教训。这不是一篇安利文,而是一份来自前线的实战手册。


🔥 关键数据

  • 作者背景:自 1990 年起编程,使用过 BASIC/C/PHP/Python/Ruby 等多种语言,非专业开发者
  • 实验规模:2 个月内完成 50+ 个 demo 项目,使用 Claude Code + Claude Opus 4.5
  • 工具对比:同时使用 Claude Code 和 OpenAI Codex,Claude Code 使用频率更高
  • 核心结论:AI Agent 在小规模原型上「近乎神奇」,但生产级工作仍需大量人工
  • 类比:AI Coding Agent 像 3D 打印机——初次体验惊艳,但要做好产品远不止按个按钮

🧠 10 条实战军规

1. 人仍然不可或缺

AI Agent 放大现有专业知识,而非替代它。越有经验的开发者,从 AI 工具中获得的收益越大。正如 Simon Willison 所说:「AI 工具放大现有专业知识。你的技能和经验越多,从 LLM 中获得的结果就越好。」

2. 模型在训练数据之外极其脆弱

LLM 在现代编程语言(JS/HTML/Python)上表现惊人,但在冷门领域(如 6502 汇编、Atari 800 游戏编程)几乎无能为力。作者用 5 分钟做出 HTML5 demo,但花了一周才做出 Atari 800 版本。

3. 真正的创新是一场硬仗

由于训练数据中的统计关联,AI 会不自觉地「套模板」。作者想做一个棋盘游戏的变体,但 Claude 总是试图把棋子对齐到格子里——即使明确说了格子只是背景。解决方案:换一种描述方式,避免触发模型的「先入之见」。

4. 90/10 问题

前 90% 的进度快得惊人,后 10% 的细节填充却极其痛苦。需要人类介入做深层判断和方向引导。

5. 上下文窗口是瓶颈

当项目变大,上下文窗口被压缩时,Agent 会「忘记」之前的解决方案。解决方案:让 Agent 做详细笔记,在 claude.md 中设定地面规则。

6. 工具链决定上限

作者不得不让 Claude 自己发明工具(命令行模拟器、MCP Server)来窥探 Atari 800 的内存和芯片状态。Agent 的能力上限取决于它能调用什么工具。

7. 提示词工程是核心技能

当 Agent 卡住时,有效的提示:「你需要什么信息才能完美实现这个?你有什么工具可以系统地发现这些信息?」这迫使 Agent 识别自己的知识缺口,而不是盲目尝试。

8. 版本控制和增量备份是救命稻草

AI Agent 可能突然破坏之前正常工作的代码。没有版本控制和增量备份,项目很容易陷入灾难。

9. 小步迭代优于大步跳跃

一次只测试一个功能,逐步推进。AI Agent 在小范围修改上更可靠,大范围重构容易出错。

10. 这些工具让人更忙,而非更闲

AI Agent 打开了 previously closed 的创作世界,但也带来了新的工作量。开发者不会失业,但可能会比以前更忙。


🔑 关键洞察

1. AI Agent 是「软件力量工具」,不是「自动程序员」

就像 3D 打印机不等于工业制造,AI Agent 不等于软件开发。它们是强大的工具,但管理项目范围、做出架构决策、平衡技术债务,仍然需要人类判断。

2.「上下文污染」是被低估的问题

当你在提示中提到「棋盘游戏」,模型会激活大量关于棋盘游戏的语义关联,这些「先入之见」会干扰实现。学会「干净地描述需求」——避免无关的语义标签——是使用 AI Agent 的高级技能。

3. 经验越丰富,AI 越有用

这与「AI 会让程序员变懒」的叙事完全相反。AI Agent 放大专业知识,而非替代它。知道「想要做什么」比「怎么做」更重要——而这恰恰是经验的价值。


🚀 引发思考

这篇文章最大的价值在于它的诚实:没有夸大 AI 的能力,也没有否认它的价值。50 个项目的经验告诉我们,AI Coding Agent 是这个时代最强大的创作工具之一,但它需要有经验的人来驾驭。

对于团队而言,这意味着:投资于开发者的判断力和架构能力,比投资于 AI 工具本身更重要。工具会迭代,但工程判断力是持久的竞争力。

对于行业而言,「90/10 问题」可能定义了 AI Coding 的当前边界:快速原型 + 人工精修,可能是未来一段时间内的最优工作流。


逍遥云初 | 2026.04.24