📰 新闻内容

2026 年 5 月,两则重磅消息在科技圈引发震动:Uber 仅用四个月就耗尽了 2026 年全年的 AI 编程工具预算;微软开始大规模取消内部 Claude Code 许可,转向 GitHub Copilot CLI。这两件事共同指向一个正在爆发的行业性问题——AI Coding 工具的 Token 经济模型正在制造成本黑洞

据 Forbes 和 The Verge 报道,Uber 95% 的工程师已使用 AI 工具,70% 的提交代码来自 AI 生成。重度用户月均消耗 500-2000 美元。Uber CTO Praveen Neppalli Naga 表示「很难在 AI 成本上升和为客户带来的有用功能之间画一条线」。微软方面,向数千名员工开放 Claude Code 仅六个月后,使用规模就迫使公司改弦更张——工程师们太喜欢这个工具了,以至于成本失控。

讽刺的是,微软是 OpenAI 的最大投资方(累计超 130 亿美元),而自家工程师却在用竞品 Claude Code 把账单烧爆。


🔬 核心问题

  • Token 定价悖论:Token 单价持续走低(Gartner 预测 2030 年推理成本降 90%),但代理式 AI 每个任务需要更多 Token,总消耗增速远超单位成本降幅。高盛预测 2030 年代理式 AI 代币消耗将增长 24 倍,达每月 120 万亿个
  • 使用率越高、花费越大:与传统软件的固定订阅不同,Token 消耗定价意味着「用得越多、效率越高 = 花费越大」。企业鼓励员工最大化 AI 使用率的同时,预算也在指数级增长
  • ROI 难以量化:Uber COO 承认「很难在 AI 成本和客户价值之间画线」。70% 代码来自 AI 不等于效率提升 70%——AI 生成的代码仍需人类审查、测试和维护
  • 供应商定价不会随成本下降:Gartner 分析师警告「不应将基础 Token 价格下行与前沿推理的民主化混为一谈」。AI 供应商不会将全部成本降幅传递给消费者
  • 企业排行榜文化加剧消耗:Meta 内部排行榜追踪 AI 使用量,亚马逊推动员工「toxenmaxx」(最大化 Token 消耗),这种激励机制与成本控制天然矛盾

🔑 关键洞察

「Token 经济」是 AI Coding 的下一个战场:GitHub Copilot 从订阅制转向按量计费(5/24 报道),Uber 的预算爆炸,微软砍掉 Claude Code——这些事件共同说明:AI Coding 的竞争正从「谁能生成更好的代码」转向「谁能以更低成本生成等效代码」。未来的赢家不是模型最强的,而是 Token 效率最高的。
Harness Engineering 的价值被再次验证:当 Token 成本成为瓶颈,「让 AI 少做无用功」变得至关重要。这正是 Harness Engineering 的核心——通过精心设计的约束、反馈循环和渐进式披露,让每个 Token 都产生有效价值。盲目「toxenmaxx」是反模式,精准约束才是正道。
算力成本 vs 人力成本的天平正在反转:英伟达应用深度学习副总裁 Bryan Catanzaro 对 Axios 表示:「对我团队来说,算力成本远超员工成本。」当 AI 工具的使用成本超过雇佣额外工程师的成本时,企业必须重新审视「AI 替代人力」的经济逻辑。

💭 引发思考

黄仁勋描绘的「每个员工身边 100 个 AI 代理」愿景令人兴奋,但如果 Token 消耗增速快于单位成本降速,这个未来带来的账单将比高管们预期的高得多。2026 年或许是 AI Coding 从「野蛮生长」转向「精细化运营」的转折点——不再比谁用的多,而是比谁用的精。

对于开发者而言,这意味着下一代 AI Coding 工具的核心竞争力将不是「生成更多代码」,而是「用更少的 Token 解决更复杂的问题」。Prompt 工程、上下文管理、约束设计——这些「软技能」将成为新的技术护城河。


📎 相关阅读


逍遥云初 | 2026.05.29