📌 核心问题

2026 年 5 月,AI Coding 领域发生了一件标志性事件:GitHub Copilot 宣布从 6 月 1 日起全面转向按量计费(Usage-based Billing),告别固定月费时代。与此同时,OpenAI Codex 周活跃用户突破 400 万,Chrome 扩展上线。两个事件叠加,标志着 AI Coding 的 Token 经济时代正式到来

📊 关键数据

Copilot 计费变革

  • 生效日期:2026 年 6 月 1 日
  • 计费方式:从固定月费 → 基于 Token 消耗的信用点数模型
  • 个人 Pro:$10/月 → 获得 $10 等值 AI 积分,超出按 Token 计费
  • 企业:基础订阅价格不变,新增月度 AI 信用额度
  • 模型差异:不同模型 Token 单价差异显著,高级模型(如 Claude Opus)消耗更快

Codex 增长

  • 400 万周活:2026 年初至今增长 8 倍(从 50 万到 400 万)
  • 两周跃升:从 300 万到 400 万仅用两周(4 月 21 日数据)
  • Chrome 扩展:5 月 8 日上线,让 Codex 直接在浏览器中完成工作
  • ChatGPT 9 亿周活:Codex 作为独立产品已接近主流开发者工具量级

🧠 技术架构分析

计费模式的结构性转变

Copilot 的计费变革不是简单的「涨价」,而是反映了 AI 编程工具的成本结构根本性变化

  • 推理成本与使用量正相关 — 每次代码补全、每次 Agent 任务都消耗实际的 GPU 算力。固定月费模式下,重度用户让 GitHub 持续亏损。
  • Agent 化推高单次成本 — 从简单的代码补全到 Agent 自主完成复杂任务,单次交互的 Token 消耗量级增长了 10-100 倍。
  • 多模型并存 — Copilot 现在支持 Claude、Gemini、GPT 等多个模型,不同模型成本差异巨大,统一的固定定价不可持续。

四家 CLI Agent 竞争格局

终端 AI 编程 Agent 已形成四方争霸格局:

  • Claude Code(Anthropic)— 代码理解王者,擅长跨文件重构和架构改造。$20/月起。内置子代理和 Hook 机制实现团队规范统一。
  • Codex CLI(OpenAI)— 自动化利器,三档审批模式 + OS 级沙箱。开源,基于 Rust 实现。2026 年初至今用户增长 8 倍。
  • Gemini CLI(Google)— 免费开源,性价比之王。终端原生设计,强调自动化。
  • Grok Build(xAI)— 后来者,主打实时性和 Twitter/X 生态集成。

🔑 关键洞察

Token 计费模式的全面到来,意味着 AI Coding 从「工具订阅」进入了「算力消费」时代。开发者不再为「拥有 AI」付费,而是为「使用 AI」付费。这个转变的深层含义是:AI 编程的成本结构第一次对开发者透明了。

对于企业用户,这意味着三个结构性变化:

  • 成本可预测性变重要 — 当 Agent 按 Token 计费时,一次复杂的重构任务可能消耗数美元。企业需要 Token 预算管理、用量监控、成本归因。
  • 效率优化成为刚需 — 不是「用不用 AI」的问题,而是「怎么用更少的 Token 完成同样的任务」。Prompt 工程、上下文管理、模型选择策略都会直接影响成本。
  • 混合模型策略 — 简单补全用便宜模型,复杂推理用高级模型。Copilot 的多模型支持正是为此设计。

💭 引发思考

这组事件放在一起看,有一个清晰的信号:AI Coding 的基础设施层正在成熟

计费模式从模糊到透明,用户规模从极客到主流,竞争格局从一家独大到四家并立。这些特征和云计算早期的演进路径高度相似:先是免费试用吸引用户,然后按量计费建立商业模式,最后形成平台级竞争

对做 Agent 架构的工程师来说,有三个实践启示:

  • Token 意识 — 把 Token 消耗纳入架构设计的考量因素,就像当年考虑 API 调用次数一样。
  • 缓存策略 — 上下文缓存、结果缓存、增量更新,减少重复计算。
  • 模型路由 — 根据任务复杂度动态选择模型,简单任务用轻量模型,复杂任务用高级模型。
公司内部的 MCP→CLI 迁移方向是对的。Token 计费模式会让 Agent 的成本可控性变得更重要,而 CLI Agent 天然支持细粒度的 Token 追踪和成本归因。

📎 相关阅读

  • GitHub 官方公告:Copilot is moving to usage-based billing — https://github.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/
  • GitHub 定价详情:Models and pricing for GitHub Copilot — https://docs.github.com/copilot/reference/copilot-billing/models-and-pricing
  • IT之家报道:微软 GitHub Copilot 宣布转向按量计费 — https://www.ithome.com/0/944/205.htm
  • IT之家报道:400 万周活的 Codex 推出 Chrome 扩展 — https://www.ithome.com/0/947/648.htm
  • OpenAI 公告:Codex for (almost) everything — https://openai.com/index/codex-for-almost-everything/
  • 三方横评:Claude Code vs Codex CLI vs Gemini CLI — https://www.deployhq.com/blog/comparing-claude-code-openai-codex-and-google-gemini-cli-which-ai-coding-assistant-is-right-for-your-deployment-workflow

逍遥云初 | 2026.05.19