📌 核心问题:AI 编码 Agent 到底在改变什么?
当 Claude Code 用户每周平均使用 20 小时、GitHub 上编码 Agent 活跃项目数自 2025 年底翻倍时,一个关键问题浮出水面:AI 编码工具是在替代程序员,还是在放大领域专家的能力?
Anthropic 基于隐私保护分析工具 Clio,对 2025 年 10 月至 2026 年 4 月间约 40 万次 Claude Code 交互会话(覆盖约 23.5 万用户)进行了大规模实证研究。这是迄今为止对 Agentic Coding 实际使用模式最系统、最大规模的量化分析。
研究回答了一个根本性问题:在 AI Agent 时代,什么能力最有价值?答案出人意料——不是编码能力,而是领域专业知识(domain expertise)。
📊 关键数据
- 样本规模:~400,000 次会话,~235,000 名用户,时间跨度 7 个月
- 决策分工:人类做出 ~70% 的规划决策(做什么),Claude 做出 ~80% 的执行决策(怎么做)
- 专家 vs 新手:专家用户每次提示触发 ~12 个 Claude 动作、3200 词输出;新手仅 ~5 个动作、600 词
- 任务价值提升:平均会话的经济价值(对标自由职业市场)7 个月内上涨约 27%
- 调试占比下降:从 33% 降至 19%,使用模式向端到端 Agent 工作转变
- 跨职业成功:所有主要职业在编码任务上的成功率几乎与软件工程师持平
🏗️ 技术架构与研究设计
- 隐私保护分析框架 Clio:对会话内容进行匿名化分类,不暴露用户隐私,同时保留结构化洞察
- 九种工作模式分类:构建新功能(25%)、修复代码(26%)、测试编排(5%)、运维(17%)、规划探索(14%)、数据分析与文档(13%)等
- 决策归属分类器:将会话中的每个决策区分为规划型或执行型,并归属到人类或 Claude
- 五级专业度评估:从 Novice 到 Expert,基于指令精确度、验证请求、纠错方向三个信号
- 23 类职业分类(SOC 标准):基于项目上下文、文件结构、引用制品和专业词汇推断,不因写了代码就归为程序员
🔑 关键洞察
🚀 引发思考
这项研究对 AI 会取代程序员的叙事给出了一个微妙但有力的修正:编码 Agent 真正取代的是纯执行层的工作。而定义问题和判断对错这两项核心能力,反而因为有了 Agent 的放大效应而变得更加值钱。
对于技术团队的启示是:与其让所有人去学写代码,不如让领域专家学会驾驭 Agent。一位能精确描述业务约束的产品经理,可能比一位不熟悉业务的初级工程师能从 Agent 身上榨取更多价值。这对教育体系、招聘标准和职业发展路径都意味着深远的变化。
更值得关注的是非软件职业增长最快这一信号:管理、销售、法律职业的 Agent 使用增速最快。Agent 正在从工程团队向外扩散,成为通用知识工作者的生产力工具。代码只是第一个被 Agent 攻克的领域,不会是最后一个。
📎 相关阅读
- 原文链接:https://www.anthropic.com/research/claude-code-expertise
- Anthropic 前序研究:Measuring Agent Autonomy — https://www.anthropic.com/research/measuring-agent-autonomy
- Anthropic 前序研究:How AI Is Transforming Work at Anthropic — https://www.anthropic.com/research/how-ai-is-transforming-work-at-anthropic
- Anthropic 前序研究:Clio(隐私保护分析) — https://www.anthropic.com/research/clio
逍遥云初 | 2026.06.25






