基本信息
来源:Anthropic 产品更新 + 安全公告(2026 年 4 月)
核心事件:Claude Cowork 面向所有付费用户开放 + Mythos Preview 因安全风险被限制访问
为什么重要
Anthropic 同一时期做了两件看似相反的事:把 AI Agent 推给更多非技术用户(Cowork),同时限制更强模型的访问(Mythos)。这两个动作合在一起,揭示了 AI 产品化的核心矛盾——「让更多人用」和「确保安全使用」之间的拉扯。
对于关注 Harness Engineering 和 AI 工程化的人来说,Cowork 的产品设计尤其值得研究:它不是单纯地「降低使用门槛」,而是通过产品机制(角色权限、团队预算、遥测监控)在扩大覆盖面的同时建立了一套默认安全的 Agent 运营框架。
新闻一:Claude Cowork 面向所有付费计划开放
是什么
Claude Cowork 是 Anthropic 推出的「非开发者版 Claude Code」——面向市场、财务、法律、HR 等知识工作者,让不会写代码的人也能使用 Agent 能力完成复杂工作流。
关键特性
- 面向对象:所有付费计划用户(Pro/Team/Enterprise),不限于开发者
- Zoom 会议摘要自动接入:Agent 可以自动加入 Zoom 会议,实时生成结构化会议纪要,识别 action items
- 团队预算管控(per-team budget):管理员可以为每个团队设定 Agent 使用预算上限,超出自动限流
- OpenTelemetry 监控集成:所有 Agent 调用可以通过 OTel 协议输出到企业现有的可观测性平台,实现 Agent 行为审计
- 角色权限(role-based access):不同角色可以使用不同的 Agent 能力,比如 HR 只能访问人事相关工具
产品设计亮点
Cowork 的巧妙之处在于:它把 Harness Engineering 的思想产品化了。传统的 Agent 安全靠工程师在代码层做约束(AGENTS.md、system prompt),但 Cowork 直接在产品层内建了三层安全网:
- 第一层:角色权限(RBAC)— 不同职能只能用对应的 Agent 能力
- 第二层:团队预算 — token 消耗有硬上限,防止失控的 Agent Loop 烧钱
- 第三层:OTel 审计 — 所有 Agent 行为可追溯,接入企业 SOC
新闻二:Mythos Preview 因安全风险被限制访问
是什么
Anthropic 宣布限制 Mythos Preview 模型的访问权限——这款模型只开放给特定安全研究公司,因为评估发现它展示出了「高级黑客能力」,包括自主发现和利用零日漏洞、生成高度针对性的社工攻击等。
为什么值得关注
- 安全边界的拉锯战又回来了:从 2019 年 OpenAI 延迟发布 GPT-2(担心生成假新闻),到现在 Anthropic 限制 Mythos(担心黑客能力),AI 安全封禁的历史在重复
- 模型能力和安全性的 tradeoff 正在加剧:Mythos 在推理和编程能力上显著领先,但安全评估却亮了红灯
- 选择性开放成为新常态:不是「发布 or 不发布」,而是「给谁用、怎么用」——这可能是未来前沿模型发布的标准模式
关键洞察
🔑 AI 安全正在从「技术问题」变成「产品架构问题」
传统 AI 安全研究关注的是模型层面——对齐、RLHF、safety filter。但 Cowork 展示了另一个思路:安全可以在产品架构层解决。RBAC + 预算管控 + 行为审计,这三个机制都不是模型层面的,而是产品和运营层面的。这和 Harness Engineering 的核心理念一脉相承——不是让模型更安全,而是让环境更可控。
🔑 「默认安全」比「事后补救」效率高 10 倍
Cowork 的设计是「默认安全」——你不需要懂 AI 安全,产品自带预算上限和权限控制。对比之下,很多企业现在的做法是先部署 Agent、再补安全策略,结果就是控制面板暴露在公网、API 密钥泄露等问题层出不穷。Anthropic 的做法值得所有构建 Agent 产品的团队参考。
🔑 选择性发布将成为前沿模型的标准操作
Mythos 的限制发布不是个案,而是趋势。随着模型能力逼近「危险阈值」(autonomous hacking、bio-weapon synthesis 等),「全量公开发布」将越来越少见。取而代之的是分级访问——研究机构可以用、企业可以申请、个人用户可能永远用不到。这对开源社区和 AI 民主化运动是一个值得深思的挑战。
引发思考
Cowork 和 Mythos 这两件事放在一起看,Anthropic 实际上在回答一个问题:「怎么让更多人安全地使用更强的 AI?」答案不是二选一——不是「让所有人用弱模型」或「让少数人用强模型」——而是「用产品机制让所有人安全地用适当强度的模型」。
对于正在构建 Agent 产品的团队,三个可以立即行动的建议:(1) 给 Agent 加 per-team 预算上限,防止 token 失控;(2) 集成 OTel 监控,让 Agent 行为可审计;(3) 实现 RBAC,不同角色只能调用对应的工具子集。这些都不需要改模型,只需要改产品架构。
相关阅读
- Meta-Harness: End-to-End Optimization of Model Harnesses (arXiv: 2603.28052)
- AGENTS.md 目录式约束文件:AI Coding Agent 的事实标准(Notion)
- Linux 7.0 Agent 按键 × Prod Agent 治理(Notion)
逍遥云初 | 2026.04.10





