📌 核心问题:AI 行业正从模型竞赛转向 Agent 系统竞赛

Google I/O 2026 的核心信号不是「某个模型跑分第一」,而是 Google 正在把 AI 从聊天窗口推进到一个更完整的 Agent 操作层:底层是 Gemini 3.5 Flash,中间是 Antigravity 2.0 多智能体开发平台,上层是 Gemini Spark——一个可在云端 24/7 执行任务的个人智能体。

但这不等于「AI 已经能完全替代工程团队」。更准确的结论是:Google 确实发布了 Gemini 3.5 Flash、Gemini Spark、Antigravity 2.0,并公开展示了多智能体构建实验性操作系统的案例;但网上流传的「现场 12 小时造 OS」「每秒洗遍人类所有书籍」等说法,应理解为技术展示和特定测试口径,而不是严肃工程事实。

从行业横向看,AI 公司已不再只拼模型,而是在拼五件事:用户入口、Agent 执行能力、企业治理、开发者工具、生态控制权。

🔥 Google I/O 2026 关键发布

Gemini 3.5 Flash:面向 Agent 工作流的核心模型

Google 官方称 Gemini 3.5 Flash 是其最强的 agentic 与 coding 模型之一,在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 等基准上给出了公开成绩。关键不是纯推理能力,而是速度、成本和 Agent 流程适配——它更像 Google Agent 体系的「高吞吐执行模型」。

Gemini Spark:24/7 个人 AI Agent

Gemini Spark 定位为 24/7 AI agent,可连接 Gmail、Drive、Calendar、Docs 等 Google 生态,处理复杂任务。先面向 trusted testers,随后以 Beta 形式面向美国 Google AI Ultra 用户($99.99/月)。战略意义:Google 试图把个人 AI 从「回答问题」升级为「持续执行任务」的入口。

Antigravity 2.0:Agent-first 开发平台

面向开发者的 agent-first 开发平台,包含桌面应用、CLI、SDK、动态 subagents、后台任务,以及与 Google AI Studio、Android、Firebase 等工具链的集成。把 AI coding 从「一个聊天框帮你补代码」推进到「多个 Agent 并行处理项目任务」的工作台。

93 个 Agent 12 小时造 OS:真实案例,但不能过度解读

Google 让 Antigravity 2.0 和 Gemini 3.5 Flash 的 agents 从零构建一个 working operating system,耗时约 12 小时、使用 93 个 subagents,运行 Doom,成本低于 $1,000。这是一个重要的多智能体编程案例,但它更接近实验性 OS,不应等同于生产级操作系统。它证明的是 Agent 编排和代码生成的并行潜力。

📊 横向对比:七大玩家 Agent 布局

Google vs OpenAI:生态型 Agent vs 产品型 Agent

OpenAI 发布 GPT-5.5 和 Workspace Agents(Codex-powered,云端持续执行)。Google 优势是 Gmail/Drive/Calendar/Docs/Search/Android/Chrome/Cloud 全在自己手里。OpenAI 更像 AI 应用平台;Google 更像 AI 系统层。短期体验 OpenAI 可能更顺,长期生态控制力 Google 更强。

Google vs Anthropic:平台广度 vs 专业可靠性

Anthropic 发布 Claude Opus 4.7,面向 coding/agents/vision 和复杂专业工作,Computer Use 支持让 Claude 操作计算机环境。Google 优势是生态和平台;Anthropic 优势是开发者口碑、安全叙事、代码质量和长文本能力。

Google vs Microsoft vs AWS:企业 Agent 三强

Microsoft 365 Copilot Agents 强调连接 M365 应用 + Graph 企业数据 + Copilot Studio;AWS Bedrock AgentCore 强调工具连接、持久记忆、安全浏览器运行时、代码解释器。个人用户和开发者叙事上 Google 更有吸引力;企业 CIO 视角下 Microsoft 和 AWS 仍然非常强。

其他挑战者:Meta / xAI / Perplexity

Meta Llama 4 开放权重是开放模型生态底座;xAI Grok 强在实时信息和 X 平台数据但企业可信度弱;Perplexity Comet 代表「浏览器成为 Agent 入口」的轻量路线。

🧠 关键洞察

🔑 Agent 系统竞赛已取代模型竞赛。未来 12 个月真正重要的指标不是发布会 demo,而是 Agent 能否稳定完成真实任务、错误发生后能否恢复、高风险动作是否可控。
🔑 Google 的真正威胁不是单个模型,而是试图把 Agent 嵌入整个数字生活和开发基础设施——Spark 面向个人,Antigravity 面向开发者,Gemini 3.5 Flash 面向高吞吐执行,Cloud 和 Workspace 面向企业。
🔑 五维竞争格局形成——用户入口、Agent 执行能力、企业治理、开发者工具、生态控制权。没有一家公司在所有维度都领先,但 Google 的生态覆盖最完整。
🔑 「93 个 Agent 造 OS」的核心价值不在「AI 取代工程师」,而在于展示了未来软件工程可能从「人类逐行编码」转向「人类定义目标、监督多个 Agent 执行、审查结果」的新形态。

🚀 引发思考

Google I/O 2026 的真正信号是:AI 公司的竞争维度已经从「谁的模型更聪明」扩展到「谁能把 Agent 嵌入更多场景、管理更多权限、执行更多任务」。这意味着接下来的关键战场不是 benchmark 排行榜,而是 Agent 的可靠性、安全性和生态粘性。

对于开发者和技术从业者,最重要的问题不再是「哪个模型最强」,而是「我的工作流会被哪种 Agent 形态重构」。是 Google 的系统级 Agent、OpenAI 的应用级 Agent、Anthropic 的专业级 Agent,还是 Microsoft/AWS 的企业治理级 Agent?不同的答案意味着不同的技能投资方向。

📎 相关阅读

  • Google Gemini 3.5 官方博客 — blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
  • OpenAI GPT-5.5 — openai.com/index/introducing-gpt-5-5/
  • Anthropic Claude Opus 4.7 — anthropic.com/news/claude-opus-4-7
  • Google Antigravity 2.0 — antigravity.google
  • AWS Bedrock AgentCore — aws.amazon.com/bedrock/agentcore/

逍遥云初 | 2026.05.27