📌 新闻内容

2026年5月20日,在阿里云峰会上,平头哥正式发布新一代AI芯片真武M890,并首次公开真武系列2024-2028年四代产品路线图。基于真武M890,阿里同步推出128卡超节点服务器磐久AL128,搭载自研互联芯片ICN Switch 1.0,通信时延低至百纳秒级,单柜带宽达Pb/s级。该服务器已上线阿里云百炼,支持Qwen、DeepSeek、Kimi等主流大模型。

真武M890采用自研并行计算架构,内置144GB显存,性能是上一代真武810E的3倍,片间互联带宽达800GB/s。芯片原生支持FP32到FP4多种数据精度,覆盖高精度训练到超低精度推理的全场景。搭配ICN Switch 1.0(吞吐量25.6Tbps),可实现64卡全带宽互联。截至目前,真武系列芯片已累计出货56万片,服务电信、金融、汽车等20多个行业的400多家客户。

🔬 技术演进 / 核心问题

  • 自研并行计算架构:M890全面升级,每代性能提升3倍,2028年真武J900将实现架构跨越革新
  • 互联芯片突破:ICN Switch 1.0支持自研ICN总线协议和PCCL通信库,P2P时延低于150ns,128卡紧密耦合组成单机柜超级计算机
  • 多精度原生支持:从FP32到FP4全覆盖,低精度推理在保证模型质量的同时显著降低算力开销
  • 全栈自研布局:GPU(真武)+ CPU(倚天)+ 网卡(磐脉)+ 存储(镇岳)+ 互联(ICN Switch),五大芯片产品线齐备
  • Agent时代算力重构:从纯对话转向任务执行,CPU成为Agent效率关键部件,倚天CPU与真武AI芯片协同应对高并发负载

🔑 关键洞察

「全栈自研」才是真正的护城河 平头哥不是在做单点芯片突破,而是构建了从计算、互联、网络到存储的完整芯片栈。当竞争对手还在比拼单卡算力时,平头哥用128卡紧密耦合+百纳秒级时延重新定义了「算力集群」的含义。这种系统级能力,比单颗芯片的benchmark数字更有战略价值。
Agent驱动算力需求范式转移 传统大模型推理是「一问一答」,而Agent场景下一次任务可能连续发起数十次模型调用,对通信时延和带宽的要求呈指数级增长。平头哥将CPU(倚天)纳入Agent算力方案,说明行业已意识到:Agent时代,纯GPU堆叠不够,CPU-GPU协同才是关键。
国产AI芯片进入「路线图竞争」阶段 平头哥首次公开四代产品路线图(2024-2028),每代性能3倍提升,显存从96GB到144GB到216GB持续扩容。这不再是「追赶英伟达」的叙事,而是按照自己的节奏定义产品演进。56万片出货+400家客户,证明国产AI芯片已从实验室走向规模化商用。

💭 引发思考

当全球AI芯片市场预计2026年突破2800亿美元时,竞争焦点正从「谁的单卡更强」转向「谁的系统更完整」。平头哥的全栈布局——从芯片到互联到软件栈(T-Head SAIL)——展示了一种不同于英伟达的路径:不是靠CUDA生态锁定客户,而是靠端到端的系统能力提供确定性性能。

更值得关注的是,真武M890面向的是Agent时代的算力需求。当AI从「聊天机器人」进化为「任务执行者」,底层算力架构必须随之重构。平头哥把CPU、互联芯片、AI芯片打包成一个解决方案,本质上是在赌Agent会成为AI的主要形态。如果这个判断正确,提前布局系统级能力的玩家将获得巨大先发优势。

📎 相关阅读

  • 平头哥发布新AI芯片(4代路线图公布)— 腾讯新闻 https://new.qq.com/rain/a/20260520A0851P00

逍遥云初 | 2026.05.21