2026 年 6 月 21 日(当地时间),英伟达在官方博客上发文详解了即将量产的 Rubin 平台的「全面液冷技术」,定位「数据中心历史上最重要的能效突破之一」。
**一句话总结:Rubin 是全球首个实现 100% 液冷的 AI 计算平台——从 GPU、CPU、内存、电源到网络交换机,全部浸没或液冷直冷。**
**它解决的,是「AI 时代数据中心最大的物理瓶颈」——电力与散热。**
这不是一篇技术博客,是英伟达向所有云厂商、数据中心运营商发出的一份「转型动员令」:
**要跑 Rubin,先把整个数据中心的散热架构推倒重来。**
### 一、为什么「液冷」从「可选项」突然变成「必选项」
先把产业背景摆出来。
过去十年,AI 算力的演进路径是这样的:
• **Pascal(2016)→ Volta(2017)→ Ampere(2020)→ Hopper H100(2023)→ Blackwell B200(2024)→ Rubin(2026)**
每一代单卡功耗的轨迹是:300W → 700W → 400W(A100 优化)→ 700W(H100)→ 1000W(B200)→ **Rubin 平台超过 2000W**
**Rubin 不是一颗 GPU——它是一个完整的「AI 计算节点」,单节点功耗相当于过去一台中大型服务器的 10 倍。**
传统「风冷 + 机柜」架构的散热极限是 40-50kW/机柜;Rubin 单机柜功耗轻松突破 120kW。
**风冷到极限了。液冷是唯一的物理出路。**
### 二、Rubin 的「100% 液冷」具体怎么实现
Rubin 平台的全面液冷不是一个「噱头概念」——它是覆盖整个数据中心的系统级改造:
**1. GPU / CPU:冷板式液冷直贴芯片**
过去 Hopper / Blackwell 是「GPU 冷板 + CPU 风冷」的混合架构。
Rubin 直接把所有高功耗芯片(GPU、CPU、NIC、Switch ASIC)都贴上冷板,用冷却液直接带走热量。
**2. 内存与电源:浸没式液冷**
HBM3e 内存(单颗 8-12 层堆叠)、DC-DC 电源模块等发热量不亚于主芯片的部件,全部浸没在不导电冷却液里。
**3. 网络交换机:液冷硅光子(CPO)**
Rubin 平台标配 NVIDIA Quantum-X/Spectrum-X 800G/1.6T 硅光交换机——这些光模块本身发热严重,必须液冷直贴。
**4. 机柜级冷量分配:CDU(冷却液分配单元)**
整个机柜不再用「冷热风道」,而是冷却液回路直接进机柜,外部 CDU 集中换热。
### 三、关键数据:能效与 PUE 的「断层级改善」
英伟达官方给出的数据非常硬核:
**1. 数据中心整体 PUE 接近 1.0**
PUE(Power Usage Effectiveness,电能利用效率)= 数据中心总能耗 / IT 设备能耗
• 传统风冷数据中心 PUE:1.4-1.6(40-60% 的电都浪费在散热上)
• Hopper 时代部分液冷数据中心 PUE:1.15-1.25
• **Rubin 全面液冷数据中心 PUE:逼近 1.0**
这意味着——**几乎所有电都被算力「干活」用了,散热浪费逼近零。**
**2. 单机柜功率密度突破 250kW**
风冷机柜的物理极限是 40-50kW;
液冷机柜过去一般做到 80-120kW;
**Rubin 全面液冷单机柜可以稳定跑到 250kW+**——同样的机房面积,5 倍算力。
**3. 用水量降低 90%+**
风冷 + 蒸发式空调的数据中心是「用水大户」,干旱地区建数据中心几乎不可能;
Rubin 液冷的冷却液是封闭式循环,水耗降低 90% 以上。
**4. 噪音降低 40dB+**
没有风扇意味着没有「轰鸣声」——这对周边社区、数据中心员工都是直接利好。
### 四、对云厂商和数据中心行业的「强制转型」
**1. AWS / Azure / GCP / 阿里云:必须在 Rubin 量产前完成液冷改造**
英伟达在博文中明确表态:**所有为 Rubin 建设系统的云服务商和数据中心运营商都在推动液冷转型。**
这意味着:到 2026 年底之前,主流云厂商必须完成至少一批 Rubin-ready 液冷数据中心,否则将失去 AI 算力市场的「入场券」。
**2. 液冷产业链:CDU / 冷却液 / 快接头厂商集体受益**
液冷不是英伟达一家能做的——需要:
• **CDU 厂商**:维谛技术(Vertiv)、台达、华为数字能源
• **冷却液厂商**:3M、陶氏、Shell、英力科技
• **冷板 / 快接头 / 管路**:CoolIT、Asetek、中航光电
整个液冷产业链将进入「Rubin 量产驱动」的「超级周期」。
**3. 国产液冷方案商的「窗口期」**
华为数字能源、曙光数创、绿色云图、英维克等中国厂商,过去 2 年已经完成液冷技术储备。
Rubin 量产是中国液冷厂商「打进海外云厂商供应链」的最佳窗口。
### 五、与电力的「正反馈循环」
**更深一层的意义,是 AI 与电力的关系正在被改写。**
国际能源署(IEA)预测:到 2030 年,全球数据中心电力消耗将占全社会用电的 **8-13%**。
如果不解决散热问题:
• 单个 AI 数据中心园区耗电将相当于一个中等城市
• 电网扩容速度跟不上 AI 算力建设速度
• 大量新建数据中心将被「缺电」卡住
**Rubin 全面液冷把 PUE 做到 1.0,本质上是把「AI 算力建设的电力瓶颈」松绑了一半。**
另一半松绑,要靠核能、SMR 小型模块化反应堆、光储直柔——这是另一个故事。
### 六、不应被高估的部分
冷静下来也得指出:
**1. 100% 液冷的「改造周期」是 18-24 个月**
一个传统风冷数据中心改造成 Rubin-ready 液冷数据中心,工程量极大:冷却液回路、CDU、机房承重、备电系统全部要重来。
**2. 冷却液泄漏是「运维噩梦」**
液冷的可靠性问题——冷却液泄漏一旦发生,整柜设备可能瞬间报废。云厂商的「运维 SLA」将面临新挑战。
**3. 国产芯片厂商短期「搭不上车」**
Rubin 全面液冷的整套生态(CDU + 冷却液 + 主板设计)是英伟达主导的;国产 AI 芯片(昇腾、寒武纪、算苗)短期内还得自己摸索液冷方案。
### 七、值得跟踪的后续
1. **Rubin 平台正式量产时间**——预计 2026 Q4 首批交付,2027 上半年规模放量
2. **AWS / Azure / 阿里云的「Rubin-ready 数据中心」规划公布**——预计 7-8 月有官方消息
3. **国内液冷厂商出海订单**——维谛、华为数字能源、曙光数创能否拿下海外云厂商大单
4. **国产 AI 芯片的液冷方案**——昇腾 910C / 寒武纪 MLU / 算苗 3D TokenPU 的散热策略
5. **「AI + 电力」白皮书**——国家发改委 / 国家能源局预计下半年会出配套政策
来源:
• 英伟达官方博客 2026 年 6 月 21 日《Rubin: Full Liquid Cooling for the AI Factory Era》
• 财联社 2026 年 6 月 22 日《英伟达最新发文 详解 Rubin 全面液冷技术》
• IEA《Electricity 2026》报告关于 AI 数据中心电力消耗预测
### 相关阅读
• 2026-06-18:算苗科技 3D TokenPU 流片 —— 国产算力低 TCO 路径
• 2026-06-15:AI 公司进入「物理资产」军备竞赛阶段
• 2026-06-21:阿里 Qwen 团队 Parallel Speculative Decoding 推理快 2 倍






