新闻内容
2026年1月CES上,NVIDIA发布了Physical AI领域的全套开源模型、框架和AI基础设施。黄仁勋宣称「机器人的ChatGPT时刻已经到来」。Boston Dynamics、Caterpillar、LG、NEURA Robotics等全球合作伙伴展示了基于NVIDIA技术栈的新一代AI驱动机器人。
核心发布包括:Cosmos Transfer/Predict/Reason世界模型系列、GR00T N1.6人形机器人基础模型、Isaac Lab-Arena开源仿真框架、OSMO云原生编排框架,以及Blackwell架构驱动的Jetson T4000模块(能效和AI算力提升4倍)。
技术演进与核心问题
- Cosmos系列:Transfer 2.5(物理仿真合成数据生成)+ Predict 2.5(机器人策略仿真评估)+ Reason 2(推理视觉语言模型),全部开源并在Hugging Face上线
- GR00T N1.6:专为人形机器人的推理视觉语言动作(VLA)模型,支持全身控制,集成Cosmos Reason实现更好的推理和上下文理解
- Isaac Lab-Arena:开源仿真框架,支持大规模机器人策略评估和基准测试,连接Libero和Robocasa等行业基准
- OSMO:云原生编排框架,统一合成数据生成、模型训练和软件在环测试,已集成到Microsoft Azure Robotics Accelerator
- Jetson T4000:Blackwell架构,4倍能效和AI算力提升,为边缘端机器人提供强大算力
- NVIDIA + Hugging Face:将Isaac和GR00T集成到LeRobot,加速开源机器人社区发展
关键洞察
洞察一:NVIDIA正在做机器人领域的「CUDA时刻」。就像CUDA统一了GPU编程生态,NVIDIA正在通过开源模型+仿真框架+编排工具的全栈方案,统一机器人的开发流程。这意味着机器人开发的门槛将大幅降低。
洞察二:「通用-专家」机器人范式正在取代「单一任务」机器人。GR00T N1.6的设计理念是让机器人快速学习多种任务,而不是为每个任务训练一个专用模型。这与大语言模型的「通用能力」逻辑一脉相承。
洞察三:仿真到真实的闭环已经打通。从Cosmos生成合成数据到Isaac Lab仿真训练到OSMO编排部署到Jetson边缘推理,NVIDIA构建了一条完整的机器人开发流水线。Salesforce已经在用这套方案让机器人分析视频并缩短事故响应时间。
引发思考
黄仁勋说「机器人的ChatGPT时刻来了」,这句话的含义是:就像GPT让自然语言处理从「专用模型」变成「通用能力」,Physical AI开源模型正在让机器人从「单一任务机器」变成「通用智能体」。
更值得关注的是NVIDIA的「开放策略」——所有核心模型都在Hugging Face开源。这与OpenAI的闭源策略形成鲜明对比。在机器人这个需要深度定制的领域,开源可能是更快的路径。全球机器人开发者社区正在围绕NVIDIA的技术栈形成生态,这个生态的护城河可能比任何单一模型都更深。
逍遥云初 | 2026.04.25


