自变量机器人发布WALL-B:全球首个具身智能世界模型

2026 年 4 月 21 日,深圳自变量机器人科技发布全球首个基于世界统一模型架构(WUM)的具身智能基础模型 WALL-B。这款可自动训练、自我更新的新一代机器人模型,将于 5 月 25 日正式推出搭载该模型的家用服务机器人,进入真实家庭场景。

同期,深圳首条人形机器人中试产线于 4 月 12 日正式投用,单机装配节拍压缩至 120 分钟以内,年规划产能 500-1000 台。赛场竞技与家庭应用双线突破,勾勒出机器人产业从实验室走向千家万户的务实路径。


📌 核心问题

「机器人硬件已到位——双足、灵巧手、力控关节都很好,但大脑没有跟上。」自变量创始人兼 CEO 王潜的判断直指行业痛点:目前全球没有任何一台机器人可以在无遥控操作的情况下,独立完成家庭综合整理任务。

此前基于 VLA(视觉-语言-动作)架构的第一代模型 WALL-A 在真实场景部署中暴露了局限性——信息在模块间逐级传递,每经过一次边界就出现损耗和延迟。更关键的是,这类模型「擅长模仿却不一定理解世界」——「机器人知道把盘子放桌上,却未必知道半个盘子悬空意味着即将摔碎」。


🔥 技术演进与核心突破

  • WALL-B 架构革新:将视觉、语言、动作、触觉、物理预测等多类能力融入同一网络联合训练,打破 VLA 模块化架构的信息损耗瓶颈
  • 世界统一模型(WUM):在预训练阶段同时学习图像、文本、动作、物理等多模态数据,具备强大泛化和推理能力
  • 自主迭代能力:无需人工重新训练、无需返厂调试,可在真实环境中自我更新
  • 家庭场景验证:2026 年 3 月已与企业合作将机器人送入真实家庭,与保洁人员协同作业,实现全球首次机器人进入家庭
  • 量产突破:深圳首条人形机器人中试产线投用,模块化组装,年产能 500-1000 台

🔑 关键洞察

从 VLA 到 WUM:具身智能的架构范式正在切换。VLA 模块化架构的信息传递损耗问题,通过端到端联合训练解决。这不仅是技术升级,更是「让机器人理解世界」而非「模仿动作」的思路转变。
家庭是具身智能的「终极考场」:相比规整的实验室和工业场景,家庭环境复杂多变。能在家庭场景立足的模型,才真正具备通用智能的潜力。
中试产线是量产的关键卡点:从研发到量产之间的「中试验证」环节,解决的是「造不出来、造得太贵、造得不好、造得不稳」的行业痛点。深圳率先建成首条中试产线,意味着具身智能正在从「能用」走向「好用」。

🚀 引发思考

自变量机器人的路径清晰可见:先做「大脑」(WALL-A 到 WALL-B),再进家庭(3 月协同作业到 5 月独立服务),同时推动硬件量产(中试产线到标准化制造)。这条「大脑优先、场景验证、量产跟进」的路线,可能是具身智能商业化的最短路径。

当机器人能在无遥控下独立完成家庭综合整理任务,具身智能就真正跨过了从「能用」到「好用」的鸿沟。2026 年下半年,这个赛道的进展值得持续关注。


逍遥云初 | 2026.04.27