📌 新闻内容

2026 年 4 月 1 日,MIT Technology Review 发布深度报道,揭示了一个正在全球兴起的新兴产业:人形机器人训练数据的零工经济。美国公司 Micro1 在全球 50 多个国家雇佣了数千名合同工,让他们将 iPhone 绑在头上,录制自己叠衣服、洗碗、做饭等家务视频,用于训练人形机器人。

这些数据记录员主要来自尼日利亚、印度、阿根廷等发展中国家,时薪 15 美元(在尼日利亚属于高收入)。报道揭示了这个产业的运作模式、数据质量挑战以及隐私争议。

🔥 核心事实

  • Micro1 在 50+ 个国家雇佣数千名合同工录制家务视频
  • 时薪 $15(尼日利亚标准属于高收入),由 AI Agent「Zara」面试筛选
  • 2025 年人形机器人领域投资超过 60 亿美元
  • 机器人公司每年花费超过 1 亿美元购买真实世界数据
  • Scale AI、Encord 等公司也在招募数据记录员大军
  • DoorDash 向外卖骑手支付费用录制家务视频
  • 中国数十个国有机器人训练中心工人穿戴 VR 头盔和外骨骼训练机器人

🧠 技术背景

人形机器人训练面临的核心挑战是「物理世界数据」的稀缺。大语言模型通过互联网上的海量文本学会生成语言,研究者类比认为人形机器人可以通过海量动作数据学会与物理世界交互。但虚拟仿真虽然能训练机器人做杂技,却无法教会它抓取和移动物体——因为仿真无法完美建模物理世界。

因此,真实世界数据——即使收集成本高昂——可能是让机器人进入工厂和家庭的必经之路。

🔑 关键洞察

1. 数据标注的「物理化」转型

从 ImageNet 时代的图片标注,到 GPT 时代的文本标注,再到如今的物理动作标注——AI 训练数据的形态正在经历第三次范式转移。这次转移的特殊性在于:数据必须在真实物理环境中采集,无法通过爬虫或众包平台远程完成。

这催生了一个全新的「物理数据零工经济」——人们用自己的身体和家庭空间作为数据采集工具。

2. 隐私与知情同意的灰色地带

尽管 Micro1 要求工人不露脸、不透露个人信息,但视频仍然捕捉了工人家中的内部环境、物品和日常习惯。更关键的是:工人并不知道他们的数据将如何被使用、存储以及与第三方(包括购买数据的机器人公司)共享。

这是一个典型的「数据权利」问题:当你的身体动作成为训练数据,你对自己的「运动数据」拥有什么权利?

3. 数据多样性的瓶颈

工人普遍反映在狭小的家庭空间中创造多样化的「家务内容」是巨大挑战。一个尼日利亚医学生每天只能录熄衣服,一个印度导师花一小时才能做出 15 分钟的视频。

UC Berkeley 教授 Ken Goldberg 指出:「这需要的时间比人们想象的要长。」数据多样性可能是制约人形机器人泛化能力的关键瓶颈。

🚀 引发思考

人形机器人的「ImageNet 时刻」可能不是某个算法突破,而是大规模、多样化物理动作数据集的建立。当前的零工经济模式虽然解决了「有没有」的问题,但「好不好」和「够不够」仍然是开放问题。

另一个值得思考的角度:当发展中国家的工人用自己的身体动作训练发达国家的机器人,这是否构成了一种新的「数字殖民」?数据的价值链条中,底层劳动者的议价权几乎为零。

对于 AI 从业者而言,这篇报道提醒我们:在关注模型架构和训练算法的同时,数据供应链的伦理和效率同样是不可忽视的议题。


逍遥云初 | 2026.04.24