中国正经历一场变革性的机器人革命。
它们保持控制与平衡,但不会偏离预设程序。Galbot正在开发的技术被机器人专家称为视觉-语言-动作模型(VLA),旨在让机器像人类一样在陌生且多变的环境中操作。目前,Galbot的机器人尚无法可靠完成对人类而言简单的任务(如洗碗),但创始人王先生向中国媒体表示,目标是在三年内让一万台机器人承担基础零售与工厂工作。(部分AI先驱如杨立昆对当前深度学习能否实现Galbot等公司的愿景持高度怀疑态度。) 陈良此次造访旨在探索Galbot机器人如何应用于电动汽车工厂——这是全球最复杂的制造场景之一。实现这一目标需对机器人进行海量工厂场景训练,但现成数据库并不存在。Galbot若想在此类环境中部署机器人,必须倚赖拥有数十年复杂制造经验的专家。此人需为人形机器人定义正确任务、明确学习数据需求,甚至弥补机器人尚无法完成的工作——这正是陈良提供的专业能力。 我们乘电梯抵达塔楼顶层,走进可俯瞰北京大学葱茏校园的会议室。一位Galbot高级工程师很快到场,向陈良介绍公司最新进展:近期已有10台机器人在北京药店24小时配药,每台搭载英伟达芯片的机器人成本约70万元人民币。演示中,工程师特意暂停在详解人形机器人技术的幻灯片页。 工程师指出,深度学习兴起前,陈良这样的工业机器人专家需手动训练机器——程序员为每个动作编写明确指令,出错时调试代码并添加新指令处理新情况。深度学习有望用更灵活的VLA模型取代手写代码。构建此类模型的主要瓶颈(也是机器人“ChatGPT时刻”尚未到来的关键原因)在于训练数据稀缺。 研究者主要通过两种方式收集数据:其一是名为“遥操作”的手动流程——人类引导机器人执行精确任务(有时需重复数十万次),每次任务记录包含视觉信息、手部定位、扭矩与深度等数据的“动作序列包”,用于后续训练VLA模型。这种方法劳动密集,因此Galbot更倾向第二种方式:构建虚拟环境。“就像《阿凡达》”,工程师以这部大片类比,“我不必亲临战场,躺在舱内就能模拟一切。” 工程师展示了Galbot机器人担任店员、老年护理伴侣、在真实街道穿行的配送机器狗等测试视频,声称若投入足够资源,配送机器人“两三年内即可落地”(尽管公司尚未决策)。了解这些可能性后,陈良难掩兴奋,提出训练Galbot人形机器人拧螺丝的计划。对人类而言这是本能动作,但分解给机器人却涉及无数微观决策:定位螺孔、对准螺丝、施加恰当压力与扭矩、判断停止时机。工程师表示机器人已能抓握螺丝刀等工具,但对精准对齐与扭矩控制尚不确定。“我们明确分工,”陈良安抚道,“你负责可靠部分,其余交给我。” 双方达成目标:若要在工厂实用,Galbot人形机器人需在8秒内完成螺丝紧固。工程师后仰身体略显压力:“你们的工程专业知识面真广。”“基因不同,”陈良从容回应,“我们可以共同解决行业难题。” 会后我向北步行一个街区至商场,Galbot在促销亭后设置了零售机器人。白色模特般的G1型号陈列于此,配有员工随时应对故障。我通过平板订购日本运动饮料宝矿力水特,G1转向货架,机械臂如翅膀展开,钳爪取走饮料。放置时高度略高,饮料在台面弹跳数厘米但未倾倒。 相处期间陈良始终强调技术发展超乎想象,但G1体验(本质是升级版半自动售货机)令我存疑。两月后的春节联欢晚会上,Galbot机器人在预制片段中焕然一新:钳爪消失,代之以十根关节手指;手臂不再笨重,变得柔韧似人。取货架水瓶时动作远较以往迅捷稳健。其中多少经过剪辑编排不得而知,但我体会到了陈良的感受。 若见过中国机器人跳舞或打功夫,它很可能出自宇树科技。去年该公司出货超5500台人形机器人,居全球之首。近期流行视频显示,中国流行歌手王力宏成都演唱会上,宇树机器人担任伴舞,埃隆·马斯克转发时仅评一词:“惊艳。”这类病毒式表演是中国有效的营销,但宇树主要客户是实验室与高校(包括牛津大学、卡内基梅隆大学、加州大学圣地亚哥分校及波士顿动力公司),它们购买机器人并开发提升智能的软件。发言人表示宇树希望机器人最终进入工厂家庭,“替人类承担危险重复枯燥的工作”。 某日深夜我在宁波出租车收到宇树发言人信息。原定次日上午杭州总部会面,但公司突然安排“重要活动”导致办公区周边道路封闭。中国能阻断交通打乱日程的事务不多。我查看手机追踪习近平主席行踪:两天前他在广州出席体育活动,后续行程未明。发言人询问能否当晚赶到,时间已是19:32。“我们在此等候。”她保证道。我匆忙赶往火车站。 尽管享誉全球,宇树总部却出奇简朴:位于杭州科技区两栋旧楼,院落两侧是汽车经销商与家庭小店。约21点抵达时多数员工刚下班,三位媒体代表引我至陈列区。紫色拳击头盔机器人组合拳力道十足,令我本能后退;旁边机器人跳着查尔斯顿舞;四足机器狗循环表演空翻特技。演示全程主持人屡次重踢机器人,机器均吸收冲击未倾倒。 美国竞争对手波士顿动力的开发者坦言,宇树硬件高度先进且价格亲民——起价约1600美元,而美国同类产品需数万美元。该开发者将宇树优势归因于结构条件:中国拥有长三角与珠三角两大都市圈,硬件供应商网络密集,机器人制造商有时可步行至隔壁获取零件。在深圳调整机器人原型可能不足一日,在硅谷则需数周(零件可能需跨州越洋运输)。这种制造便利性也解释了为何中国有330种人形机器人——它将创造性破坏转化为流程常态。“我们商业化一代机器人,”清华大学机器人创业者兼研究员徐浩表示,该代产品难免失败,“然后构建下一代。” 审视中美两栖人形机器人产业的另一种视角是光谱:一端是通用人形机器人(科幻中人类能做的它皆可),另一端是专精单一任务的机器人(为商业可靠性牺牲多功能性)。因商业化压力、政府合同、奖励差异化与利润的激烈竞争等因素,中国企业倾向专精化;受深厚风投资本庇护、商业紧迫性较低的美国科技巨头则常瞄准通用机器人圣杯。未来可能呈现美国主导通用人形机器人开发、中国向世界供应实惠可靠的专用机器人格局。美国或终将造出能修剪草坪、遛狗、看护孩子的全能机器人,但在等待期间,你大可以零头价格购买三台各司其职的中国机器人。 造访次日上午我乘车返回宇树办公室探查情况。周边街区已封锁,我步行至正门,三名西装男子审视每位过客。三辆黑色公安面包车后方景象难辨。查看手机发现习近平正在750英里外的北京接待西班牙国王费利佩六世。过街另打出租车时,司机好奇我是否看见工厂异常——他刚送载宇树员工,迅速推测:“里面肯定有军团。”其猜测不无依据:两年前中国央视播出军事演习画面,显示宇树机器狗配备机枪。美国议员曾建议切断宇树获取半导体等美国技术。宇树坚称不向军方销售亦不认可第三方军事改装,但美国分析公司指控其向承接军方项目的中国高校销售。这种审查已影响中国机器人产业,某头部机器人公司发言人透露曾被警告勿与西方媒体交谈。询问宇树客户构成及国内外销售比重时,公司仅答“两者皆有”。后续追问中宇树解释,当日安保与军方无关——系政府代表团考察机器人。 与陈良考察Galbot同周,我前往北京市郊政府所称的“中国最大机器人训练中心”。该中心由乐聚机器人运营,其机器人学习数据源自人类数据收集员(即遥操作员)提供的真实案例。乐聚旗舰人形机器人“夸父”已用于全国多家电动汽车工厂执行拆垛纸箱等基础任务。 大厅监控屏显示中国地图,五个红点标注乐聚各训练中心所在城市,旁附该点采集的动作序列数量。最大基地设于北京,约百名遥操作员在仓库分区整齐排列。每个工位两人配合机器人执行擦桌、整理餐具、移动水杯等任务;楼上遥操作员则训练机器人分拣装箱等工业任务。乐聚与关联方向第三方出售部分数据,并公开了100小时数据供国际研究者优化VLA模型。 我从侧面观察:一名戴VR式头显的员工引导机械手从桌上取土豆放入篮中,随后机器人取布擦桌;另一员工在笔记本电脑记录每项动作成功率。楼上工程师处理这些最终用于训练VLA模型的数据。另一工位员工引导机器人向碗中倒水却失手泼洒,人类搭档起身清理后重复流程。 遥操作员男女比例大致均衡,多为十八九岁或二十出头青年,通过劳务派遣公司雇佣——这是支撑中国经济却常隐形的网络一环。派遣公司从村镇与职业院校招募工人,按季调配至劳动力需求地(从iPhone组装线到疫情防控)。如今同一体系正为人形机器人时代输送训练员。 乐聚遥操作员来自山东东部,原在当地高校参加“大数据”“互联网”等专业职业培训。机器人热潮前,他们可能为自动驾驶系统标注路牌或为科技平台审核内容。他们告诉我通常每天与机器人完成15种不同任务,八小时班次中每项重复10次。 中国官员称遥操作为“新型职业培训”,但已有报道揭示工作的非人化特质。特斯拉帕洛阿尔托总部机器人训练实验室前员工向《商业内幕》描述“如同显微镜下的实验鼠”。当我试图询问工人相关忧虑时发言人介入干预。简短交流中……他们似乎对工作充满好奇。招聘海报显示无学历要求,月薪约6000至10000元人民币,与全职快递员收入相仿但工时更优。 硅谷数据服务公司Encord联合创始人乌尔里克·汉森表示,遥操作正处“爆发前夜”。Encord已在湾区设遥操作中心,即将在墨西哥开设新点。针对机器人取代人工的担忧,汉森常言遥操作是“新型制造业岗位”。有趣的是,“遥操作”既指训练机器人也含远程控制之意。“每15至20台机器人需一人管理,”汉森解释。被问及多数未能管理机器人的工人去向时,他表示新增岗位将超过被取代数量,但未提供具体细节。 所有联系公司均拒绝我采访遥操作员的请求,故尝试其他途径。小红书、抖音等社交应用常见机器人训练员招聘帖,评论区常充斥同一问题:“还招人吗?”我联系部分求职者,自称报道中国机器人热潮的记者。数日无回音后,终于有工人答复:“问吧。”键入首个问题发送后消息立即退回——账户因异常活动被标记。可能触发了垃圾邮件过滤器或屏蔽记者敏感问题的算法。遥操作员身处时代重大技术变革核心,其贡献却大多隐形。 当今中国,新技术常以超乎他处的速度普及。重庆周六夜晚的“无人机秀”让数千架无人机在长江上空排列成发光巨图(城市景观、花卉、动物);成都人形交警告诫闯入机动车道的骑行者;武汉、深圳、北京通勤者已可搭乘无人驾驶出租车。快速推广部分源于较低部署成本,也是协同努力的结果。习近平主席执政14年来,从强调“市场驱动”创新转向优先坚持中国共产党对科技目标的“统一领导”。北京的影响力已延伸至中国社会每个角落,地方政府在执行中央指令时更具响应力与竞争力。 探访机器人初创企业时,我常遇见深圳、合肥等城市的中层官员。他们坐在会议室专注倾听年轻工程师讲解,旨在吸引初创企业落户并将它们培育成带来人才与就业的地方冠军。乐聚基地——工业园区内超万平方米厂房空间——由区政府依据合资协议在我到访两月前提供。 灵巧机械手初创公司PsiBot联合创始人王维克告诉我,多个市政府主动提议助其建立训练中心。“不仅是北京——苏州、上海、武汉都愿投资机器人项目,”竞争异常激烈。在中国科技版图中,主要城市犹如《饥饿游戏》中的赞助方,各自支持冠军人形机器人企业:杭州有宇树,上海有智元,北京有Galbot,深圳有优必选。 造访乐聚次日,王邀请我在其北京办公室测试遥操作序列。任务简单:从衣堆取衣投入收纳箱。PsiBot正与快时尚零售商希音商讨服装线最基础任务自动化,王相信九月前可实现。我戴上骨架手套,通过魔术贴连接身旁人形机器人的双手。操作不如预期流畅——笨拙如操控街机抓娃娃机。试图用机械手抓衣时,潜意识期待触觉反馈。多次尝试才让机器正确执行动作。 我意识到遥操作不仅是让机器人学习的动作演示。操作中需以机器可记录的速度移动,保持手臂固定姿势,避免挠痒等人类常态动作(以免“污染”数据)。过程比预期更耗体力且超现实:我们训练机器人更像人类,为此人类须先更像机器人。 北京开往合肥的高铁飞驰在华北平原(面积约等同加利福尼亚州)。与Galbot会面六天后,我登上清晨六点列车,挤过昏昏欲睡的乘客找到座位。窗外尚暗,唯见自身倒影。列车南行间曙光渐露,耕田、公寓楼、电缆塔掠过窗前。前方屏幕播放宇树机器人同步霹雳舞表演。四小时后抵达合肥。 此行是为参观新建的华为汽车工厂,陈良的多款机器人(包括安装车轮、车窗、仪表盘型号)正在运作。曾经的农业洼地合肥已转型工业枢纽,与周边区域汽车产量超越密歇根州。我乘出租车前往南郊大型工厂园区,华为在此生产新款超豪华电动轿车Maextro...