来源:杏彩注册 发布时间:2026-05-20 18:47:56
答:一个阿姨 + 一个工程师 + 一台重逾百公斤的盘式机器人,上门服务三小时。这个装备放在 58 到家的订单页上,一度让人置疑是不是体系 Bug,少了打了一个零?
托马斯白便是带着「这不或许不是坑」的心态下的单。5 月 10 日上午十点,门铃响了。门外站着三个人和一个机器人,货拉拉司机推着机器人,工程师背着工具包,阿姨系着围裙。
机器人背面挂着一台 4K 无线G 路由把画面同步到几公里外的长途操作员屏幕上,大部分动作都是长途遥操完结的。
机器人卡机了两次,工程师上前调试重启;剩余的时刻他的首要作业是站在机器人后边,盯着那颗赤色急停按钮。
三个小时里,它拎起倒地的书包、拉上拉链(夹了 3 次才成功)、把三个书包摞成一摞。叠了五六件衣服,每件耗时 5 到 10 分钟,叠完像揉过的报纸。茶几杂物归类丢进废物桶,餐桌杂物码成半桌,临走把门口的鞋摆齐。
阿姨则拾掇厨房、厕所、卧室。托马斯白说,那位「附赠」的阿姨脚踏实地,这次体会的下限被她拉得很高。
这 149 元的服务,来自自变量机器人与 58 到家本年 3 月在深圳上线的合作项目。
这家建立两年多的公司,在曩昔半年里把阿里、美团、字节跳动、小米四家互联网大公司罕见地拉到了同一张出资名单上,是国内仅有一同拿到这四家出资的具身智能公司。仅 2026 开年的 A++ 轮,就融了 10 亿元。
前段时刻,自变量发布了全球首个根据「国际一致模型」(World Unified Model,WUM)架构的具身根底模型 WALL-B。35 天后,搭载 WALL-B 的新一代机器人将第一批进入实在家庭。
自变量 CEO 王潜判别:「今天在整个国际范围内,没有一点一台机器人能在没有遥控操作的状况下,独立完结大部分日常家务。」
宇树科技创始人王兴兴也持相似观点:机器人在预设场景中成功率趋近 100%,一旦场景改变或呈现从未见过的事情,成功率断崖式跌落。他以为机器人做家务还需求 3 到 5 年。
也便是说,全职业的一致是——现在还不可。但悉数人还在拼命往前冲。这中心的逻辑,咱们从技能架构说起。
M1 之前,CPU、GPU、内存各自独立,数据转移发生推迟和损耗;苹果用一致内存架构让悉数处理单元同享同一块内存,功能因而跃迁。
VLA(视觉-言语-动作)架构就像 M1 之前的电脑:视觉模块、言语模块、动作模块各自为营,数据在模块之间搬来搬去,每搬一次就丢一次信息。视觉学到的丰厚信息,传到动作模块时只剩一个含糊的摘要。这是自变量曩昔一年在家庭布置中实地摸到的天花板。
WUM 则把视觉、言语、动作、触觉、物理猜想悉数放进同一个网络,从零开始联合练习。这样,机器人看到杯子的一同就在核算怎样抓;感受到分量的瞬间同步调整力度。
与此一同,模型内置了对重力、惯性、摩擦力的「国际观」——桌边有一个半悬空的盘子,即使从未见过,它也能揣度会掉,自动推回桌面。
而王昊在发布会上重复强调的另一件事是数据。「试验室里的数据是能用但低价值的『糖水数据』,实在家庭的数据则是难收集但高价值的『牛奶数据』。」
这句话解说了悉数:为什么自变量执意在保洁阿姨身边布置一台动作缓慢、长途遥操、还会卡机的机器人。
太平洋对岸的 Figure:10 万行 C++ 代码,被 1000 小时人类动作数据替换
最近,Figure 发布了一段视频。两台 Figure 03 人形机器人在编排后的两分钟内完结了一整套卧室复位动作:开门,挂衣服,把耳机放回架子,合上一本书,把废物扔进脚踏废物桶,把椅子推回桌下,合作铺好一张床。
其中被重复转发的镜头是机器人单腿支撑、用另一只脚去踩废物桶的踏板。这一个动作需求一同完结重心转移、脚踝精准操控和手部操作,是 loco-manipulation(移动操作)范畴的硬骨头。
Helix-02 选用「System 0/1/2」三层架构:System 2 慢速推理方针和使命序列,System 1 以 200Hz 的速度将感知转化为全身关节指令,System 0 担任底层根底操控。这种分层规划让机器人在转移易碎物品时能边走边保持稳定握持,甚至在双手被占用时,用臀部顶上抽屉、用脚抬起洗碗机的门。
Figure 把曩昔十万余行手写的 C++ 操控代码替换成了一个端到端的「omni-model」,从像素直接算出力矩。依照 Figure 官方的描绘,这是单一学习神经网络在多人形机器人协同动作操控上的初次展现。
两台机器人之间没有同享规划器,没有音讯通讯,没有中心和谐。它们各自带着摄像头,靠看对方的动作来揣度对方目的。有点像两个人一同叠被单时,经过手的移动猜想对方下一步的拉扯方向。
Figure CEO Brett Adcock 计划在 2026 年末把 Figure 03 送进「精选家庭」,方针价格 2 万美元以下,月租 600 美元。但他也供认,机器人在自己孩子邻近时,他仍是会「盯着」。
——做机器人的人自己都不敢彻底甩手。这大概是对「家庭场景有多难」最诚笃的注脚。
另一家值得留心的是挪威的 1X Technologies。其坐落加州海沃德的 NEO 工厂于 2026 年 4 月发动,约 5.4 万平方英尺,是美国首座全流程大规模制作人形机器人的工厂,获 OpenAI 本钱加持。NEO 定价 2 万美元,月租 499 美元,第一批 1 万台产能在五天内悉数售罄。
相比之下,波士顿动力按下了暂停键。Atlas 清晰聚集工业场景,CEO Robert Playter 猜想人形机器人要 5 到 10 年后才干实在走进家庭:「急着进军家庭商场或许是一个战略上的误区。」
一侧是五天售罄的疯狂,一侧是 5 到 10 年的镇定预判。不合之大,恰恰阐明谁都没把握,但谁都不敢不下场。
曩昔,机器人变强靠的是工程师写更好的代码。现在,靠的是吃进更多更好的数据。家庭场景不只是一个「使用商场」,而是一座数据矿。
a16z 的剖析指出,工厂里的使命是重复的、有鸿沟的,而家庭里充满了「never before seen」的状况。这种长尾,曩昔是 bug,现在变成了 feature。
货拉拉运送、工程师工时、阿姨本钱——账面上 149 元远低于本钱。但每一户托马斯白家的三小时,都是无法在试验室复现的实在长尾数据;服务的下限由阿姨兜底,所以即使机器人卡机两次、衣服叠得像揉过的报纸,使用者实在的体会也不至于。
用户以为本身买了保洁服务。实际上,他们在给机器人当教师。而 149 元,是膏火补助。
它会先蠢笨地走进一户深圳的客厅,叠欠好衣服,被工程师盯着,被阿姨兜底,被某个付了 149 元的用户半猎奇半挑剔地调查一下午。第二天,再来一户。