这几天跟朋友聊天,有人提到说最近在看机器人赛道,发现有点意思。
起因是这两天纽约时代广场的大屏上,出现了一个问题。大意是这样:谁会是第一个「有脑子」的机器人,真正走进家庭,服务人类生活?
这块屏幕本来是放广告的地方,都是各种大品牌。但这次没有Logo,没有产品图,就是一个问号。
一开始,大家都还在猜这个大屏是谁投的,Figure、1X、特斯拉,名字都被点名了。
最后谜底揭开,是一家来自深圳的公司,叫自变量机器人。
再过几天,也就是4月21号,他们要开一场发布会,主题是一个家庭成员的诞生,会发布新一代的具身智能模型。
如果我们把这件事跟他们之前的一些动作连起来看,发现背后有点东西可以聊。
1这两年,机器人行业很热闹。
打开任何一个科技博主的主页,几乎都能刷到人形机器人走路、搬东西、跳舞的片段,波士顿动力的机器人能后空翻,特斯拉的Optimus能叠衣服,Figure能跟人对话。
但有一个问题:这些机器人,到底什么时候能真的进你家?
波士顿动力的前CEO罗伯特·普莱特去年底接受采访时说,家用机器人还要5到10年。
他的理由是,现在的机器人主要只能完成一些相对简单的工厂任务。工厂的环境是被设计过的,光线固定,零件位置固定,任务顺序固定。
但家庭不一样,你的猫会突然从某个角落窜出来,你让机器人去倒杯水,厨房的杯子可能是玻璃的、塑料的、陶瓷的,每一个的抓握方式都不一样。
难度天差地别。
2顺着这个思路往下想,就会冒出一个新问题:如果大家都知道家庭难,为什么还有那么多公司往这个方向冲?
我跟几个做硬件的朋友聊,他们的看法挺一致的。现在国内外头部的人形机器人公司,特斯拉、Figure、1X、智元、宇树......
如果你把他们的硬件参数摆在一起看,会发现大家的身体做得其实已经差不多了。自由度、负重、续航、运动能力,这些参数之间的差距在快速收窄。
硬件这一关正在被快速拉平。
但还没解决的,是大脑。或者说,是一个能让机器人在没见过的环境里,面对没见过的任务,依然能判断下一步该做什么的模型。
行业里有个词,叫泛化能力,就是像人一样可以举一反三的能力。你教它在客厅擦桌子,它能不能自己在厨房擦灶台?你教它叠T恤,它能不能叠牛仔裤?
所以,那块纽约大屏上的问题,才会问住这么多人。
3但让我更好奇的,其实是另一件事。
光知道问题在哪,是没用的。大家都知道家庭难,都知道泛化是关键,那为什么自变量敢回应纽约时代广场的这个问题?
我花了点时间扒了一下这家公司,发现了几个细节。
第一个是对真实数据的执念。这家公司有一个大的策略,所有涉及到复杂物理交互(如接触丰富的手部操作)完全不使用仿真数据。
相比于仿真数据,真实数据在可扩展性、多样性、使用价值、质量等各方面都要更高,且采集效率相比仿真数据也要更高。
上个月他们还跟58到家合作,在深圳推出了机器人家政服务。3小时10.75美元,帮忙收拾孩子的玩具,甚至能铲猫砂,中国驻美大使谢锋还在社交平台转发过这条视频。
这件事单独看像是一次商业化尝试,但结合他们的技术路径看,其实是在做数据飞轮。真实的家庭环境本身就是最好的训练集,里面的脏、乱、不可预测,是实验室永远模拟不出来的。
第二个是他们CEO王潜说过的一句话,他说家庭代表最开放的环境和最广泛的任务,能把家庭任务解决了,就说明模型真正实现了泛化。
不是等技术完全成熟了再去找场景,而是用最难的场景,倒逼技术成熟。场景给迭代,迭代让模型更强,更强的模型再回到场景里。
4当然,家庭机器人这件事的难度,前面已经说过了,就算方向对,从方向对到真正做成,中间还有很多问题要解决。
4月21号那场发布会会给出什么答案,现在还没人知道。但我觉得值得关注的地方是,这是国内公司第一次,在机器人这个赛道上,主动把问题抛到全球面前,而不是跟在别人后面回答。
具身智能这件事,今年大概率会非常关键。硬件的红利已经吃得差不多了,接下来所有公司都要在大脑这一层正面交锋。
谁能先拿出一个真正能泛化的基础模型,谁就有可能在未来几年里定义这个行业的走向。
4月21号那场发布会,如果你也对这个行业好奇,可以留意一下。

