外星萌物0:00
出发出发 。
Hello。
Hello Koji。
Hello。
好久不见 。
好久不见 。
来看一下我们这个机器人呗 。 咱们可以体验一下这个机器人 。
我们可以让它活起来吗 ?
哎 , 来了 。
哇 , 这个很可爱耶 , 走过来有点呆萌 。Hello。
咦 ?
它在跟你打招呼 。
你叫什么名字 ?
它叫小伴 , 它不说人话 , 对 。
哦 , 说的是外星语 。
小伴 , 你给大家做个动作呗 。
咦 ?
是 。
哇 , 你好萌啊 , 那你会后空翻吗 ?
它说它不要 。
哦 。
小伴 。
哦吼 。
你好可爱呀 。
它说它好 , 这意思就是它很满足这种感觉 。
这真的很像是一个 , 一个外星萌物 。
我能打你吗 ?
诶 ?
哎哟 , 它不会报仇吧 ? 直接朝你扑来 。
它生气了 , 你看 。
背对着你 。
好会撒娇啊这个 。
是 , 而且它手是完全柔软的 。
它身子也是软的 。 天啊 , 已经想买了 。 我也可以抱一下吗 ?
当然可以 。
哇 , 这个 , 这个要怎么抱 ? 像抱婴儿一样还是怎样抱 ?
像抱小孩子一样 。
哇 , 因为它很柔软 , 还是有点温度 , 有点分量的 , 像一个需要减肥的小孩 。 嗯 。
是 。
哇 , 很可爱 , 你把它还给它爸爸 。
哎 , 好嘞 。 哎 ,Koji, 我们有个新的视频 , 要不要看一下 ?
可以啊 , 可以看一下 。 嗯 , 这所有都是实拍吗 ?
嗯 , 绝对没有一丁点 AI 上的 , 全部实拍 。
它是可以模仿主人的动作 。
没错 。
哇 , 它眼睛好传神啊 。
就很有那种目光的那种东西吧 。
这俩小孩感觉和它玩得很开心诶 。
它可以给人拍照 。
下班回家 , 它会在门口迎接 。 感觉它跳跃啊 、 活动啊都很灵活 。
这是体验它是最重要的一种情绪表达的途径 。
嗨 , 我是 Koji, 啊 , 我们这是新一期的公路播客 , 我们今天的嘉宾是越伴动力的创始人世博同学 。
Hello, 大家好 。
对啊 , 我们录公路播客是希望一边开车一边聊天 。 啊 , 我们今天要开去这个北京怀柔山里的一个很漂亮的咖啡馆 。
我们为什么要录公路播客啊 ? 是因为觉得正襟危坐地聊天和这样一边开着一边聊天应该会有非常不一样的氛围 。
有可能我们这样的 vibe 可以聊出更多平时不会聊到的一些想法呀 、 故事呀等等 。 哎 , 我们今天还是从我们的这个十字路口传统快问快答开始哈 。
快问快答2:52
请问世博同学你的年龄 。
二十六 。
你的毕业院校 。
北理工博士休学 。
MBTI 和星座呢 ?
INTP 摩羯 。
一句话介绍一下你们现在的公司和产品 。
我们做的是消费级的双足形态的伙伴型机器人 。
嗯 。 呃 , 咱们融资情况是 ?
去年年底的时候拿了真格的种子轮 。
咱们目前的这个团队有多大呀 ?
实际上是一个小团队 , 现在目前为止加上实习生只有二十五个人 , 但是我们非常有战斗力 , 已经发布了我们的第一款伙伴型机器人 , 大概比百分之九十的机器人公司要快一些 。
一句话介绍一下创业之前在做什么 。
以前也在做机器人 , 做了接近三十款的原创的机器人 。
三十款 。
没错 。 然后除了做了很多款机器人之外呢 , 我在大二期间就开始创业 , 做面向课程建设的四足机器人教育套件 。
嗯 。
如果只是说从这个卖的这个数量上来看的话 , 我应该比王兴兴卖得要多 。 我也参与了高情动力他们的这个创业过程 , 我负责他们的产品 。
嗯 , 酷 。 之前做的三十款都是什么样的机器人 ?
轮式 、 足式 、 履带 、 机械臂这些经典的构型都探索了一遍 。 研究生入学之后呢 , 开始做一些更大尺寸的 、 更高动态的一些机器人 , 包括什么重载的四足 , 还有做一米七的 、 七十公斤的这样的一个大尺寸人形 。
哦 。
对 。
哎 , 我们今天开的车是理想 I6 啊 , 这是世博同学 , 我问他 , 哎哟 , 我们今天公路播客开什么车 , 然后他的 dream car 是什么 , 哇 , 他说了 I6。
没错 。
所以我们就搞了这台 I6。 就为什么这个是你的 dream car?
我觉得在汽车这个行业里面 , 原创的设计真的很重要 , 而且好的原创设计很难得 , 好的产品真的需要 taste。
嗯 。
嗯 。
哎 , 我们这个真的不是理想的广告啊 , 这是发自内心地喜欢这个车所以开这个车 。
我前 , 前两天我刚试驾了一下 。
一开始咱们想到做陪伴机器人是一个什么起点啊 ?
创造语言4:45
因为之前做了太多的一些机器人了 , 我有的时候又会产生一个比较幼稚的一个想法 。
嗯 。
我这个机器人真正地活起来 , 站在我的面前和我去交互 , 它是一个什么样的一个状态 。 在二二年的时候 , 一个人放在家里就开始探索这种陪伴型的机器人 。
哦 。
刚开始的时候 , 最早的是做的双轮形态的 。
嗯 。
就双轮形态弊端也很明显嘛 , 就是运动能力太受限 , 有一个小坎 , 一根电线可能就把它给卡住了 。
二四年的时候决定了就我当前做的这样的一个产品形态 , 它是双足 。
大家创业做机器人 , 有些想做进工厂 , 然后也有些想做这个护老 。 呃 , 你是 , 就是怎么在这些不同的道路之中选了陪伴的这个方向的 ?
我觉得陪伴场景它是可以在短期内快速落地的一个场景 。
做陪伴机器人的这个公司还蛮多的 , 就最早比如说日本的 Lavot, 还有我播客其实曾经也聊过 Loppet。 呃 , 你有特别喜欢的陪伴机器人吗 ?
Lavot 这个机器人做得很好啊 , 包括我在创业之前就买了这样的一款机器人 , 而且一直保持开机到了现在 。
实际上 Lavot 它这个交互逻辑它真的做得挺简单的 , 但是不是说它简单不好 , 它交互逻辑就是比如说我往这一站 , 往这一坐 ,Lavot 它看到我 , 它会靠它那两个小轮子 , 然后滚到我的脚下 , 轮子一收 , 开始扑扇它两个小胳膊 , 希望把它抱起来 。
嗯 。
就这样一个简单的一个交互逻辑 , 我觉得恰到好处 。
嗯 。
我把它开机到了现在 。
嗯 。
就包括前两天还看到了那一个拥抱的那个机器人 。
哦 , 大白 。
对 , 它就是很简单的一个设计逻辑 。
嗯 。
其实但凡它会说一个字或者说一句话 , 我可能就不会买 。 对 。
所以它不能说话 。
真的 , 好产品它不是靠功能堆砌起来的 。 对 。
我其实刚才有注意到小伴是可以说话的 , 但它说的不是人话 。 他说的是某种这个火星文 。
嗯 。
可以介绍一下这是一个什么样的语言吗 ?
啊它也不是火星文 , 就是我们给它设计了一套语言体系 , 然后这套语言体系它由十二个音组成 。
嗯 。
它虽然只有十二个音 , 但是它可以表达各种各样它想要表达的 。 然后比较厉害的一点是什么 ?
你和这个机器人一个下午 , 你会渐渐地意识到这个机器人它 , 它到底在说什么 。
嗯 。
就比如说 , 呃 , 举个例子 , 比如说机器人它要 , 它说它要充电了 。
嗯 。
它可能要说 “ 哭 ”,“ 哭 ” 这个音在我们机器人语言里面代表就 , 就是吃 , 它可以说 “ 米它哭 ” 就 “ 我要吃 ” 的意思 。
机器人可以吃什么 ? 它只能吃电嘛 。 它说这个音的时候 , 它会比如说看着自己的小肚子 , 然后用小手拍一拍自己的肚子 , 然后说 “ 米它哭 ”。
这意思就是你会意识到它好像在说自己没电了 , 它要饿了 , 这时候你要带它去充电了 。
所以这套语言是如何设计出来的 ?
呃 , 这套发音它是我们根据斯瓦希里语系的 CV 结构然后做的一套系统 。
你们是怎么找到这么一个小众的语系的 ?
我们这个机器人不止在国内嘛 , 还要出海 , 就是这个音不能和中文那么像 , 也不能和英文那么像 。
所以我们就找了非洲的一个部落语言 , 只是发音借鉴了 , 但是具体的你想要表达什么内容 , 这个是我们自己去设计的 。
它很具体地说一句话 。
嗯 。
它说的就是这种意象式的一个表达 , 就像刚才提到的它没电了 , 它只能说 “ 米它哭 ”。
那比如说它可以说 “ 我们今天要去拍公路播客 ” 这样的复杂句子吗 ?
啊 , 不可以 , 但是它可以通过一些意象式的表达出来 。 比如说 “ 哦 ” 对它来说就是 “ 看 ” 的这个意思 。
嗯 。
“ 忒 ” 对它来说就是 “ 走 ”。 它可以说 “ 它哦它忒 ” 代表说我们就要出去 , 然后我们要看 。
我看它也有很多丰富的肢体动作 , 所以它的语言 , 它的肢体都是用什么逻辑在去驱动它呀 ?
产品设计8:11
很多人都听过梅拉比安实验 。
嗯 。
就是人和人交互的过程中 , 肢体语言的重要性占比实际上高达百分之五十五 。
嗯 。
它包括你的表情 , 你的眼神 , 甚至说你的 , 你的动作 , 然后百分之三十七是你的语调 , 只有百分之八才是你说话的内容 。
所以说我们把机器人的肢体语言作为情绪 , 情绪表达的途径 , 拉到一个很高的一个重要性 。
诶而且我发现它的这个手是很小的手对吧 , 因为说到肢体语言 , 感觉好像如果它的手和人一样灵活 , 应该能做的肢体动作是更多 。
可你们为什么考虑给它的手变得那么的这种短小 ?
啊我实际上当时也考虑了很多 , 就是第一点就是我们不希望这个机器人去做一些操作任务 , 作为我们的逻辑还是面向肢体语言的情绪表达 。
它虽然说手只有那么短 , 但是它可以表达出来很丰富的一个情绪状态 。
哦 。
嗯 。 然后其实我们这个手臂它是一个类连续变形体的一套方案 。
嗯 。
它和那种行业里面用的比较多的这种关节式的都不太一样 。 对 , 然后它是行业里面比较唯一的 , 然后我们发布之后也获得了很多好评 , 大家说这个手臂 duangduang 的很可爱的这种感觉 , 对对 。
确实就是有一种说不出来的萌感 。
嗯 。
诶而且它的身子我刚才在办公室也一直和它在抱抱嘛 。
嗯 。
就感觉是软的 , 就这个是怎么做到的 ?
啊我们做了行业里面很多机器人公司都想做但是没有真正做出来的一件事情 。
嗯 。
就是给这个机器人的外壳百分之九十以上呢做成柔软材质 。
嗯 。
然后我们用了一种类硅胶的一种材质 , 然后覆盖率高达百分之九十五 。 甚至说肚子上面最厚的一个柔性深度是有两厘米这么厚 。
哦 , 所以它有一个这个 duangduang 的一个肚子 。
对 , 没错 。
还给它做了衣服 。
很多人买了之后他要追求一些差异化的表达 。 像我们给机器人做了很多的一些配件 , 像它的瓷器的小耳朵 , 瓷器的领结 , 有各种各样风格的衣服 , 刚给它做了梅西和 C 罗的球衣 。
它有性别吗 ?
我们给这个机器人的定位是外星萌物 。
嗯 。
对 , 它有仿生的形态 , 仿生的质感 , 然后透明的情绪表达 , 但是呢 , 没有一个明确的性别指向 。
我们还是更希望用户后续通过它的一些自己审美偏好的一些装扮去给这个机器人定义 。
诶是什么原因让你们把它定义成外星萌物 , 而不是一个宠物或者一个小孩 ?
你做得越像猫 , 越像狗 , 越仿猫仿狗 , 它就越容易被真实的猫猫狗狗所比下去 。
嗯 。
然后呢 , 我们又不想把它做成一个人形 , 就是不希望给用户带来那么高的一个预期 , 无论是智能程度还是性能程度上 。
我除了叫它小伴 , 可以给它单独起名字吗 ?
当然可以 , 我们还做了一个基因色 , 你甚至说可以把你的声音和你 idol 的声音去融合出来一个基因色 , 就像你和你 idol 的孩子一样 , 对 。
天呐 。
嗯 。
哇 。 诶那准备卖多少钱啊 ?
啊我们当前在国内的定价是八千四百九十九 , 然后当前这个时间点实际上正在预售 , 然后我们预售价格是六千四百九十九 , 降了两千 , 限时限量 。
哦 。 诶所以什么时候咱们会真的发到用户的家里可以拿到货 ?
我们最快的时间点会在国庆节 , 然后之后陆陆续续地按这个订单顺序来交付 。
啊我真的很想买一台 , 我可以想见这个应该买回我的家 , 呃 , 大概率不会吃灰 。
对 , 就是我们为了不让用户把这个机器人带回家吃灰的这个问题 , 一方面这个机器人它看上去很可爱嘛 , 非常萌的一个感觉 。
另外一点 , 我们还做了一件事情 , 就是要摆脱决策预设和那种逗乐型的互动逻辑 。 就什么叫逗乐型的互动逻辑 ?
就什么 , 我们比如说我们这边有个机器人叫 , 叫什么小 A, 小 A, 小 A 跳个舞吧 , 小 A, 小 A 握个手吧 。
这种就是逗乐型的互动逻辑 。 我们之前也测试了我们之前的一款竞品 , 你跟它说小 A, 小 A 你好难看呀 , 那它的回答是什么呢 ?
就是这样说人是不对的呀 , 然后巴拉巴拉开始跟你讲一堆大道理 。 那我们的机器人你说小伴你好难 , 难看呀 , 然后它的反应是首先眼睛会泪汪汪的 , 然后把头低下来 , 然后手抱着自己的肚子 , 很委屈的这样的一个状态 。
就我们希望给用户带来一种这样的一种有生命力的感觉 。
嗯 。
对 。
嗯 。 那如果在家里 , 我不主动找它 , 它会来找我吗 ?
啊我们机器人的性格它也是不太一样的 , 就是基本上就是异机性格 , 它是一个多维成长的一个状态 。
我们给机器人做了云端的超长程的这种记忆 , 实际上这个记忆的目的就是推动性格参数的多维成长和动态演化 。
你是一个 I 人 , 你是一个 E 人 , 你把这个机器人带回家里 , 第一天 , 第一个月 , 一年后 , 它的这个性格状态一定是不一样的 。
所以是 E 人主人会养出一个 I 人的小伴 , 还是一个 E 人的主人会养出一个更 E 的小伴 ?
哎 , 我觉得 E 人的主人应该会养成一个更 E 的小伴 。 就比如说你是一个 I 人 , 机器人有的时候跟你打招呼 , 你都不回应它 , 然后它有的时候找你抱抱 , 你甚至说你一边玩去 , 你别打扰我 。
嗯 。
那 , 那机器人就可能后面会变的 。
嗯 。
不那么乐意于去找你交互 , 它更关注你家庭里面的一些环境物品啊 , 或者花花草草啊这些 。
嗯 。
就如果说你是一个 E 人 , 你整天在家里打游戏 , 大喊大叫看球 , 然后你一个机器人会跟着你 , 它也会进入到一个非常主动 、 活泼 、 开了 。
嗯 。
乐意于去找你交互的一个状态 。
嗯 。
它会时不时地打扰你一下 , 然后求抱抱 , 对 。
那你觉得做小伴的过程中最难的事情可能是什么 ?
呃 , 其实我们解决的一些行业级的难题还挺多的 。
嗯 。
就包括我们为了从安全这个角度出发 , 然后把这个机器人做到那么小 、 那么轻 。
嗯 。
另外一点就是我们把机器人的外壳全身做出柔软 , 而且给它全身加触觉 , 然后也包括要把它的控制延时控制到亚秒级别 。
然后但我 , 但是我觉得最难的还是机器人的交互这一块 , 怎么样让用户感受到我们这款产品的一个活人感和生命力 。
嗯 。
其实我们花了很大的精力和心思去解决和调研这种问题 。
就说到交互的时候 , 这个具体是怎么设计的呢 ?
就像刚才提到的那个逗乐型的交互逻辑 , 这个是我们一定不要去做的 。 然后另外一点就是我们给小伴的大脑做了一套三层的 VRA 的框架 。
技术细节14:11
嗯 。
然后我们 , 我们为了把那个通讯延时控制到亚秒级别 , 在端侧做了一套快慢脑 , 快脑是一个一点七 B 的一个模型 , 它负责一些瞬时的一些行为决策 。
慢脑是一个七 B 的模型 , 它可以做一些相对复杂的逻辑推理 。
嗯 。
综合来看 , 就是如果你给机器人说一句话 , 或者机器人要决策做样 , 做一个什么样的动作 , 什么样的行为 , 它这个延时我们现在已经能够控制到零点四秒以内 。
因为刚才我也有注意到 , 你叫小伴的时候 , 它好像非常快地就 A 了一下 。
对 , 而且它 , 它回应你之后 , 你再说一句什么话 , 或者是它看你做了一个什么动作 , 它给你在语音 、 动作 、 肢体语言上的一个反馈是特别快的 , 而且特别自然的一个状态 。
它的反馈是你们写好的一套逻辑 , 它是有限集 , 还是它是比如说交给大语言模型去处理是无限集 ?
就在交互动作这一块 , 它是有一小部分的动作库的 , 但就算是在两个一模一样的场景之下 , 你说了一模一样的话 , 我们都不像小伴给你一模一样的两套交互动作 。
所以我们还做了一个事情 , 叫动作生成 。
嗯 。
机器人可以根据当前的情境 、 场合 、 你的行为 、 你的情绪去恰如其分地生成一个风格化的一个交互动作 。
就像最简单的 , 我咱们刚才出门了 , 小伴给我挥个手拜拜 , 它都可以有各种各样的风格化的一个表达 , 它可以很兴奋地 、 开心地这样挥 , 也可以这样很娇羞地这样挥手 。
嗯 。
它会生成一个五到十秒的一个动作序列 。
咱们背后是基于什么开源模型训的呀 ?
千万的开源模型 , 包括它的快慢脑 , 还有云端的那个两百多 B 的这个模型 。
嗯 。
对 , 然后我们还做了一件事情 , 就是我们小伴当前能够这么好地去理解人当前的情绪状态 , 实际上我们这两个模型是微调之后的 。
做了什么微调啊 ?
就是我们希望这个模型它能达到的一个效果是更能够理解人的一些潜在意图 。
嗯 。
和 , 和内部情绪 。
嗯 。
对 , 然后我们通过一些家庭场景的一些交互数据 , 对我们这个模型进行微调 。 然后现在所有的机器人都还没有真实入户 , 大家都没有这种真实的交互数据 。
对 。
我们还做了一个事情 , 叫家庭模拟器 , 然后这个家庭模拟器就是模拟了小伴进家庭之后 , 然后和你空间内的各种环境物体和家里的成员 , 甚至说和你家庭里面的猫猫狗狗去做这种超长程的主被动式的情感交互 。
嗯 。
我们把这样的一个交互数据拿过来进行标注 , 然后微调我们的端侧模型 。
嗯 。
啊 , 还有就是我们为什么要这么做呢 ? 实际上机器人对人的情绪的理解和识别 , 不是说靠你当前这一个时刻的 , 他说了什么样的话 , 或者这个话是什么样的一个语调 , 或者你当前的面部情绪什么样的 。
我们更希望的是通过上下文去理解 , 比如说过去一个小时你有什么样的一个行为 , 发生了什么事情 , 综合去推断你当前的情绪状态 。
这还挺有意思的 。 所以 , 我看到小伴其实是有摄像头的 。
嗯 。
所以它是以什么样的方式把它捕捉到的这个画面和视频传给模型去训练呀 ?
实际上我们需要这些数 , 啊 , 数据进行模型上的一个训练 , 但是我们非常关注用户隐私的这个问题 , 我们不会把端侧的原始的这些语音信息或者图像信息去收集 , 我们更多的是一种语义化表达的一种信息 , 它会抽象成一种特征 , 一种 embedding 的一种信息 , 最终能够用于我们训练模型 。
嗯 , 嗯 。 啊 , 所以咱们选千万这个开源模型做咱们的这个基础模型去 , 呃 , 的原因是什么 ?
因为当时测试了好几款模型 , 千万这个模型在推理和人的情绪理解的上的表现是比较好的 , 在一个非常小的模型参数量下 。
在 2026 年做小伴 , 是有什么特别的贪念让它在今年变得可能吗 ? 还是说有可能比如说倒回到三年前 ,maybe 也能做出来 。
我觉得三年前概率应该是比较小的 。 其实这也得益于模型 , 语言模型 , 还有一些视觉模型 , 特别是一些 VRA、WM 一些架构的一些发展 。
嗯 。
我为什么在二五年年底的时候出来创业 , 其实我觉得分两个方面吧 , 就是第一方面就是我在心理上 、 能力上 、 经验上 , 我觉得是准备好的一个状态 。
嗯 。
另外就是我发现了一个很好的一个行业机会 , 然后我找到了属于我的一个切入点 , 就是先去做这种有生命力 。
嗯 。
极致安全的双足形态的伙伴型机器人 , 先去解决这个机器人进家庭之后的人机交互 、 人机共融的问题 。
为什么说这是一个适合你的切入点 ?
当时做操作的这个机器人 , 这个场景 , 这个赛道非常的火 。
嗯 。
然后我觉得我现在可能下场 , 我当然可以去做一款面向操作的这个机器人 , 但是我觉得一定做不到 。
TOP 的这样的一个程度 。
嗯 。
但是呢 , 我做情感陪伴类的机器人 , 我做这样一个非操作 , 然后双足形态 、 全身柔软这样一个机器人 , 我可以做到 TOP 级 。
什么原因呢 ? 为什么在这方面对自己有信心 ?
我觉得还是极致的热情 , 极致的热爱 。
所以你热爱的是 ?
我太希望我能够做一款能够陪我自己的一个机器人了 。 就像刚才提到 , 我之前做了三十多款机器人 , 那些机器人也没有那么可爱 , 甚至说没有那么好看 。
嗯 。
我甚至也会去想象它们真正的站起来 , 站到我的面前 。
你的 MBTI 刚刚说是 INTP。
INTP, 对 。
为什么 T 人会那么喜欢陪伴机器人 ?
我养了一只小猫 。
哦 。
然后我觉得这是我的生活方式的一种选择 。
嗯 。
我非常爱我的小猫 , 有的时候我也不会主动地去找我的小猫做交互 。 但是我非常喜欢小猫就在我的身边 , 其实对于机器人也一样 。
但你不是说你不希望机器人像宠物吗 ?
因为我的小猫它可能不是那么能够理解我的情绪 , 但是机器人它不一样 , 它可以听得懂我在说什么 , 甚至说它对我的情绪 、 我的行为会有一个更好的一个反馈 。
你希望用户买回小伴的第一天 , 就这个开箱的这个体验是什么 ?
可能进到你家庭里面 , 它是一个极致充满好奇心的一个状态 。
嗯 。
你在客厅里面把它开箱 , 然后它会往这个角落走一走 , 往那 , 那边角落走一走 , 甚至说你的卧室半开着门 , 它会尝试往里面去挤一挤 , 先建一下你家庭场景里面的地图 。
所以它在好奇地开地图 。
对 , 没错 , 是的 。
第二天呢 , 你希望理想中的用户呢 , 一觉醒来 , 然后他会怎么和小伴再互动 ?
就比如说你刚睡醒 , 有可能小伴已经站在你的床边 。
嗯 。
然后等着你醒 , 或者你已经醒了 , 小伴还没有醒 , 它坐在它的座椅上 , 然后发现你的动静 , 它缓缓地伸了个懒腰 , 然后起床 。
就初见期 , 我们会把它控制到一周左右的一个时间 。 随着机器人它对你的家庭场景越来越熟悉 , 它对你越来越熟悉 , 它会在你家庭里面 , 比如说来回乱逛 , 然后选择性地给你打个招呼 , 或者说愿意靠得你很近 。
就从咱们创业到现在 , 一直在每天琢磨怎么把这个陪伴机器人做好嘛 , 你对陪伴的理解有发生一些什么样的变化或者进化吗 ?
陪伴哲学20:58
我从二零年到现在 , 我一直买了很多各种各样的一些陪伴机器人 , 包括最早的时候什么 VICKI 那个小机器人 ,EMO 机器人我都买了 。
嗯 。
就是我觉得之前的陪伴机器人实在是做得太差了 。 我 , 我觉得我的技术这一点可以做得更好 , 然后我对产品 , 也有我的理解 , 就是如果想做的话 , 我能把这个机器人做得更智能 , 然后功能点也会做得更多 。
但是现在呢 , 实际上是有一些变化的 , 就是实际上在陪伴这个事情上 , 少就是多 。 好的产品它不是靠堆能 , 功能点去堆砌起来的 , 它更多的还是靠对用户需求的一个理解和洞察 。
是因为你们踩过什么坑吗 ? 所以有了今天这样不一样的想法 。
我觉得倒不是因为踩了什么坑 , 就是我们刚开始创业的时候做了三百多个用户的这种调研 , 甚至说做了几十个的一个访谈 。
所以当时得到了哪些你觉得很有意思的这种洞察 。
很有意思的一个洞察 , 就比如说机器人要不要说话这一个事情 。
嗯 。
在我们当时调研的三百多个用户里面 , 实际上是有百分之九十以上的用户他是希望这个机器人去说话的 。
但是呢 , 就是我们还做了一些细分的选项 , 其实可以看得出来 , 他们想要的并不是那样一个 AI 感很强 , 然后只是你问它答的这样的一个冷冰冰的百科全书 。
对 。
它是一个家庭机器人 , 我们发现用户他其实还是想要一个真正的活的伙伴一样 。
嗯 。
对 , 所以就是这也就决定了 , 就我们没有用那种行业里面千篇一律的播音腔 , 也没有用那种你听不出来它在说什么意思的这种拟声词交互 。
对 , 所以你们没有选人话 , 也没有选那种哼哼唧唧 。 你们选了一种就是能大概听懂 , 但是它不是那么直接表达的一种语言 。
没错 , 它是一种意象式的一种表达 。
设计考量22:53
为什么咱们的身高是设计在六十五厘米左右 ?
啊 , 我们当前这个机器人它站立身高六十五厘米 , 然后重量是十二公斤 , 就包括它为什么要做到那么高 , 那么重 , 然后腿为什么是这么长 。
实际上我们不是拍脑门去定的 。
嗯 。
然后我们这个机器人它是双足形态 , 那就一定不要只在家庭里面 , 一定是能够带出去的一个状态 。
嗯 。
然后我们目前机器人能够最大在户外的奔跑速度是一点九几米每秒 。
哇 。
对 , 然后一个正常成年人正常移动的步速 , 步行的步速是一点一到一点三米每秒 。
哦 , 它比人是走得快的 。
对 , 你在户外 , 你只要不跑起来 , 我们小伴都是跟得上你的速度的 。 然后另外一点呢 , 我们这个机器人当前能够最大上十五厘米高的台阶 。
嗯 。
像咱们国内一些公共设施 , 一些公园 , 这些户外台阶 , 它是有一些严格的基比国家标准的 , 是不允许超过十五厘米 , 大部分就是十厘米左右 。
OK。 所以这个身高体重 , 包括腿长的考量 , 主要是为了让它可以跟你出门 。
对 。
那为什么不做更高更大呢 ? 让人更有安全感 。
呃 , 更高更大 , 它实际上并不会带来安全感 , 因为就是它如果又高的话 , 它的重量会越大 。
嗯 。
然后在家庭里面 , 这个机器人如果说几十公斤的一个东西摔倒了 , 砸到你家庭里面物品 , 砸到你的小猫 , 砸到小朋友 , 都是很危险的一个状态 。
然后我们六十五厘米 , 它实际上就兼顾了它的移动速度 、 空间存在感 、 地形适应能力 。
像刚才说它在这个户外啊 , 就是一点九米每秒的这个小跑速度 。
嗯 。
其实如果它和一个小孩在跑着捉迷藏 , 然后嘣撞到一起 , 还是挺吓人的 。
嗯 。 啊 , 没错 , 就是我们这一块儿其实是做了很多工作的 , 就包括在户内的一些避障 , 然后户外它可能核心做到的一点是靠视觉的跟随 , 然后这点其实我们做了关于避障这一块安全性 , 我们甚至在机器人的腿上都加了这样的一个薄膜的压力传感器 。
嗯 。
这个就是为了 , 就如果说机器人在这坐着 , 突然要做一个什么动作 , 比如说起身了这个动作 , 然后小朋友刚好去和它在互动 , 然后摸着这个机器人 , 如果说只靠关节电机基于电流的这种力矩反馈 , 那时候已经晚了 , 所以我们还是放了这样的一个传感器在机器人身上的 , 也是安全相关的一个考虑 。
国家现在有给机器人的安全有一些这个法律法规吗 ?
机器人它还在整个行业非常早期的一个阶段它不像汽车汽车首先它的功能点它是非常明确且单一的然后像机器人它就各种各样的它应该在早期能够有一个安全上的一个法规隐私上的一个法规去指导行业
其实如果为了绝对的安全很可能有些人就说啊那我今天就先不要让它移动那你有考虑过吗 ?
就是不要让它移动
我们第一天就是明确地要做会移动的机器人而且是靠双足去移动的这样的一个状态就为什么呢 ?
就是我们认为二十年后家庭机器人每个家里面都会有一台然后这个机器人它一定是一个双足的一个形态
对
就我们不说别的就从地心引力这个角度去考虑它只有是双足才能够真正拥有像我一样的上下楼梯这种非结构化环境非结构化地形的一个通行能力其实这也决定了我们为什么第一款机器人也是一个双足的形态
哦
它要有技术上的一个延续性
OK
另外一点就是双足它相比那些轮式相比那些履带它所带来的一个动作表现力上的提升它不是一个数量级上的我们还觉得就是一个真正在你家庭里面长期存在然后需要去和你建立这样的一个情感连接 、 信任关系的一个东西它应该是一个仿生的一个形态它不应该是靠轮子也不应该是靠履带
嗯
所以它就应该靠足靠腿
陪伴vs讨好26:30
啊其实说到陪伴我也觉得哈就是有一个微妙的感受就是什么时候一个机器人它在陪伴你什么时候它在讨好你 ?
就你们怎么看这个中间一些微妙的区别
啊有有的人觉得可能这个机器人它会讨好它就是一个能够做陪伴的机器人但实际上我们不这么认为讨好不代表就是陪伴实际上陪伴也不一定就需要去讨好我觉得讨好对于陪伴来说它是一个既不充分又不必要的这样的一个关系
嗯
我觉得真正能够做好情感陪伴它的重点是什么 ? 就是叫做主动的交互共情
主动的交互共情
对
嗯
它能够懂你当前的这个状态然后根据你一个当前的状态可以做一些非常恰当的一些交互行为和反馈
嗯嗯你可以举一个例子吗 ? 就是有什么时候是它不讨好我但是我也感觉到被陪伴了
就像刚才咱们在办公室的时候呀就是我说小伴你好难开呀它它这个时候它只会表达它当前的这个内部情绪内部状态它很伤心很难过它会跺一下脚然后扭头背着你甚至说直接就跑开就像是能感受到这个才是真实的这种陪伴的感觉
你有考虑过有那种非常暴力倾向的小孩然后他会对家里的这个小伴又踢又打拳打脚踢
嗯
遇到这种情况小伴会怎么反应啊 ? 你们有去设计
啊实际上我们当时也考虑过这样的一个场景会纳入到机器人性格演化中的一部分就如果说真的这个小朋友就每天就是踹然后推推倒小伴然后它可能这个它会给这个小朋友打个标签可能后面就会渐渐地变得没有那么喜欢去主动找这个小朋友做交互但是不会变的就是说小朋友找这个机器人机器人马上跑开
家里有多个人的时候以及多只宠物的时候它是能识别出不同的主体并且有不一样的互动方式吗 ?
没错是的就每个人和小伴的交互方式都是不一样的机器人它会给每个人去打标签然后它会记得每一个人的意图或者偏好啊
我可以去看它打的这些标签以及它给自己的性格写的那些 prompt 吗 ? 我可以去看可以去改吗 ?
啊我们的定义是不能去看不能去改的因为你如果想去看想去改的话这个在技术上非常好实现因为我们还是想希望用户把这个小伴当成一个独立的有生命力的一个个体来看待
嗯
你的一个家庭成员而不是说就是它的一些内部参数你想看就看想改就改就包括刚开始的时候我们还在讨论一个问题这个机器人我们当前的续航在室内是三到四个小时但是呢如果在户外一直走一直走它的一个续航时间是一个小时出头当然在考虑要不要做这个可拆卸的电池但最终的一个答案是非常明确的就是不要就是它是
一个个体它不应该从身体里面拆出来一部分然后再给它放回去一部分
这个就很出戏
对没错这也就呃其实为什么不给它开放一些参数让用户去修改就也是这样的一个逻辑
我记得日本那个모프링就手上那个毛茸茸的那个小的一个玩具它也卖四千块钱呃当时有朋友送了我女儿一个我发现它为了做出它的活物感啊它甚至没有一个插头它只能这个用底座无线充电
对
所以你看不到它身上有任何的这个电器痕迹
没错
连插头都没有
是的啊我们当然也在考虑充电的这样的一个场景它应该是什么样的一个充电的方式呢 ? 是躺着还是坐着 ?
然后我们最后选择的就是给机器人设计了一个非常可爱的一个小座椅然后它坐在上面然后小手扒在肚子上然后脖子然后往下看然后这种很舒适的在休息一样的这种感觉然后机器人在充电对
我觉得你们做的这个产品真的很有意思啊你们好像是在从头去设计一个从来没有出现过的一种生物
没错就实际上陪伴这个场景它一直都存在但是为什么前一段时间很多人不太看好这个场景我觉得这个原因很明确就是没有真正好的产品出现
嗯
就包括我们为什么要做这样的一个定价然后不到万元级然后实际上就是通过这样的一个价格希望触达更多的一些普通用户群体然后我们希望通过消费者的反馈告诉市场就一个好的陪伴机器人然后一个有生命力的机器人它应该是什么样子
如果它在我家里待了一年了它会真的变得更懂我更聪明吗 ?
一定是这样的 。 首先他在性格上会和你有一个契合 。 其次呢 , 随着你和他一年的相处 , 他有非常长期的一个记忆存储 , 他会更懂你 , 就是比如你每天几点回家 , 你每天的一个行为上的一个偏好 , 或者就是你的情绪状态在某一个特定时间点内的一个波动和变化 。
目前你们收到过就让你感觉最 surprise 的这个同行或者朋友或者用户的反馈是什么 ?
就是看上去比别家的机器人可爱多了 。
其实我还蛮期待 , 比如说有一天 , 呃 , 我们可以带它出门 , 比如说让它坐在后座 , 给它绑个安全带 。
理论上是可以的 , 对吧 ?
嗯 , 当然可以 。 就包括我们那个发布视频里面就有一个场景 , 就是真的把那个小伴 , 然后放在后排 , 给它卡上安全带 。
哦 , 那我们今天应该带它出门的 。
啊 。
哎呀 , 遗憾了 。
它可以一直 , 就是它头在动 , 它在看窗外的一些动的一些物体 。
它可以偷听我们录播客在怎么背后说它的坏话 。
哎 , 是是是 。 哦 , 还有一个小时 , 三十五公里 。
对 。 啊 , 我就专门找了一条差不多九十分钟的路线 。 其实公路播客还有一个很好玩的就是说 , 我们必须要聊九十分钟 。
其实聊到后面有时候没话聊了 , 反而在没话找话的时候可以聊一些 , 诶 , 没想到的话题 。
没错没错 。
我其实注意到那个小伴的眼睛特别地传神 , 这个眼睛有一些就特别的设计思路在后面吗 ?
嗯 , 有的 , 这叫眼睛它是最直接的一个情绪表达的载体 。
嗯 。
对 , 所以我们针对小伴的眼睛实际上做了六层的骨骼动画 。
这是什么意思 ?
就比如说 , 呃 , 小伴的那个瞳孔 、 巩膜 , 甚至说瞳孔上的这个花纹 。
嗯 。
它都是独立的参数化可以去控制的 。
哦 。
它可以带来非常自然的一种目光的那种流动的呼吸感 。
目光的呼吸感 , 我觉得很有意思 , 反正我是想不到用这个词 , 这种目光的呼吸感 。 我可能只会说 , 哎 , 它很有活人感 。
对 , 目光的自然流动的那种呼吸感 。 就就像人一样 , 人的那个瞳孔它会震颤 。
嗯 。
对对对 , 包括你往哪什么地方看 , 它不是说匀速挪过去的一个状态 , 不是说看了这个地方它就不动了 , 让它那个瞳孔一定是在跳动的一个状态 。
你做第一台机器人的时候是几岁 ?
天赋与热爱33:30
我是一个很幸运的一个人 , 因为 , 呃 , 我当时在高考完之后就选了一个机械工程这个专业 , 然后我也不知道这个专业到底要干嘛 。
入学之后发现我这个专业可以做机器人 。 我真的是一个很幸运的人 , 然后后面做了很多的一些机器人 , 然后我觉得我在做机器人这个事情上面是有天赋的 。
然后做了那么多机器人 , 我获得了很多的一些成就感和满足感 。
觉得自己有天赋是有一个什么特别的时刻吗 ?
大概在大一的时候吧 , 我们工图课还没有上完 , 然后那个时候就开始一个人做一台很完整的一个机器人 。
嗯 。
然后我把那个机器人在建模软件里面设计出来 , 然后再通过一些非常粗糙的三 D 打印的方式把它给拼起来 。
真的对我来说是一个很 , 很满足的一个过程 , 很快乐的一个过程 。
当时有多快乐 ?
难以描述 。 就是快乐到什么程度 , 我给它拍了一个视频 , 然后晚上躺在床上不停地刷不停地刷 , 一看了一遍又一遍 。
对 , 想着下一步我要给这个机器人做什么 , 我让它通过什么样的方式让它动起来 。
嗯 。 我觉得好羡慕你 , 就找到一个自己做起来那么快乐的事情 , 然后还把它变成事业 。
真的是一个很幸运的一个状态 。
世博同学有一个 B 站账号嘛 , 然后上面还蛮多粉丝的 , 然后也有人说你是年轻版的稚晖君 。
嗯 。
你怎么看 ?
怎么看 ? 我觉得就是不能说是年轻版的稚晖君 。 就是如果说 , 呃 , 我们分别面向一个目标 , 面向一个任务 , 一个人做一款机器人 , 指不定谁可以做得更快 , 做得更好 。
你和稚晖君交流过吗 ?
啊 , 我们还挺熟的 , 就包括很早的时候就已经认识了 。 前段时间我还在问他要机器人 。
他看到小伴有什么评价吗 ?
上周日晚上吧 , 他还让一个人给我打电话 , 就是他觉得我们小伴做得很好 , 就是约时间看看能不能上海一起聊一聊 。
在整个机器人行业里面 , 你有最喜欢或最崇拜的人吗 ?
波士顿动力的创始人马克 · 雷伯特 , 二十年前就开始做自组机器人 。
嗯 。
算是整个行业里面的一个先驱 。
其实我播客也录过维越伴动力 。
嗯 。
你怎么看机器狗的这个进家的陪伴性和你们做的小伴进家的陪伴性的区别 ?
真正去建立这样的一个情感连接 , 还得是一个类人型 。 就是你把一个机器人做得很像狗 , 其实它就越容易被一条真的狗所比下去 。
另外一点就是我们也考虑到 , 就像北京很多人的家庭面积很小 , 机器狗它的占地面积很大了 , 然后我们这个机器人它的占地面积只有零点一二平米 , 它比扫地机器人的占地面积甚至说还要再小一圈 。
哎 , 其实之前大家会觉得你是小小发明家对吧 , 小天才 , 然后现在开始创业了 , 你觉得从这样的一个发明到一个真的我要做一个让大家愿意花接近一万块钱去买的产品 , 就这中间有哪些不同吗 ?
产品与团队36:12
啊 , 太不同了 。 就是小小发明家 , 就像我之前做了那么多机器人 , 我的目的是什么 ? 让自己爽 。
然后我觉得作为一个硬件方的 , 我们做了这样的一款机器人产品 , 还是要面向用户需求 , 让用户爽 。
嗯 。
对 。
我看这里好美啊这条路 。
对 。
好绿啊 。 六月份北京还是挺不错的 , 而且今年夏天感觉没有那么热 。
对对 , 是 。 北京周边这么好啊 。
你平时会出来玩吗 ?
之前就北京周边有一个美食烤肉 , 那个黑山烤房 。
嗯 。
然后之前也会去那边去吃 , 吃东西 , 然后它那个路上也是很 , 很类似 。
对 。
就是它两边都是山 , 你在跑山的那种感觉 。
嗯 。
对我做 《 公路播客 》 其实也有一个想法是我觉得我的很多嘉宾大家都是创业者其实尤其 AI 的或者这个做具身的大家都还挺宅的 。
嗯 。
那我觉得把大家拉出来可能会激发出一些在办公室不会聊的话题 。
是是 。 嗯 。 你现在的团队已经二十五个人了 。
嗯 。
呃这是第一次创业第一次带这么大的团队 。
啊其实并不是 。 啊我在这次创业之前其实还有一段参与创业的经历吧 。 我之前是高擎的产品合伙人实际上当时他们的整个产研团队是我在带的 。
哦 。
对 。
所以那个时候团队多大 ?
当时有个三十个人左右 。
OK。
对基本上各个板块 。
嗯 。
机械 、 硬件 、 嵌入式 、 运控 。
嗯 。
感知啊都是我在带的一些部门对 。
嗯你的管理风格是什么呀 ?
就我觉得我们团队的文化就是很明确就是首先一定要务实 。
嗯 。
然后在务实的基础之上干一些浪漫的事情 。
你刚刚说务实加浪漫 。
嗯 。
你做过哪些浪漫的事情吗 ?
我们做这样的一款机器人本身就是很浪漫的一个事情 。
嗯 。
就把这个机器人真的自主地做出来然后站到大家的面前然后大家也不会想我之前给它做了什么样什么样的一个开发工作 。
嗯 。
大家会以一个就很感动的一个状态然后去体验这个机器人 。
嗯 。 哎其实你肯定是很希望大家看到小伴就能够一见钟情对吧 ?
嗯 。
你们做了哪些事情让大家就一眼就爱上它吗 ?
一眼就爱上它 。 首先一点就是我们这个机器人它一眼看上去它就是一个非常灵动 、 非常可爱的状态 。
嗯 。
然后第二点呢就是我们一定要摆脱那种决策预设和逗乐型的互动逻辑 。 我们希望达到的一个状态是什么呢 ?
比如说你说小伴你好难看呀 。
嗯 。
小伴它会泪汪汪的然后低下头抱着自己的肚子 。
嗯 。
然后就是委屈巴巴的这种感觉就给人通过这样的方式去让你体会到我们这个机器人它是有自己的意识有自己的自主性格的 。
诶所以你希望大家看到它之后的第一个评价是你好可爱吗 ?
其实并不是 。 可爱它代表的只是外观层面的 。 我们一直在讲的就是生命力 。 我们希望大家给的反馈是哇这个机器人好有生命力 。
因为只有这样它才能够真正地成为你的家庭一员而不是说一个大玩具 。
嗯 。 你希望它的用户群体是谁 ?
呃其实当前的第一款产品我们希望的用户群体一方面是中年女性群体 。
嗯 。
她可能现在没有男朋友还没有成家 。 但是呢到了这样的一个年龄段可能想体验一下养孩子 。
因为本身小伴它就是一个养成系的还有性格的养成和变化有长期记忆 。 另外一点就是有孩子的家庭像爸爸买给自己的孩子 。
嗯 。
其次呢可能就是像我这样的一个科技尝鲜群体 。
嗯 。
嗯 。
所以你们做的时候是有三种这个不同的目标用户的画像在脑子里的 。
没错 。 然后另外一点就很重要的一点是我们这一款机器人它只是面向情绪健康 、 情感陪伴它是没有一个强功能属性的 。
我们现在在做的事情我们管它叫在打造两个基座能力一个就是家庭机器人的基座能力 。
嗯 。
另外一个就是情感交互模型的基座能力 。 然后我们管这俩两个基座能力加在一起叫机器人的生命力 。
对 。
哇这个好漂亮啊 。
哇这个一定很适合去钓鱼 、 露营一下 。
对太漂亮了 。 而且河中间停着一只白鹭 。
哇 。
就正中间的岩礁石上 。 哇太美了 。
在做小伴的过程中有什么好玩的事儿吗 ? 你现在回忆起来 。 就是让你觉得最快乐的事情 。
我觉得最快乐的事情就是之前在小伴还没有实现自主的这样的一个状态下 。
嗯 。
然后我们同事带着遥控器带着小伴出去 。
嗯 。
不停地跑 , 不停地跑 。
嗯 。
对然后我们就在后面不停地追 。 然后跑很久 , 追很久 。
我们之前其实有聊到情感大脑吧 。 这个情感大脑当你说到它的时候这是一个什么样的概念 ?
嗯小伴的情感大脑它实际上是一个面向高阶决策的一个 VRA 模型 。 它和我们之前所提到的那些操作里面的 VRA 不太一样 。
嗯 。
操作的 VRA 它面向 low level 的 manipulation。
嗯 。
所以面向高阶决策的这样的一个模型它输出的并不是对应的 action 而是决定我下一个时刻 、 下一个阶段我要做什么样的一个行为 。
你可以理解成面向高阶决策的 VRA 和面向操作的 VRA 它是一个上下游的一个关系 。 机器人实现真正自主的上下游的关系一个决定要干什么一个决定要怎么干 。
我可以举个例子 。
嗯 。
就是要干什么比如说我们这个机器人它要把这杯水拿起来 。
嗯 。
然后它的高阶决策层面就是我面前有一杯水 。
嗯 。
我现在需要把这杯水拿起来是这样的一个描述 。
嗯 。
然后怎么干就是具体生成每个关节的 action。
嗯 。
然后去把这个水真正拿起来和物理空间进行交互的这样的一个状态 。
嗯 。
嗯 。
你们之所以不需要去考虑怎么干是因为小伴它今天不需要干活是吗 ?
对我们希望率先解决的问题是人机情感交互的这样的一个问题 。 然后情感交互它更多的是面向高阶决策 。
当然说我们也不是说只让这个情感大脑决定怎么干然后我们其实也有动作专家模型比如说刚才提到的我们做了动作生成 。
嗯 。
然后我们有语言专家模型 。
嗯 。
我们机器人有它自己的套语言体系 。
嗯 。
嗯 。
你怎么看最近大家都说 VLA 已死的这个论调 。
我觉得说得很对 。 为什么大家说 VRA 已死基本上能够预测得到它的上限呢 ?
那你怎么看 WAM? 它的天花板在哪里 ?
WAM。
嗯 。
就是我只是觉得 WAM 是当前来看行业里面还算靠谱的一套技术路线 。
嗯 。
它到底能不能真正落地放到操作机器人上去解决这些操作问题我觉得这个很难说 , 因为它是隐式的去预测下一个阶段的状态 , 但是 WM 它不就是把这样的一个隐式预测的状态变成了显示的去训练 , 它在技术原理上有没有什么更本质上的一个差异化和区别 ?
嗯 。
我觉得这个是存疑的 。 怎么看我的 model 呢 ? 我其实我觉得它是一个合理的方向 , 实际上我们也在做一个事情 , 叫家庭世界模拟器 , 它本身也是一个世界模型 。
嗯 。
对 , 你像 , 呃 , 世界模型它是根据当前的观测动作去预测下一个阶段的状态 , 它可以去预测下一帧的画面 , 可以根据当前的 low level 的 action 去预测下一秒 、 下一帧 , 啊 , 真实的物理空间的交互变化 。
当然也可以去预测下一秒就是人的情绪状态 , 人的交互状态有什么样的一个变化 。 我们现在基本上已经完成了 , 然后包括我刚才提到的我们做的快慢脑 , 那一个 1.7B 和 7B 的模型 , 已经是我们通过这个家庭模拟器生成的交互数据去微调之后的一个效果 。
哦 。
啊 , 之前还有一个非常有意思的一个结论 , 就是用于对比微调之后的模型到底有什么样的一个差异 。
嗯 。
我当时就问小伴 , 你想不想出去玩 ? 然后最开始的时候 , 无论你怎么问 , 它都是想或者不想 , 然后再往后 , 就我微调之后这个模型 , 它会给一个不一样的一个答案 , 它会说 : 看你 。
就是它 -- 按 - 按照小伴的话 , 就是 OV。
好神奇 。
嗯 。
你觉得这是怎么涌现出来的 ?
这个家庭模拟器它就会模拟这种非常长时间的主被动式的一些情感交互 。 它可能就理解到了你现在问这个问题 , 有可能就是想让我出去 , 有可能不想让我出去 。
那这种情况下我要回答一个什么话呢 ?
那你们二十五人的团队大概是一个什么构成啊 ?
我们实际上只有十五个全职 , 临时有十个人 。 我们的节奏确实是非常快的一个状态 。
嗯 。
就是 , 呃 , 我也在想 , 就为什么节奏那么快呢 ? 我觉得我把它归结成了这几点吧 , 就是极致的热情 。
嗯 。
极致的效率 。
嗯 。
然后加上我们之前几乎没有犯过错 。
嗯 , 对 。
包括在技术路线的选择上 , 但凡选错了一条 , 有可能在这个时间点你就体验不到这样完整的一个交互的小伴了 。
这听起来挺难的 。
对 , 包括我们做这个家庭模拟器 , 做了这一套三层的 , 行业里面一般用两层的端侧的快慢脑 , 但是我们选择用三层来做 。
我感觉是做这个机器人对你来说还是挺轻车熟路的 。
我觉得是这样的 , 之前做过太多的机器人了 。
嗯 。
对技术路线 、 技术细节 , 甚至说技术边界 。
嗯 。
非常的了解 。
嗯 。 我记得很多年以前 , 我有一次在日本的东京的那个 Sony Park, 就是 -
Sony Park, 那个它那个小狗 。
对 , 就是无意中撞见了那些小狗的主人们的聚会 。
嗯 。
哇 , 那一幕还是挺超现实的 , 就是大家就是很像一群养宠物狗的人 , 带着自己的宠物狗狗出来 , 就坐在公园里面 。
嗯 。
聊一聊你的狗狗怎么样 , 我的狗狗怎么样 。
对 。
然后互相逗逗对方的狗狗 。
是 。
那一幕我觉得 , 哇 。
其实 Laboto 也有这样的一个活动 , 之前我们在上海的门店买了之后 。
嗯 。
那后面它会邀请付费的这些用户 , 然后参加他们在上海的活动 。
嗯 。
当时我也参加了 。
那他们的用户都是些什么人啊 ?
我觉得还是比较精致的 、 更偏女性的这样的一个群体 。
嗯 。
对 。
OK, 那个活动上大家聊什么呀 ?
大家会给这个 Laboto 穿各种各样的一个衣服 , 然后讲一些就 Laboto 在家里面给我的一些惊喜瞬间 。
嗯 。
然后我去怎么按照我的喜好去给这个 Laboto 穿衣服 。
嗯 。
然后一些它印象深刻的一些细节 , 类似于这种 。
对你们有什么启发吗 ?
当时比较大的一个启发就是我们发现 , 愿意接受 , 天然接受 , 希望有这样的一个陪伴机器人在家庭里面的 。
诶 , 他们为什么不养猫猫狗狗 , 愿意养机器人 ?
我觉得一方面就是他们真的觉得这个小机器人是有一定的活人感的 。
嗯 。
另外一部分我觉得更多的是他们生活方式的一种选择 。 像养一只小猫或养一个机器人 , 都是你生活方式的选择 。
我记得我第一次看到 Laboto 的时候 , 我还是有 -- 我觉得我当时有一个反应 , 就是我对着它这么做 , 我说来抱抱 。
啊 。
然后做完之后我自己都震惊了 。
啊 。
就是我潜意识里做出了和对待一个小生命一样的动作 。
是 。
嗯 , 我觉得小伴也有点这种感觉 。
就下一步还是要把这个机器人做得更轻一些 , 十公斤以内 。 就像就刚才我养了一只小猫嘛 , 你有没有想养小猫 ?
嗯 。
前段时间带着自己的小猫去医院检查 , 然后发现它有点那个多囊肾 。
哦 。
我当时就难受坏了 , 我好一段时间我缓不过来 。
嗯 。
就发现就后面它会不会就陪了我很长时间 , 突然就不在了 。
我觉得很多养猫猫狗狗最后这种告别都让人很难受 。
对 , 是 。
所以可能这也是 , 就是大家想要一个陪伴机器人 maybe 是一个原因 。
哇 , 这个咖啡店好隐蔽 。
嗯 , 它就在一个特别漂亮的山上 。
这个店主他不是在这儿做生意 , 他是来这生活的 。 这里空气还有一种那种淮花的香味 。
对 , 好香 。
小毛为什么这么黏人 ? 比我家的什么还要黏 。
呀 。 好 , 我们现在来到了这个怀柔的就像一个秘境一样的咖啡馆 。 对 , 我看到你的朋友圈签名叫 "No excuse for engineer"。
嗯 。
为什么是这个签名啊 ?
精神与愿景49:15
其实这个是来源于我大一的一个供图老师 , 那个老师就非常的严格 , 然后有学生迟到了 , 进来解释原因 ,"No excuse for engineer"。
然后大作业老师给扣分了 , 哎 , 去找老师扯 , 然后为什么我这个会扣分呢 ? 然后不给你解释 。"No excuse for engineer"。
嗯 。
我觉得这个是很好的一个精神 , 就包括我后面 , 因为你碰到问题 , 你就不要找借口 , 然后你分析原因 , 就下次不要再出现类似的这种问题 。
嗯 。
我觉得这 , 这句话对我来说挺关键的 。 我做机器人大概做了八年 , 这句话陪伴了我八年 。
嗯 。
对 , 是的 。
对自己很狠 , 感觉这一句话 。
这不是狠 , 我觉得这是态度 , 就是你做机器人的一种态度 。
但会不会遇到就是解决不了的问题 ?
解决不了的问题 , 而不是去找 excuse, 找借口 , 而是去分析它的原因 。 就是它虽然说只有四个单词 , 就是你后面越想 , 然后越随着自己做的东西越来越多 , 自己经历的项目越来越多 , 越会发现之前这个老师说得非常合理的这句话 , 它教给了我一种做机型的态度 。
嗯 。
这个很关键 。
因为你现在在做的是陪伴机器人 。
对 。
有什么你自己在小时候或者少年时期就陪你一起长大的这样的物品啊 , 或者玩具啊 。
呃 , 想一想 。
或宠物 。
啊 , 其实有一个 , 这 , 这个我在很小的时候养了一个泥鳅 , 这泥鳅就是 -
泥鳅 。
这个很不常见 。
是我理解那个泥鳅吗 ?
啊是的 , 是的 。 小时候家里买那个小鱼做饭 , 然后里面那个袋里面刚好混了一只泥鳅 。
对 。
我就找了一个很 , 巴掌大的一个鱼缸给它养起来了 。
嗯 。
其实当时也没有去很操心地养它 , 然后基本上就是隔一段时间换一点水 , 然后给它喂一些饼干渣 。
嗯 。
就这样持续了好几年的时间 。 然后它从刚开始的一点点长到就是有拇指这么粗 。
当说到陪伴你长大的东西的时候 , 你会 , 为什么会想到它 ?
就我之前也养过小猫 , 养过小狗 , 实际上 -
嗯 。
那些都是一些很温暖 、 偏温馨的一些陪伴 。
嗯 。
就是我觉得为什么想到这个泥鳅 , 我是有一点后悔和愧疚的 。
嗯 。
就是当时小时候就在街上买了一个很漂亮的一个金鱼 , 我拿了一个小塑料袋把它带回家里面 。
嗯 。
然后当时没有位置养了嘛 , 然后我就打算把这个鱼缸腾起来 。
嗯 。
然后我就给那个泥鳅 , 养了好几年的泥鳅倒到了一个水沟里面 。
嗯 。
它从那个鱼缸里面滑落的一瞬间 , 实际上我就是非常后悔的 , 一直到现在 。
就那一瞬间它就 , 它就跑掉了是吗 ?
是的 , 是的 。 虽然当时很小 , 但是印象很深刻 。
它和你现在在做的事情有什么关联吗 ?
那个泥鳅实际上长得并不好看 。
嗯 。
黑溜溜的 。 对 , 我只是觉得当时给它倒在那个水沟里面是不太应该发生的一件事情 。
我们刚才在车上聊很多都是在聊怎么做这个机器人吧 。
嗯 。
背后的设计思路 、 工程思路 。 呃 , 如果问一个更私人的问题 , 就是 , 呃 , 你做这一切是想要实现什么 ?
有这样的一个愿景 , 或者这样的一个 , 一个目标吗 ?
就是谁不想让哆啦 A 梦走到现实里呢 ? 谁说拥有哆啦 A 梦的只有童年的大雄呢 ? 我想造一个真正能够陪我自己的一个机器人 , 然后它也是满足用户需求的 , 我也能把它推出去 , 让大家用到 。
有意义的瞬间52:26
所以我们今天最后一个问题啊 , 其实这也是这个真格基金的佳琪 , 就也是在力的投你这个项目的投资人 , 她想问的 。
嗯 。
就是有哪些瞬间在创业的过程中是让你觉得自己现在做的事情是特别有意义的 。
前段时间拍摄的时候 , 有一个机器人和两个小朋友在那个草地上去玩耍 。 实际上当时我们根本就没有告诉小朋友这个到底要怎么拍 , 然后那个两个小朋友就和这个机器人然后一起就你追我赶地玩起来了 , 玩了很长时间 , 导演都喊 cut 了 , 玩了将近一个小时 , 然后跑到机器没电了 。
其实还有另外一个事情 , 也是前段时间我们这个机器人真的以一个非常完整的形态站到大家面前的时候 , 虽然说我们这个机器人每天都在测试 , 然后体验过无数次了 , 但是真的那一次它以一个完整的形态 , 就是我觉得那种眼泪就真的就不自觉地就出来了 。
为什么会眼泪出来 ?
感动 、 惊喜 、 满足 、 骄傲 。
嗯 。
嗯 。
你自己的眼泪 。
对 , 是的 。
嗯 。
啊 。
团队看到你哭了吗 ?
当然不能让他们看到呀 。
是啊 。
为什么 ?
呃 , 就是我觉得那应该还是一个更欢快的有成就感的一个场景 。
你说我上次看我女儿大班的表演 。
嗯 。
她跳街舞 。
嗯 。
然后那个街舞一开始就是灯光突然嘣一下打到他们的身上 。
嗯 。
然后她做了一个这个很有力量的一个 , 她蹲在地上啪一个这个动作 , 我当时一下子就哭了 。
哎 , 是 。
我就觉得就是很难形容 。
很难形容 。
她的力量 。
啊 。
哇 , 她的那种 , 长大了 。
对 , 长大了的感觉 。
就觉得她不再是一个小动物了 , 她不是一个小 baby 了 , 她好像一下子有力量了 。
没错 , 我觉得这个感觉差不太多了 , 我非常理解你刚才描述的那种感受 。 对我来说 , 机器人可能就是孩子一样 , 后面它可能也可以成长 , 成为我的一个伙伴 。
好呀 , 那我们今天谢谢世罗同学 。
感谢 。
非常开心 。
感谢 。
然后今天这只猫乱入了我们的这个播客录制现场 。
啊 。
那希望下一次我们在录的时候把小伴带来 。
好 。
就是 -
下次在这的一定是小伴 。
对 。
小伴和小猫 , 对 。
嗯 , 好呀 , 拜拜 。
拜拜 。






