十年蛰伏,揭秘Rokid在空间计算时代的“野心”

VR陀螺 2023-08-30 16:06:51

“我等这一天已经等了10年”。Misa在Rokid Jungle发布会上激动地说到。8月26日,不论是对于Rokid,还是对于Misa来说,都是具有历史意义的一天。

时间拨回到25日晚上10点,经过多轮时间调整,笔者终于抵达Rokid公司见到Misa。此时他还在就一些产品细节与技术Battle。从公司的创始人、技术负责人以及产品经理、市场负责人,为了即将到来的一年一度的盛会“Rokid Jungle”正紧张有序地准备着。

历时3个多小时,凌晨一点半这场采访终于顺利结束。本文除了带来Rokid的新品体验和点评之外,还更多融合了时势下,Misa对市场的观点与判断,以及今后Rokid的走向。

凌晨1点,Misa与产品、技术正在调试

新增4800万像素镜头,Rokid产品还在升级

虽然依旧是市场上常见的Birdbath光学的AR眼镜,但此次软硬件方面不乏诸多可圈可点之处。

此次发布的新品为主打空间计算的Rokid AR Studio套装,包含一台Rokid Max Pro以及独立主机Rokid Station Pro,首先这两款终端的硬件配置都相比上一代有所提升。

Station Pro使用高通XR2+ Gen1,该CPU是高通2022年10月推出的最新方案,较上代骁龙XR2性能提升了50%,散热提升 30%,并且采用了全新的图像处理管线,能够实现低于10ms的延迟。

主性能大幅提升之外,Station Pro还新增了一颗4800万像素的摄像头,完全可以代替手机使用,甚至性能、续航以及内容丰富性各方面超过手机,而且还能为手机反向充电。

AR眼镜连接手机的形态自2019年面世,以共享手机内容生态、即插即用、Birdbath轻薄外形加上亲民价格等诸多优势,很快成为AR眼镜消费市场的主流形态之一。

是否真的有必要为其增加独立的主机?这一问题困扰了团队很久。据说Station这个项目最初立项时曾经被毙掉3次,在Misa看来,这样的产品并不符合Rokid的产品原则——Always on(始终开启)、Quick in Quick out,Rich content(丰富内容),但是尝试之后没想到这款产品竟然带来了意想不到的效果,甚至掀起移动主机潮流。

根据Misa提供的数据,超过90%的用户选择使用Station连接AR眼镜,而非使用手机。

Station Pro还内置了9轴IMU,可让主机实现3DoF追踪,使其作为操控手柄使用。在Misa看来,目前虽然暂时还无法完全实现Always on,至少已经朝着Always Standby进步中。

作为公司的创始人,Misa如今是自己产品的重度用户,他坚信,只有把自己放在用户的角度,才能真正挖掘产品的价值。他也经常与其他消费用户交流获取反馈,因此这次发布会上非常多Rokid的忠实粉丝到场应援,包括Rokid Max Pro摄像头向下15度设计的idea都是来自用户体验反馈。

Rokid Station Pro搭配的AR眼镜——Rokid Max Pro相对于上一代在参数上并无变化,只新增了一颗用于空间定位的摄像头,其目的是为了能够让交互更为自然舒适。

此外,Max Pro在新增一颗摄像头的前提下,重量比上一代仅增加了1g,依旧保持了非常轻薄的形态。

相对以上硬件,Rokid Jungle上围绕软件方面的进步要有意思得多。

十年蛰伏,与苹果空间计算的“不谋而合”

“Rokid本质上是一家系统软件公司。”

“Rokid本质上是一家隐藏在精美硬件产品中的系统软件公司。”Misa在交流中和发布会上多次强调Rokid的定位。

2023年对于产业来说注定是被历史铭记的一年,今年苹果带着Vision Pro正式加入战局。而这一年,对于Rokid来说,也是具有转折意义的一年。

“我等这一天已经等了10年”。

“2013年在硅谷参加google发布会,现场第一次戴上谷歌眼镜,两个感受:1、非常棒的创新;2、我们可以做得更好。也正是这时候萌生了离开阿里创业的想法。2018年Rokid Jungle我们发布Rokid Glass第一代产品,第一次将思考变成真正的产品,又过五年后的今天,我们才真正交出答卷。”

“一群疯子,一个梦想,十年光阴。”Misa感慨到。

梦想驱动的人身上总是闪耀着无形的光芒,交谈之中溢于言表。提到苹果的入局,Misa言谈之中洋溢着兴奋,对于这位消费电子市场的老大哥,除了尊敬、憧憬、敬佩之外,似乎还有某种默契。这些默契,最终在产品上呈现出来。

虽然是两种完全不同的技术路径,一种是基于VST(Video See Through)的VR产品形态,另一种是基于OST(Optical See Through)的AR产品形态,但在Rokid AR Studio的产品交互和功能上,的确看到了与苹果“不谋而合”之处。Misa将其总结为以下3点。

1、完全兼容2D安卓内容生态

首先是对2D内容的兼容与空间化。在苹果对外演示的Vision Pro视频中,原有的2D应用可以变成空间中的一个程序框展现,通过桌面空间可以将2D生态内容直接转化到3D空间中。

而基于Rokid最新的YodaOS-Master系统,则是可以兼容所有安卓应用直接在系统中运行,发布会现场展示了在钉钉中直接打开APK文件安装运行的视频。Misa称,在YodaOS-Master的系统上,以AOSP为底层,上面的整个Framework、引擎、框架都进行了大量的改造。

“比如我们一个Camera要做多个任务,既要做空间定位,又要实现手势,都用一颗Camera,这个里面就对原来的安卓的整个操作系统做了大量的改进,而原来旧的2D生态内容什么代码都不用改就可以直接跑过来,让他跑在底层的Sandbox里,所以应用在运行的时候,它以为自己跑在一个手机或者电脑上,实际上它是跑在一个Sandbox里面的,然后我们把它的交互再融汇到3D空间里面去。”

如今Rokid已经积累了130多款内容,Rokid专属版应用包括bilibili、随乐游、无影云电脑、影牛牛3D电影、咪视界等,涵盖了绝大部分用户日常工作、生活、娱乐中的应用类型。

2、自然头手交互+微手势

其次是更自然的交互方式,不过与Vision Pro主打手眼协同+语言交互不同的是,Rokid Max Pro支持多模态的交互方式。包括头手交互、微手势、3DoF手柄以及语音等多种交互方式。

头手交互调用眼镜的6DoF定位作为光标瞄准,结合简单的“捏合”微手势,类似PC的鼠标指针与鼠标点击动作配合,不过指针移动转变为头控。得益于眼镜上向下倾斜15度的摄像头设计,可以让手在更舒适的位置被捕捉到。

在Misa看来,VR形态的设备上可以通过多传感器来实现更精准的空间定位和交互,但是在需要保持轻薄的AR眼镜产品上,考虑到重量、功耗、设计的复杂度,要尽可能减少Sensor,所以Rokid一直在推进单摄Slam。

在Rokid内部,对于产品重量有着及其严苛的管理,以0.2g为单位,只要调整重量幅度达到0.2g就必须向Misa汇报。所以单摄也成为了Rokid践行的“执念”。

“AR实验室”是Rokid内容生态中以空间交互为核心的AR内容合集。在现场,笔者体验了诸多AR内容,其中让笔者印象比较深刻的包括以下几款:

《完美弧线》:这是一看篮球投篮游戏,在眼镜前伸手,球就会自动吸到手中,面向前面的篮筐摆出投篮姿势,即可将篮球投出去。内容简单有趣,球设置了物理机制,根据手挥动的速度和角度,模拟真实的抛物线,或许是由于命中率比较高,成为了众多AR游戏中最有人气的一款。

《飞镖大赛》:与篮球相似,摆出捏取飞镖的手势,虚拟飞镖即可附着在手上,瞄准、扔出,同样非常简单有趣。

《指尖战争》:PVP策略塔防游戏,两人各据一方,利用不同兵种的士兵、武器以及道具研究作战策略,应对敌方攻击,守住己方城墙。对战沙盘呈现在眼前,用手捏住士兵或者投石车,将其放置到沙盘中,小兵和车就会自行前进攻击敌人。

诸如此类有意思的小游戏还有很多,如用手势捏合就能控制跳跃力度的《跳一跳》、握拳就能变成锤子打地鼠的《打地鼠》游戏、通过手势控制拼合方向的《2048》、寓教于乐的天体教学内容《上帝之手》,将宇宙行星玩弄于鼓掌之中……

整体体验来看,单目Slam的稳定性和精准度现阶段必然比不上多传感器方案,这也是Rokid在接下来的软件算法迭代中需要持续改进的部分,但对于日常使用和体验小游戏来说影响不大,特别是“微手势”融合后,整体交互的舒适度大幅提升,在笔者体验过程中也从未出现手势误判、误操作等情况。

3、3D空间内容呈现

当我们与信息的交互方式从二维变成三维,它所展现的形式也应该有所变化。

“空间搜索”功能是Rokid Max Pro中极其有亮点的功能之一,相对于其他产品最大的变化在于改变了信息在空间中的组织和呈现方式,正如信息大爆炸一样,如使用语音说“搜索Rokid Station”,系统将自动识别“搜索”两字并理解用户指令,从而呈现出与Rokid Station相关的所有网页和视频,而基于一定的算法,使内容按照相关性前后排列。

选中其中一个视频或者内容,通过手捏合后,该窗口将被至于最前方并放大,同时其中的音视频画面也同步开始播放;而切换至其他内容也只需重复同样的操作即可。

“Rokid在做空间计算的时候,我们空间交互是用来回答一个什么问题,就是真正在空间里面信息的组织跟呈现方式会不会有一个巨大的变化,所以搜索就是一个几乎到今天为止,所有体验过的人都非常喜欢的功能。”

当笔者问到,未来Rokid是否要推出AR时代的浏览器,Misa表示,“空间搜索”所呈现出来的是一种信息的组织和呈现方式,这个框架将作为底层,延展到其他更多的应用中去。如短视频内容、文章内容、图片信息等等,组织与呈现都可以采用该框架来实现。

相对于传统的平面展示,“空间搜索”将空间巧妙地利用起来,结合头手交互,带来了极其自然且便捷的信息搜索展示方式,而这也是众多科幻电影中经常出现的场景,在Rokid Max Pro中成为现实。

在Rokid AR Studio套装体验过程中,笔者发现了很多细节部分,如摄像头向下倾斜15度以便更好地捕捉用户手势;桌面模式内可以放置至多5个应用窗口,切换多种查看模式;窗口操作按键位于窗口下方,方便头控使用;为了更好地识别语音指令,采用双线性降噪麦克风;舍弃传统语音唤醒词,直接以“搜索xxx”作为指令格式……

诚然,它的配置与苹果Vision Pro仍有一定的差距,但在Rokid的产品上,我们看到了在硬件极度受限的当下,团队在软件与交互上的思考与用心。

AR进入“个人计算平台”第二阶段,三大战略迎接持久战

“克制”,在与Misa交流的过程中频繁听到的一个词。

“我们跟其他的厂商最大的区别就是‘克制’。我们的产品都非常克制,比如像当时我们出Station的时候,所有人都不明白为什么要出一个Station,但等到出来之后大家就明白了,原来这个才是用户真的现阶段最想要的东西。虽然想上的东西很多,但消费者不会买单,所以Max Pro你会发现它也特别克制,没有放ToF这一堆传感器,只加了一颗普通的摄像头,然后把能力限定在当前它能做的这几件事的范围内。”

“我们考虑的重点就是,把重点放在一个稍微不受资源限制的领域——软件,硬件是整个生态的能力,Rokid没有办法通过一己之力改变整个硬件生态,至少今天做不到。但是软件是我们所有的人可以发力,并且相对来说可以摆脱当前的限制。”

“所以你可以想象一下,当我们这个产品的FOV变得更大的时候,我们的操作系统其实早就适应在这里了。未来随着硬件底层技术推进,FOV越来越大,硬件越来越轻,续航力越来越强,算力越来越高,硬件的门槛变得越来越低且同质化,但是从软件和操作系统上,我们该准备的早就准备好了,所以这是Rokid的延伸变化。”

空间计算时代的“Android”,Misa给自己与公司定下了这样一个宏大的目标。

在Misa看来,无论是VST实现的AR还是OST所实现的AR,殊途同归,所有人都在朝着一个目标前进。

“未来分成两拨,这是一个地图的中间,有两拨人从不同的出发点往中间出发,最后就看谁先到,我个人觉得今天都可能在半路中。VST的AR、我们OST的AR,传统大家理解的AR都在半路中,就看谁先到,因为最后谁先到谁会占有生态优势。实际上这两拨人,不管外面打的多凶,都是为了实现一个效果——虚实融合。”

“AR领域已经进入第二阶段——系统软件和生态之争。当然AR还是有人会去做一些工具类的特定场景的应用,但是从未来的个人计算平台来讲,它一定是变成一个操作系统,整个生态竞争。与智能手机不同的是,眼镜必须强调个性化,Spec与交互必须统一,所以这也是Rokid将重心放在软件系统的核心所在。”

未来Rokid计划将系统开放,为更多硬件产品赋能,从底层系统到开发工具、算法能力、内容生态全方位提供支持。

知易行难,创业公司要实现空间计算时代的“Android”谈何容易,持久战不光需要号召力,还需要充足的粮草和弹药。

不过此次发布会上,我们看到了Rokid的号召力。Google、高通、Unity、Bilibili、移动咪咕、钉钉、英伟达等知名企业高管、众多内容开发团队,以及伴随着Rokid一路成长的忠实粉丝们纷纷到场,共同见证Rokid这一“里程碑”式的盛会。

Rokid也向他们展示了这一路走来的耀眼成绩。据称,Rokid AR眼镜服务用户数量已经超过100万,日活用户超3万,月活用户超过40%,用户单日人均使用时长大于1小时,且应用、内容付费率达到20%;在车载AR娱乐领域,Rokid在新势力汽车品牌中市占率达到70%。Misa表示,去年Rokid在C端的产品销量为6万台,今年有望达到15-20万台。

即便如此,与智能手机等其他成熟的消费电子市场相比,AR仍是个嗷嗷待哺的宝宝。加上经济环境下行,未来几年仍逃不过“熬”的局面。

“今年有消费力,没有消费欲,真正的挑战是明年。”为了迎接更为严峻的市场挑战,Misa早早准备了三大战略:

1、以B带C

“以B带C就是在B端打磨新的技术放到C端验证。一个新的技术出来到底靠不靠谱,让用户去实验是很麻烦的,它的代价很大。但这个技术我们知道明确能解决一个非常具体的问题,我们就把特别需要解决这个具体问题的客户先作为科技产品的践行者,验证这个没问题我们就把这个技术引过来。”

2、以轻带重

“Rokid在2021年推出的AR产品,并不是真正意义上的AR,它是眼镜形态,也可以叫它智能眼镜。它的定义是非常轻的,不是重量轻,比如说观影、娱乐,还是回到旧生态,大家把佩戴舒适性放在第一位。然后逐渐的,眼镜能不能加一些比如空间定位,我们听到很多用户的声音,再把这些声音变成产品的结构,所以这个叫以轻带重,这是一个非常具有历史意义的东西。”

3、以硬带软

“以硬件为载体来不断验证软件能力,为公司带来现金流收入的同时,能够投入更多精力开发软件系统。我不做别人已经做得非常优秀的东西,即便我跟他做得一样优秀我都不会碰,这是一个基本原则,因为我没有必要去浪费社会的资源和人的才华。我们要做就做别人做不到或者做得到,但做得不够好,我们可以做得更好的东西。”

结语

纵观这些年的AR市场,相比传统科技、手机巨头,创业公司似乎更为激进,更敢于创新。

面对大厂都保守谨慎的当下,以及这条全新的赛道,创业公司往往要承担更大的风险和不确定性,而这些往往是致命的。

“我觉得如果我是那些大公司可能也会做相同的决策,一家企业的发展,什么时候比较健康或者符合我们的预期,它有能够不断的推动自己往前发展的力量就够了,过大过小都不一定是好事。尤其是对于制造型的企业,对于硬件产品型的企业还是要遵循客观的规律,你的品牌分销、营销、用户场景、用户价值之类的东西都需要考虑到。”

“但是对于Rokid来说,50万台、100万台、200万台可能就是一个非常好的能够保持自己健康往前循环的结果,但是放到大公司可能就非常尴尬,所以时间不完全是技术决定的,还跟他的使命,跟他整个团队所能够获得到的支持也有关系。”

在Misa看来,当下,就是创业者最好的时机。引用埃隆马斯克的一句话:“创新就是企业最大的门槛,而不是供需,你今天所有的守旧的东西未来都会变成你的枷锁。”

0 阅读:7

VR陀螺

简介:一家让你对虚拟世界有想法的媒体