一个从百度走出的创业者,想要消灭所有APP

2024-01-19
今年初第一个爆火的AI硬件

编者按:本文来自微信公众号 新硅NewGeek(ID:XinguiNewgeek),作者:董道力,编辑:张泽一,创业邦经授权转载。

2024年CES展上什么最火?那一定是扬言“干翻所有APP”的兔子——rabbit r1。

距离产品发布不过一周的时间,rabbit r1就预售出40000台,第5批的预定交付日期已经到了今年中下旬。

按照199美元一台来算,等于说第一个礼拜就入账800万美金。

产品的火爆,远远超出了创始人吕骋(Jesse Lyu)的预期。在rabbit公司官方twitter上,他们预计如果能卖出500台就谢天谢地了,谁曾想到第一天就卖了10000台。

图片

rabbit r1造型极为简单,只有一个巴掌大小,除去触控屏外,物理按键也仅有一个对讲键和一个滚轮。

但它的功能极其强大,通过语音的方式,调用手机上的一切APP,也就是最近大热的“AI Agent”。

对这款产品的定义,吕骋称之为“用户与智能手机之间的中介”,利用AI来改变未来用户与应用程序交互方式的设备。

图片

在rabbit r1的产品发布视频中,吕骋身着全黑装束,充满热情地介绍着这款产品的功能。他戏谑地评论道,当今的手机应用数量庞大,实现一个目标时不得不频繁在各个应用之间切换,这过程过于繁琐。正是这个原因促使他推出了rabbit r1。

这个消灭所有手机APP的想法,十年前就扎根在吕骋心中。

图片

喜欢编程的电竞选手

吕骋,1990年出生于西安,是一名充满活力和创造力的连续创业者。他的教育背景跨越多个国家,高中时期曾在新加坡交换学习,后来在西交利物浦大学主修市场营销和金融数学。

商科背景下,吕骋同样是个电脑爱好者,6岁开始接触编程,还曾加入过魔兽争霸半职业战队并参加全球总决赛。

第一次创业是在大学期间,吕骋和几个同学一同创立了Timeet,用户可以在其中上传自己的时间安排,并可以发现拥有相同闲暇时间的其它用户。

该产品至今仍在运营,被称为基于时间管理的新型社交产品。

吕骋对自己的日程安排极其紧凑:早上去上课;中午写作业;下午结课后去运动;晚上打电子竞技比赛;然后回寝室开始写代码,做Timeet;做完Timeet就补觉,最多3小时;凌晨,开始和中国投资人打电话谈合作,因为中英时差问题,往往是打完电话就要去上课了。

然而,即使在这样的情况下,吕骋仍然疯狂地坚持了两个月,并成功拿到了多所世界名校的录取通知书。

但本科毕业后吕骋放弃了继续深造,转而创立渡鸦科技(Raven Tech)。

渡鸦科技,专注于开发AI驱动的操作系统“Flow”以及创新的智能硬件,最初的设想,是类似如今小爱、小度这类“智能家居中控台”的产品。

这种化繁为简的理念在2014年就吸引到阿尔特曼的YC等一众投资者的关注。

据报道,真格基金联合创始人王强见到吕骋的智能交互平台Flow雏形后,直接站上了桌子全场寻找“最后演示的那个小孩儿在哪儿?!”,然后把吕骋拉到会场角落,当场就给出了百万美金的投资意向。[2]

图片

渡鸦科技宣讲会

Project Flow就是将现有应用通过语音识别搜索的方式接入到用户对话页面中。用户可以在聊天界面对Flow发出指令,Flow 响应之后会直接搜索出相应的结果卡片或者结果列表,并可将结果分享给好友。

这实际上就是如今的Agent逻辑,只不过受限于时代和技术,吕骋仍然将产品重心放在了分享等社交属性上。

最终落地的app,则是乐流(Music Flow)。这是一款极简主义APP,整个页面没有任何按键,按住屏幕任意位置,说出你想听的,乐流就会在50毫秒之内播给你听。

图片

乐流页面

他说,回到初衷,人类在科技上做出的所有努力的终极目的都是自我解放,而在这个漫长流程中又不断出现了新的枷锁。既然现在点火只需几秒钟,我们应该利用好科技为我们省下来的数个小时,去吸收新的知识,探索新的未知。[6]

图片

吕骋采访照片 图源:智东西

知乎上有一个问题:在渡鸦科技工作是一种怎样的体验?员工黄恺昶如此回答:“他要求他的公司充满艺术气息,他会因为员工漠视艺术而发怒,他不能容忍艺术被忽略,他要把他的公司装修成最有艺术气息的。”

另一位名为八画生的知乎用户提到,“渡鸦开会大多数是站在一起欣赏艺术品,或鉴赏毕加索的《梦》,或探讨顶级名表的宝玑针。”

“有一次,吕骋用邮件与所有员工分享了一部他看了之后泪流满面的纪录片,却因大家未及时观看,而大发雷霆,为漠视艺术、漠视精品的态度发怒,不惜利用办公时间,找来投影和大家一起看了这部90分钟的纪录片。”[5]

图片

渡鸦科技办公司

也正是在创办渡鸦科技的同时,吕骋遇到了他命中的贵人——曾任百度总裁的计算机专家,陆奇博士。

在接受Xtecher采访时,吕骋表示,他和陆奇2014年底相识于美国。彼时,渡鸦刚创建不久,经朋友推荐,他给陆奇写了一封邮件,后者时任微软全球执行副总裁,却很快回复了吕骋并约见面谈。

吕骋陆奇充满尊敬和仰慕:“当你去跟他谈论一件事情的时候,他总是把它上升到哲学的高度,去跟你讨论fundamentally this is what(基础是什么?),我觉得这对我日后的思维和决策有非常多地启示。”

吕骋回忆,他们有好几次见面都发生在周末的微软大楼里,“那栋楼都没什么人了,他一个人开个破车、穿个拖鞋,走过来把整个大楼的门打开,和我坐着聊一下午。”

虽然和陆奇聊天的机会并不多,但每一次都给他带来更深层次的思考,“往往不是求学式地对话,而是平等地交流。He is a truly experienced person.”

图片

也许正是这一场相识,让之后百度收购渡鸦科技水到渠成。

2017年,该公司被百度全资收购,吕骋随后成为百度智能家居硬件总经理,向百度原集团总裁和COO陆奇汇报。在百度期间,他负责开发raven H智能音箱,该产品以其独特的设计和功能在市场上引起了极大关注。

图片

在2018年,吕骋带着他的智能音响来到CES。在接受采访时,他拿下音响上的“配件”,自豪的告诉当时zealer创始人王自如,这个小东西才是本体。

此时吕骋的双眼盯着王自如,似乎在享受王自如脸上的惊讶。

图片

吕骋一直都想开发一款iPhone那样的“定义型产品”,以取代手机。[8]他希望为音箱赋予迷人的魅力,他还在伦敦注册了一家名为Twelve的营销公司,聘请瑞典设计公司Teenage Engineering负责音箱的设计和功能。

2018年陆奇离开百度后,吕骋追随其步伐开始了新的创业。

在发给百度公司高管及团队的告别邮件里,吕骋对公司及李彦宏等高管给予自己和渡鸦业务的支持和帮助表示了由衷感谢。他表示,自己过去一年多在百度的工作是非常开心和幸福的,在百度的段经历也注定终身难忘。

图片

同年,吕骋在加利福尼亚启动了他的新项目rct studio——下一代沉浸式交互娱乐体验。

当时,Netflix上线的互动电影《黑镜:潘达斯奈基》(Black Mirror: Bandersnatch)为玩家提供了一个独特体验:他们可以代替主角,在不同事件中做出选择,探索多种故事线路。

该剧集上线上引发了互动视频的热潮,但吕骋并不看好互动电影现在的形式,并试图改变。

他认为从互动性的角度出发,通过遥控器在有限选项中选择剧情,并不是互动电影的终极形态,这种方式对观众体验而言,显得有些割裂。

在他的rct studio的构想中,他们设想用户能够完全沉浸于故事环境之中,通过自然语言和肢体动作与影视画面互动,参与者将享有更大的自主决策空间。每一个动作和选择都能即时转化为相应的3D视图,从而推动故事的进展。

图片

凭借着这一个项目,吕骋也成为了YC China第一批学员。

而此时担任YC China的负责人就是陆奇,YC的总裁,正是现在的大红人阿尔特曼。

消灭一切APP的AI硬件,再次创业,AIGC风口已然爆发。

rabbit r1并不是吕骋的第一款AI产品。它的前身是一家名为c的AI创业公司,该公司于2023年1月发布了AI技术预览Quantum Engine。

这个引擎允许用户通过自然语言与NPC角色进行互动,并由AI实时生成剧情互动。这一技术的推出引起了广泛关注,并被认为是下一代操作系统的基础。[10]

图片

产品演示,用户扮演救世主尼奥,AI 扮演 NPC 墨菲斯,按住 F 键就可以开展跟它的对话,在移动设备上可长按屏幕说话互动[12]

但大模型和Agent领域的突破带来了新的机会,吕骋的公司改名为Cyber Manufacture,并全身心扎根在基于AGI的下一代操作系统上。

据天眼查报道,去年十二月,Cyber Manufacture宣布完成第三轮融资,金额达千万级美元,这一轮融资由美国科技富豪、风险投资家Vinod Khosla(曾经投资过OpenAI)领投,老股东Synergis Capital跟投。

于是在CES2024上,吕骋带来了试图消灭所有app,改变交互模式的rabbit r1。

图片

rabbit r1售价199美金(1430人民币),没有订阅费,并且可以无限制使用GPT4。

而GPT4的订阅费每月就需要20美元,某种意义上只要用十个月rabbit r1就等于回本了。

这并不合理,怎么看都不像有钱赚的样子,更像是吸引用户接受一个全新的概念。

这款硬件的成本基本都在软件开发上,零部件主打一个够用就行。

rabbit r1的官网上提供了一张r1的简易配置单——

搭载2.3GHz联发科P35芯片,在手机市场上连千元机都看不上。

4GB的内存和128GB的存储空间,随便一款学习机都能吊打,支持蓝牙5.0、Wi-Fi和4G网络。显示器为2.88英寸的TFT触摸屏,摄像头为800万像素,并配备一个2瓦的喇叭。

图片

这个配置相当于什么呢?仅从核心配置上来看,2018年12月发布的小米play刚好就是这个配置,起售价1099元,还送一年的流量卡(10G/月),也就是说放到2018年,这款硬件的配置都是入门级水平。

图片

5年后的2024年,在海鲜市场上,小米play还能卖二百块钱。

图片

但它的功能并不需要多少配置,毕竟它的大模型是部署在云端,本地就等于只是个显示工具罢了。

用一句描述rabbit r1的话,那就是可以学习如何操控任何APP的siri,并且智能水平和chatgpt持平。

我们先来根据产品演示视频复习一下rabbit r1的功能。

  1. 可以登录常见app,进行操控;

  2. 教学模式中,可以让r1学习如何操纵任何app;

  3. 长按对话键,可以实现基于GPT的语音问答(据说比其他模型反馈速度快10倍);

  4. 实时联网,可以查看实时股价;

  5. 通话时可以双向翻译;

  6. 有摄像头,可以实现视觉识别功能(可以识别电脑上的表格,冰箱中的食材)。

rabbit r1的演示视频展现的功能中,我们大致可以将其分为两种。第一种就是控制手机app,第二种就是一个gpt4助理。

我们先来看一下第一种,也是核心卖点,操控手机app。

rabbit r1操控手机app的能力源于其内置的“全新的基于AI的系统”——基于大型动作模型(Large Action Model,LAM)打造的rabbit os。

图片

LAM是一种结合了神经网络和行为学习的新技术。不同于ChatGPT这样的大型语言模型(LLM),LAM重点在于学习和模仿动作。

它通过观察人们如何使用各种应用程序的界面,学习并复制这些动作。即使界面有所不同或稍有变化,LAM也能适应并准确地执行任务。

简而言之,我们的手机app在视觉上有各种按钮、特效、文字,而计算机眼中是一个个方块。LAM就是学习手机上每个方块的含义、逻辑关系,并进行操控。

图片

其实这也不是什么独家技术,就像gpt3.5前还有gpt3、gpt2,自动化操控手机app很早就有公司在研究。

举个例子,在游戏自动化测试领域中,网易就开发了一个Airtest套件,基于视觉识别自动化操作手机游戏。但这个套件的功能实现还需要开发者自己编写代码。

图片

可以认为,rabbit r1的学习模式,就是用LAM写了一个操控手机app的代码。

人们将从“鼠标点击、手指触摸来操作系统的交互方式”切换成“用自然语言对话的方式来驱动系统交互”。

根据rabbit r1的官方消息,rabbit r1已经支持“常用”的一些app,比如airbnb、uber、spotify等。

如果这个功能可以真的和发布会演示的那样成熟,199美元好像也不是很贵。

rabbit r1的另一种功能类似gpt4助理,演示视频上,r1可以用来语音交互,用户可以像r1提出任何问题,并且r1的响应速度比gpt4快10倍。

图片

吕骋通过询问r1可口可乐公司的股价,来展现r1的联网功能

此外借助摄像头,r1可以完成视觉交互。如用户可以让r1扫描一下冰箱的食材,并让r1提供一个低卡菜单。

图片

在办公领域,r1也有相对应的功能。用户通过r1上的摄像头可以识别电脑上的表格,并用自然语言指令进行操作,结果会以邮件的形式返回。

图片

功能确实强大,但还有一个根本性的问题——

人们确实厌倦了在各个app之间来回切换,但为了免除这种麻烦就需要往口袋里多塞一个硬件。

这真的值得吗?

参考资料:

[1]【Xipool人物】身价过亿的西浦学长,怎么能没有一期专访?——吕骋(上) | 西浦在线团队

[2] 曾经1分钟拿到真格投资的渡鸦科技被百度全资收购,进一步打造智能交互平台 | 真格基金

[3] 渡鸦科技吕骋:据说智能家居不统一的问题被这位留英学霸搞定了 | 智东西

[4] 吕骋:创业就要不走寻常路 | 想食乡食

[5] 吕骋:我们动了太多人的奶酪 | 商业人物

[6] 人物:黑客?艺术家?吕骋和他的渡鸦科技 | 创就津生

[7] 渡鸦科技被百度收购,故事的起因、经过、结局|Xtecher特写 | Xtecher

[8] 从10万台到1万台,百度智能音箱计划是怎么失败的 | 腾讯科技

[9] 渡鸦科技创始人再创业,「rct studio」用AI引擎做沉浸式全互动娱乐 | 菁玲

[10] 华人AI创业公司Cyber Manufacture Co. 完成千万美元级融资 | 青峰君说

[11] 一线独家|渡鸦科技创始人投身AI,获OpenAI首位投资人投资 | 腾讯科技

[12] AIGC加持游戏剧情,无限故事的游戏交互体验来了 | 机器之心

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。