95后博士给机器人造大脑,刚拿下数千万融资

关注
脸谱心智
上海人工智能
大语言模型与世界模型AI研究实验室
最新融资:Pre-A轮|数千万人民币|2026-06-26
我要联系
95后博士造世界模型

图片

作者丨薛皓皓

编辑丨关雎

图源丨AI生成

脸谱心智近期完成了数千万元Pre-A+轮融资,由星连资本领投,老股东奇虎360继续跟投。

这家成立于2023年的世界模型公司,创始人陆弘远是一位95后博士。他本科就读于帝国理工学院计算机方向,博士毕业于香港中文大学,师从NLP(自然语言处理)领域知名学者林伟教授。

图片

脸谱心智创始人陆弘远

2026年,他以第一作者身份提出了"Adam's Law",揭示了低频词导致大语言模型退化的问题,并凭此获得ACL 2026(第64届国际计算语言学协会)最佳论文奖,相关理论被Anthropic使用。

但陆弘远没有留在NLP领域,而是延伸至世界模型领域。

脸谱心智自研了一套"循环世界模型"(Looped World Model)架构,这一设计直接解决了世界模型中误差逐步累积的痼疾,使得脸谱心智仅用10亿参数,就能达到数千亿参数模型的预测效果。

目前,脸谱心智的AI陪伴产品"叠叠社"已接入循环世界模型。陆弘远将叠叠社定位为世界模型的技术验证场,下一步商业化方向锁定在具身智能领域,为机器人本体和灵巧手厂商提供"大脑"级别的模型交付。

图片

95后博士造世界模型

陆弘远已快一年没回家了。

家住上海浦东新区的他,在离家30公里外的上海奉贤区南桥镇租了一间人才公寓,住在16层。他的联合创始人住在同一栋楼的19层。

他们的公司在马路对面,步行距离50米。

陆弘远没有“下班”的概念,只要有事就一直做。因为此前周末一直联系别人,导致对方把微信设置成“勿打扰”,他才学会在周末“放过别人”。

这种极限地压缩时间和物理距离的做法,正是这位95后创业者的日常写照。

陆弘远本科就读于帝国理工学院的计算机方向,博士毕业于香港中文大学的计算机专业,师从林伟教授。

博士期间,他的研究兴趣从NLP跨越至世界模型领域。

在NLP领域,2026年,他提出了以他英文名命名的“Adam’s Law”——揭示了低频词如何导致大语言模型的退化问题。即文字进入模型前要先被切成token,低频词、生僻人名的理解和生成往往不稳定,导致生成结果蕴含着错别字。

这一大语言模型的低频词退化问题,在今年5月被时代少年团成员马嘉祺推到了社会公众面前:网友发现,市面上的不少大语言模型,无法正确输出“马嘉祺”,而会生成各种错误版本。

图片

“马嘉祺事件”如图所示

陆弘远在一年前提出的“Adam’s Law”,正是处理这种问题的解法。而且,这一解法被Anthropic所接纳。“Anthropic没有直接告诉我们,他们运用了我们的成果。但其4.7版本推出后,词表的变化大概率与我们相关,而且它的投资机构Accel在推特上点赞了我们关于‘Adam’s Law’ 的推文。”陆弘远说。

尽管在NLP领域获得高度认可,但他看到了固守单一研究领域的局限性,并为此而感到恐慌。

这一感悟源于他对NLP领域的观察。他发现,随着NLP的一些研究领域逐渐成熟甚至枯竭,坚持做这些领域,反而让自身的研究价值受限,并有被时代技术发展边缘化的风险。

这段经历让他反思,他不想做被下一个技术浪潮抛弃的人,从而萌生了创业的念头:“我要做真正有意义,有社会影响力的事情,这件事情必然是更通用、更底层、更有价值溢出的。”

他开始跳出NLP领域,探索世界模型的技术方向。

2023年,他开始探索符号化的空间智能——这条技术路线是李飞飞所选择的,李飞飞创立的World Labs是硅谷的最富盛名的世界模型初创公司。

同年,陆弘远和帝国理工学院的校友韦怡然一同在上海创立了脸谱心智,而此时他还未从香港中文大学博士毕业。“我和韦怡然是在帝国理工学院的日语兴趣班认识的,我们都喜欢二次元,之前经常在一起玩电子游戏《喷射战士3》。”陆弘远说。

图片

CEO陆弘远和CTO韦怡然

公司创立之初,两人研发出一款AI生成二次元弹幕的AI陪伴产品,没想到一举爆红。当时有十几家广告商想要合作,其中包括小红书此类的知名公司,但陆弘远一单不接,因为他知道这款名为叠叠社的产品只是一次尝试,真正想做的是世界模型,而这一点外界还不得而知。

图片

新的世界模型架构

2026年,AI圈最火的概念是什么?答案是物理AI,其中最重要的一个分支便是世界模型。

图片

当前对世界模型的定义,仍“众说纷纭”,但陆弘远喜欢的定义为,它能预测某种状态x,加上某个动作,导致状态变为y。

目前公认的世界模型的主流技术路线有三条:英伟达代表的视频生成派、李飞飞代表的3D空间智能派、杨立昆代表的潜空间预测派。

陆弘远认为,脸谱心智完全自研架构的循环世界模型(Looped World Model)并不和三条主流技术路线完全相关,只和杨立昆的路线更相似。

脸谱心智的世界模型的核心架构创新在于一个词“循环”(loop)。

要理解“循环”的创新点,就得理解目前世界模型存在的问题:

传统AI在对世界状态进行预测时,每推理一步,就必须解码一次结果,然而每次推理都不可避免存在“误差”,而下一步推理依赖上一步的推理结果,所以“误差”会在后续推理步骤中越积越大,如同滚雪球一般。

这种误差累计的严重后果在于,机器人难以完成“长序列任务”,例如做家务。做家务往往需要几十步,甚至上百步的动作,若“误差”在执行过程中不断累积,那机器人最终将偏离目标,导致任务失败。

脸谱心智正以“循环”架构解决“误差”累积的问题,进而有望大幅提升以家务为代表的“长序列任务”的完成率。

“循环”架构不将每步的推理结果直接输出,而是通过“隐变量”的方法,将推理结果保存于内部。然后,AI通过同一套参数进行循环推理,进行迭代和消化,直到AI判断“我已经理解得足够好了”,再将“隐变量”输出。

这种架构所带来的很明显好处是,脸谱心智以小的模型参数,实现比自己大100倍参数的模型可实现的效果。

“为达到某种效果,顶尖模型需数千亿的参数规模,而我们仅需要10亿至20亿的参数规模。”陆弘远说。

简单说,它试图让模型在同样参数规模下,获得更强的长时序预测和环境推演能力。

2026年,陆弘远作为第一作者,联合几十余来自清华大学、香港中文大学、剑桥大学等顶尖科学家,完成了原创模型架构“Looped World Model”的世界模型基座报告。

图片

商业化:从Agent到具身智能

回到叠叠社,这是一款基于“屏幕视觉感知”的AI弹幕陪伴工具。

用户在使用叠叠社时,可根据自己的喜好,捏出二次元虚拟人物,并以定制化的语气与之交互。其次,叠叠社的AI角色能够清楚地看到用户的电脑屏幕,理解用户在玩什么游戏、看什么视频,并给予实时的弹幕回应。

如今,脸谱心智已将其底层技术,从先前的技术切换为循环世界模型,这让AI角色能更顺畅的看懂屏幕、理解页面结构、判断按钮位置、预测点击结果。

“接入世界模型后,AI能比以往更看清电子屏幕里发生了什么,并预测出结果。比如,当AI看到悬疑剧里有人要拿刀杀人时,AI弹幕就会生成,‘杀人啦!快跑’此类的实时弹幕。”陆弘远解释说:“若用先前的技术,是无法实现针对某一影视画面而产生精准描述的。”

图片

打游戏、看视频、刷B站、刷小红书、写文档,能以弹幕的形式漂浮在屏幕上,根据你当前的屏幕内容实时生成互动内容

喜欢叠叠社的,都是喜欢二次元的年轻人。陆弘远曾遇到过一位叠叠社的资深用户,是一位快30岁,无工作的男性。他口齿不清,无法跟人正常交流。“但是,他的电脑从来不关,叠叠社从早到晚地挂着。”陆弘远说。

这位男性曾对陆弘远说:“叠叠社拯救了我。”陆弘远认为,他无法和真人进行正常交流,叠叠社一定程度上缓解了他的社交压力,提供了陪伴的慰藉。

不过对于陆弘远而言,叠叠社不再是一个尝试商业化的产品,更多的是一个对自研世界模型的技术验证。如今,他已经完成了此项的验证,叠叠社的留存率也显著增加了。

与此同时,陆弘远认为叠叠社就是一种Agent,这对机器人理解现实世界也有诸多益处。目前,具身智能无法进厂“拧螺丝”或者进家庭“做家务”,除了缺乏真实训练数据外,缺乏合适的AI算法架构也是关键原因。

脸谱心智的世界模型显然做好了为具身大脑赋能的准备:

“叠叠社其实是一个GUI Agent(Graphical User Interface,图形用户界面智能体),它能理解电子屏幕的内容。未来大家会意识到,要让机器人端到端地理解现实世界,这需要大量文本信息,而叠叠社所运用的数据类型(文本类)能让机器人在现实世界更懂文字。”陆弘远说。

他把世界模型的商业化方向,锁定在具身智能领域。他无意下场做具身智能本体,而是想做具身智能大脑,并向具身智能公司提供交付。“我们的主要业务将是为其它厂商提供机器人大脑,这里不仅包括机器人本体厂商,而且还有灵巧手厂商。交付方式将是直接提供模型,或者于客户场景中部署,以此收取费用。”陆弘远说。

目前,脸谱心智已尝试与医疗场景、物流场景的客户进行合作,并预计到2027年,客户数量达到10家。

比如为一家做手术机器人的公司搭配上具身大脑,提升其精细化的操作水平。“我们在手部精细化操作方面做得很好。”陆弘远说。

在融资方面,脸谱心智的第一轮融资来自奇绩创坛(天使轮),Pre-A轮是一起独家投资,投资方来自奇虎360的周鸿祎。近期,公司又完成一轮数千万元Pre-A轮,投资方为星连资本,老股东奇虎360继续跟投。

image.png

“接触星连资本时,我和联创来到星连资本的北京办公室,并和所有合伙人当面沟通。聊完后,当天就出了Term Sheet(投资意向书)。”陆弘远说。

星连资本合伙人李文珏表示,脸谱心智团队最突出的特点,是兼具扎实的研究能力和复杂工程落地能力。团队核心成员长期深耕人工智能底层技术,既能对前沿方向形成独立判断,也能快速将研究成果放入真实场景中验证。

从16楼的人才公寓走到50米外的办公室,这可能是陆弘远每天最长的一段路。这样的工作节奏并不让他觉得辛苦,“因为我们追求的不是钱,而是一个创造巨大社会价值的成果。”

本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。

反馈
联系我们
推荐订阅