
图源丨Midjourney
在AI生成3D的赛道上,当科技巨头们还在比拼谁能生成更炫酷的模型时,一个以00后为主的国人团队,却悄然将自己的产品塞进了全球顶级企业的生产管线。
在今年的CES上,英伟达CEO黄仁勋在12K高清大屏上展示的20个机器人画面,其背后的3D生成任务正是由这家名为“影眸科技”(Deemos Hyper3D Rodin Gen-2)的公司完成。

创始团队成员,吴迪位于中间
世界第二大家具建材零售巨头Lowe’s,为了给全美1750多家门店构建数字孪生世界,也将影眸的Hyper 3D内的Rodin模型(Hyper 3D是公司产品平台,Rodin是其中的3D生成模型)接入了其工作流,将单个3D模型的生成成本压缩到不到1美元。
从2020年成立,到后来经历至暗时刻,再到如今被英伟达、Lowe’s等国际巨头“反向选择”,影眸科技用了6年时间。
在字节跳动、腾讯等大厂纷纷入局的背景下,这家于2025年宣布完成两轮融资(A轮及A+轮融资,融资额均为数千万美元,投资方包括红杉中国、蓝驰创投、字节跳动、美团等)的创业公司,选择了一条垂直赛道的道路:他们不追求生成结果的随机惊艳,而是死磕工业级生产的“可用性”,为产业装上了一把能够“指哪改哪”的3D“橡皮擦”。
01技术不等于市场
2020年,创办影眸科技的时候,23岁的吴迪(出生于1997年)和21岁的张启煊(出生于1999年)仍是上海科技大学的硕士生和本科生,不过学校鼓励创业的氛围,让他们很快“上了车”。
在创业之初,影眸就碰到一个困难:通过一台巨大的球形扫描系统仪“穹顶光场”,公司团队本想做了一个纯打光方面的产品——用户只需要上传一张照片或者一段视频,这款产品就可以根据用户需要,调整光源的位置、颜色、强度等参数。
当时团队以为可以打开市场,结果被打脸了:影眸科技当时的技术与传统的影视、游戏通用的unity系统并不兼容,在当时很难有客户买单。在这之后,团队决定,把所有2D业务线全部砍掉,全面拥抱3D。
吴迪所读专业是上海科技大学的计算机科学图形学方向,在顶尖科研资源加持下,吴迪团队能顺利将前沿技术转化为十分炫酷的技术Demo。
而后的数字人方案是,通过这台“穹顶光场”,团队能够生成细化到黑痣和皮肤毛孔的超写实数字人形象。靠着这套全流程自动化的数字人生成系统,影眸也拿到了3A游戏公司和影视公司的订单,拥有稳定的现金流。这成了当时的主要业务。

公司成立2年后,他们拿到了奇绩创坛和红杉种子基金的数千万元天使轮资金,这笔资金不仅让还是在校生的创始人们,获得了公司发展的源头活水,也让投资方的指导成为他们探索公司发展路径的重要信息来源。
然而,再酷炫的技术,如果没有足够的市场需求支撑,那么商业化瓶颈很快就会来到。随着对元宇宙难以落地的质疑增加,数字人业务的天花板已显现,而新一轮投资机构的临时撤资,令公司陷入资金紧张:一家已经谈好、SPA协议都已完成的机构,因为当时地缘政治对投资机构的冲击而在签字前几周临时撤回投资,影眸当时公司账上只剩下8个月的资金。
“科研出身的创业者,容易把实验成果吊得过高。”对于曾经碰到的挑战,吴迪反思,比实验成果更重要的,是找到科研成果和客户需求的结合。
所幸的是,在GPT发布之后,他们想到了AI在3D领域,可能有比数字人更“大”的刚需,而这也是团队可覆盖的技术领域:AI能极大地缩短3D建模的时间,甚至缩减至先前的30%,而如今AI的飞速迭代,正让3D建模师的这一梦想(或噩梦),变成现实。
正如Claude让程序员降本增效,AI生成3D正以同样的逻辑塑造3D建模。
“当时,AI生成3D的结果,看起来像一团疙瘩。”他说,这根本无法接入工业级3D模型的生产流程。
在2023年,AI生成3D模型的主流技术路线是2D升生成3D,需要AI通过2D图片,猜出3D结构,往往生成的3D模型的精度不佳,效率低。
于是,影眸的团队决定走另一条生成效果更好,却更难的技术路线——让AI直接理解3D结构,跳过2D中间件,直接生成3D。

在尝试突破更难的技术路线时,吴迪也逐渐明白一个关键的商业道理:技术不等于市场。
科研成果突破的是技术上界,而工业级产品更需关注产品的下限:客户不想在生成结果上“开盲盒”,他们在乎的是,可否在更短时间,更少花销的情况下,获得可用于后续制作流程的3D模型。
“发一篇论文,生成3D模型的成功率达到15%就是通过,但是商业产品的成功率必须达到90%,甚至95%以上,这才是让客户满意的关键。”吴迪说。
这时,吴迪刚刚从上科大研究生毕业不到一年,张启煊本科毕业不久,他们已经创业3年多了。
02给3D建模装上“橡皮擦”
尽管3D生成模型的研发成本昂贵,且公司账面资金紧张,原生3D生成模型最终还是被影眸训练出来了。
这一AI模型的核心技术框架名叫CLAY,相关论文在计算机图形学顶会SIGGRAPH 2024上,获得了最佳论文的荣誉提名。同时,影眸还成为SIGGRAPH Real-time Live! 50年来首次入选的中国大陆团队,并在现场展示模型的3D生成能力。



相比于用2D数据训练3D大模型的技术路线2D升3D,原生3D生成模型(影眸称为Rodin)让AI更懂3D结构和几何纹理,让3D模型更易被用户编辑:相当于提供了一把“橡皮擦”,赋予用户“指哪改哪”的精细控制能力。
为了让3D模型更可控,影眸研发了一系列加强可控性的功能。比如bang 和 edit。Bang 通过AI理解物品结构,将模型自动拆分为不同部件。Edit 允许用户通过自然语言直接修改、编辑3D模型。

「艺术家@豆芽AI笔记本(来源于xhs)使用 Hyper3D.AI Rodin 创作的作品」
比如创作者想把木马模型的腿换成车轮,只要选中腿部,接着输入“把马腿换成车轮”,就可以得到一个十分自然的新模型。

影眸不会对每次生成结果收费,而是只到他满意当前效果,确认模型后,才会收费。
相比于其他市面上的原生3D生成模型,影眸是唯一支持对模型拆分之后,再对某个部件进行拆分的公司。关于“bang”的论文,不仅拿了top10,还被计算机图形顶会ACM Transactions on Graphics收录。
除了学术成功,Hyper3D Rodin上线不到两个月,即获得数百万美元的ARR(年度经常性收入,Annual Recurring Revenue)。影眸的Rodin客户,也从游戏领域,扩展至影视、电商、工业设计、3D打印等领域。
公司在海外也打出了名声,许多海外客户主动接入Rodin的API接口,调用Rodin的3D生成能力。在海外极客圈内,OpenAI的首届Codex Hackathon的冠军项目,在3D生成环节就采用了Rodin。
2025年,影眸还官宣了两轮数千万美元的融资,投资方除了红杉中国和奇绩创坛两家老股东,蓝驰创投领投A+轮,字节跳动和美团龙珠两家产业投资方则共同领投A轮。

03黄仁勋、Lowe's站台
从纯打光的数字人,到推出的Rodin,被英伟达、世界家居建材零售巨头Lowe’s使用,需要花多久?
吴迪的答案,是:6年。
在今年CES上,黄仁勋的主题演讲,也用到影眸的Hyper3D平台内的Rodin模型。黄仁勋在一个12K高清大屏上,展示20个机器人画面的环节中,运用了Rodin负责3D生成的任务。

这要求Rodin在多个制作阶段保持3D模型的一致性,并呈现生动的细节纹理。
世界第二大家具建材零售巨头Lowe’s要想为其全美1750多家门店构建物理精确的数字孪生世界。要建设它,有一个完全不可能的任务——为超30000件商品创建高质量的3D模型。

Lowe’s 数字孪生商店
若按照人工方式,不仅时间消耗巨大,而且面临着天价的建模成本。
为解决这一关键的技术难题,Lowe’s 通Hyper3D平台的Rodin完成了3D资产生成。
运用这一方式,只需输入普通的2D产品图像,Rodin就能在几分钟内自动将其转换为精确的高质量3D模型。更震撼的是,这一过程将单个3D模型的生成压缩到了不到1美元。
能被纳入英伟达和Lowe’s的工作流中,这充分地证明了Rodin在3D模型生成的稳定性、精细度、工程匹配度等方面获得了巨头的验证。
此外,影眸也是国产消费级3D打印公司拓竹的第一批合作伙伴。用户能先生成各种风格的3D模型,再交给拓竹打印出实体来。
在影眸所在市场,国内外竞争者不少,不仅有同类创业公司入局,更有科技大厂涉足:字节跳动于近期推出了Seed3D 2.0,腾讯也已推出了混元3D模型。

影眸团队获得获得2025 SIGGRAPH Best Paper
对于巨头而言,3D生成只是他们AI能力的一部分,而影眸的目标是把3D能力能真正接入行业内。

吴迪认为,影眸要做的是把产品在游戏、影视等行业内扎得足够深,深入行业的生产管线,做出真正适应市场需求的产品。而现在,影眸在3D大模型的数据量和参数量,领先于大厂。
他认为,这就是影眸最核心的竞争护城河之一。
本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。







