近日,国际领先的3D生成大模型公司影眸科技宣布完成新一轮数亿元人民币融资。本轮融资由凯辉基金、上海国投先导领投,老股东持续跟投。光源资本担任独家财务顾问。此轮融资汇聚国资战略资本、国际产业资本及顶级财务机构,构成多元资本阵容,彰显了全球资本市场对影眸科技技术路线、全球化商业化能力和长期增长空间的持续信心。
影眸科技成立于 2020 年,是全球最早定义3D生成底层框架的团队。公司核心产品Hyper3D,以3D生成大模型Rodin为引擎,定位于面向真实工业流程的高质量、可控、生产级(Production-Ready)3D资产生成,能力覆盖生成、编辑、分件、修复与复用的完整链路;并全面接入全球主流3D DCC软件,深度适配专业设计师的真实生产流程。
公司基于底层模型能力独家推出自然语言编辑3D EDITING、递归分件BANG、可控生成3D ControlNet等核心功能,使3D生成不再是一次性输出结果的“随机抽卡游戏”,而是逐步走向结构精度可用、编辑流程可控、结果可交付的创作工作流。
公司方面表示,此次融资将用于影眸科技进一步推进3D大模型前沿探索,加速其核心产品Hyper3D Rodin在全球市场的商业化拓展,并发力深耕游戏、电商、3D打印、工业设计、具身智能等垂直行业场景。

Rodin Gen-2.5 开创3D生成“Thinking”时代,多项能力断代领先
伴随本轮融资,影眸科技同步发布最新一代模型Hyper3D Rodin Gen-2.5。这是全球首个具备千万面级生成能力的3D大模型,首次将类大语言模型的“先思考、再生成”运行逻辑引入3D生成领域,并同步推出全球首个12K精度的原生3D贴图模型——生成效果在几何精度与材质保真度上已可超越实景扫描。
公司披露,Rodin Gen-2.5上线首月,订阅用户与年经常性收入(ARR)的环比增速均超过400%。
[12K.mp4]
“图像和视频解决的是‘看起来对’,而3D产业真正需要的是‘用起来对’。”影眸科技CEO吴迪表示,“3D生成的价值不在于生成一个看起来不错的结果,而在于交付一个能直接进入生产流程的资产。这也是为什么我们从第一天起,就把可控性、而非观赏性,作为模型的第一目标。”
在具体能力上,Rodin Gen-2.5提供五档可调的思考深度(Thinking Effort),生成耗时在4秒至80秒之间可控,对应从快速草稿到千万面级高精度资产的不同生产场景:
• Extreme-Low 模式约 4 秒即可完成简单资产的初稿生成,适合快速原型与批量测试,以及 UGC 场景;
• Low 模式约 9 秒,输出结构干净整洁的资产,适用于干净资产与小型硬表面道具的日常量产;
• Medium 模式约 20 秒,结构与细节均衡,综合表现最优,适合中等复杂度的角色创作;
• High 模式约 40 秒,提供结构更丰富、表面更平滑的高质量资产,面向 3A 游戏主角与影视级制作;
• Extreme-High 模式约 80 秒,在模型层面实现雕塑级超高细节还原,可精确呈现皮肤微结构、纹理、毛孔等特征,满足特写渲染、收藏级 3D 打印、数字雕刻等对精度要求最高的场景。
同一套模型自适应响应从创意探索到生产交付的全链路需求,这正是 Gen-2.5“面向不同生产场景自适应”能力的核心体现。

底层创新:从CLAY到Gen-2.5,从生成到思考
Gen-2.5 的核心架构创新,是把“表征长度”从一个固定参数变成了一个可学习、可伸缩的变量。模型不再为所有物体分配等量算力,而是像 LLM 做推理时扩展那样,按对象复杂度自适应分配计算预算。自适应的可调节Thinking Effort 为未来实现与图像生成模型类似的、与LLM的深度结合提供了可能性。这一策略最早在影眸的CLAY框架中被提出。
2024年,影眸团队提出全球首个产品化的3D原生大模型框架CLAY(《CLAY:用于创建高质量3D资产的可控大规模生成模型》),通过算法和框架层面的底层创新,将3D生成效果从“不可用”拉到“可用线”。影眸由此定义了全球3D生成的“可用性拐点”,并推动行业技术路径从“2D升维”转向“3D原生”。该研究提名当年计算机图形学顶级会议SIGGRAPH 最佳论文。
影眸科技CTO张启煊介绍,近期受图像生成与LLM结合的相关研究启发,开始重新重视类LLM的Test-time Scaling 策略。通过引入该策略,Gen-2.5实现了生成时间从4秒到 80 秒的控制。从效果上看,Gen-2.5在Medium模式下(20秒),能够全面达到上一代40秒的生成质量;在较长时间(80秒)的“思考”下,可生成极致细节量的模型,远超市面其它模型水平,极大拓展了专业3D生产流程的后期空间。
“3D生成的落地运用,已经从追求观赏质量,迈向了可控、效率与质量并重,更贴近实际生产的下半场。”张启煊表示。
全球首个12K原生3D贴图模型
Rodin Gen-2.5同步推出全新的3D原生外观生成模型。它通过冻结物体表面光场,将参考图像中实际看到的外观(包括光照、纹理和细节)直接记录并绑定在几何表面上;同时利用几何条件的稀疏体素 VAE,将 2D 图像与 3D 外观统一到同一潜在空间,使图像可直接注入为3D表达;在此基础上,再通过基于 Transformer 的生成模型,在已观测区域严格还原参考图像,在未观测区域进行一致性补全,从而实现既忠实于视觉感知、又可扩展为完整三维的外观生成,在生成质量上超越了行业普遍采用的“多视图投影”方法。
新贴图模型具备图像生成级别能力,可实现材质纹理无死角覆盖,文字效果提升显著,支持基于物理的 PBR 材质。配合同步推出的12K原生3D贴图模型,生成效果在几何精度与材质保真度上已可超越实景扫描,断代领先行业水平。
由于采用了与几何模型一样的Thinking Effort设计,该贴图模型的生成时间同样可控,最快可以将几何+贴图整个流程压缩到5秒。
企业级路线,正在重新定义AI公司的价值标尺
在AI行业,一个共识正在形成:决定一家公司长期价值的,不是它拥有多少用户,而是谁在为它付费。影眸科技此轮融资与新品发布,正值市场对AI公司价值的评判标准发生变化之际。
过去一年,企业级(B端)营收的质量与可持续性,正逐步取代消费级用户规模,成为衡量AI公司长期价值的核心维度——以Anthropic为代表的企业级路线被广泛视为这一趋势的典型样本。分析人士普遍认为,相比消费订阅模式,以企业客户为核心的收入结构通常具备更高的黏性与盈利能力,也更容易获得资本市场的估值溢价。
影眸科技的商业化结构,正契合上述企业级路线的核心特征。与依赖消费端流量的打法不同,影眸自成立起便以专业用户和产业客户为核心:据公司提供的数据,约80%的收入来自海外市场,其积累的B端客户营收超过同赛道其他公司的总和,客户覆盖游戏、电商、具身智能、空间计算等多个高价值场景。
从英伟达创始人黄仁勋CES主题演讲的3D资产生成工作流,到全球第二大家居建材零售商Lowe's遍布1750家门店的数字化项目,再到OpenAI首届Codex黑客松的冠军作品——Hyper3D Rodin已出现在这一时代最具标志性的技术现场。在工具链层面,Unity AI Beta、OctaneRender 等专业引擎,以及Canva、Figma等设计平台,亦先后接入其能力(上述信息来自相关公司公开披露)。公司认为,这类高标准、高密度的专业场景对生成精度、可控性与工程化适配的要求极为严苛,相关采用情况印证了产品在最高标准产业流程中的实际可用性。

全球第二大家具建材零售巨头Lowe's,采用Hyper3d Rodin高效落地超30000个SKU的3D资产目录搭建,建模仅需分钟级完成,单个模型成本控制在1美元以内。Hyper3d与NVIDIA一起,助力Lowe's打造全球1750余家门店的数字孪生,如今每月有超过1亿用户线上逛店看到这些模型。这是AI 3D生成进入主流零售数字化场景的首个案例。
效率是这一模式的另一支撑。影眸科技建立了3D生成领域的顶级科研实验室,是唯一连续多年获得国际图形学顶级会议SIGGRAPH最佳论文及提名的商业公司,其算法团队每2人中就有1人获得或提名过最佳论文,约70%科研成果实现产品转化。公司目前团队规模约60人,整体运营人效比极高。
影眸科技创始人兼CEO吴迪表示:“3D生成的赛道正在收敛,而收敛意味着,最终只有少数真正解决了产业问题的团队能留在牌桌上。过去一年,市场习惯用用户规模和增长曲线来衡量一家AI公司的价值。但我们从第一天起就清楚,3D生成是游戏、影视、工业设计乃至物理世界智能化都绕不开的底层能力,这不是一场比谁跑得快的流量游戏,而是一场比谁扎得深的长期竞争。我们服务最专业的用户,解决最真实的生产问题,这个选择决定了我们今天的领先,也决定了我们未来要去定义、而不只是参与下一代3D生产工具的规则。”
吴迪表示,未来将继续推进原生3D大模型的技术迭代,围绕可控生成深化产品能力,并加快全球市场的商业化拓展。
查看更多项目信息,请前往「睿兽分析」。







