编者按:本文来自微信公众号 游戏葡萄(ID:youxiputao),作者:托马斯之颅,创业邦经授权发布。
第一次认识宋亚宸,我们聊的还是SLG。我完全想不到,后来他会从如此另类的角度改变游戏行业。
宋亚宸生于1997年,毕业于约翰霍普金斯大学。他曾在商汤科技参与多个AI项目从0到1的孵化,实现AIGC技术在动画及游戏行业的实际落地,并作为早期联合创始人,参与创立AI新兴独角兽MiniMax。自幼热爱游戏的他,有多年的DND(龙与地下城)跑团经验,还是资深的SLG玩家,在《率土之滨》里当过盟主。
2023年,宋亚宸创立了主攻3D AI生成的VAST,如今他们的拳头产品Tripo AI已经和腾讯、网易以及多家上市游戏公司达成合作。还有更多中小团队,正在试图把Tripo融入自己的工作流中。一个可能有点夸张的说法是:如果一家游戏公司超过100人,那它大概率听说过Tripo。
Tripo的功能很简单:只要输入一段文字或者一张图片,最快不到1秒钟,它就能输出一个3D模型。最近推出的Tripo Studio工作台还能支持一键拆分、一键绑骨和简单的动画生成。这意味着它离实际研发管线又近了一步。
事实上,已经有不少大神在用Tripo创作内容。去年9月,科幻艺术家Rui Huang用Tripo辅助制作的星舰3D模型,还获得了马斯克的转发。
葡萄君也尝试了一下Tripo。作为一名业余选手,我水平实在太菜,也不会精修。只上传角色三视图,并一键绑骨、生成动画的效果,可以说是堪比「学了三年动画」系列……
总共耗时约5分钟的产物
但作为一个大学交过拙劣3D MAX作业的人,我深知想手搓一份这样的东西,自己本该付出多少血泪。而Tripo Studio的野心,是“把3D建模的工作流,从人工时代的15小时缩减至6分钟。”
前一段时间,VAST完成了数千万美金的Pre-A+轮融资。借这个机会,我们再次和宋亚宸聊了聊。
宋亚宸说,在游戏行业,高昂的试错成本,漫长的研发周期,使得创作者只能用大概20年的青春赌四款游戏——就算每一步都中了彩票,最后熬成了制作人,可能也会因为日复一日地拧螺丝而丧失创作能力。他相信,Tripo有朝一日能够解决这个问题。
聊到这些,我难免会想起蔡浩宇那段劝人转行的暴论:未来99%的业余爱好者可以为了满足自己的想法,而一时兴起创建游戏。宋亚宸也很认同这段话,他非常期待等到Tripo真正成熟的时候,自己能用它研发一款4X游戏。
虽然目前看来,大厂依旧多是在接入Tripo API的基础上做二次开发,不知道什么时候才能抵达这样的未来。但宋亚宸提醒我,3D AI生成技术刚刚面世两年,我们不该低估新事物进步的速度。
两年前,图生3D还根本不存在
葡萄君:现在游戏从业者都会怎么用Tripo?昨天我问了一个创业者,他说目前可以辅助做3D概念,但他们的项目还不太能直接进管线。
宋亚宸:依据他们项目的情况,可以在我们API的基础上做二次开发。当然,也可以把3D AI作为一种新的交互玩法来使用。
Tripo适合Pro-UGC的创作者,比如网易Lofter社区的很多朋友。以前我是半次元的KOL,ID不能说,因为马甲不能掉……但我花了好多钱去养我的设子。2D立绘、3D mmd、泥偶、布偶……这些都要找人定制。现在有了Tripo,大家的选项会变得更丰富。
至于更广泛的UGC,还是拿网易举例,在《燕云十六声》里,我们合作了一个万物太极的玩法。比如前面有条河,玩家就可以言出法随,生成一座桥来过河。它有潜力变成更自由的建造系统,甚至创造出更多的新玩法。
葡萄君:抛开玩法乐趣不说,这样消耗的成本会不会太高了?
宋亚宸:这种属于速度很快,也不太要求精度的闪电版,单次生成的Token成本非常低,以后还会更低。如果未来能跑在用户的CPU上,那游戏公司的成本就是零了。
葡萄君:现在你们能做到吗?
宋亚宸:其实以前就做到过,但这不是目前大家优先思考的东西,因为AI 3D生成发展的速度太快了。成立至今,Tripo每3-5个月就能更新一个大版本。我们下一个模型的参数,比现在的要大10倍。
在技术飞速进步的时候,大家没时间考虑怎么优化,怎么提升速度,因为精度还在飞快提升——大家都在起新墙,如果你只是在思考怎么修旧墙,那你就该挂了。
我们很多同行的SEO做得特别好,在Google上搜索Tripo,之前甚至只能排在第二页、第三页。但为什么Tripo现在的用户量还是很大?因为他们在优化360P的时候,我们已经在做720P、1080P的技术了。
葡萄君:现在的AI 3D技术,距离硬件的上限,或者说摩尔定律的上限还有多远?
宋亚宸:很多人会用静态的眼光看问题。但其实GPT3.5才发布了不到三年;在两年之前,人类还没有办法用一张图就生成3D模型,这一切都是很Crazy的。
要知道,过去这几年AI 3D生成不是共识,曾经很多人吐槽生成的效果太垃圾。你见过一家公司,像我们这样成立才2年,就要开源18个项目的吗?这是因为我们要做分享,要让更多学术界的人能够低门槛地投入到3D当中。
别看AI这么热,但过去两年我们做分享,微信群两个群都拉不满,可能全球只有几百人在真正研究它。但今年不一样了,论文数量在疯狂增长,大厂在真金白银投入。它的发展速度只会越来越快,甚至快过我的判断。
葡萄君:有人跟我评价,说你们在AI 3D领域的技术全球最强,有很高的壁垒。
宋亚宸:创业公司没有任何壁垒,技术只能给我们一个短暂的时间窗口。
我们最大的壁垒,是大公司要看见才能相信,而我们会先相信,然后创造新的物种,做给大家看。你想抄我的东西随便抄,但我相信大众干不掉特斯拉,英特尔干不掉英伟达,逻辑不是这样的。
自动拆分,自动绑骨:3D AI如何帮助游戏?
葡萄君:自动拆分、自动绑骨这些Tripo的新功能,对游戏团队的实际价值有多大?
宋亚宸:之前很多专业设计师都会吐槽,用AI文生图的图样没法分层,没法进Photoshop。3D生成也有一样的问题,一件衣服拿下来,角色的肚子就多了个洞。把肚子补上了,再把衣服装回去可能更麻烦。
但Tripo Studio的新版本,可以实现万物可拆分:它会根据语义自动分割模型,你可以隐藏不想要的部件,编辑特定的部件,而且还能把拆分下来的部件补充完整。
右侧为自动拆分的部件列表
葡萄君:有点儿像3D抠图?
宋亚宸:Exactly!举个例子,以前建完模,我想把你的鞋子拆分下来改一改鞋带,那要想办法一点点选中它,把它切出来,而且切出来之后的鞋带、鞋子也不完整。而语义生成可以自动把鞋带和鞋子分开,并把它们自动补全,让你进行二次编辑。
包括以前的自动绑骨,是自适应人类的骨骼。但现在我们的模型能识别鸟、鱼、龙、蜘蛛之类的异形物体,而且未来还会适配宝箱、车门、飞机之类的非生命体,尽可能地实现万物皆可绑定。
葡萄君:你们还有其他适配游戏行业的功能么?
宋亚宸:新版本的Tripo还能做到一件事:用自回归路线,做低模的生成。
最传统的AI 3D生成的模型动不动就要50万-100万面,用来3D打印还可以,但游戏要实时渲染、实时交互,性能压力扛不住。它用的是类似Diffusion的扩散模型,有点像是把沙子聚拢起来,变成石头,然后慢慢雕琢它,迫使它用面片来表达。这样做的后果,就是直接降低面数会很粗暴,拓扑结构可能不合理。
而我们采用的自回归路线,有点类似文字的Tranformer模型,它像小孩玩的磁力片。每个面就像一个磁力片,它会不断生成面片,彼此连接,所以拓扑结构相对合理,该粗糙的地方粗糙,该精细的地方精细。这样对二次编辑也更友好,模型会更适合游戏管线。
葡萄君:这个听起来还挺实用。以前没有同类产品实现这些功能么?
宋亚宸:应该没有。我们的研究团队才刚刚攻克这些技术,产品就已经用上了。
说实话,我们不知道这个路线是对是错,还需要更多数据验证。但我跟产品团队说,你们有胆量挑战存在了这么多年的传统管线,这很需要勇气,“人类的赞歌就是勇气的赞歌”。我们要让大家能用上最前沿的东西。
葡萄君:你们都是怎么发现这些需求的?
宋亚宸:我们访谈过1000多个Tripo的创作者,里面有暴雪的前任美术总监,也有独立游戏开发者。我们会给大量生成模型的用户发邮件,尊称他们为CEO——Chief Evolution Officcer(首席改革官),跟他们打电话,然后把记录抄送所有同事。
像那位在做独立游戏的前任暴雪美术总监,会给我们分享自己用AI生成模型的工作流,讲用Midjourney生成图片时如何筛掉有版权的图片、怎么用Magnific、为什么以前用Blender重拓扑、Normal Map怎么样做法线、为什么我们的算法渲染出来的黏土感不够精致、拐角不够锐利……我们特别喜欢这种用户。
葡萄君:在游戏行业,你们服务的对象主要是谁?
宋亚宸:虽然我们很多客户都是大厂,但就像蔡浩宇说的那样,未来可能只有0.0001%的人能做《黑神话:悟空》,剩下99%的人都会创造自己的游戏。我们同样想跟这99%的人站在一起。
葡萄君:对于中小开发者,你们的帮助能有多大?
宋亚宸:首先是节约资源。很多独游开发者其实都是全能选手,他们理解拓扑结构,自己也能做建模,做绑骨,但做这些事情太消耗时间,要么就只能为了扩大产能,出去找投资,管发行要钱。
其次,3D这件事其实很重,它需要一定的图形学积累。而我们团队有一些十几年经验,做过TA或者全栈开发,也了解引擎的老师傅,可以帮大家做技术架构和选型,解决疑难杂症。
另外我们也在和大家一起思考,能不能围绕AI 3D创造下一代流行玩法。比如我们和听泉鉴宝合作,做了一款游戏叫《开门赏宝》,玩家可以拍摄现实中的物体,在游戏里用照片建模,然后获得AI评语。下半年我们还打算举办一届AI游戏设计大赛。
葡萄君:很多人会质疑,3D AI,甚至AI真的能做出好的玩法吗?现在很多AI游戏都是为了AI而AI,玩起来并不有趣。
宋亚宸:在未来,AI应该是一种非常Standard(标准)的玩法和交互选项,就像现在的社交系统——没有它也能做出游戏,但有人会用它做出巨大的玩法创新。
还是那句话,我们很容易静态地判断一件事。AI真正流行才有几年?你看手机摄像头发明了多久才有抖音?
葡萄君:在这条路上,3D AI会比图文AI更近一步吗的?
宋亚宸:它们之间不是进步的关系,而是组合的关系。
天地以及人类的躯壳是3D的、具象的,但人的思考和表达形式是线性的、抽象文字的。你说天地更大,还是人的精神更大?很难说,它们都是世界的组成部分,再加上物理规则,共同构成了世界的样子。
葡萄君:但抛开人的精神不说,3D是不是也更符合物质世界的样子?
宋亚宸:没错,一个小孩可能还不会叫爸爸妈妈的时候,就能学会玩《水果忍者》。它是一种信息更密集、更真实、更爽、更符合本能的媒介。只是一直以来,3D内容的生产被它的创作门槛、创作成本、创作周期所限制。
在微博上粉人、骂人是为了赚钱吗?是为了表达自己的爱恨;玩知乎是为了赚钱吗?是想上来讲一句人在美国,刚下飞机,用来装逼;发抖音快手小红书是为了赚钱吗?是为了分享、炫耀、展示、表达自己。这些事为什么UGC不赚钱也愿意做?是因为创作内容的成本很低。
以前我玩贴吧,当过火影忍者吧的小吧主。当时这个吧最高的楼,是卡卡西、佐助、自来也、鼬等高人气角色的生日楼,这是2D时代表达爱的方式。但在3D AI时代,我们完全可以盖一个木叶村,然后大家在里面祷告、唱赞歌、cos玩梗——人类永恒的需求,就是表达爱、表达恨、表达和炫耀自己。
葡萄君:而且未来还要考虑到VR的影响。
宋亚宸:VR一定是个更锦上添花的事情。
葡萄君:所以在你看来,3D交互内容,也就是游戏会是未来更流行的内容形式,就像现在的抖音一样?
宋亚宸:是的。在微博出现之前,有多少人天天看书?在短视频出现之前,有多少人每天看电影?这是专业内容和大众内容的关系。
现在的游戏,就相当于过去的电影。在3D AI技术更发达的未来,3D可交互内容,比如说游戏至少是一个几万亿美金的市场。
另外降低制作成本还关乎一件事:如果一款游戏要花1000万甚至1个亿,那出钱的人一定希望它能赚上10个亿。所以这个行业几乎不可能有电子沙拉、电子鸡腿,它只会有更多的电子垃圾食品,也就是氪金游戏。
不是说氪金游戏不好,我也玩,我也充过很多钱。但如果一个行业只有垃圾食品,它是一定发展不大的。
葡萄君:按照这个逻辑,小游戏也还远算不上大众化。
宋亚宸:做一款差不多的小游戏至少需要50万。如果发一条小红书要花50万,你还发吗?
让游戏行业不再需要赌上创作者的人生
葡萄君:刚刚你说,Tripo更想和99%的中小开发者站在一起,这是为什么?大厂给你们带来的收入应该更高吧。
宋亚宸:这是我们一开始的愿景,我们想改变一件事——中国的游戏和动画都是劳动密集型产业,一帮有创意的创作者,每天都在工位上拧螺丝。
我从小就喜欢游戏,也梦想做一款自己的游戏,小时候还做过一个很厚的本子,在里面画地图,设计游戏机制,和同学玩纸上谈兵。但问了一些资深的游戏人,他们说你要想好,一切要从「表哥 」做起——先学会配表再说。
接下来,组长、主策、制作人……闯过每一关的死亡率,几乎都在98%以上。而且现在单款游戏的研发周期越来越长,20年青春,也就能赌四款游戏。就算全中了彩票,在40岁的时候终于有机会做一款属于自己的游戏,你还要听老板的,听投资人的。
一个优秀的创作者,一辈子不可能只有四个点子。可这么做游戏,你只能做别人的点子,或者你的点子,一开始最多只能是战斗系统里某一个细节的小优化。第一款成功了,第二款能用的点子大一点,第三款再大一点……最后20年过去,你熬出头做了制作人,但因为天天拧螺丝,已经没有创意了。
想明白了这些,我就觉得对我来说做游戏实在是太难了。但如果能把Tripo做成,可能很多有天赋的创作者就不再需要每天配表、绑骨、打磨细节,让建模更像原画。
在未来,很多公司会越做越小,会有很多非常酷的人聚在一起,通过我们和其他人提供的各种工具、各种外挂,让自己的创意绽放光芒。这是我们的信仰,我们相信它一定会发生。
葡萄君:你都喜欢玩什么游戏,又想做什么游戏?
宋亚宸:什么都玩,RPG、SLG、各种主机游戏,甚至网页游戏……我还一直在玩DND,每隔一两周,就要和朋友一起跑个长团。
上学的时候,我特别喜欢《Battle Dawn》,它是一款实时的战争策略游戏,服务器分成分钟级、小时级、天级、周级等等。比如天级,就是所有行动都要一天之后才能生效。这种设计特别上头,特别动脑子。
如果要做这类游戏,我有很多想法,但现在做游戏还太花时间,也太贵了。希望未来借助Tripo,我能自己做一款这样的游戏——创造一些规则、一种玩法、一个世界,很多人在玩,很多人因你受益,这对我来说是正反馈。
葡萄君:现在Tripo距离帮你实现做游戏的梦想还有多远?
宋亚宸:通过Tripo,我用Unity做了人生中的第一个角色、第一段动画、第一个可交互内容。我们在社区里经常举办建模比赛,我还参加过好几次,做的一个克苏鲁风格的Boss还排到过第二名。
宋亚宸的作品
现在Tripo还不够成熟,对我来说还是有点太硬核了。如果未来Tripo更强大,我一定会是它最核心的用户。
葡萄君:最后有一个问题我很好奇:创业这么忙,你是怎么还能坚持跑团的?
宋亚宸:不能说坚持,这对我来说是放松。
人想完全放松特别难,有的人会靠冥想,而我是靠浸泡在一个平行世界里,和一群朋友一起,接受另一套人生目标、价值观和社会评价体系,获得一种纯粹的心流体验。
玩DND和创业很像,你要做各种各样的决策,并且为这些决策负责。某种程度上说,创业者算是最自由的人,但你做决策的责任也是巨大的。
创业者往往活在当下,甚至过于活在当下。你要面对各种各样的焦虑,面对短时间内无法解决的问题,甚至在历史上也没有参考的事情。但因为DND不是每天都打,它反而会提醒你,你已经经历过很多事情,你可以不断地回味这个旅程。
就像爬山一样,如果你只想着往上爬的当下,坚持真的很难。但有的时候看看风景,看看过往的路,你会觉得还可以继续往前走。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。