AI孙燕姿,数字人的商业机遇与永生梦想

2023-05-29
只有不断满足客户的需求,才能让数字人真正“永生”。

编者按:本文来自微信公众号 时代财经APP(ID:tf-app),作者:贾迎亚(上海大学管理学院副教授)、李博伦 (上海大学管理学院硕士生)、邱肃川(复旦大学智慧城市研究中心高级研究员),编辑:何涧石,创业邦经授权发布。

5月23日,#孙燕姿回应“AI孙燕姿”#登上热搜,真身孙燕姿回应AI“分身”,她表示:“人类无法超越Al,做自己就够了。

在虚拟人类作为技术创新与文艺创作相结合的载体的今天,“AI孙燕姿”们打开的数字人与人”的世界不是一场简单的双厨狂喜”“梦幻联动”。

在竞争激烈的市场环境中,亿万分身不眠不休亿万产业无穷无尽,越来越多的数字人类被开发、应用于互联网中。技术使机器充分具备了人的特点,人类也在追求智能化的道路上越走越远。

数字人,早期只是影视行业的一个噱头。2022年岁末,一场数字人的革命在中外两部现象级大片中一触即发。一是《阿凡达2》上映,男主以虚拟化身形象通过“脑机”穿越至异星球,与原住民展开一场惊心动魄的冒险,其逼真的动作捕捉技术让观众仿佛置身于另一个世界。而同期上映的《流浪地球2》(图 1),以“好莱坞级”高质量的制作水准诠释了“中国式科幻”的定义。与《阿凡达2》中虚拟化身不同,影片以真人形象出现的数字人:达叔、丫丫、图恒宇引发了社会各界对真人复刻数字人的百家争鸣。

《流浪地球2》在国内以40.2亿元票房成为这场票房大战的最终赢家,银幕中逼真的数字人形象与不乏温情的剧情设计,引发了每位中国观众灵魂深处的情感共鸣。

01后起之秀,真人复刻数字人”实现弯道超车

真人复刻数字人(2D或3D形象),是一种利用计算机视觉、图形渲染、动作捕捉、深度学习、语音合成等多项先进技术,在外观形象、行为表达、思想交互三个方面完美复制实体人的数字化存在。艾瑞咨询预测,真人复刻数字人将会经历三个阶段,在《流浪地球2》中均有具体体现(图 1)。

图片

◎图 1真人复刻数字人发展的三个阶段与特征

来源:根据相关资料绘制

第一阶段,以CG技术(Computer Graphics)还原真人表情、动作的阶段。如影片中的已过世的香港演员吴孟达,便是以CG技术渲染出的虚拟形象。第二阶段,以脑机接口植入意识、记忆到数字备份中,并通过电脑还原。如影片中已过世的图丫丫,只能重复预设的程序化动作,进行简单的初步对话。第三阶段,通过量子计算机进行深度神经网络的学习,对思维和意识进行全部还原。如影片中牺牲的图恒宇,其数字分身同时进入图丫丫所在的虚拟空间,进行实时交互。

尽管是数字人领域的新秀,但毋庸置疑,真人复刻数字人在数字人行业的趋势可谓是“星星之火,可以燎原”。数字人行业正在经历一场变革,除了在舞台上正挥斥方遒的头部企业,也为中小企业演绎出全新的入局机遇。

当前,想要提供真人复刻数字人服务或利用数字人特性进行业务驱动、场景升级的中小企业面临两大需求:一是进入元宇宙虚拟空间的数字形象需求,二是用户对数字分身进行内容创作的需求。基于此,本文重点探讨即将入局数字人赛道的中小企业面对B端和C端如何做出抉择,以实现真人复刻数字人的商业价值最大化。

02避实击虚,于B端方兴未艾,寻C端蓝海商机

在数字人赛道上,一场革命正在悄然发生。自从2020年,人工智能技术突飞猛进,数字人企业如雨后春笋般涌现,吸引了无数资本的关注。截至2022年9月底,中国数字人市场投资金额较2021年翻了两番,达到14.96亿元。清华大学发布的《虚拟数字人研究报告2.0版》显示,数字人已经渗透到各行各业,成为新一代的生产力和创造力。从头部企业的布局来看,数字人产品服务在B端占有79%的市场,而在C端的占比仅有36%,显然,B端是当前头部企业数字人布局的重点领域(图 2)。

17997d87b2dce17f4858f6a45a7350d4_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

◎图 2 “人-货-场”的B端应用路径

来源:根据相关资料绘制

头部企业切入B端赛道,主要围绕“人-货-场”的发展路径,并建立了完整的数字人产业链。不管是数字人IP、功能型数字人还是AI员工的市场,头部企业在基础层和平台层已建立较高的行业壁垒,例如,占据基础层的微软、Unity、英特尔等,占据平台层的网易、科大讯飞、腾讯等。而围绕C端,真人复刻数字人的应用场景主要分为功能服务型和数字分身型。功能服务型数字人如数字员工、数字助理,人工的能力在虚拟空间中得到增强,能够轻松应对各种工作任务。数字分身型数字人是真人人格化的身份代理,推动虚拟空间中的内容生产与创作。

中小企业又该如何抢滩登陆数字人赛道呢?作者认为,中小企业应将重心放在C端的内容层,利用企业自有技术和AI平台为真人复刻数字人赋能(图 4)。

图片

◎图 3数字人产业链的分类图

来源:参考《数字人产业发展趋势报告(2023)》自行绘制

在此方向,部分元宇宙企业率先探索了C端创新的应用场景。例如,优链时代利用3D云阵相机扫描实体真身,生成高度逼真的数字分身,并将其植入到各种场景中,让用户体验不同的生活方式。你可以和梅西、C罗一起踢球,也可以穿越到古代庭院,或者在杭州西湖畔散步。容积视觉则采用3D动作捕捉+场景投射的方式,让用户可以将自己或他人变成任何角色,并将其投射到现实空间中。你可以和你喜欢的明星、动漫人物、历史人物等一起合影,也可以制作出各种有趣的视频和照片。容积视觉还开发了一个“72变NPC”的APP,让用户可以随时随地召唤自己扮装的NPC角色,与之进行虚拟互动。此外,刹那元宇宙则是一个基于Web3.0的大众化元宇宙社交空间,让用户可以创建自己的数字孪生形象,并拥有自己的live house小宇宙,在数字世界中分享生活点滴。刹那元宇宙还支持用户间的跨空间互访,让用户可以在不同的元宇宙中进行探索和交友。

作者认为,中小企业步入真人复刻数字人C端赛道将迎来四方面的机遇:

机遇一,政策导向。2023年两会期间,ChatGPT引发了一场AI革命,让全国人民见识了AI的无限可能。科技部部长王志刚在会上表示,“AI是未来的大方向、大领域,我们要把握场景驱动和用户需求这两个关键点”,并明确提出了支持数字人赛道的政策措施。

机遇二,资本涌入。2022年数字人赛道的资本融资热度显示,“交互”与“内容制作”稳居投资热词榜首。各路资本纷纷加入到数字人赛道的探索中,为中小企业提供了充足的资金支持。

机遇三,用户需求。随着元宇宙时代的到来,用户对于真身形象的需求越来越多样化和个性化。中小企业可以针对不同层次的用户需求,提供不同类型的真人复刻数字人服务。例如,对于只需要基本形象的用户,可以提供2D数字形象的生成业务;对于对形象、动作或神态有一定要求的用户,可以提供3D动态的真人复刻数字人的生成业务;对于追求极致体验和沉浸感的用户,可以提供全息投影或神经连接等高端技术方案,附加高度自由化的数字内容创作服务。

机遇四,技术成本。传统的身份型数字人和服务型数字人需要几十至数百万元的生成成本,全部的制作流程需投入一至两个月的时间。由建模和渲染所产生的软硬件设备成本和动作捕捉等场景搭建成本使得数字人视频每秒成本约在8000元至15000元的区间。随着虚拟引擎与图形渲染技术的发展,数字人的生成成本逐渐降低。2023年3月1日,Open AI开放了ChatGPT的API接口,中小企业可以轻松地生成多模态化的真人复刻数字人,并赋予他们智能和灵活的对话能力。上海小零网络科技有限公司就是一个典型案例,在AI为数字营销领域赋能的场景中,他们通过生成2D真人复刻数字人“优娜”,使用ChatGPT的API接口,结合语音识别技术,就可以创建一个智能客服或记录语音指令的员工。除此以外,C端多模态数字人还可以承担个人助理、儿童照料、适老陪伴等多项任务。

03不忘初心,重在C端,乘AIGC东风扶摇直上

当中小企业选择真人复刻数字人的C端入局后,又可选择何种具体的模式发展呢?作者认为,目前最可行、便捷与最易变现的渠道是从事真人复刻数字人的AIGC内容创作,最关键的是落实到具体的垂直场景,根据客户需要进行相应设计,这才是入局的“初心”所在。

AIGC+真人复刻数字人会碰撞出怎样的火花?

在Chat GPT掀起了人工智能创作的浪潮之后,各大科技巨头纷纷加入竞争,AIGC迎来了前所未有的机遇和挑战。AIGC即AI Generated Content,是一种利用人工智能技术来生成内容的应用。在Web3.0时代,内容生产方式由PGC(专业制作)和UGC(用户制作)逐步过渡到AIUGC(AI辅助用户创作)和AIGC时代(表 1)。AIGC利用生成式算法、自然语言处理(NLP)以及人工智能学习知识图谱,打破了内容创作者的创作限制,创作者可以更自由地实现二次精加工。从长期来看,随着数据、算法、算力等要素的不断提升,创作者甚至可以利用AI技术创造出超越现实的奇幻世界。

图片◎表 1 PGC、UGC、AIGC的特征对比

来源:根据相关资料绘制

最令人惊叹的是,AIGC能够实现真人复刻数字人的多模态化,即外观、声音和动作三者完美融合。自媒体量子位认为,AIGC在生成方面包含着基于线索的部分生成、完全自主生成和基于底稿的优化生成。内容方面,不仅包含图像、文本、音频等外显内容,同样也包括策略、剧情、训练数据等内在逻辑内容。当垂直场景直接导入或模型生成(如NeRF模型),只需利用大厂提供的AI工具(Bing、Midjourney、Runway、Soundraw等),一款多模态化的真人复刻数字人就可以出现在你的眼前。

本文认为,对中小企业而言,实现真人复刻数字人在细分场景下变现,需注意以下三点:

第一,规避大厂深耕多年的数字人场景,寻找有特色和需求的场景例如,利用数字人打造具有当地文化特色的旅游景点、乡村振兴项目、远程医疗服务、老年人生活辅助、智慧城市管理等,让用户感受到数字人与真实世界的互动和融合,提高用户的沉浸感、真实感和参与感,解决现实世界中存在的问题。

第二,不断创新,快速迭代打造高品质的数字人产品。要想让数字人从平面图像变成立体模型,从单一表达变成多样化交流,需要不断地优化技术和算法。以广州赛灵力科技有限公司为例,该公司专注于开发能够模拟真人感官体验的2D数字人赛道,从医疗、法律、直播带货三个场景出发,构建数字人应用平台,提升数字人的服务水平(图 5)。目前,许多数字人中小企业都选择了类似的策略,即在基础技术阶段“做深、做细、做实”,然后向着渲染、动捕和唇形等技术难度较大的3D数字人领域进军,并不断丰富场景化应用。

第三,打造数字人业务闭环。需要考虑的是如何从人工标注、模型训练,到深度学习、自我迭代,并建立稳固的用户反馈。短期来看,倒映有声公司为代表的视频生成技术还原了真人的唇形和语音、语速、语调,应是发展的重心。长期来看,以小冰公司为代表的实时互动技术才能满足元宇宙中的社交需求,为用户带来真实体验。在这个过程中,中小企业应围绕用户的实时反馈来优化数字人产品与服务。

未来,数字永生是“筚路蓝缕”还是“水到渠成”?

在未来的世界,人类可以通过数字技术实现永生。这是一个令无数中小企业趋之若鹜的商机,也是一个充满挑战和风险的领域。究竟如何将真人的外貌、行为、思想转化为数字化的存在?我们可以把这种存在称为“数字孪生体”或“数字生命”。它们有着与原型相同或相似的特征,但也有着自己的个性和意志。

目前,有两种主流的数字永生模式:一种是被动上传信息,只保留“数字记忆”的单向意识;另一种是主动上传信息,在记忆载体中持续学习,并具有交互的双向意识。前者更像是一个静态的影像,后者更像是一个动态的灵魂。例如,来自美国的Somnium Space选择了后者,在虚拟社交平台中复刻了大量逝者生前的数字形象和声音、性格倾向等数据,但也引发了一系列的伦理道德争议。

在数字永生的竞赛中,不同的参与者有着不同的策略和目标。Somnium Space的创始人阿图尔·西乔夫利用ChatGPT的强大对话能力,打造了一个能与用户沟通和互动的数字灵魂平台。他认为,这是实现数字永生的最佳途径。而埃隆·马斯克的Neuralink则采用了更为激进的方法,他声称已经成功地将人类的意识上传到了云端,实现了人机融合。他认为,这是实现数字永生的最终目标(图 6)。与国外巨头从根本上改变人类命运的雄心相比,中国中小企业的创新则更加务实。他们从真人复刻数字人的功能性出发,在应用层寻求可能的商业化应用场景,如刹那元宇宙计划从逝去亲人转换到陪伴幼小儿童成长的角度去提供数字人服务。他们认为,数字永生不一定要完全模拟真人,而可以根据用户的需求和喜好进行定制和优化。

真人复刻数字人是一条全新的进化路线。当虚拟偶像市场已被头部企业所垄断,中小企业无法与之抗衡时,另一条锦囊妙计呈上:利用自身的技术和创新能力,专注于C端市场,打造最适合用户需求的真人复刻数字人。精益创业、产品迭代,最终才能实现3D真人复刻数字人的蝶变。对此,复旦智慧城市研究中心主任凌鸿教授认为,从市场化的角度来看,数字人需要先经历虚拟和真人两种赛道,最后再朝着数字永生的方向发展。未来,中国特色元宇宙将以科技向善、合作共赢为原则,让每个人都能享受数字永生的福祉。但我们也要清醒地认识到:没有什么产品是完美的,只有不断满足客户的需求才能让数字人真正“永生”。这是我们从未改变的初心。

注:复旦大学智慧城市研究中心的元Talk栏目为本文提供了文字素材支持,广州赛灵力科技有限公司为本文提供了图片素材支持,杭州优链时代为本文提供了视频素材支持,特别鸣谢。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。