虚拟人直播不靠谱,大厂争什么?

2022-01-17
布局的是未来。

编者按:本文转自微信公众号陆玖财经(ID:liujiucaijing69),作者:薛机智,创业邦经授权转载。

从用户体验、经济模型、产业链成熟度等方面看,在非常长的一段时间里,虚拟人直播都将是一个伪命题。然而,阿里、百度、科大讯飞等大厂仍在积极布局,在技术和产业链生态各方面竞速。

虚拟人直播目前还未成为一个成熟赛道,却已不乏抢跑者。

2022年1月14日,百度智能云AI人机交互实验室负责人李士岩说,希望在最近两年内,通过百度智能云曦灵平台的开放,让每个人实现数字人自由。他提到“虚拟人3.0”的重要应用场景是视频、直播、chatbot等。

一份截至2021年12月的数据显示,现在淘宝已有超过200个虚拟人直播间,而且这个数字还将迅速增长。

华创证券一份报告显示:科大讯飞的AI虚拟主播解决方案,和多家媒体已有成功合作案例,此外,对于网络直播平台也已具备较高的实用性。

那么,让这些大厂如此重视的虚拟人直播,现状如何?

走进虚拟主播直播间,乍一看,它不仅形神兼备,会介绍商品带货,还能来一段舞蹈和Rap调节氛围和情绪。更重要的是,它很安全,没有明星、头部主播那样的塌房风险,不会生病、闹脾气、疲累,甚至可以一天24个小时连续不间断地进行直播。

但陆玖财经发现,虚拟人直播,一方面直播间里用户体验差、没有互动、时常翻车,另一方面,对于绝大部分普通商家而言,大大增加了运营成本,目前还是一个失败的经济模型。

现阶段,虚拟主播还抢不了真人主播的饭碗。百度、科大讯飞、阿里这样的技术大厂,目前大力投入,布局的是未来。

虚拟主播=真人套假头?

要形成一个成熟赛道,不能只靠洛天依、A-SOUL、翎Ling几个明星虚拟人。那么,在直播间观看普通虚拟人直播,是种怎样的体验?

目前,普通虚拟人作直播,基本都是在带货。为此,陆玖财经的同事小羽,到虚拟主播直播间进行了一番真实体验,他的结论是:“目前的虚拟直播主要有三种,一种是给真人带货主播‘套假头’,一种是虚拟主播搭配真人助理带货,还有一种是类似于vivo手机官方旗舰店的‘机器人’虚拟带货主播。”

首先,是真人带货主播“套假头”。这已经成为一个成熟的小产业,虚拟主播背后的真人为此还有个专业术语——叫做“中之人”,就是字面意思“里面的人”。小羽在抖音的均瑶官方旗舰店看到,虚拟女主播在镜头面前卖力地介绍自家产品,但是在直播期间,虚拟人居然整理起自己的指甲。

小羽经过很长时间的观看体验,如此总结:“初入直播间给我的感觉很新奇,因为一般都是真人出镜,它直播间的动捕特效追随感很强,还能看到主播面部细微的表情变化,但多看一会就会发现,在其脖子衔接处会出现明显的阴影和撕裂感,有时候虚拟特效还会忽然消失,违和感还是蛮强的,我感觉这不就是我们常玩的那种换脸吗?”

根据均瑶直播间2022年1月13日晚上的数据显示,粉丝团有6279人,收获5000+点赞量,但并未进入同时间段的抖音带货榜和小时人气榜中,直播间还有观众向主播提问:“你的脸怎么看着这么奇怪呀?”

可见,这样的形式,观众似乎并不买账。

而美食领域的虚拟IP“我是不白吃”,采取的则是虚拟主播+真人助理的形式带货,它会在直播间和真人助理进行趣味性互动,介绍一系列美食类货品。小羽在其抖音直播间体验一番之后,感觉这样的形式比较好玩,两人有来有往就可以有很多出彩的点吸引人去观看。

根据抖音方面数据显示,其一场直播首秀便实现了抖音涨粉12万+,一周涨粉126万+,并在短短两个月内从首播时的六百万达成粉丝规模翻倍,其带货的如迪冰激凌曾在24小时内登顶抖音好物榜第一。

虽然战绩十分可嘉,但它实质上并未摆脱对真人的依赖。

小羽又体验了天猫的vivo手机官方旗舰店,这里的直播采用的是全虚拟人的形式,主播是一个可爱的Q版人物,在直播间里讲解自家手机性能,声音温柔又亲切,时不时还会为观众们跳个舞活跃气氛。可是,当小羽想和主播互动时发现,这个虚拟主播就像一个机器人,完全实现不了互动。

小羽问她:“18号链接什么活动?”她还继续着自己的舞步,结束之后又开始讲解刚才未讲完的商品,并未同小羽进行语言动作等交流,只是在公屏上文字回复:“您刚才提到的问题,可以联系咱们店铺客服人员帮您跟进处理。”

小羽的这次体验结论是:“这种类型的虚拟主播感觉就像智能客服一样,很机械化,可能最大的互动感就只是在我进直播间的时候欢迎一下,然后该干嘛干嘛,用她要求的格式互动才能唤起她的语音互动,虽说是对真人主播形式的补充,但我感觉完全替代不了真人那种陪伴感,她说的买它、不要错过之类的营销话术,加上机械腔,感觉失去了灵魂。”

成本增加,经济模型并不成立

陆玖财经和多位业内人士交流之后,大家对于虚拟主播带货的共同观点是:基于当下虚拟主播的经济模型并不成立,它较之于此前的带货直播没有推出什么新的解决方案,没有扩大需求、反而增加了成本。

现阶段,虚拟主播对真人的依赖性仍然较强。“我以前直播间雇个主播,现在还要多花一份钱买个虚拟人技术。”资深电商从业者Lion向陆玖财经表示:“品牌用那种套头型虚拟主播或者是虚拟主播+真人助理的模式,相当于我们在双重用工。并且,直播间带货形式本质上并没有什么变化,噱头只是一时的,并不能切实增加销量,实际上没有太大的意义。”

根据广发证券虚拟人研报显示,打造虚拟人网红或主播在技术、运营等方面投入成本很高,打造视频化虚拟人的MCN公司前期投入成本有的高达百万,后续维护过程中的每条更新视频制作成本同样高昂。

某虚拟人技术集成商王先生告诉陆玖财经:“现在的虚拟主播带货目前还是一个伪命题,大大增加成本却不能增加收入,可能刚开始给人眼前一亮的感觉,但风光过后可能就是一地泡沫。”

而且,虚拟主播带货在当下的运营模式中,其实很考验其背后运营团队和“中之人”的配合,稍有不慎,虚拟主播不会塌房的优势也会消失。

在此前虚拟主播带货直播类互动环节中,因为“中之人”即兴发言不当引发危机的案例时有发生,例如holdlive旗下的赤井心和桐生可可两位虚拟偶像的“中之人”,曾连续发表两次不当言论,最终导致holdlive上的所有日本虚拟偶像都被撤出了中国市场。

另外,现阶段技术方面的限制也是制约虚拟主播的主要难题。由于动捕设备的价格门槛和应用场景的局限,普通终端用户当前没有动力购买高端动捕设备或定制虚拟人形象。在此前的618大促中,初音未来作为顶流级别虚拟主播,也难逃建模生硬的问题,甚至转过头来直接变成了秃头小宝贝。

不少淘宝直播虚拟主播团队也表示,很多设备续航能力仅有3个小时多,无法满足5-6小时的淘宝直播增粉模式,不利于增粉和开拓。

王先生表示:“如果虚拟主播在商业模式上不能带来新的增长价值和应用,这件事和真人带货相比就没有什么意义,更多的只是商业噱头。”

产业链各个节点相对割裂

陆玖财经了解到,现阶段虚拟主播的产业链大概由三个环节组成:上游是提供底层技术的技术厂商,中游是负责技术集成与整合应用的技术集成方,下游则是采购虚拟主播服务的品牌商家等。

根据广发证券研报显示,上游的技术方,包括渲染建模、动捕面捕、AI技术、XR设备厂商等,负责完成虚拟人的制作。技术上竞争壁垒的巩固离不开前期大量成本投入,互联网大厂相比单一布局、体量较小的中小型技术厂商,其在虚拟人技术的资金、资源投入上更具优势,同时更有能力打造聚合的技术平台,能极大实现虚拟人制作环节的降本增效,将一系列精密硬件、技术、算法和软件聚合。

王先生表示:“目前提供技术的这些企业我觉得还到不了内卷的状态,因为他们的侧重点会有所不同,虚拟主播技术的门槛还是比较高的,每个技术环节都有很多公司在开发,底层技术应该交给大厂去研发,比如虚拟主播要用到的语音交互,中游整合就可以采购科大讯飞的、百度的、微软小冰的服务等等,主要还是以技术本身的成本、兼容性和开放性等为参考标准。”

中游是虚拟人这个赛道的内容产出环节,这其中包括资产制作类公司、策划运营类公司等,负责虚拟主播IP的策划、运营,为上游技术方提供虚拟人的人设、形象设计(或提出需求)。上游技术公司通过建模、动捕等技术,制作出相应的虚拟人形象,交付中游内容产出公司。

“我觉得我们很像超市里货架的角色,在执行一个方案时可能会同时运用到全球几十个公司不同的软硬件,根据客户实际需求和预算来选择产品和服务,在底层技术的基础上去写新的插件和工具。”王先生这样解释道。

中游的内容方公司承上启下,除了提供技术整合服务外,有的还负责运营虚拟主播IP,对接下游丰富应用场景和合作方,最终实现虚拟主播的变现。像蓝色光标就是这其中的典型厂商,其与阿里巴巴达摩院共同打造虚拟直播间,购买其产品的商家集中在联合利华、keep、美赞臣等知名品牌。

据《虚拟数字人深度产业报告》显示,我国当前虚拟数字人市场吸引着赛道上中下游的玩家纷纷入局。但是,产业链的高效协同仍有待挖掘和提升。

在百度2022年1月14日的AI开放日活动中,李士岩公开指出,虚拟人产业目前最大的问题,仍是产业不能协同,公司之间没有有效整合,没有形成完整产业链。目前行业中大多数公司只是数字人制作与运营全流程上的一环或其中几环,产业生态尚未打通,这使得制作虚拟人时,成本很高。

虚拟主播未来在哪?

那么,虚拟主播的未来该走向何方?或者说,大厂在虚拟主播产业上,争抢的是什么?

首先,是底层技术的突破。量子位产业报告中指出,虚拟数字人不适用于通用性、专业性、交互性过强的领域,会暴露其现有的技术短板。华创证券在其研究报告中也表示,当前虚拟人高度依赖脚本,或只能对简单的随机问题应变,深度高级人工智能技术仍然有待开发成熟。

可以看到的是,大厂们正在底层技术上不断取得突破,百度智能云曦灵应用四大AI引擎,即人像驱动、自然对话、语音交互、智能推荐层面实现数字人能听能说能理解能互动。而科大讯飞则是推出自主研发的AI智能交互一体机,结合语音识别、语义理解、语音合成、虚拟形象驱动等AI核心技术,实现用户与虚拟人物之间的“面对面”互动交流。

对于虚拟主播而言,人工智能三大核心技术中的NLP(自然语言处理,解决人与计算机之间的交互问题)是最需要突破的底层技术,具体包括知识图谱、词法分析、句法分析、语义分析和语言模型。

陆玖财经在国家知识产权局专利检索及分析网站检索发现,在这五个技术领域,百度、腾讯、华为、阿里巴巴、微软这些大厂,频频出现在专利数量前五的位置。

科大讯飞方面向陆玖财经透露,目前直播间是虚拟主播非常直接的商业化场景,虚拟人能否为直播间带来更大的经济价值,需要整个行业的探索,讯飞正在和讯飞开放平台的合作伙伴一起探索。

此外,要扩展虚拟主播的应用场景。李士岩指出,目前数字人的服务场景与演艺场景并未有效打通,虚拟主播不仅是黏性场景,还是效率场景。

第三代数字人的建模和内容生产均有AI参与,这使得数字人的制作效率更高,也更智能,能面向更多应用场景。可面向全群体用户,可由视频、直播、chatbot等载体承载,更具备千人千面的互动能力。

中国传媒大学将在1月底推出《中国虚拟数字人影响力年度发展报告》,其中,将虚拟数字人分为了三类:虚拟偶像、虚拟主播、企业IP。而随着虚拟数字人应用场景的拓展,这些分类会增加,例如虚拟客服就是一个很大的应用类别,“真人虚拟分身”也会是一个海量的市场。

最后,是布局产业链生态。李士岩认为,解决这个问题的有效方式是,大平台联合产业链共建生态,最终产生飞轮效应,降低虚拟人成本。

除了百度,目前在建设虚拟人生态方面,美国的Meta公司、中国的腾讯等也都在布局。

李士岩说,虚拟人的终极追求是,你在和他交流,但你无法发现他是虚拟人。只有这样,虚拟人才会更温暖,更有人文色彩,提供内容也会更加生动。也许到了那天,才是虚拟主播这个赛道正式起跑的时刻。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn`