数字时代的版权挑战:AI 技术下的前瞻思考

2023-09-06
未来5-10年以后,90%的内容也许都是AI来生成的。

8月30日,由创业邦主办的2023AIGC技术应用大会在深圳举行。

本届大会以“元载万物·智启新界”为主题,旨在聚焦AIGC技术的创新应用,打造深入探索AIGC产业落地的交流平台。

会上,蚂蚁集团数字科技事业群数字文创产品部总经理徐惠,在主题演讲中的精彩观点如下:

1.所有的商业本质是交易,但是交易的基础是确权,所以只有把权属权益定义好之后,交易才会繁荣。

2. AIGC最大的冲击,在于以前我们认为只有专家才能完成的事情,现在ChatGPT也能完成。

3. 未来5-10年以后,90%的内容也许都是AI来生成的。

257e027c0bef34095f0dd82ad658157.jpg

以下为演讲内容,由创业邦整理:

徐惠:谢谢主持人介绍,也感谢主办方的邀请,很高兴有这样的一个机会跟大家在这里一起交流一下。在数字时代,从蚂蚁的视角来看,我们看到的一些机会,包括对未来的一些思考。

自我介绍一下,我是徐惠,负责的是蚂蚁链这一块数字文创的产品,包括我们有很多的应用。

刚才相信大家听完前面几个嘉宾的演讲,其实看到了一个非常绚烂的以及快速发展的一个全新赛道,里面诞生了非常多的机会。

但如果我们去看未来,可能你会被一个巨大的焦虑感所包围,因为科技日新月异,不断发生巨大变化。

去年最热的词可能还是元宇宙,今年已经是AIGC了,然后明年可能又会涌现出更多新技术。

在这样一个浪潮里面,我们要把握什么?

我们还是要看一下过去,看看什么是在这个时间浪潮下不变的东西,这样的话我们会更笃定,能够更清楚地看到未来变化与不变的部分。

我们知道,印刷术出现后,人类才有大量作品涌现。

印刷术被发明之前,文字记录其实用过的竹简等,传播效率非常低。

所以人类知识第一次大爆发源于造纸术、印刷术的发明,这样的一个技术突破。

这其实突出了版权的重要性,因为谁来出版,谁就拥有最大的商业收益。

所以到了后来,就有版权法这种法律专门解决出版问题。

第二次科技浪潮是无线电,传播方式产生了巨变。

在这之前最重要的媒体还是报纸,随着无线电的产生,包括视频技术的产生,电视就成为了最主流的媒体,同时它的影响力也史无前例达到最大。

这个时候其实法律的一个变化是创作权变得尤为重要,所以著作权法在这个时代背景下就诞生了。

上世纪又产生了互联网,这个时候我们会发现讨论很多的话题都关于网络著作权,然后传播本身产生了巨大价值,所以对于网络信息传播这件事情的界定就变得尤为重要。

所以很多互联网公司,包括一些新的巨头应运而生,它们其实也是在这个时代里得到技术最大红利的受益者。

再来看最近发生的,无论是像元宇宙也好,人工智能也好,在这个背后都会产生一个新的概念,叫做虚拟财产权,因为这些内容属于纯数字化的创造,甚至于它产生的第一天都源于一个数字的世界,在这个里面它有没有权益?

我们相信所有的商业本质是交易,但是交易的基础是确权,所以只有把权属权益定义好之后,交易才会繁荣。

比如有很多AIGC创业公司,当我们面向C端的时候,你发现变现都会非常困难,其中有一个很重要的原因就在于他创作的这些内容本身有没有版权,他能不能因此而获得版权收益,这是一个很重要的问题。

所以我们会认为在这背后就产生了又一次新的巨大机会,因为全新的技术带来了新的机遇,当然也是对立法的一个挑战,但是谁能够解决这个问题,然后服务最多的用户,可能就会站在新时代的最前端,这是我们看到它在不断地演进,但同时也在保持着它原有不变的那个核心,就是技术的革命和法律的变化,它是相辅相成的,是一个相互推进的进化史。

如果再换一个视角,现在对AI有非常多的定义,或者说非常多的角度,有一种观点是说认为AI可能会颠覆人类,未来我们可能就无所事事了。

还有一种观点是我们认为它是工具,工具多么强大,人类要做的事情就是用好这个工具。

如果我们回头去看一下历史,其实这件事情也经常发生的。

最早的一个工具,比如笔的发明,然后刚才提到了造纸印刷,这样的一个工具,让我们更方便地去书写绘画,让我们有更丰富的方式去创作,以及印刷术让我们更高效地去做传播。

照相机的诞生也非常有意思,把一个整个流派都颠覆掉了——以前西方绘画追求写实,也就是画得像是绘画功力非常好的一个表现。但是当照相机出来之后,你会觉得画得像这件事情已经被照相机彻底替代了。

所以艺术的流派也发生了变化,像印象派、后现代主义,抽象派开始涌现了,所以技术它会改变很多东西,但是有些东西不会变,因为我们还是有追求项,追求真实的一个需求,只不过说我们更多地是用照相机来完成。

摄影这件事情也有技术含量。要拍出一个好作品,你会发现它还是有壁垒的,不是你拿出相机随便拍一下就可以,而是要考虑光照、角度、光圈,甚至于还有审美,这些都是在新技术诞生之后又产生的新职业——摄影师。

再往后,在电脑、手机出现之后,大量数字作品创作也出现了,包括像以Photoshop这样为代表的一些创作工具也涌现出来,使得我们可以做出更生动的、更美轮美奂的艺术作品,包括动画、动漫,影视里的特效,也都应运而生了。

AIGC最大的一个冲击,在于以前我们认为只有专家才能完成的事情,或者说以前我们认为创意是最难被机器所替代的,但是从ChatGPT开始,我们发现白领也有可能会更快速地失业,甚至于程序员可能是第一个被干掉的,因为ChatGPT它也可以写代码。

这个时候我们会发现所有原来不可能,或者说不容易被替代的,很有可能会更早的被替代掉。

但是它带来的效果是什么?

就是它会带来更多的创作,你只要给它足够多的算力,足够多的数据,它可以源源不断去生成内容。

我们判断可能未来5-10年以后,90%的内容也许都是AI来生成的,因为它会产生大量的内容,对它来讲只要成本降到足够低,它就有足够强的能力去生成。

这件事情我觉得其实是不可逆的。

就好像我们现在跑步,只会去跟人跑,不会去跟高铁跑,不会去跟飞机比,因为你知道在速度这件事情上,我们已经被交通工具所替代掉了,我们的竞争对手就是人,所以我们会有奥运会的、亚运会的盛会,但是我们的对象都是人。

反过来我们会限制,跑步不允许用高科技,比如说特殊的衣服、特殊的鞋,包括特殊的药物,这些要去掉,只能人跟人之间去比。

那背后本质,就是说我们会看到科技带来了一个全新的创作能力,而且它的确权需求、作品数量会爆发式增长。

再换一个视角,就是我们去看产业,那我们更加确定,无论是从技术这一侧,刚刚提到的像模型的突破,英伟达从它的A100又推出了H100,性能在不断地提高,然后我们的数据在不断积累,随着数据化浪潮不断推进,有越来越多的产业,包括传统行业都开始完成数字化,所以积累了大量数据,包括我们的模型实现了质的突破,这些都共同构建了一个底层,就是说它的技术已经到了临界点。

第二块就市场本身也有剧变。光2023年,(关于市场)有一个预测数字就能到143亿人民币,到2030年就会突破万亿,这是一个指数级的增长。

如果我们再去看产业,其实海外围绕AIGC这个领域,就已经有2000多家公司和应用,国内其实也有200多家。

资本其实是很聪明的,就是它追逐的是最有想象力以及最有革命性的一个场景,资本涌入也会推动这个行业规模的发展。

这是我们在各个维度的视角下看到的AIGC这个产业的方向——首先它不可逆,而且它非常繁荣。

在这个繁荣背后同样我们也看到它其实有很大的挑战和问题。

第一个就是我们现在训练就需要数据,但数据本身是否存在侵权的问题。

在早期野蛮成长的时候,可能大家忽略了或有意识地忽略了,因为解决侵权问题是需要成本的,但它确实存在。

我们用来训练的这些数据是不是得到授权,是不是已经拥有版权?

第二个就是通过AIGC来生成的作品,它本身权属归于谁?

如果我们看当下,你会发现其实从美国的视角来讲,AIGC生成的作品是没有版权的。

到目前为止,中国的法律其实也不保护这种版权,因为我们要保护的是自然人,只有自然人才能拥有版权。

但是这样的一个置之不理的方式并不能真正解决这个行业的问题,因为它会不断地产生这种问题。

如果这些作品没有版权,意味着使用方、消费者就可以使用这些没有版权的作品,也不需要为此付费。

反过来它就会冲击传统的内容产业,因为他们再也赚不到钱了,因为你们创作的内容别人可以通过AI来生成,而且还是可以免费获取,所以反而会对这个行业产生毁灭性的打击。

我们的一个判断是最终它其实还是会回归,就是我们重新来定义AI,我们不把AI看作是一个人,它不是跟自然人去抢生意的这样的一个生物,而是我们的一个很强有力的工具。

所以如何用好AI,如何用好这个工具会成为未来的主流。

如果是这样一个界定的话,其实它的权属就非常清晰了,版权依旧会归创作者所有,只是说这个创作者他应用了AI工具,跟以前他用照相机去拍照其实没有本质的区别。

那同样的,既然这个作品有版权,同时他用的数据源本身其实也需要是合法授权的,包括他这个工具如何使用,这个创作过程也非常重要。

在这里面我们梳理了三个重要环节。第一个就是训练的数据本身一定会走向确权,就需要一个确权市场。第二就是你的整个创作过程需要有记录,这个过程其实很像我们现在的发明专利,就是当你做了一个专利之后,需要保证这个东西是可以复现,就像室温超导,你可以发这样的论文,但是如果没有人能复现你的结果,其实这个论文的价值是极低的。

但是如果大家可以高效地去复现室温超导,它就有一个划时代的意义。

所以创作过程其实变得尤为重要。而且你要确定这个权属其实是你发明的方法,就是你用了一个方式能够做出美轮美奂的作品,这个本身值得被保护起来。

最后就是它生成的作品也会需要认证,目前网信办已经开始有要求,就是需要去打标签,去区分人工制作和AI自动生成,我们认为这只是第一步,是最初级的一步,再往下走一定会涉及到内容的审核和管理,因为没有法外之地,即使用AI生成的作品,如果涉及到比如黄赌毒这样的内容依旧是不被允许的。

如何去进行审查?如何去发现它到底是数据源头的问题,是AI工具所产生的问题,还是创作者有意引入的一些问题?

监管部门也需要把这个全链路进行透明化和追踪,所以这就是蚂蚁最早推出一个AIGC认证服务。

我们相信未来随着我们的应用越来越深入,尤其是越来越多地进入到C端,我们需要帮助C端用户去做他的作品确权,因为这样的话他才能获得作品的收益,这个从商业闭环链路来讲,它是必不可少的一环。

同时从另外一个逆向链路上来讲,内容审查、包括责任的认定,这一块它也需要去追本溯源,所以也需要把整个全链路进行高效的存储,包括存证。

在这一套产品背后,其实它也需要技术支撑,我们会觉得未来的内容审查也是越来越多地依赖AI技术,实际上现在的很多审查都是靠人工,但是未来是海量的内容,每天产生几亿,甚至几十亿作品,人工是审查不过来的,它只能靠算法来自动识别,所以这背后就需要有一套完整的体系。

在这个里面其实蚂蚁也做了一些探索,包括一些已经是相对成熟的,比如肖像,就所有涉及到肖像的,其实换一个视角,它就跟我们的生物识别,就刷脸很像。

AI生成的作品再像,但是如果你去看人体解剖学,或者你去看他的瞳孔,进行放大的时候,依旧可以去识别出来它到底是人工拍的真实照片,还是AI生成的一个作品。

另外一类问题属于全局跟局部的关系,就是我们粗略一看,可能认为这张图很像,美轮美奂,但是当你去把它进行放大,去看它的一个局部细节的时候,你会发现它就会产生不连续性,包括不合理性,所以这样的一个局部微观纹理就会暴露很多的信息跟细节,可以鉴定说它到底是AI生成还是人工生成。

但是最终还会有一个框架,包括对作品本身,创作过程进行确权,因为这样的一个保护才会更有利于进行作品的交易。

所以当我们有了他所运用的模型,包括他所输入的那些提示词,包括他所调整的这样一些参数,我们是否能进行情景重现?

当我们发现可以有很高相似度重现的时候,这个方法就可以予以保护,而当它的相似度很低的时候,它就会被拒绝。这样的一个模式,未来我们相信它会越来越多地被运用到各个内容的确权,包括内容审查的环节里。

但是最终,我们希望也是通过我们的技术赋能,能够让整个AI产业更加繁荣,而且我们也相信这个大趋势不可逆,也非常希望能够跟在座的各位一起努力去推进,然后也为这个产业贡献一些绵薄之力。谢谢大家。

更多活动大会一手信息,欢迎加入创业邦会员,现场聆听一线投资人、头部企业家精彩分享,掌握最新创投趋势!

图片

27567280c7caafd95829dc36c70450d.png