AIGC重塑百业千行,企业升级如何借势?

2023-09-11
未来,生态竞争会变得非常重要。

8月30日,由创业邦主办的2023AIGC技术应用大会在深圳举行。本届大会以“元载万物·智启新界”为主题,旨在聚焦AIGC技术的创新应用,打造深入探索AIGC产业落地的交流平台。

会上,无界AI联合创始人马千里、生数科技首席执行官唐家渝、登临科技联合创始人兼首席架构师王平进行了一场名为《应对策略—AIGC重塑百业千行,企业升级如何借势》的圆桌对话,圆桌对话由BV百度风投AI应用赛道负责人温永腾主持。精彩观点如下:

马千里:未来可能算法推荐不是特别重要了,算法创造变得特别重要,大家看的内容不是算法给你推荐的,而是算法时时刻刻给你创造的。

唐家渝:未来AIGC会普惠到每个人的生活中,图像、视频等信息表达将变得像打字、刷短视频一样简单,我们自然而然地就能开展创造、编辑等工作,极大提升每个人的信息交互效率和创造力。

王平:国内的企业越来越难拿到美国的高端芯片,在这样的大背景下,本土化的算力需求肯定会越来越多。

温永腾:生成式AI落地或将带来生产方式与交互方式的变化,这其中蕴藏着许多重塑、增强,甚至是颠覆传统应用的机会。

a36958d06da75c2b98181b8e5aa5ac7.jpg

以下为对话内容,由创业邦整理:

温永腾:第一个问题想请教一下无界的马总,是否可以跟我们分享一下,无界是如何利用AIGC技术去为各种不同的行业提供个性化的内容解决方案,帮助企业去升级他们的内容创作。

马千里各行各业他们去用AIGC的时候有一个很大的瓶颈问题,就是他们要么有场景但是没有算力,要么没有专业的团队,要么没有把数据去归集起来,去做相关的行业应用。我们在和B端合作的时候,会由轻到重和他们做应用的合作。AIGC最轻的一个结合我们认为是营销的结合,因为任何B端的企业都需要营销,他们会发现AIGC是一种非常容易触达到C端的营销工具。稍微重一点的应用行业结合是利用我们的现实能力,比如说你有场景但是没有算力,那直接使用我们的接口服务就行了。所以B端的企业在去做AIGC的时候,不用着急去采购很贵的服务器,可以先看看市面上的解决方案。最深的一层合作就是对于AIGC行业有产业认知。比如说我就知道我的行业有什么痛点,我要做一个什么样的行业模型,然后我用模型的方案去解决它,这种合作我们也有一些。

温永腾:好,谢谢马总。接下来我想问一下生数科技的唐总,现在我们都比较坚信底层模型是往多模态方向发展,我知道生数科技在整个多模态的生成式大模型上有非常好的积累。唐总能不能今天跟大家分享一下,我们如何将多模态的生成式大模型应用在不同的领域,并且去促进这些领域的内容的创新和升级。

唐家渝:刚刚马总从不同合作的深度出发去讲产业化落地。因为我们做多模态模型,所以我们就从不同模态的维度去聊一下这个事情。

就图像生成来说,目前已经有比较多的产品应用推出。整体上看,目前生成的图片在画面细致程度和美观度方面已经做得比较好,但相对而言可控性还比较差,所谓可控性就是说如何将用户脑海里所想的画面准确地生成出来。目前用户在使用图像生成的时候,会结合现有技术成熟度的特点,将它的优点发挥在比较擅长的领域。比如游戏美术领域,因为生成的可控性比较差,所以去做精细的道具设计、人物设计还是比较困难的,但可以用它来做主美术风格的设计,设定游戏整体的视觉风格。这是游戏开发非常核心的一环,传统做法需要原画师花一到两个月的时间不断打磨。现在利用生成技术,可以快速生成大量的概念图,从中挑选风格契合的图像,再在这个基础去调整,这样一周左右就可以确定一个主美术风格,大大提升了开发效率。

3D方面最核心的就是如何快速创建3D资产。现在我们能做到通过输入一段描述或者是输入一个单视图或多视图,自动化地创建出3D模型。目前,我们团队生成的3D模型在分辨率、贴图精细度等方面已经做到业内最好水平,但距离实际落地还有差距,还不能完全替代人工,所以目前更多是将它使用在精度要求没那么高的场景中,比如游戏道具、背景等的生成。

还有视频生成,目前业内初步能够实现文生视频、元素编辑和风格转换等能力,但生成的视频在连续性、时长、清晰度方面都还有待提升,所以更多还是使用在概念设计的初级阶段,或者是更进一步的分镜设计阶段。

除了上面提到的2B场景应用,还有更普适的面向2C场景的应用。多模态大模型的发展未来一定会大大降低内容创作门槛。降低到什么程度?类比来看,以前有打字机、打字员这样的概念,但现在打字已经是我们自然而言、随时随地都在做的一件事。未来AIGC会普惠到每个人的生活中,图像、视频等信息表达将变得像打字、刷短视频一样简单,我们自然而然地就能开展创造、编辑等工作,极大提升每个人的信息交互效率和创造力。

温永腾:谢谢唐总。唐总的分享让我们感觉到多模态的进展是非常快的,我还是想再问一下有关于比如说生数科技在生态,或者说产业合作构建上的想法,生数科技作为一个多模态的生成式底层模型的公司,是怎么跟这些合作方去构建相关的生态和合作的关系。

唐家渝:我觉得,AIGC的发展离不开“算法、算力、数据、场景”完整生态链的打造。以我们自身为例,作为具备底层研发能力的团队,我们持续研发和优化模型算法,但同时也在算力方面与硬件厂商开展合作,以获取更有性价比的计算资源。

在数据方面,我们也积极引入特定领域的优质数据。AI其实就像孩子一样,需要让他学各种各样的东西,它才能去创造各种各样的东西。比如在文生图场景,我们会引入高质量的美学数据,让模型去学到什么样的图是美的、为什么美等等,这样它才能创作出同样美的图像。

另外从产品能力的维度,我们通过MaaS的形式与不同领域的服务机构开展垂直场景下的合作,将底层通用能力与行业know-how相结合,最大化的提升产品价值。

温永腾我想问一下登临的王总,我们都知道整个生成式大模型底座的核心还是算力,登临在国内是非常领先的通用GPU的玩家。我们想听听,从您的角度,登临是如何看待这样一个机会,以及如何发挥自己的产品和技术的优势,为这些上游的公司赋能的。

王平有以下几个方面,目前行业进入了算力热潮的时代,算力非常紧张,企业对算力的需求非常迫切。那从登临的角度,我们看到这是一个很大的机遇,这个机遇提供一个更好的、更便宜的算力。但这有一个前提是要解决通用性的问题。对于AIGC的客户来说,他们不仅仅是做一个文本生成图片或者是其他解决方案,而是用户能够真正用起来的产品。这个产品可能会有一些传统的模型甚至传统的算法集成进来。作为一个完整的方案,这个时候去移植其他的东西,用其他的架构会非常痛苦,移植成本也非常高。

再基础一点,我们的客户希望得到更好的、更具性价比的算力,这个本身也是登临希望自身能够带给客户的价值。我们在AI这方面有特别的优化,可以有一个更高的性价比,一般来讲就是对比国际主流通用GPU产品有2到3倍性能的一个能耗比的优势。尤其在大模型这个领域,我们也会有自己更有优势的地方。

我们还有一个很大的优势就是可以做单机大模型,有些客户他对自己的数据比较敏感,单机的大模型在提高算力的同时,能够让他自己在本地就可以完成使用。

温永腾:我也想再追问一个问题,因为现在芯片缺货还是比较严重的。那对未来比如说2到3年内芯片供应情况,或者说芯片格局,您有一些看法可以跟我们分享一下吗?

王平:如果从供应情况的基本面来讲就牵扯一个国际关系—中美关系了。咱们国内的企业越来越难拿到美国的高端芯片,坦白地说,我个人认为国内没有哪家企业生产的芯片能够真正替代美国高端芯片。但也是在这样的大背景下,我相信国产的算力肯定是会越来越多。芯片是一定要迭代的,大家使用国产算力越多,客户前场的问题才能够反馈,我们在后续迭代中才能够改进,提升使用体验。

温永腾:好,感谢王总。那我们进入下一个问题。我们看到无论是底层模型,还是上层的Rola,还有各种工具链,都有很快的进展。那三位嘉宾是否可以在各自的领域去展望一下未来技术的发展方向。

马千里首先我认为非常有意思的东西仍会出现,AIGC的生产量很大,它对UGC的替代会是一个非常碾压性的事情。而与此相对应,刚才提到了算力这一块,我们无比希望摩尔定律持续地发挥作用,算力会持续地去扩张。还有一个点就是模型也在去做小型化,每个人未来都可能会有一个模型在自己的手机里。

结合这三个点,一个是算力,一个是模型的小型化,再有一个就是AIGC生产量的极度扩张。那未来可能会产生这样一个场景,就是以后可能算法推荐不是特别重要了,算法创造变得特别重要,大家以后每天去看的内容,不是算法给你推荐的,而是算法时时刻刻给你创造的。

回到一个和我们产业息息相关的观点,未来可能技术竞争都变得不是特别重要,而是生态竞争会变得非常重要,就是你的一个模型和另外一个模型之间可能不会有特别强的差距,但是有很多人在你这个模型之上去做研发,那么它的生态会长得很大,哪怕有另外一个做模型的公司也都干不过它,所以生态会是更重要的事情。

唐家渝:我觉得未来的技术变革将主要发生在两方面,一是信息,二是能耗。

信息这一块是指需要实现更高效的信息流通。真实世界中,人类无论是在数字世界交互还是物理世界交互,信息都是多模态的,基于一个大脑同时处理不同模态信息。所以,AI的未来发展也必然是多模态融合,在统一化的架构下实现多模态输入与多模态输出,这对信息的处理是最高效、最准确的。

但在技术层面还存在非常多的难点,比如说多模态的信息如何去有效地进行统一表示。目前常见的方式是把各种信息用一个个序列化的形式去表示,对于像图像或者视频这种多维的模态,这实际上天然地破坏掉了数据结构。如果对信息的表示是不充分的,那么模型学习到的知识也是不充分的。另外还包括如何有效提取到不同模态数据的特征与隐含信息、如何设计高效统一的架构等等难题,目前我们团队正在进行一系列攻关并取得了很好的进展。

另外就是能耗层面。人是一个典型的“低能耗、高智能”的智能体,只靠摄入简单的食物就能涌现非常高的智能。未来AI技术的发展也需要去实现利用更少的能源、产生更大的智能化。我们在这方面也做了相关工作,在数月内实现了大模型训练速度数十倍的提升,同时也正开展一系列部署优化工作,让大模型能够在移动端上运行,实现从云端到本地智能化的演进。

王平从技术路线上来说,我们更多地是在这个潮流下去优化我们的微架构,使用更新的工具或者是通过互联之类的来提升我们能力,从而更好地服务客户。

另外一点刚才唐总也提到,我们还要有合作。在底层上,在不丢失精度的情况下,大家做一些合作,可以有效地降低延迟,或者是提高吞吐率,解决客户的真实问题。就像一开始神经网络的模型出来的时候,它对算力要求也很高,但很多都是无用算力。经过几年的演变以后,它的精度和之前是一样的,甚至更好,但它的算力需求降低了很多。这其实是应用侧大家共同合作的结果。我相信未来在算法层上会有很多很多这样一个往下走的过程,在这个过程中我也希望大家能够合作,为客户创造更大的价值。

温永腾:最后回到今天的话题,我们也想分享一下关于生成式AI落地的一些看法。

我觉得这里有两个比较大的变化。第一个是整个生产方式的变化,因为语言模型和生成式模型的出现,各行各业的整个业务流产生了很大的变化。以应用开发为例,虽然前端、后端、数据库依然重要,但我们不可否认,模型的重要性还是大大增加了了,因其使基于底层模型进行产品开发的门槛大幅降低。这不仅可以优化和改变传统的开发流程,也为下一代算力芯片、开发平台和应用市场创造了新的机会。

其次,是用户交互方式的革新。过去,我们总是先预设用户如何使用产品,然后再设计相应的交互流程。而现在,以Language User Interface(语言用户界面)为核心,我们开始有机会为用户的每一次新的需求直接构建或链接内容与服务,这里我们发现还有大量未被充分挖掘的应用场景。这种变化为重塑、增强乃至颠覆传统应用提供了大量的机会,也是我们BV百度风投一直在寻找和探索的方向。

更多活动大会一手信息,欢迎加入创业邦会员,现场聆听一线投资人、头部企业家精彩分享,掌握最新创投趋势!

图片

27567280c7caafd95829dc36c70450d.png