文心一言背后,百度还是那个百度

2023-03-20

对百度而言,文心一言不是一个结果,而仅仅是这家技术企业在过去多年投入的一个缩影和侧写。

作者|皮爷

出品|产业家

“第一枪”打响。

伴随着一身“工程师范”的李彦宏出现在台上,在市场备受期待的文心一言正式亮相。在发布会现场,作为百度的掌门人,他依次演示了文心一言的各项功能板块,并基于文心一言的特殊性和未来百度智能云的联动进行了阐述。

功能必然是值得且应该被核心关心的,包括文心一言的回答精准度,包括文心大模型背后的中文数据训练量,以及其能支持多模态的能力。

但在功能背后,一个更应该被思考的视角是,文心一言发布的价值是什么?

对于中国科技的发展,市面上往往有“跟随”和缺乏创新的论调,这种论调在PC互联网以及移动互联网都被一部分人诟病。但在如今的大模型时期,文心一言的出现似乎在向市场证明,中国在科技的创新能力,已经具备了和海外同台竞技的能力。

诚如李彦宏所说,文心一言是如今全世界唯一一个由大厂推出的生成式AI应用。在过去的一段时间里,尽管各家磨刀霍霍,但真正由大厂开发的生成式AI并没有出现。比如微软仅是调用OpenAI的能力,将其集成进自己的产品,而其他厂商如谷歌、Facebook等都没有成型产品的发布。

在当下的节点,文心一言更像一个特殊的“有勇气”的领头人。

关于百度,一个公认的点是百度一直是中国技术的代表企业,不论是被无数人推崇的“工程师文化”,还是百度对于AI长期以往真刀真枪的投入,这些在中国一众互联网大厂中都独具一格。

或者也更可以说,纵观中国科技行业,能够打响,并且能够打好大模型第一枪的,也只能是百度。

一、文心一言,打响中文大模型“第一枪”

第一枪。这是文心一言发出后,不少业内人士对它的评价。

文心一言到底如何?整体来看,中国大模型的第一枪,百度没有令人失望。

首先来看功能层面。从目前发布会介绍的功能来看,文心一言目前在公开场合演示的有文学创作、商业文案创作、数理推算、中文理解和多模态生成能力。其中,文学创作可以说是基于独特的中文大模型生成的,后续四个能力也都在现场做了不错的演示。

而在发布会之后,各方人士也纷纷对文心一言进行了测试。根据文心一言在市场反馈的程度来看,它的回答符合人们对其的预期,尤其是在中文语义的问题表达上,文心一言的表现甚至要高于市场预期,明显优于chatGPT。

一个背景信息是,文心一言背靠的是文心大模型。而文心大模型的定位是基于中文语义的知识增强大模型。从背后训练的数据来看,其训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这使得文心一言在中文语言的问题处理上具备天然优势。

或者也可以说,从使用体验来说,相较于chatGPT,文心一言更符合中国人的使用习惯。

在单纯的创作之外,一个市面上普遍的反馈是,文心一言在推理能力上也有不错的表现。除了李彦宏在现场演示的“比较”的问题,比如对某些计算相关的问题,文心一言也都有不错的回答,其答案的准确性、逻辑性、流畅性也都基本符合预期。

尽管文心一言后续的强预测和推理能力仍需要更多的测试,但人们的正向预期在发布后的几个小时内,就有了充分的良性反馈。

根据数据显示,截至3月16日晚间,百度智能云已经与5家企业完成首批签约合作,并与650家企业启动签约,申请文心一言的API调用服务测试的企业突破6.5万。而在3月17日港股开盘后,百度股价上涨超过10%。

二、“欢迎迈进大模型时代”

那么,为什么在当下产业数字化的节点,各个大厂对生成式AI,以及其背后的大模型有这么高的热情?或者也更可以说,为什么百度要在海外chatGPT推出的很短时间内,迅速推出自己的大模型?

关于大模型,一个通俗的定义是相较于之前的模型训练,其采用的数据更为原始和无秩序,模型框架可以基于深度学习的方式进行自监督学习,基于海量数据进行特殊的智能表达和推理运算。

如果对其做一个更精确的定义是,大模型或将是未来产业数字化的终极方式。

“未来会是大模型+行业模型的时代。”在百度阳泉智算中心的现场,百度智能云云计算产品解决方案和运营部总经理宋飞告诉我们,“在过去的几年时间里,百度已经帮不少企业落地了行业模型的模式。”

类似的形式不罕见。不单纯在国内的部分产业侧,在国外,微软推动的“通用行业模型+行业模型”也在成为各个行业数字化转型的依托。这样做的好处在于,企业可以基于自身的大模型进行内部不同环节的产业表达,比如营销、智能客服等等,帮助企业实现一定程度地智能,进而减少人员成本。

而除了企业内部自行测试之外,在模型被正式推出后,其可以利用外部输入的数据进行深度学习。换言之,伴随着模型被使用次数的越来越多,其智能化程度将会越来越高,模型本身也将越来越成熟。OpenAI推出的GPT大模型就是一个鲜明的例子。

除此之外,尽管当下不论谷歌还是微软,抑或是百度推出的通用大模型更大的预训练模式都集中在C端板块,但未来其将可以与其前端的SaaS应用,以及公有云和私有云产品进行深度耦合,进而提供一个具有实际生产力的工具。

对数字服务厂商而言,这是一个先发战。谁能率先跑出第一步,就能占据先发优势。

但这并不是一件容易的事情。以国外的预训练语言大模型为例,根据国盛证券报告《ChatGPT 需要多少算力》现实,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。以 ChatGPT 在 1 月的独立访客平均数 1300 万计算,其对应芯片需求为 3 万多片英伟达 A100 GPU,初始投入成本约为 8 亿美元,每日电费在 5 万美元左右。

这并不是一笔任何企业都能够且愿意投入的费用。那么,为什么在今天,百度会优先选择站在舞台之上?答案同样是业务本身。

从当下百度的业务模式来看,其上到百度智能云业务、无人驾驶,下到小度等智能终端,以及百度固有的基本盘搜索,本质都可以与文心一言以及文心大模型有足够强的连接力和协同力,且有强加持。

此外,从实际投入来看,早在2019年,百度就已经推出了文心大模型ERNIE 1.0。在2021年,百度又基于ERNIE发布了全球首个百亿参数的对话大模型PLATO-XL。

截止目前,百度最新发布的ERNIE 3.0 Zeus,已经拥有千亿级参数,并具备智能创作等各类自然语言理解和生成任务。与业界其他模型相比,其在公开数据集上的小样本学习、理解和生成任务效果也已经处于非常领先的水平。

换言之,在当下大模型时代即将来临的当下,百度需要并且有能力构建自己的生成式AI产品,以此更好地满足市场需求。此外,通过此,也更能展现中国企业在过去十年里基于技术上的投入和科技厚度。

一个形象的比喻是,如果说OpenAI打开的是AI发展的一道门,那么百度本身已经在这个AI的门内腾挪。

三、我们应该如何理解文心一言?

再说回文心一言产品本身。在打响中国生成式AI产品第一枪背后,我们应该对文心一言有一个怎样客观评价和感知?

综合来看,目前文心一言的表现有惊喜,也有不足。但在chatGPT成为大模型时代的唯一代表的当下,不可否认的是,文心一言正在成为一个中国大模型的新代表。

这种代表不单纯在产品本身,也更在其背后文心大模型代表的中国企业的新侧写。比如百度是如今全球为数不进行全栈布局的人工智能公司,这次文心一言背后的技术栈,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有领先业界的关键自研技术,并且几乎全部是自研产品。

再比如,百度拥有强大的算力基础,其目前拥有阳泉、徐水、定兴三个云计算中心,仅阳泉一个智算中心,就承载着24万台服务器,为大模型的研发提供着强大的底层支持。

同样因为这次文心一言,还被人知道的是百度一直保持的压强式、马拉松式的研发投入。比如在2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。

也可以说,在文心一言发布背后,市场能看到的不单纯是产品本身,也更能看得到中国企业愈发强大的技术实力和为技术持续投入的决心。

此外,在投入之外,百度也恰是在自证。即能感知到的是,伴随着文心一言的发布,百度也在开始享受自己多年技术投入带来的红利反哺,比如文心一言将会给百度智能云强大的AI加持,能给客户提供更为彻底和更为专业的数字化服务,同时结合“通用大模型+产业模型”的形式,为企业打磨自己的模型。

实际上,在过去的几年时间里,百度已经基于文心大模型为客户提供行业模型的解决方案,比如和国家电网一起打造的电力大模型等等,这些模型层的解决方案也终将会反哺到底层的算力层,推动百度智能云的增长和强服务力。

对百度而言,文心一言不是一个结果,而仅仅是这家技术企业在过去多年投入的一个缩影和侧写。“做自己擅长的事情。”这是百度的最真实写照。