文心一言背后,站着中国软件自强的梦想

2023-03-20

微信图片_20230320194813.png

出品 | 子弹财经

作者 | 李老师

编辑 | 闪电

美编 | 倩倩

审核 | 颂文

不久前在ChatGPT爆火时,有数码博主说了个段子:“美国高科技公司在搞ChatGPT,而我们的高科技公司在搞外卖与卖菜。”

说者无心,听者有意,大多数中国互联网企业似乎一直在消费互联网的道路上走得太久,忘了在高精尖科技的接续投入。

当年,超级电脑“深蓝”可以勉强战胜国际象棋大师卡斯帕罗夫;后来,阿尔法狗轻松战胜李在石柯洁;不久前在更为复杂的策略性MOBA游戏DOTA2中,Open AI Five队已经可以战胜人类战队。

其实当AI抛弃人类时,他们已经打了招呼,只是被我们选择性忽视了。

1、兵家必争的大模型,百度去拼了

这一次,在生成式AI对世界的颠覆中,我们不能再坐视不理。虽然对于C端用户,ChatGPT目前只是聊天机器人,DALL-E2只是AI图画生成器,但在AI领域他们的意义不止表面那么简单。

人类擅长分析事物,传统AI的首要任务就是帮你分析;不过更擅长的是创造事物,如赋诗一首、作歌一曲、撰文一篇,以从社交媒体到游戏,从广告到建筑,从编程到产品设计,从金融到客服,许多需要人类自发产生内容的行业,都等待着生成式AI的重新创作与落地。

甚至有人设想过,生成式AI将创造工作的边际成本降至零,产生巨大的劳动生产率和经济价值,以及相应的市值。

2022年,生成式AI就已经荣膺最有前景的技术预测榜的榜首,进入2023年,大模型成为全球科技竞赛兵家必争之地。所以基于大模型的杀手级的生成式AI产品——ChatGPT出现了。

但中国不能没有自己的生成式AI产品,因为生成式AI面对中文语境时,会发现从逻辑训练到知识学习都非常复杂。之前有人测试ChatGPT时发现,由于没有丰富的中文训练数据,它有时会胡言乱语,甚至当问题出现一些“弯弯绕”时,ChatGPT并不会拐弯,一“骗”就上当。

微信图片_20230320194854.png

或者当ChatGPT脱离一些通用领域来到需要中文知识积累的垂直领域,它也不一定适合,例如有人问它“津”时前鼻音还是后鼻音时,它回答的是错误的。

微信图片_20230320194859.png

另外,在生成式AI的背后是大模型的训练,这才是兵家必争之地。因为大模型增强了AI技术的通用性,让开发者以更低成本、更低门槛,面向场景研发、使用更好的AI模型。其实早在四年前,当百度创新性的开始文心大模型ERNIE 1.0研发时,微软也向ChatGPT的母公司OpenAI下注了10亿美元。

如今,随着百度新一代大预言文心一言在国内的发布,围绕语言模型的竞赛显然已经正式展开。

不过各种大模型距离规模产业应用,并成为产业基座还有一段路要走,未来几年更是大模型的快速发展窗口期,相关的大模型算法、算力基础设施、下游B端通用应用软件和垂直行业领域都有望迎来加速增长。百度知道哪怕不是立刻能用能产生利润,还是同样义无反顾地做了。

2、文心一言,上场即是胜利

3月16日,百度的GTP类产品文心一言,正式面向公众放开了测试。

在文心一言的新闻发布会上,文心一言与人类在文学写作、逻辑推演等互动都让我们看到了文心一言的“人有我有”。特别是在一些逻辑推理题中,文心一言能发现使用者出了错误的鸡兔同笼题目在骗它,还能在使用者改正题目后模仿一个人类的解题思路将这个题目算出来。

微信图片_20230320194902.png

另外,文心一言在中文语境、多模态下的表现,让我们意识到,其实中国科技企业也可以做到“人有我优”。在新闻发布会上,李彦宏让文心一言解释一下洛阳纸贵这个成语和成语背后的经济价值,文心一言都能顺利完成,在中文语境下,文心一言还可以通过洛阳纸贵赋诗一首。

微信图片_20230320194906.png

在一些中文的倒装句、口语化测试上,文心一言也能够get人类想要什么回答,还不忘提醒一下“直男”送礼物要根据女朋友的需求选。

微信图片_20230320194908.png

另外,百度文心一言的优势在于不仅能够生成文字,还融合了百度在AI领域的其他能力,例如文心一言的图片创作能力、以及根据文案自动生成视频的能力,能够理解你脑海中的画面并且做到还原。

微信图片_20230320194911.png

所以我们看待文心一言,不仅仅是尝鲜式互动,更是百度面对全球科技竞赛升级,又一次站出来的魄力和决心。

因为类似于文心一言的大语言模型,可不是随随便便就能投资得起。对标ChatGPT来看,其总算力消耗约为3640PF-days(即假如每秒计算一千万亿次,需要计算3640天),需要7~8个投资规模30亿、算力500P的数据中心才能支撑运行。

而近十年累计研发投入超过1000亿元的“马拉松式投入”,也让百度具备了先发优势。

目前,百度拥有多个云计算可用区、庞大的超算集群,奠定大模型训练的基础设施。另外,百度还在阳泉、徐水、定兴三个云计算中心,特别是阳泉智能云数据中心仅一期就可承载16万台服务器,预计整个百度阳泉云计算中心可承载24万台服务器。

虽然李彦宏形容大模型训练是暴力美学,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。但面对着文心一言大模型的应用的高并发、高弹性、高精度等不同计算需求,还是用积累做到了游刃有余。

当然,李彦宏也坦言在英文语境下,文心一言确实还有不完美,不过百度也在尽早开放测试,希望可以通过人类的反馈,加速文心一言模型的迭代速度和丰富度。

「子弹财经」了解到,与传统AI通过海量无标注数据进行训练的方式不同,文心一言与ChatGPT均采用的模型微调、强化学习、真实的用户指令等技术逻辑,真人参与反馈后,文心一言高效的反馈闭环能帮助大模型不断去调优迭代,越做越好。

中金互联网行业首席分析师白洋也预计,随着文心一言的公众开放,有望建立起真实的用户调用和模型迭代之间的飞轮,模型将越来越聪明,中国的大语言模型,值得市场给予一些信心与耐心。

回想王坚当年做飞天操作系统,华为当年做鸿蒙,其实都是在没有完全ready的状态下上马,重要的是我们需要有技术觉醒的意识,毕竟科技行业中创新都是九死一生的,这件事让百度这样的大企业来做,“生”的几率更大。可见,文心一言的顺利登场,现在即是胜利,哪怕结果还不完美。

3、中国软件当自强

比尔・盖茨对GPT类产品的赞誉是,这种人工智能技术出现的重大历史意义,不亚于互联网和个人电脑的诞生。那么文心一言的出世,于中国的科技界又意味着什么?

从技术上来看,文心一言是百度在模型层面的一次大开拓。目前行业的共识是,模型层面的不断更迭,改变了IT技术的技术栈,让过去的三层分级,变成了芯片层、框架层、模型层和应用层。而从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,最后到搜索、智能云、自动驾驶、小度等应用,百度是全球为数不多在四层都有领先性产品(布局)的人工智能公司。

微信图片_20230320194917.png

李彦宏还预言,回望2007年,大家不会想象今天会有抖音、淘宝、微信,在AI时代、大模型时代也会出现这样现象级的应用,这些应用会是基

于大模型开发的。因此在模型层上,还会带来三大产业机会。

微信图片_20230320194920.png

第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS(模型即服务),例如多模态大模型大大扩展了AI落地的场景,所以提供的模型是不是好用,成为了未来云计算公司的竞争奥义。

第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Konwhow能力,这时调用通用大模型能力,就能为行业客户提供解决方案。

例如之前有不少金融行业人士向「子弹财经」表达了对于大模型能力的期盼,他们期望生成式AI是否可以把程序化交易的门槛降低,带来客户群体的爆发性增长?大模型后续可以落地个人金融业务成为销售助手、投研助手,因为它是一个“通才”。目前,互联网、媒体、金融、保险、汽车、企业软件等行业的650家头部企业,都宣布加入百度“文心一言”生态。

而第三类是基于大模型底座进行应用开发的公司,即应用服务提供商,随着文心一言等通用AI产品的技术迭代和成本降低,许多公司都有机会参与到生成式AI的创业中。

更重要的是,在真实世界国家能力博弈中,作为中国企业的百度,在运用大模型吸引国内企业合作时,也能够避免一些合规性和话语权的问题。

文心一言之所以可以跨越这么多不同的领域,辅助实现生产效率的提升的基础,是因为百度的文心大模型已经包括36个大模型,涵盖基础大模型、任务大模型、行业大模型的三级体系,全面满足产业应用需求,构建了业界规模最大的产业大模型体系。未来,它提供的能力或将成为人工智能时代的“石油”,支撑社会运行最底层的“代码”。

我们有理由预测,目前文心一言对于大模型的进击,是让基础软件稳定、不再被卡脖子的缩影。毕竟软件及软件池子里的数据、框架、模型,包括积累的软件人才,都是重要的生产资料,没有这些中国的数字经济发展就会受阻,而刚刚过去的“两会”中,国务院机构改革新设了国家数据局,也意味着数字化强国是一定要实现的。

曾几何时大家聊到大飞机、芯片等卡脖子事项时,都会提到,若我们不能啃下这样的“硬骨头”,几十年后,可能较难在竞争中脱颖而出。

在软件中亦然,往小了说是关于产业经济和技术进步,往大了说足以和国家竞争力挂钩,软件也是一场我们“不能输”“输不起”的战争。

《中国人工智能发展报告》中提出:中国在历次工业革命里一直处于落后追赶的状态,而在第四次工业革命兴起之际,中国已经和其他国家一起坐在头班车上。所以,百度坚持文心一言和其他大模型的训练、行业落地,也是中国软件自强的另一种坚持。