拆解华为盘古大模型:与ChatGPT有何不同?

2023-04-10
AI大模型热潮持续

编者按:本文来自微信公众号 时代周报(ID:timeweekly),作者:杨玲玲 郑栩彤,编辑:林铭铭,创业邦经授权发布,头图来源摄图网

AI大模型热潮持续,国内多家科技企业已走出不同路径:百度集团发布文心一言,成为中国第一个类ChatGPT产品;阿里巴巴的类ChatGPT产品通义千问,也在近日开启外部测试。

而市场传言,华为亦将加入大模型竞赛,发布“盘古系列AI大模型”,但时代周报记者未在华为云官网找到相关信息,咨询华为云相关人员“盘古系列AI大模型”上线时间也没有得到明确答复。

4月8日,华为云人工智能领域首席科学家田奇在人工智能大模型技术高峰论坛上发言。论坛上,田奇并未透露关于盘古大模型的最新变化和产品计划,亦未透露更多NLP大模型的消息,而该模型是被认为最接近人类中文理解能力的AI大模型。

但田奇表示,华为云盘古大模型推动人工智能开发从“作坊式”到“工业化”升级。目前,华为已陆续发布矿山、气象、海浪等系列盘古行业大模型,展望未来,AI for Industries是人工智能新的爆发点。

△图源:田奇演讲PPT

当大厂们相继涌入大模型赛道,各行各业纷纷接入大模型提供的AI能力,预示着一场声势浩大的技术革命悄然发生,新的产业风口正在形成。风口之下,华为盘古大模型与其他“类ChatGPT”产品究竟有何不同?

01 拆解盘古大模型

田奇的演讲内容并不新颖。在3月举办的博鳌亚洲论坛2023年年会上,田奇就称“AI for industries将成为人工智能新的爆发点”。

对于广受关注的盘古NLP大模型,田奇透露的细节不多,而这一大模型正是ChatGPT、文心一言、通义千问等近期走红的大模型所属的技术领域。

会上,田奇只简单介绍称,目前,在NLP大模型上,华为盘古聚焦文本生成与内容理解,已进入智能文档搜索、智能ERP、小语种大模型领域,落地企业财务异常检测、阿拉伯语大模型等场景。

市场对盘古新NLP模型的期待,来自于这一模型此前的突出表现。资料显示,2019年的权威中文语言理解测评基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项的排名均为第一,总排行榜得分83.046,接近85.61的人类水平。

上海证券分析师陈宇哲在研报中称,在早前的华为开发者大会上,华为曾宣布盘古大模型是业界首个千亿级生成与理解中文的NLP大模型,其认为未来有望成为国内最强的Chat GPT应用。

演讲的后半段,田奇重点介绍了盘古CV大模型和科学计算大模型,以及它们的应用场景。比如,CV领域的矿山大模型、基于盘古CV大模型的铁路巡检方案等,以及科学领域的盘古气象大模型、药物分子大模型、海浪预测大模型。

其中,盘古矿山大模型通过5G+AI全景视频拼接综采画面卷,传输到地面,地面工作人员将来可以实现地面控制机器进行采矿,实现矿下无人少人安全作业;华为云盘古气象大模型,可实现20公里范围内、小时级、13层最高精度气象预报,如台风生成时间与移动硅基的预测准确率达85%以上;华为云盘古药物分子大模型,让先导药的研发周期从数年缩短至1个月,同时降低70%的研发成本。

浙商证券分析师陈杭撰写研报表示,在ChatGPT背后,不断迭代的GPT系列使得大模型成为当下科技企业核心竞争力的重要体现,未来,大模型将成为AIGC时代的核心支撑。华为作为国内科技龙头,2021年发布的盘古大模型有望在AIGC时代中引领潮流。

02 大模型洗牌提速

加入华为之前,田奇已经是AI领域业界知名的学者。2020年3月,田奇加入华为云后便开始组建团队并进行方向梳理;9月,团队开始推动盘古大模型的立项,希望能够在华为云的产业基座上,完成适配各个产业AI开发的大模型;11月,盘古大模型在华为云内部立项成功,并完成与合作伙伴、高校的合作搭建。

据媒体报道,支撑盘古大模型不断攻坚克难的团队,起初仅有几个人,他们是让盘古大模型得以从实验室走向产业的中坚力量。随后,团队逐渐壮大起来,拥有20多名博士、30多名工程师、3名广受关注的“华为天才少年”,还有50多名来自全国C9高校的专家。

要打造一个属于中文世界,并且适配各种真实产业场景的AI预训练大模型,摆在研发团队面前的是两大门槛。

一个是技术门槛,大模型需要卓越的并行优化来确保工作效率,这对网络架构设计能力提出了更高的要求;第二是资源门槛,大模型训练需要极大的算力,在训练千亿参数的盘古大模型时,团队调用了超过2000块的昇腾910,进行了超过2个月的训练。

2021年4月,盘古大模型正式对外发布。盘古大模型发布以来,已经发展出L0、L1、L2三大阶段的成熟体系持续进化。

所谓L0,是指NLP大模型、CV大模型等五大水平领域的基础大模型;而L1指行业大模型,比如气象、矿山、电力等行;L2指面向各行业中细分场景的模型,比如电力行业的无人机巡检。

去年9月,华为轮值董事长胡厚崑在2022世界人工智能大会上表示,华为云盘古预训练大模型已完成从学术大模型到产业大模型的转变,形成“基础大模型-行业大模型-细分场景大模型”的发展路径,并且在医疗、互联网、金融、煤矿、农业、气象等领域中实现降本增效。

如今,随着华为、百度、阿里、腾讯等科技企业陆续推出相应产品,以及商汤科技、科大讯飞宣布发布计划,大模型赛道将进一步拥挤,市场普遍认为,未来大模型市场势必将迎来新一轮的整合与洗牌。

田奇也在分享中提到,未来“大模型将成为应对AI领域应用碎片化的一种方式,相较于此前不同场景对应不同小模型的状况,未来大模型有可能收编高度定制化的小模型,导致市场向大公司集中”。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。