谷歌急推大模型,夺回交椅的第一步

2023-12-10
对于谷歌这样的巨头来说,他需要的不是在某一个细分方向和初创公司掰手腕,而是重新夺回领导者的位置

编者按:本文来自微信公众号 财经十一人(ID:caijingEleven),作者:刘以秦,编辑:谢丽容,创业邦经授权转载。

12月6日,外界期待已久的谷歌多模态大模型Gemini (双子座) 发布,包含三个版本,Nano、Pro和Ultra,Pro对标GPT-3.5,Ultra对标OpenAI在今年3月发布的GPT-4。发布会上,谷歌CEO (首席执行官) 桑达尔·皮查伊 (Sundar Pichai) 说,Gemini最先进的版本,Ultra在多项测试中领先GPT-4。

目前上线的只有Nano版本,Nano版本专门用于移动设备,将集成到谷歌最新的手机中,Pro预计在下周上线,Ultra至少要到明年上线,谷歌称这是因为还需要更全面的安全测试。

根据谷歌官网发布的信息,Gemini和GPT-4的对比并非同类比较。以“通用性”为例,Gemini得分90%,GPT-4是86.4%,但Gemini的评估方式是谷歌自己研发的,GPT-4是根据行业标准评估的。

谷歌的新品发布时间大多集中在每年的5月到6月,过去几乎没有在年底的时间段发布过重要产品。在这个节点发布Gemini是谷歌的一次破例,据美国媒体报道,谷歌的管理层担心OpenAI、ChatGPT、微软的Copilot正在成为AI领域的代表,谷歌不能再等下去了。

OpenAI之前,谷歌是全球AI领域公认的领导者。但现在这个地位正在动摇。今年3月,谷歌推出AI聊天机器人Bard,以应对ChatGPT的竞争,但用户体量一直没能赶上。第三方分析公司Similarweb数据显示,今年8月,Bard的访问量1.83亿次,是ChatGPT访问量的13%。

在AI驱动的云计算领域,谷歌和微软的差距也在拉大。今年三季度,微软云服务营收增速29%,高于上个季度的26%;谷歌云服务营收增长25%,低于上个季度的28%。

但谷歌也不是说没有胜算。今年,在中国AI领域频繁被提及的一个问题是,什么时候能有中国的OpenAI和ChatGPT?类似的问题同样出现在美国—什么时候有一家公司能超过OpenAI?多位AI业内人士告诉《财经十一人》,谷歌有希望做出比GPT-4更好的大模型,更好的大模型一定是多模态的,谷歌除了基础设施能力强大,还有YouTube的数据,在视频领域的资源更好。

谷歌演示Gemini的视频中,也频繁使用图像和视频,展现强大的多模态能力。

发布会后,谷歌的股价当天上涨5.3%,市值增加860亿美元,一天就涨出一家OpenAI (最新估值约800亿美元) 。而在谷歌今年3月发布Bard时,股价当天下跌7.4%。

今年截至目前,谷歌股价涨幅约54%,微软涨幅56%。微软最新市值2.7万亿美元,谷歌最新市值1.7万亿美元。

从谨慎到破例

一位熟悉谷歌的AI从业人员告诉《财经十一人》,过去几年,谷歌在AI领域一直相对谨慎,虽然很早就开始了大模型的研发,但并未投入过多资源。

谷歌2018年就发布了大模型Bert,同样是基于Transformer,但和GPT是不同的路径。Bert更像是在过去谷歌AI能力基础上的优化,是一个有几亿参数量的基础模型,在用AI执行具体任务时,只要基于具体场景做微调训练即可,不用再从头做一个模型了。这有点像今天不少中国公司提出的垂直大模型,成本更低。

GPT的参数量超过千亿,成本高得多,但在通用能力上,直接表现出“降维打击”效果。

2018年,OpenAI推出了GPT-1 (参数量约1.1亿) ,在当时不少AI领域的竞赛中,Bert的表现都更好。谷歌证明了当模型参数变大,模型效果更好。但这都还停在“量变”阶段,一位AI从业人员告诉《财经十一人》,参数量从百万级到亿级,已经是很大的投入了,当时没人能证明,当参数量从亿级增加到千亿级时,会发生“质变”。

由于谷歌在AI领域的领先地位以及Bert的表现,2018年后不少科技公司都跟随Bert的路径研发自己的大模型,直到OpenAI推出GPT,且短时间内持续更新迭代。一位关注AI领域的投资人说,OpenAI给了所有科技公司和投资人“当头一棒”。

在Bert之后,谷歌的两名研究员研发出了AI聊天工具Bard。他们试图说服谷歌的高管们对外开放Bard并整合到谷歌助理中,且在发布会上公开演示。但并未成功。谷歌的高管们认为,这不符合谷歌对于AI安全和AI公平的标准。这两名研究员2021年从谷歌辞职创业。

当时,谷歌发言人回应称,研究员的成果是有趣的,但有趣的产品和可以让用户使用的产品之间存在巨大差距,“在对外发布AI技术方面,谷歌必须比初创公司考虑得更周全。”

这并非证明谷歌在AI领域的能力不足,而是在突破性创新面前,初创公司通常会更有魄力,也更能承担失败的后果。OpenAI的早期团队中,有不少核心人员都来自谷歌。

为了应对竞争,谷歌走出谨慎。今年4月,谷歌合并了两个不同的大型AI团队,分别是2011年创建的Google Brain和2014年谷歌收购的独立团队DeepMind。合并后的团队是Google Deepmind,负责Gemini大模型的开发。

这两个团队在过去几乎是没有合作的,Deepmind总部位于英国伦敦,主要做学术方面的研究,谷歌会使用其开发的软件来提升数据中心的运行效率。Google Brain则是用AI技术提升谷歌在搜索、广告等业务的能力。过去,两个团队使用完全独立的代码库,且都研发了自己的大模型,在谷歌的算力资源上存在竞争。

除了合并团队,谷歌还大幅提升了整体工作效率。据美国媒体报道,Bard团队的员工提到,过去三个月才能完成的工作,现在一周就要完成,晚上和周末也要加班。有员工曾经在内部会议上提到,工作和生活已经无法平衡,得到的回应是,这样的员工可能不适合谷歌的大模型团队。

过去10年,谷歌都是AI领域的领导者。2011年,谷歌开始研发机器学习系统,在此基础上2015年推出Tensorflow,成为当时使用最广泛的深度学习框架。2014年,谷歌收购DeepMind,这家公司的使命是推动通用人工智能 (AGI) 的发展,2016年DeepMind推出AlphaGo,打败了最顶级的人类围棋高手,让全世界第一次直观感受到AI的能力。

2016年,桑达尔宣布谷歌将成为一家人工智能优先(AI First)的公司,AI是谷歌最重要的方向。2017年,谷歌研发团队发表了论文《Attention is all you need》,提出了Transformer架构。这也是今天所有大模型的基础。

在算力层面,2015年,谷歌在数据中心中使用TPU (张量处理单元) ,2018年开放给第三方使用。TPU是谷歌为机器学习定制的专用芯片,特点是在不影响深度学习处理效果的基础上,功耗更低。

不少人评价谷歌在大模型领域是“起了大早、赶了晚集”,过去的优势也是谷歌的束缚,谷歌面临的是比其他所有科技公司都更高的关注度和更严格的监管。

谷歌能否改写大模型行业格局?

目前大模型领域呈现出“一超多强”的局面,OpenAI代表的是大模型领域的最强实力,几乎所有新推出大模型的厂商都会对比GPT-4,稍弱一些的会对比GPT-3.5。OpenAI模型的强大是基于巨额成本和持续的投入,在落到实际商业应用中时,会产生“杀鸡是否要用牛刀”的问题。

但谷歌这次推出的大模型目前看来并没有解决高成本的问题,谷歌并未公布训练Gemini耗费的算力,今年8月,芯片研究机构SemiAnalysis的两位分析师Dylan Patel和Daniel Nishball估计,Gemini消耗的算力可能已经超过GPT-4,下一次迭代的版本消耗的算力资源可能是GPT-4的五倍。

谷歌对于Gemini大模型的规划有几个方向,一是凭借其多模态能力,为Youtube的创作者们提供更好的视频创造工具。此外,在贡献谷歌主要营收的广告业务中,大模型可以为广告商提供工具,可以自动生成广告,内容包括文字、音频和视频。

此外,谷歌还会在智能手机中融入大模型能力。目前,谷歌手机的市场占有率并不高,根据Canalys的报告,2023年谷歌智能手机在北美的市场份额仅为4%。同期苹果为54%,三星24%。但在移动设备上融入大模型是一个相对确定的趋势,OpenAI也在积极布局这一领域。手机的计算速度远低于电脑,因此需要对大模型做压缩或是轻量化部署。在国内,华为、百度、腾讯的公司也都在做针对移动端的轻量级模型。

这些都是谷歌基于原有业务的优化,短时间内很难看出实际效果。

不过,谷歌再一次证明了自己在算力和AI技术上的强大实力。对于谷歌这样的巨头来说,他需要的不是在某一个细分方向和初创公司掰手腕,而是重新夺回领导者的位置。

谷歌和亚马逊扶持的初创公司Anthropic被称为OpenAI最大的竞争对手,最新估值约300亿美元。谷歌在今年2月投资了这家公司,回报是Antropic将采购更多谷歌的云计算服务。谷歌还在今年投资了聊天机器人初创企业Character.AI、生成式AI初创公司Runway、AI文生图公司Midjourney,投资回报均包括使用谷歌云和TPU进行大模型训练。

资本市场已经给了谷歌正面反馈,但投资人随时都有可能变脸。

摩根大通董事总经理Douglas Anmuth在给客户的报告中写道:华尔街对谷歌这次的发布会不太满意,也许是认为该产品还不太完整,但我们很高兴看到谷歌在这一重大技术方面取得的进展。

今年2月,桑达尔在一封给谷歌员工的电子邮件中说,谷歌部分最成功的产品并不是最先上市的,而是随着时间的推移赢得了用户的信任,“这是一段漫长的旅程,我们现在能做的是,专注于打造一个伟大的产品,并负责任地开发它。”

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。