谷歌急推大模型，夺回交椅的第一步

财经十一人·2023-12-10

关注

节点

四川社区社交

建立国内第一的资源社交市场。

最近融资：|2014-07-01

我要联系

对于谷歌这样的巨头来说，他需要的不是在某一个细分方向和初创公司掰手腕，而是重新夺回领导者的位置

编者按：本文来自微信公众号财经十一人（ID：caijingEleven），作者：刘以秦，编辑：谢丽容，创业邦经授权转载。

12月6日，外界期待已久的谷歌多模态大模型Gemini （双子座）发布，包含三个版本，Nano、Pro和Ultra，Pro对标GPT-3.5，Ultra对标OpenAI在今年3月发布的GPT-4。发布会上，谷歌CEO （首席执行官）桑达尔·皮查伊（Sundar Pichai）说，Gemini最先进的版本，Ultra在多项测试中突出GPT-4。

目前上线的只有Nano版本，Nano版本专门用于移动设备，将集成到谷歌最新的手机中，Pro预计在下周上线，Ultra至少要到明年上线，谷歌称这是因为还需要更全面的安全测试。

根据谷歌官网发布的信息，Gemini和GPT-4的对比并非同类比较。以“通用性”为例，Gemini得分90%，GPT-4是86.4%，但Gemini的评估方式是谷歌自己研发的，GPT-4是根据行业标准评估的。

谷歌的新品发布时间大多集中在每年的5月到6月，过去几乎没有在年底的时间段发布过重要产品。在这个节点发布Gemini是谷歌的一次破例，据美国媒体报道，谷歌的管理层担心OpenAI、ChatGPT、微软的Copilot正在成为AI领域的代表，谷歌不能再等下去了。

OpenAI之前，谷歌是全球AI领域公认的领导者。但现在这个地位正在动摇。今年3月，谷歌推出AI聊天机器人Bard，以应对ChatGPT的竞争，但用户体量一直没能赶上。第三方分析公司Similarweb数据显示，今年8月，Bard的访问量1.83亿次，是ChatGPT访问量的13%。

在AI驱动的云计算领域，谷歌和微软的差距也在拉大。今年三季度，微软云服务营收增速29%，高于上个季度的26%；谷歌云服务营收增长25%，低于上个季度的28%。

但谷歌也不是说没有胜算。今年，在中国AI领域频繁被提及的一个问题是，什么时候能有中国的OpenAI和ChatGPT？类似的问题同样出现在美国—什么时候有一家公司能超过OpenAI？多位AI业内人士告诉《财经十一人》，谷歌有希望做出比GPT-4更好的大模型，更好的大模型一定是多模态的，谷歌除了基础设施能力强大，还有YouTube的数据，在视频领域的资源更好。

谷歌演示Gemini的视频中，也频繁使用图像和视频，展现强大的多模态能力。

发布会后，谷歌的股价当天上涨5.3%，市值增加860亿美元，一天就涨出一家OpenAI （最新估值约800亿美元）。而在谷歌今年3月发布Bard时，股价当天下跌7.4%。

今年截至目前，谷歌股价涨幅约54%，微软涨幅56%。微软最新市值2.7万亿美元，谷歌最新市值1.7万亿美元。

从谨慎到破例

一位熟悉谷歌的AI从业人员告诉《财经十一人》，过去几年，谷歌在AI领域一直相对谨慎，虽然很早就开始了大模型的研发，但并未投入过多资源。

谷歌2018年就发布了大模型Bert，同样是基于Transformer，但和GPT是不同的路径。Bert更像是在过去谷歌AI能力基础上的优化，是一个有几亿参数量的基础模型，在用AI执行具体任务时，只要基于具体场景做微调训练即可，不用再从头做一个模型了。这有点像今天不少中国公司提出的垂直大模型，成本更低。

GPT的参数量超过千亿，成本高得多，但在通用能力上，直接表现出“降维打击”效果。

2018年，OpenAI推出了GPT-1 （参数量约1.1亿），在当时不少AI领域的竞赛中，Bert的表现都更好。谷歌证明了当模型参数变大，模型效果更好。但这都还停在“量变”阶段，一位AI从业人员告诉《财经十一人》，参数量从百万级到亿级，已经是很大的投入了，当时没人能证明，当参数量从亿级增加到千亿级时，会发生“质变”。

由于谷歌在AI领域的突出地位以及Bert的表现，2018年后不少科技公司都跟随Bert的路径研发自己的大模型，直到OpenAI推出GPT，且短时间内持续更新迭代。一位关注AI领域的投资人说，OpenAI给了所有科技公司和投资人“当头一棒”。

在Bert之后，谷歌的两名研究员研发出了AI聊天工具Bard。他们试图说服谷歌的高管们对外开放Bard并整合到谷歌助理中，且在发布会上公开演示。但并未成功。谷歌的高管们认为，这不符合谷歌对于AI安全和AI公平的标准。这两名研究员2021年从谷歌辞职创业。

当时，谷歌发言人回应称，研究员的成果是有趣的，但有趣的产品和可以让用户使用的产品之间存在巨大差距，“在对外发布AI技术方面，谷歌必须比初创公司考虑得更周全。”

这并非证明谷歌在AI领域的能力不足，而是在突破性创新面前，初创公司通常会更有魄力，也更能承担失败的后果。OpenAI的早期团队中，有不少核心人员都来自谷歌。

为了应对竞争，谷歌走出谨慎。今年4月，谷歌合并了两个不同的大型AI团队，分别是2011年创建的Google Brain和2014年谷歌收购的独立团队DeepMind。合并后的团队是Google Deepmind，负责Gemini大模型的开发。

这两个团队在过去几乎是没有合作的，Deepmind总部位于英国伦敦，主要做学术方面的研究，谷歌会使用其开发的软件来提升数据中心的运行效率。Google Brain则是用AI技术提升谷歌在搜索、广告等业务的能力。过去，两个团队使用完全独立的代码库，且都研发了自己的大模型，在谷歌的算力资源上存在竞争。

除了合并团队，谷歌还大幅提升了整体工作效率。据美国媒体报道，Bard团队的员工提到，过去三个月才能完成的工作，现在一周就要完成，晚上和周末也要加班。有员工曾经在内部会议上提到，工作和生活已经无法平衡，得到的回应是，这样的员工可能不适合谷歌的大模型团队。

过去10年，谷歌都是AI领域的领导者。2011年，谷歌开始研发机器学习系统，在此基础上2015年推出Tensorflow，成为当时使用最广泛的深度学习框架。2014年，谷歌收购DeepMind，这家公司的使命是推动通用人工智能（AGI）的发展，2016年DeepMind推出AlphaGo，打败了最顶级的人类围棋高手，让全世界第一次直观感受到AI的能力。

2016年，桑达尔宣布谷歌将成为一家人工智能优先（AI First）的公司，AI是谷歌最重要的方向。2017年，谷歌研发团队发表了论文《Attention is all you need》，提出了Transformer架构。这也是今天所有大模型的基础。

在算力层面，2015年，谷歌在数据中心中使用TPU （张量处理单元），2018年开放给第三方使用。TPU是谷歌为机器学习定制的专用芯片，特点是在不影响深度学习处理效果的基础上，功耗更低。

不少人评价谷歌在大模型领域是“起了大早、赶了晚集”，过去的优势也是谷歌的束缚，谷歌面临的是比其他所有科技公司都更高的关注度和更严格的监管。

谷歌能否改写大模型行业格局？

目前大模型领域呈现出“一超多强”的局面，OpenAI代表的是大模型领域的最强实力，几乎所有新推出大模型的厂商都会对比GPT-4，稍弱一些的会对比GPT-3.5。OpenAI模型的强大是基于巨额成本和持续的投入，在落到实际商业应用中时，会产生“杀鸡是否要用牛刀”的问题。

但谷歌这次推出的大模型目前看来并没有解决高成本的问题，谷歌并未公布训练Gemini耗费的算力，今年8月，芯片研究机构SemiAnalysis的两位分析师Dylan Patel和Daniel Nishball估计，Gemini消耗的算力可能已经超过GPT-4，下一次迭代的版本消耗的算力资源可能是GPT-4的五倍。

谷歌对于Gemini大模型的规划有几个方向，一是凭借其多模态能力，为Youtube的创作者们提供更好的视频创造工具。此外，在贡献谷歌主要营收的广告业务中，大模型可以为广告商提供工具，可以自动生成广告，内容包括文字、音频和视频。

此外，谷歌还会在智能手机中融入大模型能力。目前，谷歌手机的市场占有率并不高，根据Canalys的报告，2023年谷歌智能手机在北美的市场份额仅为4%。同期苹果为54%，三星24%。但在移动设备上融入大模型是一个相对确定的趋势，OpenAI也在积极布局这一领域。手机的计算速度远低于电脑，因此需要对大模型做压缩或是轻量化部署。在国内，华为、百度、腾讯的公司也都在做针对移动端的轻量级模型。

这些都是谷歌基于原有业务的优化，短时间内很难看出实际效果。

不过，谷歌再一次证明了自己在算力和AI技术上的强大实力。对于谷歌这样的巨头来说，他需要的不是在某一个细分方向和初创公司掰手腕，而是重新夺回领导者的位置。

谷歌和亚马逊扶持的初创公司Anthropic被称为OpenAI最大的竞争对手，最新估值约300亿美元。谷歌在今年2月投资了这家公司，回报是Antropic将采购更多谷歌的云计算服务。谷歌还在今年投资了聊天机器人初创企业Character.AI、生成式AI初创公司Runway、AI文生图公司Midjourney，投资回报均包括使用谷歌云和TPU进行大模型训练。

资本市场已经给了谷歌正面反馈，但投资人随时都有可能变脸。

摩根大通董事总经理Douglas Anmuth在给客户的报告中写道：华尔街对谷歌这次的发布会不太满意，也许是认为该产品还不太完整，但我们很高兴看到谷歌在这一重大技术方面取得的进展。

今年2月，桑达尔在一封给谷歌员工的电子邮件中说，谷歌部分最成功的产品并不是最先上市的，而是随着时间的推移赢得了用户的信任，“这是一段漫长的旅程，我们现在能做的是，专注于打造一个伟大的产品，并负责任地开发它。”

本文为专栏作者授权创业邦发表，版权归原作者所有。文章系作者个人观点，不代表创业邦立场，转载请联系原作者。如有任何疑问，请联系editor@cyzone.cn。