编者按:本文来自微信公众号 中欧商业评论(ID:ceibs-cbr),作者:况阳,创业邦经授权转载。
创造ChatGPT时刻的OpenAI,开始急眼了
三年前,ChatGPT 横空出世,AI 江湖瞬间改朝换代。昔日的王者谷歌,被 OpenAI死死地摁在地上不能动弹。那之后,谷歌接连经历至暗时刻:演示视频造假被扒、自家大模型幻觉严重存在人种偏见、内部文化撕裂……甚至有人开始给谷歌搜索倒计时。
然而,2025 年 11 月18日,伴随着谷歌Gemini 3 的发布,这家科技巨头似乎突然又行了,一下子就翻身了。
一时间,外界开始惊呼:曾经的霸主,怕是又王者归来了。
不仅外界震惊,连谷歌的宿敌OpenAI都感到震惊。OpenAI CEO山姆·奥特曼先是在X(推特)上服气地留言祝贺谷歌,接着没过多久,又迫于Gemini 3对ChatGPT的全面压制,不得不在内部拉响“红色警报”(Code Red),以应对来自谷歌的威胁。

OpenAI拉响内部红色警报,图源:The Information
讽刺的是,这一幕三年前就上演过,只不过当时拉响红色警报的,是谷歌。
如今,才短短三年,攻守就异形了。曾经被动迎战的谷歌,如今反客为主,成了把对手逼到墙角、急红眼的那一方。
数据也验证了这一点。谷歌Gemini的用户使用时长,已开始超越ChatGPT,位居第一。对OpenAI来说,这是一个很危险的信号。

大模型用户使用时长趋势图,图源:金融时报
这真是三十年河东、三十年河西,风水轮流转,今年到我家啊。
很多人好奇,一个从巅峰跌落、步履蹒跚的科技巨人,凭什么突然就重新回到了舞台中央?这是一场真正的科技复兴,还是短暂的数字狂欢?
要理解这一切,我们既要深挖 Gemini 3 的技术能力,更要深入谷歌的组织深处,去看清这家巨头在灵魂层面,到底发生了什么变化?
谷歌Gemini 3,真的强到足以引发行业地震吗?
先回答最关键的问题:Gemini 3真的有那么强吗?
答案是——是的,它确实强得足以让行业侧目。
如果说谷歌早期推出的Bard只是一次“匆匆忙忙、连滚带爬”的应激反应,那么Gemini 3则是谷歌在沉寂三年后给出的“从从容容、游刃有余”的降维打击。
先看最硬核的事实:Gemini 3 Ultra 在少样本学习(5-shot)中取得约 90% 的总准确率,首次突破人类专家平均线(~89.8%),而 GPT-4 在同条件下仅为 86.4%。

Gemini与OpenAI GPT-4测评数据对照,图源:网络
这意味着 AI 在综合考试中的表现第一次历史性地站在人类专家的上方,也意味着 GPT-4 在这场竞赛里被直接甩开了几个身位。
其他数据也验证了这一点。在最新的 LMSYS 大模型竞技场中,Gemini 3 Pro 以 1492 分登顶,把 GPT-5.1、Grok 4.1 等全部甩出一大截。
但真正让行业震惊的,并不是排行榜,而是 Gemini 3 在三大维度上的质变:
1. 从抢答型模型到慢思考专家
Gemini 3 的一项关键突破,是引入了全新的深度推理模式。
过去的大模型更像“抢答机器”:只要你问题一问出,它立刻就给出一个最可能的答案。反应速度确实快,但回答偏浅层,难以处理真正复杂的问题。这种思考模式,其实就是心理学中典型的 “单环”模式。
而 Gemini 3 的 慢思考能力,则更接近心理学家阿吉里斯提出的 “双环”模式:不仅要“做对事情”,更要在行动之前先思考——“我为什么要这样做?”这种在行动前自我质疑、在推理中自我纠错的做法,更接近人类专家的理性思考模式。

心理学家阿吉里斯双环学习模式,图源:GeminiAI生成
这意味着,AI 正在从过去的 “概率生成”范式,迈向更高维度的 “逻辑推理”范式。
2. 行业首次真正意义上的原生多模态
过去的大模型,说是“多模态”,实则多是“缝合怪”——“文本脑 + 视觉外挂”的组合拼装,本质上还是以文本为核心的文本大模型。
Gemini 3 的出现,第一次让行业看到了什么叫真正的“原生多模态”。
它从训练之初便是多模态训练,文本、图像、音频、视频、代码在它眼里没有区别,都是一样的信息流。这种近似“人脑”的通用理解能力,彻底甩开了竞品。在它面前,其他大模型瞬间显得像是上一个时代的古董。
3.从只能回答问题到主动完成任务
借助全新的开发平台,谷歌Gemini 3 不再只是一个“会回答问题的大脑”,而是一个真正能“动手”的智能体——它可以自主操作浏览器、管理本地与云端文件、调用 API、执行复杂流程,甚至能够在需要时发起多步规划。
这意味着,AI 从能说会道,跃迁到了能够实实在在地帮人们做事;从被动响应式工具,跨越为主动行动式伙伴。

Gemini与ChatGPT对比,图源:Sprintzeal.com,谷歌翻译
翻盘的真相:谷歌究竟做对了什么?
很多人都在纳闷:一个业已失去进攻能力三年之久的巨人,为什么突然又能打了,又跑到最前面去了?
企业的成功当然有偶然性,但肯定也有必然性。管理,就是要在偶然中,找到必然。
对谷歌来说,这场科技狂欢里隐藏的必然性究竟是什么?
我们不妨以华为四张地图——业务地图、组织地图、文化地图和人才地图——的逻辑,来一层层破译它的成功密码。

谷歌翻盘的四张地图
1、业务地图:敢于主动革自己的命
谷歌最大的包袱来自它最成功的业务——搜索。十几年来,这个现金牛贡献了谷歌大半的利润,支撑起了谷歌的整个家底。然而,正如华为所说——过去的成功不是未来的可靠向导,这也在很大程度上限制了谷歌的战略魄力,让它畏首畏尾。
所以在很长时间里,谷歌不敢激进地推进生成式 AI。直到 2022 年底,OpenAI 用ChatGPT 给了谷歌一记响亮的耳光,彻底把它打醒了,让它意识到:再不主动革自己的命,就会被别人革命。
于是,谷歌内部正式拉响红色警报(Code Red),做出了十年来最重要的战略决策:从撒胡椒面式的AI投入,转向力出一孔式的 All in AI。
谷歌开始将 Gemini 系列模型定位为下一代核心技术底座,迅速将其全面融入到公司各条产品线中。2023年下半年,谷歌将 Bard 全面升级为基于 Gemini 的新版本,同时做出了一个历史性的动作:把大模型直接塞进谷歌搜索(SGE)。
从此,用户看到的首条搜索结果,永远是由 AI 生成的综合性优质答案。这是什么等级的决策?这是谷歌主动打翻自己的奶牛业务,牺牲短期广告点击率收益,换取更长线的用户时长与体验增长。
2、组织地图:统一指挥中心
长期以来,谷歌的AI实力强得惊人,但也散得可怕——一边是隶属于研究院、擅长大模型架构的 Google Brain,一边是独立子公司 DeepMind,主攻前沿智能。从人才到算力再到科研方向,谷歌的这两大王牌团队像并联的大脑半球,各自辉煌,却很难形成合力。ChatGPT 的爆火,让谷歌瞬间人间清醒:如果连自己的大脑都是分裂的,又如何构建一个统一、强健的超级大模型?
于是,2023 年 4 月,谷歌做出了一个重要的组织决策——将这两个部门 合并,成立全新的 Google DeepMind。CEO皮查伊的讲话直白而犀利:我们需要一个专注的团队,把全部算力压在它身上,让 AI 的研发不再分散为彼此竞争的涓涓细流,而是汇聚为一条奔涌的大河。合并后的领导权交由 DeepMind 联合创始人哈萨比斯(Demis Hassabis )统一掌握,迪恩(Jeff Dean)则转任首席科学家负责路径规划,Gemini(最初代号 Titan)由此获得了真正强有力的组织依托。
组织统一后,谷歌随即将资源倾斜给了新团队:最优先的 TPU 集群,最自由的架构试验权,最强工程师与科学家。Gemini 项目组遍布全球八个时区,数百个协作聊天室昼夜同步,这种研发速度,是过去双轨制结构下几乎无法想象的。这也充分说明,技术突破的背后,往往不是天才的灵光,而是组织终于不再相互拆台。
与此同时,谷歌也开始正面清理长期积累的组织冗余。从 2023 年起,谷歌大幅削减了约三成以上的小团队管理岗——那些只管理三五个人的“微型经理”,被统一拉回到了一线战场去做专业贡献。冗余的层级被剥离,决策链路也因此得以缩短,信息自此直达一线,开发迭代速度显著加快。皮查伊反复强调:“谷歌不能再依赖加人来解决问题,而必须提升单兵与协同效率。”
组织的重塑不只发生在科研端,也发生在产品端。谷歌意识到:模型做得再强,如果到不了用户面前,就只是论文与玩物(Demo)。于是,在 2024 年中,谷歌进一步把原本负责 Bard / Gemini 应用的一线团队,整体并入 Google DeepMind,让研究与产品第一次绑在了一起。研究人员可以第一时间获得用户反馈,产品团队则能即时推动新的模型能力上线。过去需要数月的迭代周期,现在能缩短到数周甚至数天。
归根结底,Gemini 的成功,首要的还是组织成功——是谷歌打通了它的任督二脉。
只有组织跑通了,技术才能真正跑起来。
3、文化地图:回归创始人模式,向“官僚主义”宣战
OpenAI 的迅速崛起,对谷歌那套长年稳健、谨慎乃至日趋官僚化的文化造成了巨大的冲击。原本习惯慢慢打磨、层层评审、不愿意冒险的谷歌,被迫第一次直面现实。
谷歌首先大刀阔斧地清理了自身的官僚主义。今年 5 月,在迈阿密举行的 All-in Summit 上,布林罕见地公开点名谷歌内部的荒诞现象。
“说来惭愧,”布林开口就让全场一惊,“我们内部竟然有一份清单,规定哪些工具能用于编程、哪些不能。荒唐的是,我们自己的 Gemini 赫然在‘不能’那一栏。我完全无法理解。”
这段话背后的讽刺性不言自明:谷歌做出的 AI,竟然谷歌人自己都嫌弃、不愿用。
布林的愤怒不难理解,但让人更震撼的是,即便他亲自下场,这样一条荒谬的禁令也花了很久才被彻底废除——足见谷歌官僚文化根深蒂固到何种程度。
事实上,这只是问题的冰山一角。和几乎所有大企业一样,谷歌也染上了典型的“大企业病”:凡事讲流程、讲规范、讲分工,看起来每个人在忙忙碌碌地把“事情做正确”,却很少有人追问一句——这件事本身正不正确?
原本,佩奇和布林已多年参与公司的日常管理。但自 2022 年底意识到危机后,两人开始密集出现在各种 AI 项目评审会上。尤其是布林,多年来首次频繁现身办公室,直接审阅模型表现,反复督促团队必须“像一家创业公司一样提速”。
功夫不负苦心人,在两位创始人的持续影响下,谷歌文化在慢慢扭转。
谷歌开始重新定义“风险容忍度”。过去谷歌在推出任何 AI 产品时,都要经过漫长的安全审查,宁可慢一点,也不能容忍丝毫差错发生。LaMDA 之所以多年不公开,就是典型例子。创始人布林和其他高层传递的信号十分明确:谷歌不能再是那个谁都能Say No、却无人说Yes的地方。
在这种压力下,谷歌文化发生了肉眼可见的转向——从“宁缺毋滥”变成“边做边改”。Bard 的发布是谷歌这一文化变化的最极端也最具象的体现。尽管内部员工普遍认为它“不够格”,答案质量参差不齐、存在幻觉,但管理层还是决定“先发布出去再迭代优化”,让真实的用户反馈去驱动产品迭代。这在过去几乎是不可想象的事情——它违背了谷歌过去数年来一直坚持的精益求精、把事情做到完美成再发布(Do one thing really, really well)的信条。

谷歌十大信条,图源:《绩效使能:超越OKR》
所以,创始人的回归,不只是精神象征,更是一种使命感的召唤。它意在告诉所有人:AI 不只是某个部门的小目标,而是关乎整个公司生死存亡的大战略。
在一家公司,职业经理人可以是在“打一份工”,但优秀的创始人永远在“经营一份事业”。这种长期主义和使命感,能凝聚组织的灵魂,能重新点燃组织的奋斗激情。
在国内,理想汽车 CEO 李想在三季度财报会上说过一句话,几乎可以作为谷歌故事的最好注脚:
“创业公司和职业经理人是两种完全不同的治理体系。它与流程、组织结构无关,而是管理理念和要素的差异,以及各自适用于不同阶段和行业环境。”
他公开反思理想过去三年推行职业经理人模式,让公司“变成了越来越差的自己”;解决之道,就是废弃职业经理人模式,让创业精神回归。而创业精神的回归,必然伴随着创始人的重新上场。
这也再次表明:当战略范式发生跃迁时,你必须用创始人精神,与大公司病死磕,唯有如此,僵死的组织灵魂才能再次焕发生机。
4、人才地图:让懂AI的人呼唤炮火
其实,在AI赛道,谷歌非但不缺人,还是这个星球上人才密度最高的地方。DeepMind CEO哈萨比斯和高级研究科学家 John Jumper是2025年诺奖得主,两人因在AI领域的突出贡献而获此殊荣。此外,《全球 AI 人才追踪》也显示,谷歌拥有全球最多的顶级 AI 研究者,这一规模甚至让斯坦福、清华和麻省理工等顶尖科研机构都难以望其项背。

全球顶尖人才排行榜,图源:MacroPolo《The Global AI Talent Tracker 2.0》
然而,有人才是一回事,能不能让人才真正发挥价值又是另一回事。
谷歌显然意识到了这一问题,于是在三年间悄无声息地完成了一场“人才革命”。
首先,谷歌在人才队伍内部做了一场“壮士断腕式”的人才大清洗。就在ChatGPT 发布后不到一个月,谷歌就宣布裁撤 12,000 名员工,这是谷歌历史上最大规模的裁员。外界看到的是数字,谷歌内部感受到的则是真实得不能再真实的危机感:资源必须让位给 AI,才能换来未来的增长。与 AI 无关的团队被瘦身,与 AI 不匹配的岗位被优化,母公司Alphabet 在搜索、营销、硬件等十个关键部门开始推行自愿离职计划,组织肌肉被重新塑形。有工程经理坦言:“不知道怎样做才算安全,唯一能做的是拼命加快 AI 项目进度。”某种意义上,这场裁员确实起到了鲶鱼效应,让谷歌多年松散的节奏变得敏捷起来。
同时,为加快人才的规模效应,谷歌将公司最优秀的工程师和研究员抽调出来,集中到最关键的项目上。 在Bard 项目启动时,谷歌直接从各部门抽调 了100 多名最顶级工程师组成突击队,给予他们高度自主权,让他们像战时特遣队一样快速推进。这种“拉最强的人打一场最关键的仗”的做法,过去在谷歌很少出现,如今却逐渐成为新常态。
最后,为了让人才真正成为变革发动机,谷歌这两年还持续调整关键岗位配置,让懂AI 的人上,不懂AI的人下。例如,让搜索负责人 Raghavan 转为技术顾问,让更多产品线的工程负责人直接向 DeepMind 报告,让技术和产品的节奏统一在 AI 大战略之下。组织内部因此诞生出一种新的默契:你可以不懂搜索、不懂广告,但你不能不懂 AI。 在这一点上,谷歌的转型与任正非的管理哲学不谋而合:
在变革时期,雷霆变革手段往往都是——你不换脑,我就换人。
综上,正是谷歌在业务、组织、文化和人才这四张地图上同时破茧重生,才为Gemini 3的横空出世提供了肥沃土壤,让谷歌终于在时隔3年后长舒了一口气,重新站到了AI浪潮的潮头。
谷歌翻盘了,百度在哪里?
最后,当我们把视线拉回中国,国内与谷歌几乎同时押注 AI 的大厂,大概非百度莫属。然而,百度“最近比较烦,比较烦,比较烦”…最新一季财报显示,百度第三季度总收入下滑 7%,亏损 112.3 亿元,这是其上市以来最惨的一份季度成绩单。
更尴尬的是,在百模大战中,百度的大模型虽有存在感,但始终缺少“炸场”时刻,迟迟拿不出像谷歌Gemini 3这样能够点燃市场情绪的王炸级产品。此前,有新闻报道苹果Apple Intelligence 国内最终选了百度进行合作,其中,文心一言作为核心云端引擎。但由于苹果Apple Intelligence在国内最终落地的时间一再生变,百度的大模型产品所受关注度也日渐降低。
三季度,百度的 AI 应用(文库、网盘、数字员工等)收入也显得乏力,同比仅增长 6%。在整个 AI 行业高速狂飙的背景下,这样的增长怎么看都更像是夕阳业务在回光返照,毫无应有的爆发力与想象空间。
甚至,三年前才大举加码 AI 的腾讯,今年都已经尝到了“AI 赋能业务”的甜头,市值一路飙升,这与资本对百度AI的冷寞形成了鲜明对照。
更令人唏嘘的是,原本在 ChatGPT 时刻到来后,国内最早推出中国版聊天机器人的正是百度——文心一言。但短短两年多时间,这款产品的名字连续改了三次:从“文心一言”到“文小言”,再回到“文心”。名字的反复,既是战略上的摇摆,也是自信心的流失。而这款曾被寄予厚望的国内第一款类 ChatGPT 产品,如今已然泯然众人矣。
数据显示:苹果App Store上,文心的下载量仅1.9万,远不及豆包、DeepSeek、千问、Kimi 等新晋大模型应用。QuestMobile《2025 年三季度AI应用价值榜》更显示,文心仅排第八名,月活517 万;而排名第一的豆包月活已达1.59亿,第二的DeepSeek为1.46 亿 - 百度已被它们远远甩在身后。
问题是,同样都是最早押注 AI 的大厂,同样资本雄厚、人才济济,为什么谷歌能迅速翻盘,而百度却仍在泥坑里苦苦挣扎?
谷歌的翻盘告诉我们:对任何一次技术革命而言,成功都不仅仅源自技术优势,而是业务、组织、文化和人才四张地图的同频共振。当这四股力量被重新调校到同一个频率上时,即便是老牌巨头,也能像创业公司一样重新焕发生机,跑起来、杀出来、赢回来。
那么,百度到底卡在哪一张地图上?这才是百度需要思考的真问题。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。







