
作者丨林夕
编辑丨小龙
图源丨谷歌
Google I/O 2026,终于还是变味了。
过去几年,Google I/O的主角,通常还是某个模型、某个参数量、某个Benchmark。但今年不一样。整场两个多小时发布会,Google其实只反复讲了一件事:Agent。
不是聊天机器人,不是“帮你回答问题”的AI,而是真正开始替用户持续执行任务的AI Agent。
Google想做的,是把Gemini从一个App,彻底变成Google所有入口背后的操作系统。搜索框里有Gemini,Chrome里有Gemini,Android里有Gemini,Docs、Gmail、YouTube、Maps里也全是Gemini。甚至连智能眼镜里,Google也塞进了Gemini。
更关键的是,它不只是会聊天。它开始替你盯信息、跑工作流、调应用、写代码、生成内容、跨平台执行任务,甚至还能自动帮你下单。
某种意义上,今年的Google I/O,更像是Google正式宣布:AI Agent时代,终于开始进入规模化落地阶段。
01 Google开始重新定义Agent
这次发布会上,Google几乎把整个产品体系全部Agent化了。最核心的新产品,是Gemini Spark。
你可以把它理解成Google版“全天候数字分身”。它运行在Google Cloud虚拟机上,7×24小时在线。即便你关掉电脑、合上手机,它依然会在后台继续工作。
Google现场演示了一个典型场景:用户正在组织社区派对,Spark会自动汇总邮件回复、统计每个人带什么东西、追踪谁还没确认、生成提醒邮件、同步Google Sheets,再自动做一份Google Slides宣传页,整个过程几乎不需要用户手动操作。

Gemini Spark演示 图片来源:直播视频截图
另一个演示更像“AI助理”真正落地。用户一句话:“帮我整理过去一周Gemini的重要更新,并用我的语气写成团队邮件。”Spark会自己去Gmail、Docs和聊天记录里找资料,然后自动生成内容。

本质上,Google正在把Agent从“问答工具”,变成“长期运行的执行系统”。过去的大模型,更像即时响应;现在的Agent,则开始拥有持续状态、任务记忆和跨应用执行能力。
Google甚至专门给Android做了一个新的Agent入口:Android Halo。它会直接显示AI当前在后台执行什么任务、进行到哪一步。某种程度上,这已经越来越像一个真正的“数字员工”。
02 Gemini 3.5 Flash:Google开始卷AI成本
但问题来了。Agent最大的难点,从来都不只是能力,而是成本。
因为Agent实在太烧Token了。Google披露的数据非常夸张:目前Google自家产品每月处理的Token,已经达到3200万亿个,同比增长7倍。而Google内部开发任务,如今每天已经消耗超过3万亿Token。
于是,Gemini 3.5 Flash出现了。
这可能是今年Google最关键的模型。因为它不再单纯强调“最强”,而是开始强调“最适合跑Agent”。

Pichai现场直接算了一笔账:如果一家头部企业每天处理1万亿Token,把80%的工作负载从其它前沿模型迁移到Gemini 3.5 Flash,一年能省超过10亿美元。

Gemini 3.5 Flash生成速度为其他模型的四倍 图片来源:直播视频截图
这其实已经暴露出AI行业新的竞争方向:不是谁最聪明,而是谁能把Agent成本压到企业真正敢大规模部署。
Google给出的方案很激进:性能接近顶级前沿模型,输出速度快4倍,在Antigravity平台上甚至快12倍,而成本只有同类模型的一半甚至更低。
更关键的是,它开始专门针对Agent工作流优化。长任务、工具调用、多Agent协作、代码生成、长上下文推理——这些过去最烧钱的环节,现在全成了Google重点优化方向。
所以Google现在反复强调一句话:“你不需要再在质量和速度之间二选一。”因为Agent时代,比拼的已经不是一次回答,而是持续运行能力。
03 Antigravity 2.0:Google版Claude Code来了
如果说Flash负责“让Agent更便宜”,那Antigravity 2.0负责的,就是“让Agent真正开始干活”。

谷歌Antigravity 图片来源:直播视频截图
它原本只是个AI Coding工具,现在Google直接把它升级成了多Agent协作平台。
开发者可以同时调度多个Agent:一个写代码,一个生成设计素材,一个规划产品架构,一个测试漏洞,一个修Bug。Google现场甚至演示了一个极其夸张的案例:93个Agent并行协作,从零开始搭建一个可运行的操作系统。
整个过程持续12小时,处理26亿Token,最终居然真的跑起来了,甚至还能运行Doom。而整个API成本不到1000美元。
Google显然是在正面硬刚Claude Code和Codex。但真正可怕的地方,其实不是Coding,而是Google开始把整个Agent平台化。
因为一旦Agent之间开始协同,很多原本需要团队协作的事情,就开始出现自动化趋势。这也是Google现在最想押注的方向:Agent团队。
04搜索彻底变了
Google这次还对搜索动了最大的一刀。
Pichai说,这是Google搜索框25年来最大升级。因为搜索不再只是“搜答案”,而是开始“生成执行结果”。
比如用户问:“黑洞如何影响时空?”以前搜索会给你十条蓝链,现在Google直接生成一个交互式可视化界面,你甚至可以拖动参数、实时观察变化。
再继续追问:“双黑洞如何形成引力波?”搜索会现场重新生成新的交互页面。
本质上,搜索开始变成实时生成式UI。
Google还把Agent正式塞进搜索。用户未来可以创建Information Agent,让它24小时后台监控信息,比如跟踪股票、监控租房、盯球鞋发售、观察行业动态、追踪价格变化。
Agent会自己搜、自己总结、自己更新。搜索开始从“一次性查询”,变成“持续性任务”。
Google其实正在重新定义搜索本身。
05 Gemini Omni:Google开始冲“世界模型”
另一条很重要的线,是Gemini Omni。

Gemini Omni 图片来源:直播视频截图
Google这次对它的定义非常激进:“从任何输入,生成任何输出。”
它不是单纯的视频模型,而是Google第一次真正意义上的原生多模态世界模型。文本、图片、音频、视频,都能混着输入,然后再混着输出。
现场演示很夸张。用户上传一段骑行视频,一句话:“把背景改成雪地。”Omni直接完成环境替换。再一句:“改成侧面跟拍。”镜头视角直接改变。最后:“加旁白。”AI开始自动生成配音和背景音乐。
整个过程都在一个连续对话里完成,不用切工具、不用重新导出、不用重新上传。
Google其实正在试图把视频生成,从“生成片段”,升级成“持续编辑世界”。
这也是为什么Google一直在强调World Model。因为它真正想做的,并不是视频工具,而是理解现实世界运行逻辑的AI系统。

AI Mode演示 图片来源:直播视频截图
06 Google最恐怖的其实是生态
但整场发布会真正最危险的地方,其实不是模型,而是Google的生态。
因为OpenAI现在最强的,是模型能力;但Google最强的,是入口。
搜索、Chrome、Android、YouTube、Gmail、Maps、Workspace……这些产品加起来,本身就是全球最大的互联网流量系统之一。而现在,Google正在把Gemini嵌进所有入口。

这意味着,别人还在想办法“获取用户”,Google已经开始直接给几十亿用户发Agent。
这是完全不同的战争维度。
甚至连智能眼镜,Google也重新杀回来了。今年发布的Android XR眼镜,可以直接通过Gemini完成导航、下单、消息总结,用户甚至不用掏手机。

Android XR智能眼镜 图片来源:直播视频截图
某种意义上,Google真正想做的,其实是让Gemini变成未来所有设备背后的默认智能层。
07 AI行业开始进入“运营时代”
今年Google I/O还有个特别明显的信号:AI行业正在从“模型竞赛”,进入“运营竞赛”。
过去两年,行业核心是“谁更聪明”;现在开始变成谁更稳定、谁更便宜、谁更能规模化、谁更能真正接管工作流。
所以Google这次反复强调速度、成本、Token效率、推理价格和Agent工作流。因为当AI真正开始进入企业、进入个人长期使用场景后,决定胜负的,已经不只是模型智商,而是整个基础设施。
Google今年资本支出预计高达1800亿~1900亿美元,第八代TPU开始拆成训练芯片和推理芯片。Google甚至公开强调:“我们要把最强AI,变成最便宜的AI。”

谷歌最新训练用TPU 8t 图片来源:直播视频截图
这已经不是单纯的技术竞争,而是一次基础设施战争。
08最后
过去几年,大家一直在讨论:AI到底什么时候能真正“替人做事”。
Google这次给出的答案是:现在。
而且它不准备只做一个聊天机器人。它想做的是,一个全天候运行、跨应用协作、持续执行任务、存在于所有入口里的超级Agent系统。
搜索是入口,Chrome是入口,手机是入口,眼镜也是入口。Gemini则开始变成背后的统一大脑。
Google迟到了。
但现在,它终于开始全面开卷Agent。
本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。







