刚刚,谷歌弃Bard发布超大杯Gemini,全面对标GPT-4,前2个月免费!

2024-02-09
第一时间上手测评

编者按:本文来自微信公众号 量子位(ID:QbitAI),创业邦经授权转载。

就在刚刚,谷歌深夜搞了个大动作——

Bard现在统称Gemini。

发布Gemini Advanced,由谷歌最强多模态大模型Gemini Ultra 1.0支持!

图片

为了防止概念混淆,我们拿OpenAI家的大模型来对比理解:

  • Gemini是品牌总称,相当于OpenAI的ChatGPT;

  • Gemini Advanced付费服务,对应ChatGPT Plus;

  • Gemini Ultra模型,对标的是GPT-4;

切换到Gemini Advanced界面的操作也和ChatGPT类似,只需点击左上角的选项即可:

图片

在价格方面,Gemini Advanced的定价也是颇有意思——19.99美元/月,比ChatGPT Plus(20美元/月)便宜了亿点点。

不过谷歌也给出了一个小福利,订阅后的前两个月,免!费!!

并且不会像GPT-4那样有每小时使用次数限制,可以放开了用。

图片

不仅如此,谷歌这次还顺带在安卓手机里推出了Gemini的APP,特定的安卓机长按电源键等按钮可以“直达”的那种:

图片

iOS用户也不用着急,Gemini将在未来几周会出现在Google App中,届时的打开方式会是这样的:

图片

毕竟谷歌此前发布Gemini Ultra这款大模型之际,便是一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平。

现如今产品化的它终于上线,也是让众多网友纷涌而至,一时间也是出现了短暂的宕机。

图片

那么加持了谷歌自家最强大模型的Gemini Advanced,效果到底如何?

我们在第一时间成功开通了试用。

实测Gemini Advanced

虽然谷歌声明目前只开放英语支持,但实测用中文提问,它不但能懂也能用中文回答

既然是谷歌出品,肯定少不了考验它的联网搜索能力。

本来想试试能不能当吃瓜神器,结果因为谷歌严格的伦理道德限制,Gemini Advanced当场拒绝作答。

图片

那么退而求其次,问问纯事实不带价值判断的,它的表现就非常亮眼了。

图片

回答中,标绿色的语句展开就可以看到引用来源

图片

标黄色的语句则表示没有找到明确引用来源,可以尝试进一步核实。

图片

AI在回答中生成的表格数据,也可以点击“Export to Sheets”一键导入到Google Docs进一步编辑处理,在工作场景可以说是非常实用了。

图片

接下来,还可以在“扩展程序”中打开对其他谷歌服务的支持,如地图、Gmail邮箱、YouTube视频。

图片

关联邮箱账号后,Gemini Adavanced就成变你的个人AI管家,可以帮你管理不少事情了,如找出可退订垃圾邮件。

不过很可惜,扩展程序目前还不支持中文指令。

图片

用英语“find me youtube videos……”就可以触发搜索视频功能,辅助学习知识也是一把好手。

图片

除了联网搜索、集成应用,谷歌还特别强调了Gemini Advanced的推理能力。

先来一道微软对GPT-4测试时的经典推理题,结果Gemini Advanced不仅成功作答,还考虑了额外的小概率情况。

图片

注意界面中的“Show drafts”按钮,代表Gemini Adavanced每次会生成三个“草稿”,并挑选其中最好的展示出来。

三个草稿或使用不同的推理方式,或试用不同的写作风格,但答案无一例外都是正确的。

如果实在不巧,遇到三个草稿都不满意的情况,也可以选择最右边的全部重来按钮。

图片

再注意答案最后面一排按钮,除了常规的点赞、点踩、分享之外,还有两个不常见的新功能

中间的滑块按钮代表“修改回答”,可以选择更短、更长、解释更简单、语气更轻松、语气更正式。

图片

尝试选择语气更轻松,整个回答就会变得更口语化。

图片

选择更正式,整个回答就像是在考场上答卷了。

图片

最后的谷歌G图标,代表使用搜索引擎核查AI生成的答案是否准确,结果同样也会用“绿色-有引用来源”,“黄色-无引用来源”的形式标出来。

图片

在更实用的场景中,要求生成一副科技主题春联,Gemini Adavanced也能满足“仄起平收”这个要求。

图片

生成代码也是小菜一碟,还“大义灭亲”,把自家广告也给隐藏了。

图片

一番体验之后,最后总结一下。

Gemini Advanced在超大杯Gemini Ultra模型加持下,能力基本达到GPT-4同级别水平

设计上也更像一个成熟产品,而不是大模型的技术演示Demo了。

与谷歌强大的互联网服务集成后,实用性上也有独到之处。

另外在这次发布前,量子位也与谷歌Gemini团队有过一次短暂的交流。

团队表示这次发布更专注于把Gemini Ultra的语言能力释放到产品中,未来还会持续更新多模态能力、交互性更强的代码功能,以及上传文件分析数据等功能

与谷歌产品更深入集成,比如直接在Gmail里使用Gemini来回复邮件,目前还在“Coming soon”状态。

不过我们要到一张示意图,敬请期待。

图片

另外在交流中,谷歌开发团队特别提醒了一点:

由于产品刚刚从Bard改名为Gemini,AI偶尔会出现混乱,需要时间慢慢过渡。

图片

原来AI也像人类一样改名会不适应,也是让人哭笑不得了。

都是20美元,你pick哪一个?

就在这次Gemini Ultra刚刚有消息传出的时候,知名爆料账号Flowers from the future组织了一次投票。

同样20美元,GPT-4和Gemini Ultra你会订阅哪个?

最终2360人参与,有四成坚定的继续留在GPT-4,只有12.3%选择迁移到Gemini Ultra。

图片

不过这次投票是在真正发布之前几天了。

在体验过之后,不知道又会有多少人因为产品的功能体验和服务集成“弃O投G”。

而就在刚刚,沃顿商学院一位教授表示在他已经提前体验了Gemini Advanced长达6周的时间。

他给出的一句评价是:

Gemini Advanced显然处于GPT-4的水平,但并没有明显超过它。

二者在使用过程中各有各的优势。

图片

例如在搜索能力方面,让它俩都去查看一下运动鞋的最新趋势,Gemini Advanced能够搜索YouTube,而ChatGPT使用的是Bing。

这表明Gemini Advanced在搜索集成方面有所不同。

图片

这位教授还认为Gemini Advanced的界面比GPT-4更流畅,技术错误出现的也较少。

它在“个性”上与GPT-4有所不同,更友好和愿意进行文字游戏。尽管两者在个性上有差异,但它们在处理复杂提示时表现出了兼容性。

图片

当然,这并非是教授在拿Gemini Advanced和ChatGPT直接做比较,而是借着二者探讨AI在未来可能发展的方向:

Gemini Advanced与GPT-4相比的独特优势和劣势表明,模型仍有很大的改进空间,未来我们将继续看到快速的进步。AI的发展浪潮尚未达到顶峰,OpenAI的下一步可能是发布传闻中的GPT-4.5或GPT-5。

如今距离ChatGPT发布已经过去14个月还要多,谷歌终于在模型-应用-生态上都准备好了与之竞争的对位产品。

然鹅,老对手OpenAI却已悄然奔向下一个战场。

根据The Information爆料,OpenAI正在开发新一代Agent应用,根据用户请求移动光标、点击、输入文本以及像人类一样使用各种APP。

如将文档中的数据填写到电子表格中进行分析,或在会计软件中自动填写费用报告。

图片

换句话说,下一代ChatGPT将接管你的手机和电脑。

参考链接:

[1]https://blog.google/technology/ai/google-gemini-update-sundar-pichai-2024/

[2]https://blog.google/products/gemini/bard-gemini-advanced-app/

[3]https://www.oneusefulthing.org/p/google-gemini-advanced-tasting-notes

[4]https://www.theinformation.com/articles/openai-shifts-ai-battleground-to-software-that-operates-devices-automates-tasks

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。