三星大模型慢半拍

2024-01-20
从智能手机到AI手机,什么是划时代的变化?

编者按:本文来自微信公众号 锌产业(xinchanye2021),作者:山竹,创业邦经授权转载。

2023年做大模型,国内更关注的是云厂商,很少有人会注意到,硬件厂商的大模型做得怎么样。

例如,三星。

实际上,就连三星自己,似乎也没那么热衷于大模型。

相较于其它互联网公司的疯狂跟进、高调发布,三星直到2023年11月才对外公布了自己的大模型产品——一个以传奇数学家高斯(Gauss)命名的大模型。

至于在三星意在打造成下一代机皇的三星Galaxy S24上,并没有看到Gauss的身影。

不过,Galaxy AI还是毫无悬念地成了这代产品的代名词

用一个更时髦的词来替换的话,应该是,端侧AI。

三星求变,大模型上线

在智能手机这个行当里,三星一直是全球销冠,每年出货两三亿部手机都不在话下。

不过,2023年对于三星来说,是运势不佳的一年。

IDC前不久公布的统计数据显示,苹果在2023年超越三星,成为全球智能手机“榜一大哥”,这也是苹果首次超越三星坐上这个期待已久的宝座。

这时的三星,也就更需要一个变数。

“AI将为移动产业带来深远影响,三星也将开启一个新的时代,”在三星Galaxy S24发布会上,三星电子MX部门总裁TM Roh如是说。

图片

TM Roh这里提到的AI,正是加入了云边协同的生成式AI能力的Galaxy AI。

这样的AI在三星Galaxy S24上第一个功能体现是「实时翻译」

三星是直接将实时翻译装进了手机通话系统中,在接打电话时,用户可以选择将通话语音实时翻译成母语语音或文字呈现,这一功能被三星亲切地称为“私人翻译”。

图片

目前这一功能支持汉语、英语、法语、德语、西班牙语等13种语言实时双向互译。

对于国内大部分习惯了使用聊天软件,而非电话功能的用户,这似乎就成了一个比较鸡肋的功能升级。

不过,不要紧,三星还将这一功能下沉到了本地interpreter软件中,用来供国外旅游线下问路、点餐等场景使用。

本地软件,不是这一功能下沉的终点。

三星将这一功能进一步下沉,直接下沉到了三星官方键盘上,让三星键盘可以直接将用户打字内容翻译成目标语言。

图片

从现场演示效果来看,这样的功能升级,要归功于自去年兴起的生成式AI。

实时翻译功能,主要用到的是生成式AI的语言处理能力。

在被三星高度重视的S24上,另一项用到这一能力的功能是「笔记助手(Notes)

在三星Galaxy S24的笔记助手中,用户可以对已经写下的会议记录加入不同风格的个性化排版,也可以对会议记录提取摘要。

图片

这样的笔记助手体验,其实在大模型风靡的2023年已经十分普遍。

尤其是在国内,大部分协同办公软件都已经有了类似的功能,例如此前锌产业文章中提过的钉钉魔法棒,腾讯会议、字节飞书也都上线了类似功能。

如果说有什么不一样的话,那应该是另一个应用了生成式AI图像处理能力的「Circle to Search」功能,翻译成中文就是「即圈即搜」,这实际上是一次对搜索功能的优化。

也是谷歌为Android机带来的一个搜索功能升级

以往用户对搜索引擎的使用,往往是基于文字搜索,即便是基于图片搜索,也是直接上传图片,通过图片对比,搜索同类图片。

这次,在谷歌新新研究出的「Circle to Search」功能中,用户可以在手机上各类应用中圈出感兴趣的元素或内容,直接进行搜索。

图片

在三星Galaxy S24上的使用方法是,长按home键唤醒这一功能,然后圈出要搜索的元素进行搜索。

这样的搜索功能,显然吸取了以往应用在智能手机中的拍照搜图的灵感,但经谷歌之手,直接在移动端的搜索引擎上进行功能升级后,锌产业认为,这样的新搜索功能更接近用户在成熟应用繁多的移动生态上的搜索习惯

值得注意的是,上述这些“端侧AI”能力,实际上均来自谷歌Gemini。

GPT-4的终极对手

2023年12月7日零点过后,谷歌在官方公号上发布了一篇推文,就这样,谷歌Gemini正式亮相了。

谷歌CEO Sundar Pichai说,“Gemini分为Ultra、Pro、Nano三个版本,是我们迄今为止最强大、最通用的模型。”

当时谷歌官方公布的测试结果显示,Gemini Ultra在文本、推理、数学、代码几个领域的表现,已经远超OpenAI的GPT-4

在多模态能力方面,Gemini在图像、视频、音频几个领域的表现,更是全面碾压GPT-4V

图片

正是因为Gemini测试数据的突出表现,尤其是其亮眼的现场演示视频,Gemini在发布后一度陷入“造假”风波。

对此,谷歌官方随后也做出了解释:视频中的输入和输出数据是真实的,只是出于演示简洁目的,剪辑了延时的等待时间。

图片

不过,这并没有影响Gemini成为堪比GPT-4的顶级大模型,Gemini也被认为是GPT-4最强劲的对手

这其中,Gemini Nano是用于端侧AI的大模型,首款搭载Gemini Nano的,是谷歌去年发布的Pixel 8 Pro。

在2023年10月的Made by Google大会上,谷歌曾在Pixel 8 Pro上展示了不少基于生成式AI的功能,当时谷歌用在这款手机上的大模型还是未升级的Bard

即便如此,谷歌依然在Pixel 8 Pro上实现了类似Bing AI的对话式搜索,可以基于本地诸如Gmail、YouTube、谷歌云盘、谷歌地图等应用中获取的信息,为用户生成出行计划、旅行计划等内容。

图片

甚至还将谷歌键盘Gboard进行了一番改造,推出了“智能回复”功能。

可以说,正是Pixel 8 Pro的顺利上市,让三星得以将这一盟友在端侧AI的技术复用到了这次发布的三星Galaxy S24。

初代Galaxy AI,谷歌Gemini至少有一半的功劳

三星高斯慢半拍

2017年,尚且笼罩在Galaxy Note 7爆炸事件阴影中的三星,着手加紧对人工智能相关技术的研究。

这年年底,就传出了三星计划成立人工智能研究中心的消息。

当时CNBC报道称,这一研究中心横跨三星电子的移动和消费电子业务两大部门,为的正是以人工智能这一技术创新,推动以手机为主的消费电子设备的商业创新。

也是在这一年,三星特别为人工智能技术做了一场规模不小的活动,请了十几位大学教授和知名企业、研究机构的研究人员来分享人工智能最前沿的成果,这就是Samsung AI Fourm。

图片

这一论坛,后来一直延续到了今天。

就在两个月前,在Samsung AI Fourm 2023上,三星电子CEO Kye Hyun Kyung在开幕式上分析称:

“2023年,大家已经将目光聚焦到了生成式AI上,以大语言模型为代表的生成式AI技术正在重塑世界,但隐私、幻觉等问题依然存在。”

生成式AI的出现和随之而来的问题,是一个新技术周期的起点,尤其是这项技术中让科学家们束手无策的不可预测与不可控性,科学家们最终只能将生成式AI归结为“智能涌现”。

另一个更微妙的产业背景是,经过2023年一年的百模大战,生成式AI已经从技术竞赛迈入到了产业落地竞赛阶段

这其中尤以1月10日OpenAI应用商店——GPT Store的推出最为代表。

图片

正是在这样的背景下,三星在这个一年一度的AI论坛上,也对外公布了自己的AI大模型——Gauss。

和大多数大模型类似的是,三星Gauss同样强调三项能力:自然语言、代码编写、图像处理。

三项能力分别对应的是三星Gauss的三个模型:Gauss Language、Gauss CodeGauss Image

图片

作为三星研究院一款自研大模型,Gauss首先被三星用到了公司内部,例如通过Gauss Language来辅助员工简化编写电子邮件、工作总结和编译内容等工作。

目的是为了看看,现在的大模型究竟能不能提高工作效率?又能提高多少效率?

另外,也是要在内部使用过程中,发现问题、解决问题,进而优化软件功能,在产品商业化之前尽可能地将模型优化到位。

创新技术内部使用、内部先消化一段时间,是互联网公司一贯的技术验证手段,尤其是对于软件技术。

至于Gauss的商业化,三星官方当时解释称,三星会在2024年将Gauss Language陆续应用到商业化产品中

销量触顶、亟需新意的智能手机,自然也成了Gauss附魔的对象。

然而,从发布会上公布的信息来看,锌产业并没有看到本该出现的Gauss的身影。

尽管如此,三星依然十分看好大模型带来的这波红利,不仅在发布会现场大谈Galaxy AI,TM Roh甚至还做出了两个预测:

第一个预测是,Galaxy S24系列手机将实现两位数增速,三星重回全球第一

第二个预测是,生成式AI功能,预计将帮助全球智能手机市场实现触底反弹

大模型,成了三星为智能手机押注的变数。

那么,从「智能手机」到「AI手机」,什么才是划时代的变化?

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。