为什么说AI将是下一代网盘的基石?

2022-08-01

你可能用过iPhone自带相册的“回忆”功能:系统将同一地方或相关主题的照片精选后,再自动配上BGM生成小视频。虽然结果有些“粗糙”,却改变了我们使用照片的方式。

iPhone相册的“回忆”功能,是AI加持下手机相册服务主动化的一次尝试。而在云端网盘上,利用更强大的云端AI技术,照片的智能化服务已向前一步。前段时间,小红书、微博等平台有很多用户分享了#如果回忆会说话#照片回忆杀,照片上的文案不是手工输入而是AI配置。

这是百度网盘做的一个活动,用户上传任意类型的图片到百度网盘,AI都会结合照片上的人物、场景、风格等匹配文案,生成秒懂用户的照片回忆。

从百度网盘的动作可以看到,网盘能给用户做的比存储、管理和分类照片可以更多。用AI给照片加载智能文案,网盘也卷到了一个新的高度。

2012年是网盘大众化的元年,这一年,百度、腾讯、网易和360等互联网公司纷纷推出网盘服务,“百盘大战”一度上演。不过2016年网盘市场却迎来关停潮,UC、新浪、金山和迅雷等公司的网盘业务相继关闭。

十年弹指一挥间。今天的网盘市场玩家所剩无几,互联网公司中坚持下来的只有百度等少数公司,其余玩家要么是运营商要么是手机厂商。此一时彼一时,当年决定关停网盘的玩家,今天或许会悔不当初,因为:网盘市场的黄金时代终于到来。

5G时代“云肥端瘦”,网盘迎来黄金时代

5G时代,人们拥有的设备越来越多,设备产生的数据越来越多。以照片视频为例,随着智能手机影像能力提档升级,人们拍摄的照片和视频越来越多,且越来越“大”,比如4K高清内容日益流行。

属于每个人的数据越来越多“大”,但受限于成本和技术,手机/Pad存储空间不能无限扩容,512GB成为一道槛且成本高企不下,很多设备用一段时间后都面临“存储空间将满”的提示。

用户本地数据大爆炸与手机存储短时间难扩容的矛盾,引发了“存储焦虑症”。与此同时,IoT技术普及让个人或家庭的设备越来越多,可穿戴设备、智能家居、智能汽车、无人机等都在不断生产数据,而疫情则加速了人们的工作、学习、生活场景的上云,比如远程办公日益流行,这些变化都意味着,人们在不同设备间进行内容同步、备份和分享的需求越来越强。

不论是缓解存储焦虑症,还是数据的备份、同步、分享,都可被网盘很好地满足。云存储空间理论上无上限。基于5G等新一代网络,数据上云成本显著降低,不同设备间数据同步、内容分享变得更容易。结果就是,云存储服务呈现出爆发之势。

艾媒咨询发布的《2022年中国个人网盘市场研究报告》显示,5G、AI和大数据等技术的快速发展,使得个人网盘的应用场景趋向多元化,未来云存储容量需求将不断增加,2021年中国个人云存储的用户规模达4.41亿人,预计2022年底将达4.89亿人。

不过,随着人们数据需求的不断升级,今天的网盘早已不再只是解决存储痛点的“云端硬盘”,在存储外,网盘承载了更多新的价值。

当我们用网盘时,我们在用什么?

2005年,Gmail首创的大容量空间已被用户用来储存文件,这是网盘的雏形,此后Dropbox、115网盘等初代网盘面世,核心只解决一个问题:即云存储,人们将数据存储到云上,需要使用时下载到PC等本地设备,这一阶段可被称为网盘1.0时代。1.0时代的网盘本质上只是将U盘/移动硬盘云端化,增大空间的同时,规避了U盘/硬盘需要携带,容易丢失,不够安全这些缺点。

2012年,百度等互联网公司入局网盘市场,网盘在存储这一刚需外,形成了更多增值服务,核心体现在数据管理上,比如针对照片视频,网盘支持相册管理、图片水印、视频播放等简单的管理和处理功能;再比如针对办公文档,网盘支持在线查看甚至在线编辑等功能。这一阶段可被称为网盘2.0时代,即在数据存储的基础上力所能及地增加数据管理的需求,尽可能地提高用户数据管理的效率。

这两年,人们在使用网盘中出现了新的需求,即人们越来越倾向于在网盘上所见即所得的消费数据,而不是将文件下载到“本地”再处理使用,一方面是因为疫情让人们习惯于云端获取一切,包括文档都在走向在线化编辑,“能不下载就不下载”,这其实也是懒人经济使然;另一方面,5G、AI等技术日益成熟,给人们在云端直接消费数据提供了基础能力。

举两个例子,一个是照片视频这样的影像文件,人们除了要在网盘存储备份和分类管理外,还有照片美化、处理、打印甚至分享的需求,针对此百度网盘推出独立的一刻相册来满足,并引入了美图秀秀、云冲印等小程序服务;另一个是视频文件,用户也不再满足于只是可以“看”,而是要有高清播放、倍速播放、投屏播放等播放功能,甚至可以直接将照片转化成带BGM的可分享视频。

也就是说,用户想要在网盘上做的事情越来越多,网盘变得越来越“重”,其在数据存储、数据管理、数据同步等传统功能外,越来越多地满足于用户的内容消费需求。正是因为此,我们看到现在头部网盘玩家的发力方向不再是PK存储空间大小,传输速度快慢,而是围绕云端内容细化不同场景对服务深耕细作,而只满足存储这一单一需求的平台基本都很小众,比如iCloud就无法改变苹果用户转投第三方网盘的趋势。

从内容管理工具到内容消费平台,是网盘从2.0阶段迈入到3.0阶段后的根本变化。在新的阶段,网盘的核心竞争点将不再是存储、传输等传统“硬功能”,而是围绕内容消费决策的“软服务”,而要服务好用户的内容消费需求,就离不开AI技术的全面支持。

网盘3.0时代,AI是用户体验的基石

当用户对网盘的需求只是数据存储以及简单的数据管理时,AI技术并没有很大的发挥空间,这时候的网盘更多是“资源型”网盘,谁有存储空间、谁有网络带宽,谁就可以做好,这也是运营商一度成为网盘主力玩家的原因所在。

不过,3.0时代的网盘承载了更多内容消费决策的价值,其在更强的数据管理基础上,进一步提供了大量的主动服务,就像一个数据管理的智能助理一样。要对海量网盘数据进行全生命周期管理,AI技术也就变得更加重要,甚至不可或缺。

一、云端数据越来越多,人工管理难。

最突出的就是照片与视频的爆发式增长。用户习惯每天拍摄照片视频,系统后台会不断同步到云盘。数据生产是碎片化、随机性、不间断的,但数据的整理却是系统工程。随着云盘数据的日积月累,用纯人工的手段去管理已不现实,而对海量数据的处理正是AI技术所擅长的。

针对这一痛点,百度网盘基于AI算法实现比本地相册更强大的智能分类能力。相较于手机相册常见的日期、地点、人物等粗放分类而言,百度网盘基于机器视觉、知识图谱等AI技术,可实现对照片本身的深层理解,基于此给照片打上归类标签进行智能分类,大幅提高了用户整理和查找照片的效率。此外,百度网盘正在探索基于照片语义理解的照片复杂搜索能力,用户可通过类似于“在水库边有几棵开着黄花的树”这样的自然语言去找到对应的照片。

简言之,通过AI技术去理解内容本身,再基于此对数据进行智能管理将是网盘的发展趋势。

二、云端数据容易沉睡,主动消费难。

很多人一直将数据同步到硬盘、云盘却很少使用,因为数据越多,整理越难,越不整理,越难消费。随着数据在云端日积月累,用户对内容的使用往往会“有心无力”,可能想去看看照片/视频回忆却不知道从何看起。这时候,云盘要基于AI技术形成主动服务能力,激活用户使用,让内容不再沉睡,iOS自带相册上线“回忆”功能正是基于这一逻辑。

百度网盘基于AI技术,做了“回忆”升级版,基于对照片内容的深刻理解,百度网盘上线了AI智能推荐,通过对用户的意图识别,可智能筛选照片组合成用户感兴趣的回忆内容,让昔日的故事能够重现在用户眼前,让以前的照片不再“蒙尘”,这一功能上线后,百度网盘每天有将近百万的用户翻阅自己的回忆,用户人均图片消费张数提升了将近30%。

实际上,百度网盘的AI智能推荐服务跟iOS相册的回忆要解决的问题都是类似的,即对数据智能整理给用户提供主动服务。不同的是百度网盘在云端基于更强大的AI算法和算力,以及更全面的数据,将“主动服务”这件事情做得更好。

开篇提到的#如果回忆会说话#活动,也是百度网盘基于AI技术让照片不再沉睡的一次探索。看似简单的“给照片智能配文案”功能,底层技术并不简单。根据百度研发工程师此前在“照片会说话背后的智能化技术解析”直播中介绍,百度网盘&一刻相册的智能配文应用了基于飞桨文心大模型Ernie-Vil智能配文服务。文心大模型可针对不同场景定制AI模型,其中跨模态大模型(ERNIE-ViL)可同时对图片与文字进行理解学习,基于此再给照片配置的暖心文案丝毫不输人工,得到了用户的认可。从整个技术实现来看,要实现有意义的照片智能配文技术门槛还是很高的。

三、云端数据体量庞大,智能处理难。

用户使用数据的过程需要对数据进行处理,比如文档要编辑,视频要剪辑,照片要美化……不过,存储在云端的数据有着不同的文件格式,人们的处理需求也五花八门,正因为此,过去云盘只能提供基础的存储和少量的管理功能,在内容的处理上能做的不多,以照片视频为例,人们在分享前往往需要先下载再打开专门的美图工具美化处理,这中间涉及到很多步骤,耗时耗力。

百度网盘的探索是,基于AI技术让很多照片/视频的处理在云端一步到位,背后逻辑也很简单:人们在手机上用来处理照片/视频的软件也是用机器视觉、语音识别、知识图谱等AI技术,这些技术在云端表现更好同时也是百度所长,基于此,百度网盘已在云端直接实现了照片美化处理、电影中英文字幕生成、电视剧自动加字幕、电影画报等功能。虽然用户下载照片/视频在别的软件上也可实现类似功能,但百度网盘却可实现从内容存储到处理再到分享的一步到位。

早在2017年百度网盘就已上线“故事”频道,通过AI技术帮助用户对相册进行智能化分类和推荐,把用户海量的照片智能分类组合成一个个图片故事集,这样的探索远远早于iOS相册的“回忆”功能。

2022年,百度网盘基于百度AI技术优势,以及此前AI技术应用的实践,更加深入全面地应用AI技术,探索智能分类、智能推荐、智能文案、复杂搜索、智能字幕等应用,同时强化AI开放生态的构建。基于小程序服务生态、智能设备服务生态、AI模型生态,百度网盘吸引开发者开发智能应用,满足用户不同的网盘内容消费需求,如图片、音视频、文档智能处理。

今年4月百度网盘开放平台发起了百度网盘AI大赛,鼓励选手结合计算机视觉技术与图像处理技术,通过模型算法帮助人们实现图像的水印智能消除,以及文档智能检测的优化。

百度网盘今天将AI技术放在如此重要的位置,一方面是因为网盘进入3.0时代后,AI技术对用户体验发挥着决定性作用,任何网盘企业都不可能不重视AI技术;另一方面则与百度网盘自身发展有关,其今年被调整到百度ACG(智能云事业群组)。ACG的AI技术与应用场景给百度网盘AI化提供了新的助力,借助百度网盘企业版,百度网盘可实现个人云存储与企业云存储的B/C协同,在教育、影视、科研等行业音视频、文档、图片、视频等内容存储/管理/消费等场景下,探索云服务。

重视AI技术不是百度网盘的独家选择。Google Photos在2018年就已加入大量AI特性,比如帮助用户智能修复照片,此后其又上线了2D转3D,黑白转彩色,照片高清化等AI功能。如今,随着网盘上积累的数据越来越多,随着用户对网盘的需求从数据存储/管理到数据存储/管理/消费/决策的全生命周期升级,AI技术正在成为网盘的基石,这也是百度和谷歌的共识。