病毒入侵,大数据还可以做什么?

2020-01-25
大数据在这一次的疫情防控中,扮演了重要角色。

1.jpg

编者按:本文来源创业邦专栏罗超频道。

疫情猛于虎。1月23日武汉封城,1月24日广东等多个省份或直辖市启动重大突发公共卫生事件一级响应,截至1月24日17时,全国累计确诊887例新型冠状病毒肺炎,除西藏和青海两省外,全国各地均出现不同数量的确诊疫情,武汉确诊549例。

一场没有硝烟的战争正在进行中。跟2003年SARS爆发时不同,武汉肺炎疫情爆发时,互联网已成为主要的信息平台,通过搜索引擎、信息流、社交网络、社交媒体、新闻客户端……人们得以实时获取疫情动态和防疫知识,也可以知晓和关切疫区人民的状态。

还有一点值得关注的是,2003年尚未出现的大数据,在这一次疫情中正在发挥作用。

肺炎疫情中的大数据应用

1、人们在关心什么?百度指数大数据一清二楚。

多家新闻媒体援引百度指数数据进行了报道。

《大数据告诉你,疫情风暴中心的武汉人到底关心什么?》一文主要关注疫区中心的武汉人民的关切。1月23日,百度指数显示武汉地区“封城”、“武汉封城”的搜索指数迅速上升,在搜索地域分布中,武汉都是排第一的城市。

2.png

封城后,武汉用户搜索最多的不是“天价蔬菜”(该词百度指数热度反而不如北京上海),更关注的是“84消毒液”“体温计怎么用”“n95口罩”等自我防护关键词。同时“试剂盒”、“核酸检测”是当地用户关注的重点,这些关键词与病情确诊有关,这验证了武汉医疗资源特别是试剂盒紧张的现状。

3.jpg

《百度指数揭示了“新型肺炎”的那些影响》一文则呈现了全国网友的关注趋势变化。曾经春节期间最热指数非“红包”莫属,然而今年红包热度很稳定,“口罩”则成为飙升热词。

4.png

曾经的贺岁档电影关注度大幅下降,《唐人街探案3》的百度指数出现断崖式下跌,难怪贺岁片纷纷撤档。“蝙蝠”“果子狸”“帕劳(蝙蝠宴知名地方)”等疫情相关知识词汇则出现了不同程度飙升。

《互联网迎战新型肺炎,战胜疫情背后的无知和恐慌》一文则报道称,1月21日“新型冠状病毒+新型肺炎+武汉肺炎”三大关键词搜索指数较之前日均值上涨近100倍,达到118万。同时疫情最为严重的武汉、广州、北京等地也是“新型冠状病毒”搜索的高频地区。

……

百度指数成为新闻媒体了解和报道人们疫情关注点的重要工具,有些让人意外。曾经很多人认为移动时代搜索已经不再那么重要,然而从爆发疫情后用户的关注来看,重大突发事件时,搜索依然是人们第一个想到的获取信息和知识的渠道。

跟平时打发时间时的刷消息不同,在疫情这样的突发事件面前,人们不只是需要第一时间被推送实时新闻,同时更有主动的获取信息和知识的需求,因为这种时候人们的需求是非常明朗的,而搜索则是满足主动信息获取需求的第一工具,说到底,它可以提供权威准确的信息和知识,来回答人们心中的疑问。

2003年时百度只是一个简单的搜索引擎,贴吧、百科、知道均未上线。如今百度已经成为一个综合的内容入口,搜索、贴吧、资讯、知识产品(知道、百科、文库和经验)、信息流(百家号)、小度智能音箱诸多子产品,帮助人们获取信息与知识,百度指数综合百度旗下诸多产品用户大数据得出,可以回答“人们在关心什么”这一话题。

基于百度指数这样的大数据,我们就可以了解到一些真实状况。我朋友圈所有人几乎都只关注疫情,这个年还过吗?百度指数显示,1月23日,“春晚节目单2020”指数飙升到61842,“拜年祝福语2020”飙升到28263,这表明,尽管大家遇到了困难,但年还是要过的,生活还要继续,明天一定会更好。

5.png

2、人们都去了哪里?运营商和地图大数据知道。

网上流传的一张照片显示,某省份运营商尝试利用大数据画像来帮助卫生部门进行潜在疫情风险定位,该文件中从武汉漫游到某省,某省漫游到武汉的用户数一目了然。基于漫游数据,再结合号码实名制的身份信息,理论上可以对疫区漫出人员进行追踪和防控,进而降低乃至堵截疫情传播。只要用户不扔掉手机,不关闭手机,就可以被追踪到,这里面有用户隐私保护的问题,运营商自然是配合监管部门进行梳理分析,在相关法律法规框架内对用户大数据进行利用。

6.png

在精准防控外,地图则是另一个掌握用户迁徙轨迹的科技产品。人们不论如何出行,往往都会用到地图,基于此地图平台就可以形成宏观的出行大数据。百度迁徙应该是比较有代表性的一款产品,其基于地图大数据反映出人口流动轨迹,2014年推出时被央视用于报道春运,名噪一时,如今这款产品依然在服役,一篇名为《用大数据“预判”武汉疫情的高发区》中援引百度迁徙数据对武汉流出人口进行了分析,发现其人口主要流向了长三角、广东等地区以及周边城市,流入人口数量与当地疫情爆发数量呈现出一定的相关性。

7.jpg

像OTA平台、网约车出行平台、共享单车、航空公司这样的平台都有各自的出行大数据,只不过比较分散,且覆盖人群和出行场景都是比较有限的,因此其大数据在疫情中的作用不像运营商或者地图的这么大。

3、人们都在买什么?电商大数据全都知道。

疫情爆发后,尽量不出门的“宅”成为人们防疫的主要形式,不出门少出门,就能减少人口流动,不给社会添麻烦的同时,降低疫情传播的机会。这时候,像盒马鲜生这样的生鲜平台,京东/淘宝/苏宁等电商平台,就发挥着不可缺少的作用,保障人们的物质需求。

口罩是防御疫情的第一武器,淘宝数据显示仅1月20日和21日两天,淘宝上已经售出8000万只口罩。1月19日至22日期间,京东平台口罩累计售出超过1.26亿只、消毒液累计销售31万瓶,洗手液累计销售100万瓶。仅1月22日一天,口罩的销量环比上月日均,增幅高达48倍。

各家电商平台在监测到口罩销量飙升且部分不良商家不合理提价后,均出台限价措施,淘宝禁止商家涨价同时从聚划算百亿补贴拿出部分专项补贴口罩商家。

8.jpg

京东承诺口罩、消毒液、药品等不涨价的同时,1月24日宣布向武汉市分批捐赠100万只医用口罩及6万件医疗物资,以缓解当地医疗物资短缺的局面,1月24日下午3时许,首批N95口罩已经送达武汉同济医院、协和医院、武汉大学中南医院等医疗机构,送到了一线医护人员的手上。

9.jpg

从人们关心什么,到人们去到哪里,再到人们在买什么,大数据均能给出一些洞察,而这些洞察结果会被用于决策上:有的被用于卫生监管部门的防疫决策,有的被用于个人用户的防疫教育,有的被用于媒体的直观报道呈现…网上还有一个基于华南海鲜市场以及附近的支付大数据,来判断相关高危人群走向的应用,后来被证明是假的,但不得不说,这也是一个思路。当然,大数据应用的前提是隐私和安全,如果没有这两点,一切都是白扯。

为什么大数据“存在感”这么强?

2003年,没有大数据这个概念。2013年,大数据概念才逐步风靡开来。为什么大数据应用今天存在感这么强?

首先,地方政府拥有最多且最重要的大数据。2003年非典后,我国建立了一套完整的疫情监控防治体系,数据是其中的关键部分,我们每天看到的疫情通报,各地确诊、疑似、观察、接触诸多数据,都是基于一个严密的机制各地层层上报、归集和汇总而来的,这套机制的底层同样有互联网信息系统在支撑。

国家为这个防治体系付出了很大的心血,只要不存在瞒报漏报虚报的人为过失,数据的汇总是十分迅速的,发布是十分及时的,信息是十分透明的。我们看到国家要求各地不得瞒报虚报漏报,也是想从源头上来抓数据准确性。从中也可以看出数据对疫情防控实在是太重要了,因为人们各种决策,都是基于数据,如果没有数据凭借个人经验或者主观感觉进行决策,是可能会出错的。

其次,移动互联网大发展成了大数据基础设施。2003年互联网方兴未艾,BAT才刚起步。如今互联网已进入移动互联网时代。跟互联网不同,移动互联网一方面与人们生活形成了更加紧密的联系,通讯、社交、搜索、短视频、资讯新闻、地图、支付、电商、外卖等等,都与生活息息相关,人们时时刻刻在用手机,时时刻刻在产生各种行为数据(有的是主动的比如搜索时输入关键词,有的是被动的比如刷信息流,看短视频,走路坐车)。另一方面,各种App以及运营商有了用户ID,可以知道用户身份,可将数据与用户关联起来。

移动互联网成为大数据基础设施,在应对新型冠状病毒肺炎时,卫生防疫部门可以利用大数据,宏观层面更科学地决策,微观层面进行全面的追溯与排查。

最后,AI技术的普及,则让大数据可以被更好地挖掘与应用。

2009年3G发牌,移动互联网在中国开始普及,距今已有十年时间。今天人们都在说后移动互联网时代已经来临,这一阶段最重要的新技术就是AI。AI本质就是大数据应用,它不只是产生了类似于刷脸支付、语音助理这样的应用,也可对大数据进行更好地挖掘洞察。在AI技术普及前,大数据早已存在,只不过缺乏利用,是被雪藏的富矿,AI普及后大数据价值爆发,因为AI有更强的洞察力,同时倒逼了算力的指数级提升,可以快速、准确和深度地对数据进行挖掘。

正是政府的重视、移动互联网的高速发展以及AI技术的普及,让大数据在这一次的疫情防控中,扮演了重要角色。疫情防控中应用大数据也得到权威专家认可。国家卫健委高级别专家组成员曾光就对媒体表示,“大数据的排查一定是重要的,特别在大城市里,每个单位、机构、学校都要去做这样的工作,不忽略不漏掉每一个人。”但他同时提醒大家:“大数据实施并不容易,特别是在人流密集的地方,疫情防控存在极大的不确定性,而且运用大数据,同时需要人与人的交流与沟通。即使大数据正在发挥作用,更要主动配合个人防护,才能有效避免病情的扩散风险。”

简单地说,就是大数据很重要,然而却不是万能的,人,才是疫情防御中的关键决定因素。实际上,从肺炎疫情的防控来看,大数据虽然已经在扮演角色,然而依然有很多有待深挖的地方,我们期待未来中华大地不要再有任何大的疫情,然而实事求是地说这是不现实的,正是因为此,我们更要思考,如果有下一次疫情,大数据可以做什么?科技又可以做什么?

防御疫情大数据还能做些什么?

理论上来说,大数据可以做得更多。

第一个是对人口流动、搜索、医疗等数据进行AI挖掘、预测,发现趋势防患于未然。

武汉疫情防御中,大数据只反映出现状,如果能够未卜先知,预测到疫情的爆发,今天形势就不会如此严峻。虽然看上去这太难,但人类抗击疫病传播时早已在尝试应用AI+大数据进行预测。早在2008年,Google便推出了Google Flu,利用人们的搜索查询记录来发现流感的爆发,它甚至比美国卫生部门提前两周发现了2009年的猪流感大流行,然而这种方法倾向于高估疾病流行的严重程度,容易引发社会恐慌,最后被Google叫停。

10.jpg

2014年,百度预测上线“疾病预测”,利用用户的搜索数据,并结合气温变化、环境指数、人口流动等因素建立预测模型,实时提供几种流行病的发病指数。搜索引擎的预测逻辑均是:看用户关心什么,因为用户去医院诊疗前往往会先搜索一下。

第二个是智能调度医疗防护资源。

电商平台均发现了武汉等疫区医疗防护物资短缺的趋势,然而只是发现趋势是不够的,因为这解决不了医疗防护资源调配的问题。基于趋势发现,通过大数据,进行智能供应链管理,让物资以最短物流路径,最短在途时长从生产线到达疫区就至关重要。

现在电商平台已在发挥大数据+供应链的优势,进行智能调度来最大化降低疫区医疗防护物质短缺的情况,京东大数据研究院首席数据官刘晖在接受央视采访时表示:我们正在发挥供应链资源的优势,与各品类开展自营合作的核心品牌厂家紧密沟通互动,推动它们加班生产、优化库存。

当商品被卡在了生产环节时,怎么调度都是不够的。不过,如果能够结合第一点,即疫情的大数据预测,特别是分区域的预测,再进行有的放矢的预生产、预调拨,就可以有效降低物资短缺、物价波动的情况,理论上还可结合IoT技术,对捐赠的医疗物资去向进行精准追踪,确保它们能在第一时间到达最紧缺的地方,避免出现压在仓库的情况。

第三个是甄别谣言、假消息和错误消息。疫情来了,所有人高度关注,各种消息满天飞,真真假假,要每个用户去甄别消息不现实,封堵消息则会造成更大恐慌,甚至给谣言滋生创造土壤。针对这样的情况,互联网大平台上线了辟谣功能,然而对于社群、社交网络上的一些碎片化消息,特别是像截图、段子、短视频这样的假消息,依然缺乏有效治理。针对此,可结合社会化举报机制、专家审核机制以及AI识别机制,对一些错误的图像和文字内容进行智能识别和清理。

第四个是机器人诊疗,降低医护人员风险。医护人员是从不缺席的白衣天使,今天依然冒着感染风险奋战在疫情一线,很多医院医护人员的请战书都让人泪目。有没有什么科技可以让医护人员更轻松?

看到新闻说,美国第一例SARS冠状病毒在西雅图确诊后随即被送往华盛顿一家医院的特殊病原体科,为了避免这种疾病在医院内传播爆发院内感染,该医院的医生一直使用机器人诊治这名病患。该医疗中心的负责人乔治狄亚兹(George Diaz)接受卫报访问时表示,他坐在400平方英尺的隔离病房外操作拥有摄影机、麦克风跟听诊器的机器人,以随时确认患者的状况,而不需要通过医护人员不断监看患者状况。这家医院的特殊病原体科成立于2015年,主要是要应对2013到2015年爆发的埃博拉病毒问题。类似于这样的机器人诊疗,真的很希望未来能够普及。

11.png

AI+大数据在疫情管控上应用空间还有很多,比如通过车脸识别来发现疫区车辆进行管控,比如智能问诊对涌来的恐慌性求诊人群进行分流……虽然很多应用在现在的疫情面前显得有些苍白无力甚至是痴人说梦,但是我们一定要因为相信而看见。84岁高龄依然奋战在一线的钟南山老院士,大量的一线医务卫生人员,后台的医疗卫生科研工作者是防控疫情的关键战士,而科技能够做到的就是减轻这些英雄的负担,给他们提供更好的工具,让他们更高效、更心安、更安全。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。