大数据时代,如何保证数据和隐私安全

2020-10-19
隐私计算技术如何实现价值流转。

10月17日~18日,由创业邦主办,成都市科学技术局、成都市博览局、成都市投资促进局、成都市新经济发展委员会指导,四川天府新区成都管理委员会支持的2020DEMOCHINA创新中国总决赛暨秋季峰会在成都举行,峰会聚焦“大健康、大消费、金融科技、企业服务、5G”五大赛道,分别设立专场DEMOSHOW和专业领域探讨,希望通过聚集创新力量,开启智慧经济新时代的内在逻辑。

在开幕式上,锘崴科技CEO王爽做了活动致辞,观点如下:

1. 在数字化时代,5G、AI、云计算等技术基础都是数据,隐私计算的技术就是服务于数据价值的可信流动。

2. 通过锘崴科技的操作平台,在上面搭载垂直的安全应用,可以实现数据的安全跨越的融合,打通数据价值之间的桥梁,通过隐私计算的平台实现大数据高效价值的转化。

3. 数据时代,锘崴科技基于大数据的隐私计算技术,助力全国打造一个非常先进的信息化标杆,基于更大的大数据加快研发速度,提高更安全的数据服务平台,旨在提供一个更高效也更安全的大数据应用。

以下为演讲实录,由创业邦整理(有删减):

大家好,非常荣幸今天有机会在创业邦主持的会议上跟大家分享锘崴科技在隐私计算方面的工作,什么是隐私计算,5G、AI、云计算他们的基础都是数据,隐私计算解决的就是数据在交互的过程当中,如何合规的能够更高效的更体现价值的一个扭转,我们在做的隐私计算的技术就是服务于数据的价值的可信流动。

锘崴科技的愿景是使数据安全跨域的融合,在“可用不可见”的计算范式下,打造数据价值之间的桥梁,通过隐私计算的平台实现大数据高效价值的转化。

我们在做隐私计算的工作已经有10余年了,我们最早在2010年研发隐私计算在医学大数据领域相关的应用,于2012年提交并在全球首次发表了医疗在线联邦学习的论文,提出了解决隐私机密计算的基础性框架,比Google在2016年提出的联邦学习在移动互联网上应用整整早了5年。锘崴团队曾发表过300多篇SCI的论文,作为发起人在2014年的时候创办了全球的iDASH的隐私计算大赛,目前已经举办了7届。每年大概有20个国家的一百多个Team参加我们这个比赛,比如国内的阿里、腾讯,国外的IBM、MIT等一些著名的机构都会参加。

在公司去年成立以后我们也做了很多相关的商业上的推广,比如赋能中国医疗数据产业在隐私保护下的价值的转换,同时也获得了顶级风险资本数千万的融资,并参与制定了国内外隐私计算相关的标准。锘崴科技至今落地了50家商业计算应用的场景,跟蚂蚁金服、腾讯也建立了合作。

隐私计算的本质是为数据合规使用赋能。法律法规层面上在欧洲有GDPR,美国有CCPA,很多时候使用数据不合规,造成数据的泄露,会产生严重的后果,比如巨额罚款。在中国发布像2016年的网络安全法,中国在隐私安全法正大踏步地赶上欧美,今年刚刚颁布的数据安全法的草案和个人隐私安全保护法的草案明确规定了数据如果出现隐私泄露会产生非常严重的后果,如5千万或者5%的营业额。通过隐私计算的技术使数据在使用的过程当中能够合规的低风险地实现数据价值转换。

我们都在讲数据在进行要素化,如何实现数据要素化,这个数据重复要创造价值,传统的数据的分享的模式的情况下,数据一旦给出去以后,数据可以进行任意的拷贝,没有办法分离数据的使用权、所有权和管理权,出现数据需要多方合作交流的时候就需要隐私计算这个基础设施的解决方案来实现数据的真正的要素化的价值。

我们解决的是供需双方的痛点,比如说数据需求方,首先是要有找到数据的诉求,很多情况下在找数据的时候查找的条件是非常敏感的,像药厂做新药研发的时候可能对于某些疾病的变异的点和疾病相关性想去找适应的人群,通过隐私计算的技术可以在保护他的查询条件的情况下,非常高效的找到相关的数据。

在找到数据以后,可以进行数据的分析,传统上数据往往是进行一次性的买卖,通过隐私计算可以实现数据租赁的模式,可以实现多方数据虚拟的融合,合规地实现AI模型的构建,最后能够在这个模型基础上提取出相应的结果,也通过隐私计算的加持,保证真正的需求方程能看到相关的结果,对于数据提供方对系统进行数据的注册,注册后的数据只是这个注册的数据的描述性信息,对外可见可搜索,原始数据还是留在数据源的本地,这样可以实现按次按需进行数据价值转换。

同时由于数据本身是没有给出第三方的操作,所以说他们可以在任意时间进行数据的注销,在合规的情况下完成数据的交易,而在传统模式下需要数据的脱敏汇总。

锘崴科技的核心底层架构可以服务不同跨域协作,包括政务、金融、医疗企业等,数据源的信息还有查询的时候匹配的模型,以及隐私建模的过程,在查询到相关数据以后要做数据分析的时候,通过隐私建模的平台实现多中心的跨越联合的建模。建模完成以后,在使用过程中涉及到对模型的保护,通过隐私推理平台实现第三方AI公司在对数据方进行赋能。如何保护他们自己的这个模型的信息,通过锘崴科技的底层平台技术来支撑数据的交易和管理平台。部署方式提供软硬件一体机的模式、云部署的模式、软件包的模式,提供Saas和Paas的服务。在应用层目前可以服务于各行各业,如医学研究,合保风控,精准营销等等,在这些领域锘崴的产品都有实际的落地应用。比如通过锘崴科技的NovaVita平台,助力开展了肿瘤的分子机制的研究、肿瘤表观遗传学分析、肿瘤全基因组学关联分析、肠道菌群及肿瘤分子标志物的鉴定。

还有服务金融联合的风控的应用,比如说银行它本身是有一些客户的坏账的标签的信息,但是他需要更广纬度的其他的描述性信息,比如从互联网公司拿到用户的一些行为习惯信息,通过这两种数据源的一个多标签的数据的合作,可以提高更广纬度的风控或者是精准的营销,但是传统的模式下,互联网公司不想把他的数据交给银行,银行也不能把他客户的信息交给互联网公司,通过这个系统首先可以实现一个ID的碰撞,在碰撞的情况下找到银行和互联网公司重复的用户,整个这个碰撞的过程是在隐私保护的条件下进行的,双方不用泄露对方客户的信息,可以找到相关重叠的用户,基于重叠的用户可以进行进一步的联合的建模分析,实现用户精准的画像。

锘崴科技的愿景是助力我国打造一个世界领先的隐私机密计算平台,基于“足不出户,可用不可见”的全新计算范式,加速数据的共享和应用落地。

来源:创业邦