首发|「行星数据」完成百万级别首轮融资,由同方金控清弘基金投资

2020-10-17
你知道此时此刻你身边的PM2.5是多少吗?

10月17日消息,创业邦获悉,环境大数据“生产商”行星数据于近日完成百万级别首轮融资,投资方为同方金控清弘基金。CEO白纯钰表示,本轮资金主要用于算法优化、团队建设和算力增强方面。

环境数据是环境健康、公共卫生等领域科研产业化的基础。但以前国内大气质量浓度都是采用地面采样检测系统,全国只有1400多个国家级地面站,平均一个站点只覆盖1-2平方公里,巨大的空间没有被覆盖。且采样设备技术迭代慢,数据质量和格式不统一,易形成“数据孤岛”。卫星定量遥感与人工智能算法技术的发展,让彻底打通环境数据成为了可能。

本文文章插图来源于行星数据,经授权使用

行星数据的技术来源于创始人刘阳教授在美攻读博士期间的研究成果,以及其作为教授带领团队攻坚科研的多年积累。2016年刘阳博士开始为环保部、中科院等国家级科研机构提供历史环境数据;同年,由刘阳团队归国的李莘莘博士完成了覆盖中国全境的PM2.5算法开发,与深耕大气污染治理技术的白纯钰合作创立行星数据。

现阶段行星数据仍以解决政府需求为主,如污染源监控,各级政府污染控制政策效果评估等。但随着中国整体环境数据基础逐步完善,行星数据希望最终实现环境数据在公共卫生和精准医疗领域的深度应用。

白纯钰表示,雾霾、臭氧问题对于人体健康有巨大影响,行星数据的初衷就是希望把这些数据彻底高分辨率量化,最终应用到跟环境,尤其是大气环境相关疾病的预测算法和精准医疗方面。

据介绍,现阶段阜外医院、301医院等都在进行一些精准医疗探索,需要涉及到生活习惯、背景、基因等数据,但关于大气环境这部分数据仍存在较大缺失。“墨迹天气上的PM2.5值只是采样点数据,这个数据跟你个人的关系不大,我们想告诉你的是你身边此时此刻的PM2.5和臭氧是多少。”

这个数字可能对于哮喘病人、孕妇、心脑血管疾病患者有一定的影响,未来行星数据可以推算出哪些病人会受影响,并实施精准推送。因此精准医疗将是行星数据持续探索的未来蓝图。

以卫星、近空、地面和人口等数据为参数的算法生产出的空气质量数据,目前行星数据可提供的数据产品有6种,包括PM2.5、二氧化氮、二氧化硫、臭氧、甲醛以及颗粒物组分。

通过将推演出的数据和地面站检测到的数据作比较,目前行星数据提供的数据相关系数达0.9,即误差控制在了10%左右。这也是客户选择行星数据的重要考量因素。

同时,行星数据也将在接下来提升自身的人力和算力,并将中国整体区域分为几个片区,不同片区采用不同模型提升准确性。白纯钰表示,行星数据数据来源由遥感卫星、地面监测装置、大气化学模式。用这些信息构建的机器学习模型相当于在每平方公里布置了一个虚拟地面空气质量监测站,达到中国全时空覆盖。

白纯钰介绍,行星数据预计一年内以苏州市建立标杆城市,提升算力,实现从数据清洗筛选到模型计算到输出全部在5分钟内结束。接下来逐步推广到全中国的城市,打好底层数据,在输出数据的同时行星数据也在吸收当地一些采样数据,让数据更加精准,预计三年以后能实现最终蓝图。

现阶段,行星数据主要靠数据收入,不做二次开发。行星数据为客户提供带时间、经纬度标的质量浓度数据,以单个像元计价,按照时空累计收费。

行星数据现正和科研类客户包括301医院、环保部规划院等进行PM2.5时空分布研究;和阜外医院进行雾霾和心血管疾病的流行病学研究;同时也如苏州市环保局合作,共同研究苏州超标排放监测等。

机器学习模式对输入数据和算力的要求很高,行星数据目前使用本地高性能单机和云计算混合使用的模式,并致力于构建自己的小型高性能计算集群。但在卫星遥感数据层面,基于中美关系的敏感,美国科研卫星数据的收集可能会受阻。

因此,如果行星数据顺利完成两轮融资,行星数据之后可能会发射属于自己的大气遥感卫星以保证稳定的数据来源。

谈及核心优势,白纯钰表示,行星数据目前拥有较强的算法建模开发、训练的能力。这样较强的项目原创技术正是投资方同方金控清弘基金选择下注的要素之一,而这正是基于背后具备强大研发能力的团队。

行星数据团队目前15人左右,包括有中科院遥感所、清华环境学院和刘阳美国科研团队博士、博士后成员。算法开发、数据运维和产品设计是主要的人力投入。目前以苏州为总部负责科研算法产业化和市场推广,亚特兰大研发中心负责数据预处理和算法革新。

首轮融资后,行星数据预计在未来三年内实现1500万的营收目标,并计划于2021年3月开启新一轮融资。

本文文章头图来源于摄图网,经授权使用。本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。


来源:原创