一场竞赛加速产学研融合:看百度对“AI+”复合型人才的执着

2020-10-29

在产学研结合的趋势下,互联网巨头均在主办各种学术类竞赛,但是像“国际大数据竞赛”这样的能够坚持举办六年、且不出意外会继续办下去的比赛,却不多。

10月19日,2020 IKCEST 第二届“一带一路”国际大数据竞赛暨第六届百度&西安交大大数据竞赛颁奖典礼在西安举行。长长的全名背后是6年来竞赛不断升级的过程。

一个竞赛办了六年,规格不断升级终成国际

最初这一比赛的主办方只有百度与西安交大,由于赛事影响力与关注度不断提升,2019年竞赛首次面向“一带一路”倡议沿线国家高校开放,升格为国际化权威赛事,主办方在原来的百度与西安交通大学外,增加了联合国教科文组织国际工程科技知识中心(IKCEST)、中国工程科技知识中心(CKCEST)等权威机构。2020年大赛再次升级,指导单位在教育部高等学校大学计算机课程教学指导委员会和丝绸之路大学联盟外,增加了中国工程院。

(2020国际大数据竞赛官方海报)

“国际大数据竞赛”通过“豪华”的顾问与评委团队来确保大赛权威性。今年竞赛顾问委员会就包括图灵奖得主Raj Reddy、中国工程院潘云鹤院士、中国工程院院士郑南宁、印度科学院院士N.Balakrishnan、德国工程院院士Otthein Herzog、比勒陀利亚大学Jan Eloff、西安交通大学郑庆华副校长、百度CTO王海峰博士等,竞赛顾问包含中国工程院副院长王辰院士、华山医院感染科主任张文宏医生。

去年国际大数据竞赛有来自16个国家2312支赛队3226位选手报名参赛,覆盖440多所高校;今年虽然有疫情影响,但竞赛热度依然空前,共有超过3000支赛队近5000人参赛,覆盖五大洲22个国家580所高校,包括哈佛大学、帝国理工、伦敦大学等世界名校,和国内42所双一流高校;其中,仅美国就有28所高校组队参赛。此外,大赛还首次吸引来自南非、俄罗斯、印度等国家的选手团队。

今年竞赛首次关联医学课题,紧扣时下疫情,以“高致病性传染病的传播趋势预测”为主题,要求参赛选手针对赛题所构造的若干虚拟城市,构造传染病群体传播预测模型,根据该地区传染病的历史每日新增感染人数、城市间迁徙指数、网格人流量指数、网格联系强度和天气等数据,预测群体未来一段时间每日新增感染人数。

这一赛题打破了AI与现实医学的“次元壁”,冀望运用大数据技术助力传染病的传播预测和控制,增强人类社会合作抗风险的意识和能力,也为年轻人提供了参与社会议题的平台。

经过近半年的鏖战,来自西安交通大学的“打完BDC再来”团队斩获国际特等奖,收获了10万元奖金。

(西安交通大学党委书记张迈曾、中国工程院院士郑南宁、百度CTO王海峰共同为冠军选手颁发奖项)

经过六年发展,“国际大数据竞赛”在高校大数据AI相关学生群体中已形成广泛影响力,作为国内最专业最权威的高校大数据赛事之一,事实上已成为高校竞赛的头部IP。

国际大数据竞赛,对AI产业化的正向价值明显

在一些人看来,面向高校群体举办竞赛的最大的意义是在年轻人中放大企业品牌,确实有很多企业参与主办的比赛或者说活动的主要目的是这一点,但是国际大数据竞赛却是例外。

要特别说明的一点是,国际大数据竞赛虽然名称强调“大数据”,但实际上却是一个AI大赛。AI的基础是大数据,大数据应用离不开AI算法,国际大数据竞赛不强调算法本身,更强调通过AI来挖掘大数据,来解决现实场景中的各种问题,换言之,国际大数据竞赛强调的是AI的应用,而不是专门AI大赛那样做图像识别、语音识别、自然语言理解等AI基础能力的PK。

疫情正在加速社会数字化进程,而数字化的终极目标是智能化,AI产业化势不可挡,当下,打造标杆应用、培养AI人才、完善AI基础设施,是推动AI产业化的关键。站在这样的时代背景下再看国际大数据竞赛,就能发现它绝对不是一个品牌市场活动。

首先,AI的发展一定是产学研结合的,国际大数据竞赛加速产学研结合。

学研界拥有算法等理论知识与人才资源,产业界拥有数据、算力、场景等AI要素。学研界要做AI模型验证离不开算力\数据\深度学习框架\场景等等基础设施支持,这些正是百度等AI产业巨头的核心优势。国际大数据竞赛事实上就成了一个大数据AI产学研的交流平台,汇集AI基础设施、优质数据、应用场景、专家智囊、GPU算力、实践平台等AI应用的关键要素。

百度是我国AI领头雁企业,也是大赛的发起者与主办方之一。百度给所有选手提供飞桨深度学习开源框架、以及其他数据资源,包括“打完BDC再来”在内的获奖团队,也都是基于飞桨深度学习平台来做模型搭建与数据集训练。

竞赛顾问委员会主席、图灵奖得主、中国工程院外籍院士Raj Reddy教授也表示:“大学是人工智能人才的摇篮,但必须承认,学校在数据、计算机硬件和应用场景等方面缺乏资源,这样的比赛可以探索可行的解决途径。比赛所采用的数据以及大量的算力资源是高校难以获得的,而这正是百度这样的企业参与进来的优势和价值。”

(竞赛顾问委员会主席、图灵奖得主、中国工程院外籍院士Raj Reddy教授)

其次,AI人才最紧缺的是复合型人才,国际大数据竞赛有利于培养与选拔AI复合型人才。

国际大数据竞赛对于AI产业界来说,一方面具有“擂台”价值,可以面向全球高校广泛征集与发现优秀的技术“苗子”;另一方面,有利于引导优秀人才投身AI大数据行业,发现自己的专长再确定学习研究方向,比如今年国际一等奖团队“岳麓F4”成员、中南大学计算机专业的研一新生郭海富就是“大数据新手”,从未参加过相关比赛,但他对此投入了极大的热情,边学边干,初赛期间突发39.9°高烧时还在隔离酒店内一边做核酸检测一边进行代码整合与提交的工作,最终拿奖。

难能可贵的是,国际大数据竞赛通过与现实问题结合的赛题设置,还可以发现时下产业最缺的AI复合型人才。百度创始人、董事长兼CEO李彦宏曾经提出一个AI发展三阶段的说法,即技术智能化阶段、经济智能化阶段以及社会智能化阶段。今天AI处于第二阶段的下半阶段,即人工智能全面产业化,行业应用与商业化全面普及。AI在不同发展阶段,产业急缺不同类型人才。第一阶段最缺的是基础AI算法相关人才,比如做机器视觉研究的,做语音研究的等等,当前阶段AI要跟不同行业结合,最缺的是即懂AI,又懂特定产业的复合型人才。

在4月份国际大数据竞赛启动时,百度CTO王海峰与本次竞赛特聘顾问中科院副院长王辰有一次对谈,当时他们均提到一个观点,即复合型人才在AI产业正在越来越重要。今年竞赛主题是“高致病性传染病的传播趋势预测”,参赛选手不只是要懂AI大数据技术,同时要快速学习大量的医学传染病相关知识。王海峰直言,“未来,想要更好的打破医学界跟信息科学界、大数据相关技术之间的坚冰,培养复合型人才可能会发挥更大价值。”

(中国工程院副院长、院士、呼吸病学与危重症医学专家王辰与百度CTO王海峰)

因为意识到AI产业化的“跨界”属性,因此今年组委会特别在原有的AI大数据学术权威外,邀请到华山医院感染与传染病专家张文宏主任担任竞赛“特聘顾问”,张文宏也表示“我们非常期盼从事大数据领域和医学领域的人才能够结合,能够给我们国家的防疫专家提供非常好的数据。”

如今行业需要的不只是AI+医疗的复合型人才,比如AI+金融、AI+教育、AI+政务、AI+交通等行业都急缺多面手,国际大数据竞赛对于选拔与培养AI复合型人才是有直接帮助的。

最后,国际大数据竞赛引导技术人才重视社会现实问题,培养工程学科人才。

技术的核心使命就是解决现实社会的问题,但是不管什么领域的技术,往往与产业会存在鸿沟,让技术从实验室走向现实场景本身就很难,技术人才也很容易犯“拿着锤子看什么都是钉子”的错误。因此对于AI产学研各界来说,培养理论型人才的同时更要注重培养工程型技术人才。

跟一些纯学术竞赛不同,国际大数据竞赛的主题设置一直都很注重“实用性”,参赛者要基于大数据,利用AI技术来解决现实中的问题,去年竞赛主题是“基于卫星遥感影像和用户行为的城市区域功能分类”即用大数据解决城市治理的问题,今年主题紧扣疫情问题,最终评委评选也会十分注重实用性与工程思维。今年“打完BDC再来”拿到国际特等奖,在评委团看来,该团队“选手具备很强的数据洞察能力,能利用数据可视化,深入数据分析和理解。”获奖方案在特征工程鲁棒性、模型方案创新性与泛化能力上表现突出,评委还认为,整体方案有很强的落地实用价值。

每年的国际大数据竞赛,都不只是提供一个“纸上谈兵”的平台,而是会构建一个与现实场景结合的“练兵场”,在AI产业化巨头百度的支持下,给选手提供基础设施、应用场景、真实业务数据,最终引导参赛选手们构建“工程思维”,用技术解决现实社会的问题,让技术创造社会价值。

为什么这样一场非盈利活动,百度坚持做了6年?

跟一些市场活动不同,国际大数据竞赛不具备任何商业化属性,是一个非盈利活动。但就是这样一个竞赛,却能够坚持六年,从百度与西安交通大学的校企合办,升格为面向“一带一路”倡议沿线国家高校的国际竞赛,规格不断升级的同时,影响力不断放大、参与者越来越多、竞赛价值不断凸显。毫无疑问,这个竞赛是十分成功的。百度一直是这个竞赛的幕后支持者,每年都投入大量的资源支持,不计回报。为什么百度如何重视这一比赛?

让外界印象深刻的是,十年前就已率先布局AI的百度对AI的未来一直很笃定,多年来一直在给AI产业摇旗呐喊,李彦宏、王海峰等百度高管每年都会在各种场合给AI“鼓与呼”,让行业关注AI产业化并走在正确的道路上。大雁在飞行时,前面总会有一个领头者,负责引领方向与组织队形,这个领导者被称为领头雁。可以说,百度一直在扮演着我国AI“领头雁”的角色。

但是,对于AI产业化,百度在做的不只是摇旗呐喊,而是一直在给AI产业“添砖加瓦”,夯实AI产业化的基础。一方面,是提供AI新基建。百度飞桨深度学习平台、百度大脑、百度智能云、百度地图、小度DuerOS……百度给各行各业提供AI基础设施,涵盖底层深度学习平台、知识/AI中台与平台化的AI解决方案,降低AI应用门槛,提供AI产业化新基建。另一方面,则是AI人才培养。

(百度AI新基建版图)

在AI产业化如火如荼时,我国AI人才依然供不应求,有媒体报道,到2025年中国AI人才缺口将达到1000万。百度一直在成体系地大规模培养AI人才梯队,AI人才不只是为自己所用,同时输送给我国AI产业。

今年6月19日,百度宣布未来5年计划培养AI人才超过500万。截止当时,百度培养出超过100万以上的AI人才,培养来自清华大学、北京大学、浙江大学、哈尔滨工业大学等400余所高校的上千名AI专业教师,通过设置黄埔学院、AI快车道等面向产业AI人群的培训课程,大量培养既懂AI技术又懂AI场景的产业复合型人才。

在高端AI人才上,百度有“AI黄埔军校”的别名,很多公司的AI技术骨干甚至带头人都来自百度;初级AI人才百度一直注重产学研合作,从教材、课程、师资、竞赛、联合实验室等维度多管齐下培养AI人才。国际大数据竞赛就是选拔与培养全球顶尖AI大数据人才的手段之一,特别是对于培养工程型AI人才和复合型AI人才,更是有显著效果。

看到这里就不难理解,为什么百度6年来都要不计回报地支持国际大数据竞赛,只要是对AI产业化有利的事情,不论大小,百度就会认真去做。