“AI同学”想从小学毕业,还需要走多久?

2020-07-14
尽管AI正在加速落地,出现在越来越多的应用场景,《IT时报》记者发现,目前的AI发展距离大众的期待仍有落差。

图片来源:pexels素材库

编者按:本文来自IT时报(ID:vittimes),作者孙鹏飞,创业邦经授权转载。

30秒快读

1

或许你习惯于刷脸支付、对着智能音箱下达命令,也听说过机器人了打败专业围棋选手的故事,AI正走进我们的生活。

2

尤其是疫情期间智能热成像仪、消毒机器人等AI产物,在防疫、抗疫、复工、复产方面发挥着重要的作用。

3

只是,尽管AI正在加速落地,出现在越来越多的应用场景,《IT时报》记者发现,目前的AI发展距离大众的期待仍有落差。

如果说大众对AI的期望是一名大学生,那么如今的AI还只是一名“小学生”,会学习,会有归纳,有结果输出,但还不会举一反三、随机应变。

这意味着,如果无人驾驶场景中遇到突发情况时,AI能足够快给出判断吗?我们能信任AI给出的判断吗?而应对这些缺陷,目前AI在框架上又有哪些性能提升空间?

带着这些问题,记者在2020年世界人工智能大会上一路追寻。

01

AI仍是“小学生”:

走不出黑箱

中科院院士何积丰表示,思考是对现有知识的加工和消化,并产生新知识的过程,相比于单纯学习,对人工智能而言需要更进一步。

事实上,目前人工智能已经发展到第二代,通过神经网络深度学习模拟人类的感知。数据、算力和算法是AI深度学习的三大要素。

那么,只会学习的AI如何打败了会思考的专业围棋大师?答案是数据!

据中国科学院院士、清华大学人工智能研究院院长张钹介绍,Alpha go在参加比赛前有6000万盘棋局的学习,但一名围棋大师学习的棋局只有百万级。

AI以量取胜。这也是目前AI的运用主要集中在声音识别、图像识别等方面的原因。由于声音、图像数据可以随时生成,能自我复制,几乎是无穷尽的。从本质上讲,AI是统计学,有了海量数据支撑,能够提升AI算法准确度。

但如今AI产出的结果并非完全令人满意。

由于深度学习通过数据层层分割,AI只能从局部识别,而非整体。AI识别一张阿尔卑斯山图片的准确率达94.39%。但如果给这张图片加上一层色彩躁点,尽管生成的新图片人类肉眼几乎看不出太大异样,但AI识别的结果却是一条大黄狗,识别率达99.99%。可见,AI只能识别物体,而不会真正理解含义。

遗憾的是,深度学习是黑箱算法,技术人员无法获知AI为何会产出上述结果。不可解释,带来的是对AI不安全、不可靠等方面的担忧。

在中科院院士、清华大学人工智能研究院院长张钹看来,目前的AI主要依靠数据、算力(蛮力)来解决完全信息和结构化环境下确定的问题,解决的问题很有限。面对复杂环境中的突发状况,比如无人驾驶突发路况,AI仍力不从心。

AI这位小学生距离毕业典礼仍有很长的路要走。

02

AI毕业路上加速度:

可变Batch Size策略下的提升

前路漫漫,毕业无期。但同时,《IT时报》记者也发现,AI小朋友的“学习状态”正在调整。AI框架的优化,让我们看到在算力和算法上的提升。

根据中科院计算所高性能计算机研究中心主任谭光明的分享,从2013年起,利用计算机GPU加速深度学习已成为业内趋势,而多节点并行计算逐渐成为主流。

深度学习发展早期,AI往往采用单节点的训练模式,只是随着更大的数据和更深层次的模型(从AlexNet、ResNet、NasNet直至AmoebaNet)被提出,意味着计算机需要更大的内存和计算能力。

当单GPU训练也无法承受应用的负载时,AI企业不得不采用边缘计算的形式为其解压。“分布式或并行计算将在AI框架中变得尤为重要。”谭光明表示。

据悉,目前无论是国外的TensorFlow、PyTorch还是国内的旷视天元MegEngine、百度飞桨都设计了分布式深度学习框架。

但是这一框架依然有着遗憾,比如算法的性能和精度。

Batch Size(批量取样规模)指的是深度学习神经网络中一次训练所选取的样本数,其大小会影响计算模型的优化程度和速度,也会直接影响GPU内存。

如果把计算模型看作是一头奶牛,那么批量取样规模是牧草。大量的牧草能提供奶牛丰富的营养,产出的牛奶质量越高。只是奶牛消化牧草需要时间,产奶也需要过程。因此,目前妥协于GPU内存情况和计算速度,AI企业不得不将批量取样规模调整到较小的数值,牺牲了准确度。

Facebook曾在1小时内完成了ImageNet的训练。当时Facebook采用的手段是将GPU的线性扩展到256个规模,并将8K作为批量取样规模的选择,能达到76%的准确率。与此类比,Google将批量取样规模从128上调至1024,但达到的准确率只有57%左右。

根据中科院研究院在2019年IEEE举办的一场峰会上发表的成果,计算模型在训练前后期,AI的学习效果显著不同,并提出了训练前期用8K批量取样规模,后期用64K批量取样规模的可变Batch Size计算策略。如同先给奶牛少部分牧草,促进消化,再提升牧草量,保证产出的牛奶质量。

效果显而易见,相比Facebook,这套新计算策略能在ImageNet上将训练时长从1小时缩短至25分钟。

值得一提的是,在分布式计算框架下,中科院还采用了“决策树”模型,将决策树作为选择器,为不同网络层确定合适的数据布局。

事实上,如果AI根据经验判断提取的数据,往往不一定是最优解。因此,有了“决策树”,目前能达到95%以上的预测精度,要知道运用传统方法,达到90%的预测精度并不容易。

或许从理论和技术上,AI正加快速度走向小学毕业的终点。

03

AI小学毕业:

模仿人脑,举一反三

AI的小学毕业典礼,是多位演讲嘉宾愿意畅想的未来,届时AI将真正拥有“智慧”,即随机应变、举一反三。

借鉴人脑模型,可能是AI的未来。如果AI能够理解识别的语义,可以像人类一样一眼就明,当遇到特殊情况时,能更快识别,做出合理判断。

知识、数据、算法和算力是张钹认为的第三代人工智能四个要素。

有了知识的AI有何不同?

事实上,目前AI能做的只有在确定环境和完全信息条件下的推理和决策。从AI玩围棋、国际象棋上看,本质上是一场决策的概率学。

当现实生活中,人们面对的更多是“博弈”。以玩德州扑克为例,AI还需要了解的是对手的心理,在对抗环境下做出决策。

不确定的环境、不完全的信息、动态变化的场景,对AI而言计算并不容易。

或许从理论上, 我们可以看到第三代AI运用于更大范围的场景的可能。人工智能正在飞速发展,这一天似乎并不遥远。

“序幕已经拉开,大戏即将上演!” 张钹说。

本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。