5年过去了,高举高打搞AI的阿里到底干成了啥样?

2019-09-29
这里有阿里AI的布局、成绩和组织方法论,他们自己说,阿里目前已经是中国最大的人工智能公司了。

QQ截图20190613150315.jpg

编者按:本文来自全天候科技,作者张吉龙;创业邦经授权转载。

几天前,杭州上城法院基金小镇人民法庭审理了一个“另类”的金融借款纠纷案件,另类的原因倒不是因为这个案件本身有多曲折,而是因为辅助法官审案的不是法官助理,而是一个虚拟的AI“小智”。

在小智的帮助下,远程连线的原告和被告的发言被记录成实时的文本,并且自动对双方争议焦点、案件风险点进行了重点标注,最终还智能预测裁判结果,实时生成出裁判文书。一个过去原本需要花费40天的审判流程被缩减到了30分钟。

“小智”是由浙江省高院联合浙江大学、阿里巴巴共同研发的AI法官助理。随着法院审理的金融案件不断增多,为了解决案多人少的矛盾,去年4月,该项智能化审判研发正式启动。上文中提到的案件就是小智的首次实战。

“中国基层办案的法官压力非常大,每年要处理三百多件案子,而这其中很多案件是比较清楚、简单的。我们就想能不能用自己的技术帮助他们”,阿里巴巴达摩院语音实验室负责人鄢志杰表示。

鄢志杰介绍,小智是阿里巴巴在人工智能领域的成果之一,在此之前,从手机淘宝的阿里巴巴小蜜到高德地图语音导航,从阿里巴巴翻译到天猫精灵,再到司法、金融、钢铁等不同专业领域,阿里巴巴已经将人工智能成果运用在多个领域。

9月26日在云栖大会上,阿里云副总裁马劲公布了一组数据:目前阿里巴巴的AI每天调用的次数超过了一万亿次,服务全球十亿人;每天处理图像超过10亿张、视频超120万小时、语音超55万小时、自然语言超5千亿句。由此,他们自己得出结论——阿里已经是中国最大的人工智能公司。

阿里巴巴人工智能全景

在云栖大会上,阿里巴巴首次对外公布了在人工智能领域的完整布局,并展露了其在AI芯片、AI云服务、AI算法、AI平台、产业AI领域的进展和成果。

阿里巴巴集团首席技术官张建锋在会上亲自对外发布了平头哥成立之后第一款正式流片的NPU芯片“含光800”。

张建锋表示,含光800是阿里巴巴第一次用了自己的硬件架构集成了算法到芯片,也是中国互联网公司研发的第一款芯片,并且从设计、验证到正式的流片,含光800只花了一年半的时间。

在在业界标准的ResNet-50测试中,含光800推理性能达到78563IPS,比目前业界最好的AI芯片性能高4倍,能效比也是第二名的3.3倍。

据了解,1块含光800算力相当于10块传统GPU,“阿里巴巴有一个拍立淘,每天处理超过10亿张图片。原来要处理1个小时,还要用更多服务器,现在只要5分钟。”张建锋称。

含光800的诞生对于阿里巴巴而言意义非凡,意味着其在芯片领域迈出了万里长征第一步。“阿里巴巴今后会成为一家真正软硬件一体化的协同发展科技公司,”张建锋毫不掩饰地说,“阿里巴巴有足够的能力去做传统硬件公司能做到的,包括他们不能做到的。”

在AI云服务层,2018年底阿里云升级为阿里云智能,成为阿里巴巴在人工智能的强力支持。据了解,阿里云已经构建起亚洲种类最全、规模最大的人工智能集群,包括GPU、FPGA、NPU、CPU、超算集群、第三代神龙架构等在内的公共云服务。

根据2019年7月Gartner发布的2018年全球云计算市场数据显示,阿里云位居微软Azure、亚马逊AWS之后成为市场前三,而在亚太地区的份额则稳居第一。中国有40%的网站都在阿里云上运营,一半独角兽公司也在使用阿里云。以日前国内刷屏换脸应用ZAO为例,阿里云为其调集近万片GPU,创下世界记录。

在AI平台层,阿里巴巴建立了飞天AI平台、飞天大数据平台、AIoT平台等多个平台,帮开发者大大降低AI开发门槛。

其中飞天AI平台是国内首个云端商业化机器学习平台,支持上百亿特征、千亿训练样本的超大规模经典算法,并且可以降低35%训练成本、多个场景下提升400%训练速度还首创公共云上可视化建模,为开发者提供了接近本地开发的体验。

在算法层,成立两年的阿里巴巴达摩院在云栖大会上也公布了其“成绩单”:截至2019年9月,达摩院在国际顶级学术会议上累计发表近450多篇论文,在自然语言处理、智能语音、视觉计算等领域算法夺得40多项世界第一。

其中自然语言处理在SQuAD机器阅读评比中精确阅读率首次超过人类;智能语音入选MIT Technology Review 2019年“全球十大突破性技术”,在语音客服领域,其技术号称超越了谷歌;在视觉领域可识别超过100万种物理实体。

除了纸面上的成绩之外,外界更加关注的是人工智能技术走出实验室之后的落地情况。“AI落地最大的困难,就是实验室里面的技术跟行业真正所要的产品之间的鸿沟。”一位阿里巴巴的内部人士拿人工智能下棋举例,“下棋是一个典型的实验室场景,它的规则是非常清晰而明确的,但是现实生活却非常丰富、非常复杂。”

阿里巴巴副总裁、阿里云人工智能中心负责人华先胜认为,人工智能面临的问题除了算的准不准、快不快之外,还要考虑能不能产生核心的价值。

在云栖大会上,阿里巴巴还披露了AI技术在天猫精灵、城市大脑、自动驾驶等方面的进展。

天猫精灵目前销量已经超过2000万,并且不断迭代新的版本。9月25日下午,天猫精灵发布了两款新品天猫精灵CCL和天猫精灵IN糖。与此前的版本相比,这两款智能音箱首次实现了全领域的全双工自然对话技术,一次唤醒,多轮连续自由对话,并且可以随时打断。还支持方言识别和方言语音合成,目前已经能够识别四川话和广东话。

在城市大脑上,阿里巴巴称北京、上海、澳门、吉隆坡等全球23个城市已引入城市大脑,覆盖了交通、城管、文旅、卫健等11个领域48个场景。

在自动驾驶方面,阿里巴巴集团首席技术官张建锋表示,阿里巴巴的自动驾驶已达到L4水平,2018年获杭州政府颁发的首张无人驾驶路测牌照“浙A4390试”。

AI走出阿里巴巴

人工智能天生就具有To B属性,这意味着AI需要和产业进行结合。

“AI是一个赋能工具,并不是一个单独的产业,到目前为止,AI没有成为任何产业。”张建锋接受媒体采访时认为,AI一定要和产业结合起来,否则就是空中楼阁。

他透露,现在阿里云上有300个解决方案,每个方案都是面对客户解决某一类问题的。

另一方面,从产业界来看,传统行业对于利用人工智能来升级产品、提高效率也有很高的期望。鄢志杰表示,阿里巴巴在走访调研时发现行业也非常想要智能技术升级产品。

但真正的结合并非易事。

对阿里巴巴而言,To B是一个全新的挑战。“从咨询到做方案到实施,一直到交付和服务,这是阿里巴巴没有经历过的,阿里巴巴今后要面对非常大的挑战。”张建锋认为,阿里巴巴需要补课,要学会从原来的互联网公司向To B的服务型公司转变。

除了流程的变化,另外一个挑战是对行业的积累还有待提升。“过去互联网的创新创新在C端,因为C端不需要行业积累。”张建锋认为,产业界非常碎片化,每一个行业碰到的问题都不一样。

产业的人没有AI背景,有AI背景的人又不了解具体的工艺,这不仅是阿里巴巴进入产业的难题,在过去,传统技术提供商们也遇到了这些问题。

鄢志杰表示,从过去的经验来看,传统技术提供商提供的标准化能力,往往达不到行业利用的最低门槛,必须要专门定制,这意味着企业要提前付钱还要等上几个月,最终效果还不一定理想。

以智能视觉在工业质检领域的应用来看,各种工业场景十分复杂的,行业差异非常大,像太阳能电池、电路板、食品等行业,瑕疵的形态多,背景干扰大,因此他们对精度要求非常高;而在医学影像领域,某些疾病的数据不清晰,而且样本量很少,技术稍微不精准就容易漏掉问题,耽误诊断。

另外,过去外界对于阿里巴巴的人工智能也有过高、不切实际的期望。

“人家觉得你是阿里巴巴,我这个东西给你,AI一上去肯定什么问题就解决了。”张建锋总结,过去阿里巴巴在人工智能产业化结合上,遇到了很多教训,比如客户自己想解决什么问题都不太清晰,阿里巴巴也不了解工艺,最后很多项目实施并不成功。

伴随着这些经验教训,阿里巴巴开始意识到,最终AI在产业里面要成功必须要有很多具备不同行业经验的人来参与。因此阿里巴巴开始联合合作伙伴一起提供解决方案,“AI是一个非常大的产业,阿里巴巴本身是没办法覆盖这么多的产业”,一位阿里巴巴内部人士表示,比如在安防上,阿里巴巴与商汤科技进行合作。

这些合作伙伴,多数是阿里巴巴投资的企业,从国内AI芯片领域的独角兽公司寒武纪、深鉴科技、到美国芯片公司Barefoot Networks,再到计算机视觉领域的独角兽公司商汤科技、旷视科技等。

上述人士表示,阿里巴巴的人工智能生态和其他公司最大的区别是通过投资等方式和技术不错的公司结成广泛的生态联盟,而不是简单的找了一堆集成商。

而在生态内部,张建锋表示,阿里巴巴不会从头到尾把事情全部都做完,而是会考虑分工和协调。以平头哥做的芯片为例,阿里巴巴的重点是设计芯片,而不会亲自造芯片。“我们是作家,我们不是印刷厂,印刷厂是台积电。我们永远不会去建个印刷厂,就像一个作家永远不会去自己印书,他一定是写书给别人看。”

在服务客户时,常遇到的一个问题是涉及到行业数据,很多时候传统行业的从业者处于数据安全的考虑,并不愿意把这些数据拿出来。

为了解决这个问题,阿里巴巴的做法是提供了自学习定制优化的产品,任何行业的从业者都可以基于整个产品在安全的环境里注入自己行业的数据。鄢志杰表示,通过这种方式,阿里巴巴让行业从业者自己握住方向盘,决定AI在行业里落地的方向。

技术与业务结合

随着阿里巴巴在人工智能领域的崛起,外界不可避免地将其和华为、谷歌等企业进行比较。

但张建锋表示阿里巴巴不会刻意和其他公司比较,在接受媒体采访时,他表示:“我们并不会去跟别人竞争而存在,我们是面向未来而存在的。”

而且他认为在人工智能业务布局上,阿里巴巴会基于自己对行业的理解来判断,不管是电商、支付宝、云,阿里巴巴都是行业的创新者,不觉得别家一定是正确的方向。

在人工智能未来方向的探索上,阿里巴巴目前旗下有多个机构,不仅有阿里云还有达摩院、平头哥,各个板块既有分工也有重合。

其中一个有意思的现象是,很多技术领头人同时在其中几个机构任职。以张建锋为例,他既是阿里巴巴的CTO,同时也兼任阿里云智能总裁和达摩院的院长。

这种奇特的内部人员和组织的关系,与阿里巴巴在技术上的理念分不开,“阿里巴巴的技术体系是研发跟研究比较分开,但也不是完全分开”,张建锋表示,比如达摩院的人在做AI的时候,还需要时刻关心应用,在研究的基础上能做出平台给其他人用。

和其他科技公司研究院纯粹钻研技术不同,阿里巴巴成立的达摩院既注重前沿技术的研究,比如量子操控,也注重与业务的转化。在阿里巴巴看来,技术和业务紧密结合是未来的方向。

据了解,在达摩院成立之后,张建锋曾经和马云讨论要不要请一个专职的院长,但是遭到了后者的反对。马云认为,专职的研究院肯定搞不好,希望达摩院和技术研发体系有非常强的关联。

虽然目前达摩院、阿里云、平头哥在一些技术上有重合,但张建锋认为,这并不是重复建设,阿里巴巴内部也鼓励高水平的竞争,“两个部门都有非常的高水平,我们鼓励竞争,最大的(目标)是要消灭低水平的重复。”

本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。


来源:全天候科技