人工智能时代,AI与经济学能擦出怎样的火花?

2017-07-22
具体的场景应用才是AI发展的未来

谈起人工智能,最先印入脑海的一定是横扫围棋大师的AlphaGo。但在业界,更令人吃惊的标志性变革发生在德州扑克:不需要准备海量棋谱,也没有充分公开的完美信息场景,化名“冷扑大师”的AI系统直接针对对手的劣势自我学习、通过博弈论选取最优策略,横扫德扑顶尖高手,“高情商”令人瞩目——不完全信息场景,正是错综复杂商业运作中常常面临的困境。

李开复说,“冷扑大师”战胜人类的意义,就在于“更多人通过比赛了解到了更全面的人工智能,知道AlphaGo所代表的深度学习并不是人工智能的全部”。而在商业智能时代,量化决策势不可挡,如何从汹涌的AI泡沫中找到正确方向,是学界和业界共同关心的议题。

7月20日,创业邦(微信搜索关注:ichuangyebang)受邀参加由杉数科技和钛媒体共同主办的AI大师会,会上清华大学交叉信息研究院青年千人助理教授、博士生导师、计算经济学研究室主任唐平中博士首先进行了主题演讲。

唐平中着眼于人工智能(AI)与经济学的结合,演讲主要围绕经济学与人工智能的交互发展,详细探讨了AI提升社会福利和商业效率的应用,具体例子包括:百度广告拍卖、淘宝刷单、滴滴拼车、甘肃水权交易。

清华大学交叉信息研究院助理教授唐平中

他表示AI算法针对村庄水资源配置问题,能够计算出水资源交易的最优匹配定价,提高交易效率并证明该定价能够最大程度满足各村交易动机,促进村和村之间的交易。从计算和经济两个角度组合出击,解决了水权市场的设计难题。

滴滴拼车定价上,滴滴拼车定价是一口价,不管拼没拼成,都是这么多钱,按理说拼成付少一点,现实是约没拼成就付多一点,现在是拼没拼成都是18块钱。

这就有个问题,滴滴希望乘客拼成,因为能收两倍的钱,如果拼不成滴滴会亏很多钱,因为拼车价格比快车价格便宜很多,但是乘客不希望拼车,自己坐一辆车多舒服,所以有一个这样的利益冲突。

唐平中表示,与杉数科技合作提出了一套比较好的算法,就是所谓的“两口价”算法。拼上是一口价,拼不上是另外一个价,这样双方是统一起来的,而不是之前的对抗。这个策略制定之后,当然后续会有很多相应算法去计算最终的价格。所以说利用一些人工智能和经济学一些技术,我们在这两个方面帮助滴滴做了一个非常好的优化,既改善了民生,也提升了一个公司的收益。

在电商刷单问题上,唐平中从博弈论和机制设计的角度,用全新的防止刷单的理论模型和相应的实现算法。在这个模型中,推荐的流量分配被建模成一个可分割资源的问题,卖家参与刷单的成本大于刷单得到流量提升带来的收益,因而卖家不会选择刷单。之后对阿里巴巴提供的购买数据进行分析处理,模拟论文中提出的机制,发现机制带来的总成交量优于淘宝现有的推荐算法。

而在广告拍卖中,博弈论和拍卖理论可以给广告拍卖这个场景下提供了一类经典的模型,但这类经典的模型还有较大的优化空间。我们用强化机制设计模型,如RNN模型,深度学习模型,把机制设计和强化学习结合起来,在此机制下带来收益,一般情况下大概有40%左右的提升。

会后记者对唐平中进行了采访,以下为部分问答。

Q:谷歌和百度现在都在推行广告系统,但是百度广告系统遭到很多非议,比如说经常找重要东西,前三页直接不看,谷歌相对做的好些他们之间的商业算法有什么区别?

唐平中:首先百度去年做了一次调整,把整页的广告数量缩减到4个广告,所以现在页面干净非常多。就算法而言,他们在技术细节上没有任何区别,但在对广告主的挑选上,可能会有一些不同,比如说我打个医疗广告,哪些广告主可以投放,哪些不可以投放,这个可能会有不同地标准,这也一定意义上是中美广告主之间的差异造成的。

Q:在医疗行业,通过数据的学习帮助医生做诊断,但目前来看比预期差了很多,比如IBM即便有大量数据训练模型也不尽人意,如何解释这一现象?

唐平中:我与北京一些医院的主任也有聊过,现在IBM最大问题可能在于它想做一个通用的方案,比如检测癌症、肿瘤,他做的东西是检测所有肿瘤,但是从医生角度看,这是不可能的,你可能检测白血病跟检测肺癌、肝癌,但用的是不同的技巧,所以一个通用的方案,在这个所有的癌症上面是做不通的。

Q:现在人工智能在电商方面的应用比较多,就比如说淘宝、京东、维品会等都在用,不同平台,他们应用逻辑是不是一样的,这其中是基于不同的系统,还是普遍的应用?

唐平中:就我对AI在电商应用的了解,比如京东这家,各个部门都用到了AI,但AI技巧很多都不一样,比如说客服部门,可能需要一个人工智能来设计一个聊天机器人,帮助解决客服上的问题;仓储部门,需要用到人工智能优化技巧怎么样去合理优化他们的供应链和仓储,而定价则需要另外一套人工智能的技巧。所以说,不能说人工智能用一个通用系统解决所有问题,很多部门用到的都是不同的人工智能的知识。

Q: AI未来的发展是在哪个方面?

唐平中:我们利用一些优化的技巧,能够帮一些企业做一些非常好的决策,在很多的场景里面,是可能一开始只是一个公司领导拍脑袋想了一个决策,这个没关系。我们现在能做一件什么事情——可以检查这个决定所产生的后果。比如说我做了一个资源分配,给员工奖金,或者给淘宝流量分配。

现在能够得到的一些结果,收集很多数据。利用这些数据来改进我们之前所做的决定的表现。我觉得这在接下来的很多领域会持续地用到,所以这是我比较看好的一个领域。