重磅!AlphaGo明日决战柯洁,获胜奖金高达150万美元,人类胜一盘棋的几率有多大?

2017-05-22
AlphaGo,你又来了

早在2015年10月,AlphaGo就以5:0比分全胜欧洲围棋大赛冠军,但那次并没有让人们熟知AlphaGo。

2016年的3月,谷歌围棋人工智能AlphaGo与韩国九段、世界围棋冠军李世石进行了一场围棋大战,当时李世石代表“全人类”征战,人类认为AlphaGo不可能这么快就战胜人类顶尖棋手,结局是4:1,五局对决中,人类赢了一局。

也是这场人机大战,让我们知道了AlphaGo在如此强大的存在着,同时我们也深刻感受了一把“人工智能”的威力。可以说这是人工智能的一次里程碑。

AlphaGo第三次挑战人类时,已经是2016年年底,一名叫“Master”的隐秘棋手,短短几天相继打败了韩国世界冠军金志锡九段、世界排名第一的柯洁以及64岁的棋圣聂卫平等一众高手,以60胜0负1和的结果血洗了人类围棋界。

明天(23号)早上10点半,是AlphaGo第四次挑战人类,据悉本次比赛获胜奖金达150万美元(合约人民币1033万)。柯洁、时越、古力等高手将一同参与这次的乌镇巅峰对决。

有别于前两次的AlphaGo VS人类对决形式,这次的比赛形式特别多样化,除了配对赛外,还有团队赛。柯洁将在23,25,27日,与AlphaGo三番棋:每方3小时,5次1分钟读秒。

具体赛程和对战形式如下:

5月23日 柯洁 VS 阿尔法狗AlphaGo

5月24日 时越+陈耀烨+芈昱廷+唐韦星+周睿羊(相谈棋)VS 阿尔法狗AlphaGo

5月25日 柯洁 VS 阿尔法狗AlphaGo

5月26日 古力+ 阿尔法狗AlphaGo VS 连笑+阿尔法狗AlphaGo

5月27日 柯洁 VS 阿尔法狗AlphaGo

比赛还没开始,作为同行的中国围棋高手、也是八次夺得围棋世界冠军得主的古力却对柯洁的战绩持悲观态度。古力在西安参加一场围甲联赛时曾接受媒体采访时表示,柯洁赢一盘的几率大概只有10%(一共三盘棋,充满无奈感但又没办法)。

同时,古力认为这次人类将会次失败,但或许可以从中看到未来的一些围棋人工智能的发展模式,比如它们之间可以自我对弈,让我们发现一些围棋贴目的规则可能会改变。

左右都是失败,古力给柯洁的建议是:放下包袱专心在棋局上,输赢无所谓,只要发挥出自己的正常水平就行了。

AlphaGo背后计算惊人,人类怎么可能赢?

大家知道,AlphaGo是一款由谷歌旗下DeepMind公司研发的围棋人工智能程序,使用蒙特卡洛树搜索(是一种人工智能问题中做出最优决策的方法)和深度学习结合的方式使计算机的围棋水平达到甚至超过了顶尖职业棋手的水平。AlphaGo 的内部技术采用了包括了深度 CNN,监督式学习,强化学习,以及蒙特卡洛搜索树 (MCTS) 等。

蒙特卡洛搜索树被认为是AlphaGo击败人类的功臣之一。它是一种启发式的搜索策略,能够基于对搜索空间的随机抽样来扩大搜索树,从而分析围棋这类游戏中每一步棋应该怎么走才能够创造最好机会。

此前AlphaGo战胜李世石,ta的优势在于通过自我对弈,产生了3000万盘围棋棋谱,而李世石怎么可能找到这么多棋谱。AlphaGo依赖运算能力和结果概率推导,就胜负关系而言,依照阿尔法狗的运算能力,每分钟可能推演上亿步的棋局演化,人类未出招,ta已经想好N的N次方的方法来接招。

而此次与柯洁对战的是1月DeepMind发布的AlphaGo 2.0。升级版的AlphaGo摒弃人类棋谱,只靠深度学习(机器学习中一种基于对数据进行表征学习的方法)的方式成长起来挑战围棋的极限,也就是说它不在受人类棋谱的局限,可以下出真正属于ta自己的围棋。

Alpahgo的自我对弈训练环境都是5秒一步快棋,所以现在的Alpahgo 更适应于快棋,在快棋上的表现将大大超过以前的老版本。

令人担忧的是AlphaGo还在不断地学习古今中外棋谱,学习此前围棋高手的对弈,并尝试理解胜负之间的关系。

不过即便如此,早些时候,柯洁对此次对战做了表态:“能代表人类出战是我的荣幸,我也会下好自己的棋。

AlphaGo之后

明显的一个感觉,不伦这次比赛的结果如何,显得都不是那么重要,而我们的重点是如何利用AlphaGo获胜的方法——深度增强学习算法,去影响我们的生活,而不只是停留在围棋的应用上。

深度增强学习算法使得计算机能够通过自对弈的方式不断提升棋力。深度增强学习算法由于能够基于深度神经网络实现从感知到决策控制的端到端自学习,它被认为具有广泛的应用前景。

单就谷歌本身而言,其利用这种深度增强学习算法已经在视频、游戏、围棋、机器人等领域取得了突破性进展。加之今年谷歌在I/O大会上新发布了第二代的 Tensor 处理单元(TPU),这是一个云计算硬件和软件系统,是作为专门为机器学习而专门设计的专用芯片。将加速谷歌人工智能落地的速度。

其第一代 TPU 被 AlphaGo 人工智能系统用作其预测和决策的基础。新的TPU 设备可提供高达每秒 180 万亿次浮点运算的性能,大大加速了对单个大型机器学习模型的培训。

当前,深度学习也已在计算机视觉、语音识别、自然语言理解等领域取得了一定进展,并已经落地到我们的生活当中。

一个简单的例子,国内人工智能创业公司商汤科技的计算机视觉已经在多个领域得到应用,比如,美图秀秀的自拍功能,其中就是利用了人脸识别技术。还有科大讯飞的语音识别技术,已经成功运用于游戏、手机、智能手表以及很多家庭智能产品当中。

未来将是万物互联的时代,越往后发展,你将体会更多人工智能的落地应用。当然,人工智能的出现,一部分人也将面临失业,5-10内,医疗保健、自驾汽车、教育、服务业等都将面临被淘汰的危险。李开复也曾在公开演讲中表示,未来10年,世界上50%的工作将被人工智能所取代。

而我们能做的应对措施唯有不断创新,才能不被机器代替,否则你还不如一条AlphaGo。