原创专家说：AlphaGo机器人对战李世石的胜率只有30%

 2016-3-9 11:57  1158 28 28 分类: 机器人/ AI

近日来，国际顶级科学期刊《自然》（Nature）‎[1]上关于电脑战胜职业围棋选手的报道引起了人们对人工智能的广泛关注，这是历史上电脑首次在公平竞赛的条件下战胜职业围棋选手。即将到来的AlphaGo和李世石九段的大赛更多是让人联想起当年深蓝和卡斯特罗夫的对奕。

那么，既然已经有了电脑战胜国际象棋冠军的先例，为什么在围棋这个领域还会引起这么大的关注呢？其根本原因在于,从计算的角度来看，围棋比国际象棋难的远远不止是一两个数量级。象棋的棋盘上的位置只有围棋的大约六分之一，这就决定了围棋的计算复杂度（简单说来就是可能出现的不同棋局的总数）远超国际象棋，从目前人类实用中接触的数字来看，几乎是一个无穷大数。不太理解的朋友可以参考“一张纸如果能对折64次可以从地球伸到月球”的传说。

换个角度来说，以目前计算机的能力而言，想穷举搜索或者尝试所有可能的棋局变化是完全不可能的。基于这个原因，虽然计算机已经在国际象棋领域战胜了人类，计算机在围棋上战胜人类一直被认为是一个尚需时日的事情。包括学术界和围棋界在内的大部分专业人士都没有想到这么快计算机就可以和专业棋手一决高下了。

从目前的趋势看，无论这次AlphaGo能否战胜李世石，计算机战胜国际顶尖围棋选手只是早晚的事情。而这次举世瞩目的比赛其成败具有的更多的是象征性的意义。

AlphaGo能够匹敌或战胜职业选手这一事实，对于人工智能乃至整个科技的发展，都是一个极为重要的标志和鼓舞。由此带来的技术突破和信心必将进一步推动人工智能尤其是机器学习在很多领域的应用。事实上，除了DeepMind的AlphaGo以外，其他的一些研究组也在计算机围棋方向取得了令人期待的进展，比如来自卡内基梅隆大学最近的工作‎[2]。

不出大家的意外，这次使AlphaGo大放光彩的核心技术是近年来蒸蒸日上的深度学习技术。自2006年Hinton再度引爆深度神经网络的热潮之后，深度学习在十年间几乎横扫所有人工智能相关的领域，在语音和视觉等领域的众多问题中频频取得突破性的进展。很多学者和工业界研发人员也从最初的谨慎怀疑态度转向积极跟进，进而推动了深度学习在理论和实践两方面的迅猛发展。就亮风台在增强现实领域的经验而言，尽管深度学习在实用时还需要克服一些诸如实时性的挑战，但我们亮风台已经在一些实际应用中（比如大规模图片识别和人脸分析）成功的使用了深度学习技术，并且期待在不久的将来会取得更好的结果和推广。

下面就我个人的理解来对这次比赛下注。首先声明，虽然我们在科研和应用上都在使用深度学习的技术（如今想不用都难啊），我本人对于深度学习研究有限，所以下面观点仅仅是很主观的个人观点。总的来说，这次人机大赛，我觉得AlphaGo的胜率不高，感觉在30%以下。下面就几个方面解释一下我的理由。

一、AlphaGo之前战胜的欧洲围棋冠军樊麾是职业二段，棋力和世界冠军的九段李世石有很大的差距。

李世石本人认为“AlphaGo和我约差2子”‎[4]，也是符合围棋段位之间的基本差距的‎[5]。这一观点得到了棋界诸多当前顶尖棋手的认同，参见‎[6]。当然，由于机器学习的强大学习能力，AlphaGo是有可能在这次比赛前的时间内得到棋力上的飞速提高，理论上是有可能进步到顶尖棋手的能力。但是，这种提高并不是能够轻而易举实现的，参加下面的解释。

二、深度学习毕竟还是要学习的，而学习是要样本和训练的。

尽管AlghaGo可以很容易的获取大量历史上的棋局资料，但是李世石这样的顶尖棋手的棋局资料还是有限的。更重要的是，计算机棋手和顶尖专业棋手的对局资料非常稀少。之前零星的几次疑似AlphaGo和高手在弈城围棋网上的比赛和即将进行的比赛差距还是太大，应该不足以弥补这个训练样本上的缺陷。

三、反过来从棋手的角度来看，顶尖的专业棋手对于机器棋手的行棋方式和漏洞可能更为敏感也有更强的应对方式。

比如，很多高手都指出了在AlphaGo-樊麾棋局中的一个明显失误‎[6]（这个嘛，只有业余11级水平的我其实没有看懂）,这样的漏洞相信不会被李这样的高手放过的。当然，人也有状态不稳定和犯糊涂的时候，不过高手发生这种状况的概率是很低的。

四、确实存在一种可能：AlphaGo可以通过头一局或两局迅速学习和调整。不过我个人感觉即使如此也不太容易达到击败李世石的水平，中间差距还是有些大，更多的样本才会更可靠一些。一个参考是当年深蓝和卡斯特罗夫的第一次比赛‎[7]。

总结一下来说，基于深度学习的技术使得计算机战胜专业棋手，虽然比大多数人预料的要早，并不是完全意外的。作为人工智能领域的从业者，我们应该更多的感到鼓舞，并期望从相应的技术泛化中汲取指引我们前进的知识和经验，使我们能在具体的应用领域上不断前进。

本文作者为亮风台首席科学家凌海滨

参考资料：

1. "Google AI algorithm masters ancient game of Go, Deep-learning software defeats human professional for first time." Elizabeth Gibney, Nature, 2016

2. "Better Computer Go Player with Neural Network and Long-term Prediction," Yuandong Tian and Yan Zhu, International Conference on Learning Representations (ICLR), 2016.

3. "Reducing the dimensionality of data with neural networks." Hinton, G. E. and Salakhutdinov, R. R., Science, 2006.

4. "Deep Blue versus Garry Kasparov," Wikipedia