AlphaGo是怎样学会下围棋的呢?

来源：中国教育信息化网
作者：李志民

　　谷歌计算机围棋程序“阿法狗”(AlphaGo)的主要工作原理是“深度学习”。深度学习是指机器通过深度神经网络，模拟人脑的机制来学习、判断、决策，已经被广泛应用于许多领域。这就涉及到机器如何学习，现在科研进展如何呢?

　　机器学习的方法主要分为三种：监督学习、半监督学习和无监督学习。

　　监督学习是指利用一组已知标注类别的样本调整分类器的参数，使其达到所要求性能的过程。具体是给机器一堆有标记的数据，让机器学习后，推测得出新的未知的信息。代表方法为神经网络、SVM、NaveBayes、KNN和决策树等。

　　韩国棋手李世乭挑战的谷歌阿法狗采用的就是神经网络的学习方法，阿法狗幕后的科学家利用神经网络算法，将棋类专家的大量比赛记录输入给计算机，并让计算机自己与自己进行比赛，在这个过程中不断学习训练，积累胜负经验，制定策略网络，逐步形成全局观，对弈时给出最优落子选择。某种程度上讲，阿法狗的棋艺不是开发者教给他的，而是自学成才。

　　机器学习的进一步提高就是半监督学习，半监督学习是指介于监督学习和无监督学习之间，利用少量的标注样本和大量的未标注样本进行训练，以得出新的位置信息的办法。现在正在研究并兴起的一种机器学习方法。

　　无监督学习是机器学习研究者的最高追求。无监督学习则指设计分类器时，不给样本参数任何标签，让机器自行分析处理。目标便是让机器学会自主学习。Facebook、Google等公司以及学术界的研究者正在对某些有限的非监督式学习进行实验。

　　尽管阿法狗学习下围棋属于机器学习方法的低端阶段，但阿法狗的学习能力给未来创造了更多的可能性。无关胜负，都是一次了不起的挑战。

　　回顾IT业发展史不难发现，人机交互方式的每次变革都给产业发展带来巨大机会，比如从DOS系统到WINDOWS的进化，从触屏操作、语音交互到智能手机和平板电脑的流行。去年10月14日，阿里云2015云栖大会在杭州召开，来自全球约2万名开发者参加。阿里云及其合作伙伴在大会上发布了一系列新的云计算技术，200多家云上企业展示了量子计算、人工智能等前沿科技。期待今后科技界带来更多新奇的高科技，进入人类生活更多的领域。

　　（2016-03-23）

上一篇：AlphaGo为何能够战胜顶级围棋手李世乭?

下一篇：AlphaGo为何没有实现4连胜呢?

访谈视频

访谈嘉宾