首先,我们通过组图来了解Alphago的发展历程:
再来看看Alphago zero 的自学发展过程:刚开始的3小时,Alphago zero表现的像是一个初学者,热衷于去吃对方的棋子。
可是,发展到19小时时,Alghago zero表出更为先进的围棋理论,知道死活、厚势以及实地。
等到70小时之后,Alphago zero 已经达到顶级人类水平。整个棋盘包含着各种决斗。
我们在惊讶于zero惊人的成长之后,谷歌之后发布的数据更让我们目瞪口呆,说100:0战胜Alphago Lee版本,89:11战胜master版本,要知道在2017年年初master在网络上把中日韩三国的顶尖高手砍了个60:0,于是,master“让人类顶尖高手三个不在话下”、“甚至可能4个”这样的评论甚嚣其上。现在连zero版本都能大幅度领先master版本了,那岂不是可以让人类4个,5个甚至更多?可能对于广大没有接触过围棋的朋友来说,让4,5个基本没有什么概念,不就是在棋盘上摆上4个或5个子嘛!可是对于职业棋手来说,别说4个,5个,就是2个这样的差距都是不可想象的。
我来普及一下围棋让子的概念:让子指是围棋的一种对弈制度,指持黑子的一方先在棋盘上摆上一定数目的子之後,再由执白子的一方开始下,这种制度在于使原本棋力有差距的两个对弈者,能拉近彼此距离,以增加趣味并有助磨练棋力。放子的位置2-4子时放在四个角落的星位,第5-8子放在四边的星位,第九子放在中央的天元位。超过9子,则再放在九子子间中点的位置。下面举几个例子:
那么让子数的多少如何量化呢?假设合理的贴目是A(日韩是6.5目,中国是7.5目),那么让N个子,平手下棋,黑棋应该赢A*(2N-1)目,换句话说,假设合理贴目为7目,我让一个对手3子,对手执黑大致是7*(2*3-1)=35目,才算正常。换句话说,我让他三个子,他贴我35目,这是一盘五五开的对局。具体理论是,让N子,可以看作是黑正常先行,然后白pass了N-1手,每pass一手,损失是两个贴目。而黑本来就要一个贴目,所以,黑等于领先了总共2N-1个贴目。
因此,如果Alphago zero能让柯洁3子,相当于让柯洁领先35目后对弈,这个结果相当可怕的,因为我们知道职业棋手的水平,最强的职业最多只能让最弱职业2子,不可能再多了。有兴趣的可以翻阅历届的晚报杯大赛,最后有职业对战晚报杯前十的业余棋手,这些顶尖业余棋手大致也有职业三四段水平,一般让2子对抗,最后业余的赢面较大。如果是让先对局,通常是职业赢面大。记得去年晚报杯,一线职业棋手全巢出动,把业余让先打了个10:0,厉害吧!你看就是多了一个贴目,业余高手们的成绩就好很多了。
可是,在zero之前的master,却硬生生的把顶尖职业打成60:0的战绩,我觉得从战绩上看至少3子,60:0意味着分先没有机会。如果两个人只相差2子,下60局,也不会一点都没有胜利的机会。有点水平的业余爱好者应该都有这样的体会,在比赛面对比自己差2子的选手很有可能会输,只能说赢面比较大,所以60局是一种绝对实力的碾压。可是,大家不要忽略计算机所具有的特点:稳定,不犯错误,60局又是30秒快棋,这意味着人类的两个弱点被放大了:失误率增加和心理因素。人类棋手下棋70%靠经验的推理,为什么会有盲点的存在?就是经验导致的失误。快棋是在限定的时间内要你做出合理的应答,所以,盲点就多了。相比于冷冰冰的机器,棋手的心理起伏会对整个局势起到影响,一着不慎,满盘皆输说的就是这样的情况,但是,计算机不会,给他一个程序,经过他的计算,做出合理的应答,不需要解释。经过Alphago的更新换代,zero自我对弈盘数之多是人类一辈子都赶不上的,它的经验可以在三天内达到人类这一千多年的累积。
但是我们再来看zero对弈master的战绩89:11,这意味着什么呢?意味着边际效应正在递减,说明zero在不断自我更新强大的同时正在无限接近围棋真理,如果我们把zero看作围棋上帝,那么,master其实离围棋上帝并不那么远。所以,会出现一定概率的胜负。
综上所述,我认为zero大致能让人类顶尖3子,当然这可能也保守了,最好的方式当然是Zero 让人类3子下一盘,但是谷歌表示今后不再在围棋领域投入研究,转战游戏领域了,哦,那我们就只能靠自己仅有的经验意淫一下了,毕竟有生之年能看到围棋之神的产生是何其幸运的事情,Zero 让子数多只能更进一步证明围棋这一古老游戏的魅力,千变万化,经过人类上千年的经验积累都无法穷尽。而Zero 的自我对弈中仍有人类棋手的招法,也更说明了人类总结的围棋棋理是正确的,是经久不衰的。所以,人类棋手不要沮丧,想想以后随时有一个围棋高手可以和你对弈,何其幸哉!