百科问答小站 logo
百科问答小站 font logo



AlphaGo 下棋的策略套路与人类策略有哪些相似吗? 第1页

  

user avatar   windycloud 网友的相关建议: 
      

其实Alphago的策略套路和人的策略套路本质是非常相似的,不同的是估值系统更为科学,aja huang自己的棋力也十分强大,这个因素是十分重要的。最近我发现有一部分人对Alphago的理解简直跑到玄学范畴里面去了,让我大惑不解一个这么正直的算法程序,怎么就这样变成一辆小火车……

继续推荐田博士的这一篇:

AlphaGo的分析 - 远东轶事 - 知乎专栏

14年起我一直业余时间经营知乎围棋群,期间来来往往上千个零基础为主各行各业的成年人群体,感觉总有点话想说,简单总结一下好了。

我想把不同阶段的棋友问题做个概括,然后讲讲我看到的Alphago的优势之处,欢迎评论区拍砖

【零基础群体的思维问题】

如果说成年人学棋进步极慢最大的瓶颈是什么,就是想问题进行决策先入为主的太多,贪心不足而犹犹豫豫,到头来很多时候不知道在想什么。

如果让我根据一般入门成人的思维路线画个图,那么很可能是下面这个样子:

如图,充满了奇怪而浅度的分支判断,不但目标不明确,判断标准也很混乱如果你真要追究一下每个分支是啥可能是这样的:

这么下真的好吗,啊我好想这么下可我没有勇气。

书里好像有这样的变化,但是局面好像不太一样。

对手好像是想这么欺负我但我应该反击么?不该反击么?

上次这么下被骂了,这次也好想这么下……

猪肉炖粉条好吃……啊,时间过得好快。

————————邪恶的分界线——————————————

如上,很多变化因为个人的情感因素不去深入计算,每个分支由于进行的很浅都没什么实际意义。

相比一下,儿童时期一张白纸,老师说什么就潜移默化去聚精会神的记下来,虽然不一定比成人理解力强,有时候结果反而要好一些。

这时候会问出这样的问题:

记定式有用么,感觉好枯燥?

我一般回答做乘法之前记九九乘法表有用么.这好像打架之前练习招式一样,可以不用招式但是当一个招式可以迅速击溃对方的时候你可以立刻反应过来。

做死活题有用么?

基本功就像打架练臂力,腰力,腕力,你技巧高是可以战胜一些空有蛮力的人,但是……说到这里该懂了吧。基本功永远是最重要的。

[零基础群体问题小结]

棋如其人在这个阶段体现的非常充分,很多人会卡在莫名其妙的地方踟蹰不前,可能只是别人认同不足或者自己对知识的吸收零碎破烂。这时候一个朴素踏实的学习思路会让一个人迅速突破初学的瓶颈进入下一阶段。

看到这里我想看看读者的情况,请问下图白棋先走,如何吃掉被标记了两个黄点的黑棋?

答案很简单。如下图:

留两个思考题:

(思考题1)

这个局面轮白下是什么情况。

(思考题2)

这个局面轮白下又是什么样。

类似的题大家可以移步我之前的答案:

零基础应该怎么学围棋? - 云天外的回答

【段位及以上的情况】

基础知识打过之后,围棋不同阶段的不同特性会吸引不同的人走向不同的道路,但是思维通路图比起零基础会有显著地不同,举例来说,喜欢计算秉性偏急一些的会在自己感到收货不够多或者意图被打乱的情况下把局面变复杂。喜欢判断性子偏悠长的会在大部分时间争取棋局安全运转在中后盘慢慢寻找对手的小漏洞。

(大局观强而细致计算力不足的棋手思维路径,细致计算不足可能出现随手)

(计算力强而判断力不足会在细枝末节上计算非常多而导致主线计算深度不足)

如图,思维路径会慢慢变成这样,主次分明,但是目的明确,有的地方分支算的很深但是会通过一些方法在计算到底之前排除掉。当然,排除掉的不一定是不好的变化,有的妙手隐藏的十分隐蔽,可能反复看几次都不会觉得有棋。

有一句话说得非常好,围棋主要的乐趣在于怎么从别人的百般阻挠中寻找一条可以实现自己意图的方式。但是水平还不够高的棋友出现的最大问题是你的意图全照你想的实现,你会发现你反而输多了,所以之前有人问我,围棋是不是只有计算而没有境界之分,我嗤之以鼻。只会计算算什么本事,你算得多,判断的根本不对,路都选错了能赢么。

{顺便说说优化}

最近刚开始学习python,看到各种算法优化,感觉和人脑的思路优化是有一点像的,同样执行一件事,有的思维方式又麻烦犯错的机会又多,重新审视复盘的时候还会觉得这一串思维表达式太繁杂一时半会找不出最关键的问题。

职业高手计算的时候计算极快,极远又极深。有多快呢?

(题目来自濑越宪作九段与吴清源九段合著的手筋辞典)

上图这样的题,即使没有做过,30秒内可以把各个主要分支计算的非常清楚。高手的思路清晰深远,计算力与判断力俱佳。

人的判断模型如下图,是有记载的各种新手定式可选点:

根据不同点的胜率决定对变化的取舍。(以上资源来自

围棋学研网 - 围棋入门

以上是人的一般思路。

【机器学习初窥】

算法这方面大家还是多看专家的分析,我这里只能简单叙述一下我的经验:

这篇视频是最早让我正视ai突破的:

Alex Wissner-Gross: A new equation for intelligence

机器学习是建立在统计基础上的一种研究方式,但是从很早很早开始选用蒙特卡罗树搜索以后,就和人有了根本不同,蒙特卡洛是随机抽样,人来根据他大量运算的结果,调整对盘面的估值模型。初期的时候,大量的样本就是电脑互相之间胡乱瞎下,没有一点道理,也没有一丝看点,这时候给出的胜率参考没有一点价值,早期的程序我下过很多,普遍无所谓大小,死活一通胡下,同样的错误一盘来十几次。

我看到很多人都在谈ai给人带来的恐惧感,但这里最该关注的其实是优化参数的aja huang的团队,就像我之前说的,计算力强有什么了不起的,你可以一个字一个字穷举世上所有诗歌,但你没有表达的诉求也没有一个最基本的使用评断标准又有什么用。

从围棋角度看李世石与 AlphaGo 的第二局比赛有哪些关键之处? - 云天外的回答

{先说相似性}

有个地方,我发现我自己的群里大家都没有去关注,这句

每次搜索到叶子节点时,没有立即展开叶子节点,而是等到访问次数到达一定数目(40)才展开,这样避免产生太多的分支,分散搜索的注意力,也能节省GPU的宝贵资源”,

这里和人的思考路径是有相似性的,包括快速落子系统,避免战斗强调大局的下法,通过一定方法减少无意义的计算,这一点是相通的。

{再说不同}

我们大家这两盘棋看的很清楚,Alphago最大的特点是开局非常有“创新意识”,下出来的棋之前的棋谱库里基本没有,这是为什么?

还是因为机器是随机抽样,大量运算,计算机的眼里会根据团队给他的估值系统给全盘所有的点做一个评分,可以说真正做到了胸怀全局,而且是十分数字化系统化的大局观。

如之前所述,人的判断,很多知识来自己于老师,对手,书籍,长时间的训练之后对很多点是不会去想的,因为对一些奇怪的或者理论上一般会认为比较俗的变化进行研究,人达不到一个非常系统的评断胜率的级别。这是一个非常具有积极意义的地方,我看到很多棋友刚开始学棋,很多棋看着有效,但是会因为比较“粗俗”等理由不去下,或者仅仅因为对方的棋目的过于直接或者选点过于罕见而鄙视,相信这种风气在有了Alphago以后可以有更科学的改变。



(欢迎大家各种意见各种拍砖)




  

相关话题

  如何理解马云在世界人工智能大会上说的「保护哭喊的落后力量,一定会阻碍创新」? 
  做底层 AI 框架和做上层 AI 应用,哪个对自己的学术水平(或综合能力)促进更大? 
  是否会出现《棋魂》里面龙彦这种棋力至少职业二段以上的业余棋手? 
  如何看待SQuAD比赛中,阿里、MSRA机器阅读理解准确率超越人类? 
  对局AlphaGo,我完全随机落子,无数盘中能否赢一盘? 
  如何看待周志华等人的新书《机器学习理论导引》? 
  如何评价农心杯,芈昱廷超时负(已经反反转)? 
  在一个非常繁忙的十字路口,红绿灯坏了,请问无人驾驶汽车能顺利通过吗? 
  如果你是图灵测试者,你会问机器什么问题? 
  AlphaGo 下棋的策略套路与人类策略有哪些相似吗? 

前一个讨论
如何评价第二局比赛 AlphaGo 又一次战胜李世石?
下一个讨论
从围棋角度看李世石与 AlphaGo 的第二局比赛有哪些关键之处?





© 2024-11-08 - tinynew.org. All Rights Reserved.
© 2024-11-08 - tinynew.org. 保留所有权利