百科问答小站 logo
百科问答小站 font logo



如何评价AlphaGo Zero? 第1页

  

user avatar   xie-dan-9 网友的相关建议: 
      

成神了。

之前的估值和策略合并,这是合理的。

rollout 和蒙地卡罗 本来就是同样的,只是为了快速采用快速走子,这个合并很明显的选择。

简单说,这个论文就是把以前人工干预的东西全部合并入新的体系,数学上学术上可以算完美版了。

三天超越alphago ,可见速度+算法+数据的厉害,人类历史的三千年智慧只等于TPU的三天。


建议:Alphago Zero 对人类历史的所有棋谱进行一次遍历。找出那些10+%胜率变化的妙招和败招,一则可以统计下人类的妙手发生率(特别是造成比Alphago Zero 还好的妙招)。基本上看看人类历史上有多少手超越Alphago Zero 的招数,看看人类做为一个整体,是否还有用。


顺便看看围棋的历史,到底是能力为王还是传承为王,这个是围棋文化的一个历史课题啊。


另外说说棋力:

Zero 对master 90% 胜率,这在围棋中基本是让两子的差距了。

Zero 对 alphagoLee 100% 胜率,这是三子以上四子的差距了。

反过来可以推,master 对 alphagoLee 让三子很正常。柯洁当时该让三子试试,发挥下人类的余热啊。




  

相关话题

  黑棋和白棋谁赢了?还是打平了?有没有人可以帮我解决一下这个问题? 
  如果智能机器人真的大批量取代人工,那真的会失业么? 
  神经网络中,bias有什么用,为什么要设置bias,当加权和大于某值时,激活才有意义? 
  观电影机械姬(Ex Machina)有何感触? 
  如何评价Kaiming He团队的MoCo v3? 
  蒙特卡罗算法是什么? 
  如何评价何恺明、Ross Girshick组的自监督时空表征学习新作? 
  如何评价柯洁在2017年LG杯32强比赛中击败元晟溱? 
  围棋是否有热度下降的趋势? 
  如何评价DeepMind新推出的用于训练通用智能体的XLand? 

前一个讨论
怎么评价梁孟松加入中芯国际?
下一个讨论
如何看待百度搜索「自杀」的时候提示的画面?





© 2024-11-12 - tinynew.org. All Rights Reserved.
© 2024-11-12 - tinynew.org. 保留所有权利