百科问答小站 logo
百科问答小站 font logo



如何评价DeepMind新提出的MuZero算法? 第1页

  

user avatar   rewrgf 网友的相关建议: 
      

感觉没啥新的东西,他虽然声称rule-free,但实际上是去掉了判断禁入点,是否终局之类的那个simulator而已,最重要的胜负判断器并没有去掉,本来是禁入点是直接用simulator判掉不让你下,现在改成你下了就判负而已。

当然,胜负判断器去掉的话,也不可能下的出围棋了。但不去掉胜负判断,只去掉simulator,本质上也就是初期训练时候多几个step而已,稍微学了几个step之后model就能知道哪里是禁入点哪里不是了,然后就和原来的alphago master, alphago zero, alphazero什么的一样了。




  

相关话题

  如何看待金立签下柯洁做代言人的行为? 
  如何评价基于游戏毁灭战士(Doom)的AI死亡竞赛大赛结果? 
  CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别? 
  第 22 届农心杯申真谞战胜柯洁,以 5 连胜的战绩帮助韩国队夺冠,如何评价本场比赛? 
  美本本校AI直博概率大吗? 
  如何看待 2019 年 12 月 10 日召开的 OPPO 未来科技大会,有哪些值得关注的信息? 
  是否存在这种审稿人思维:因为完全看懂了论文更增加了将之拒掉的几率? 
  人类有哪些能力,是 AI 无法拥有的? 
  有哪些深度学习效果不如传统方法的经典案例? 
  如何评价周志华教授新提出的 Deep Forest 模型,它会取代当前火热的深度学习 DNN 吗? 

前一个讨论
如何看待帝国理工关于新冠变异种的第一份报告?
下一个讨论
如何看待台湾地区领导人开放含有莱克多巴胺的美猪,台湾人民能阻止的了吗?





© 2025-01-18 - tinynew.org. All Rights Reserved.
© 2025-01-18 - tinynew.org. 保留所有权利