百科问答小站 logo
百科问答小站 font logo



如何评价DeepMind新提出的MuZero算法? 第1页

  

user avatar   rewrgf 网友的相关建议: 
      

感觉没啥新的东西,他虽然声称rule-free,但实际上是去掉了判断禁入点,是否终局之类的那个simulator而已,最重要的胜负判断器并没有去掉,本来是禁入点是直接用simulator判掉不让你下,现在改成你下了就判负而已。

当然,胜负判断器去掉的话,也不可能下的出围棋了。但不去掉胜负判断,只去掉simulator,本质上也就是初期训练时候多几个step而已,稍微学了几个step之后model就能知道哪里是禁入点哪里不是了,然后就和原来的alphago master, alphago zero, alphazero什么的一样了。




  

相关话题

  有没有根据一张人物的立绘正面像,自动生成同风格各侧面角度像并自动衍生表情的软件啊? 
  AlphaGo 与李世石的第四局比赛中有哪些值得关注之处? 
  机器学习中的PR曲线一定会过(1,0)这个点吗? 
  机器通过主动学习能为人类生活带来怎样的改变? 
  技术产业每十五年就出现一个新的中心,智能手机之后,下一个「大事物」会是什么呢? 
  G7 忙着「秀」,有哪些值得注意的细节? 
  为什么现在的CNN模型都是在GoogleNet、VGGNet或者AlexNet上调整的? 
  参加kaggle竞赛是怎样一种体验? 
  如何看待柯洁对罗志祥事件的评论? 
  如何看待AI伦理科学家Timnit Gebru在邮件控诉谷歌缺乏种族多样性后被Jeff Dean炒掉? 

前一个讨论
如何看待帝国理工关于新冠变异种的第一份报告?
下一个讨论
如何看待台湾地区领导人开放含有莱克多巴胺的美猪,台湾人民能阻止的了吗?





© 2025-02-21 - tinynew.org. All Rights Reserved.
© 2025-02-21 - tinynew.org. 保留所有权利