百科问答小站 logo
百科问答小站 font logo



如何评价DeepMind新提出的MuZero算法? 第1页

  

user avatar   rewrgf 网友的相关建议: 
      

感觉没啥新的东西,他虽然声称rule-free,但实际上是去掉了判断禁入点,是否终局之类的那个simulator而已,最重要的胜负判断器并没有去掉,本来是禁入点是直接用simulator判掉不让你下,现在改成你下了就判负而已。

当然,胜负判断器去掉的话,也不可能下的出围棋了。但不去掉胜负判断,只去掉simulator,本质上也就是初期训练时候多几个step而已,稍微学了几个step之后model就能知道哪里是禁入点哪里不是了,然后就和原来的alphago master, alphago zero, alphazero什么的一样了。




  

相关话题

  能否用AI控制枪械,实现自动寻找目标、瞄准、击发? 
  有哪些相见恨晚的家居好物推荐? 
  机器学习如何才能避免「只是调参数」? 
  在中小学阶段设置人工智能相关课程对于培养人工智能人才具有哪些意义?如何推进会比较有效? 
  如何评价「棋圣」聂卫平称荣耀Magic3的AI能力达到围棋选手职业水平? 
  五子棋如果可以无限下,比 5 的个数怎样? 
  如何看待「机器学习不需要数学,很多算法封装好了,调个包就行」这种说法? 
  这个棋是不是围棋? 
  caffe开发过程中使用了哪些工具? 
  面对飞速发展的人工智能,我们应该如何调整对孩子的教育? 

前一个讨论
如何看待帝国理工关于新冠变异种的第一份报告?
下一个讨论
如何看待台湾地区领导人开放含有莱克多巴胺的美猪,台湾人民能阻止的了吗?





© 2025-02-22 - tinynew.org. All Rights Reserved.
© 2025-02-22 - tinynew.org. 保留所有权利