百科问答小站 logo
百科问答小站 font logo



如何评价DeepMind新提出的MuZero算法? 第1页

  

user avatar   rewrgf 网友的相关建议: 
      

感觉没啥新的东西,他虽然声称rule-free,但实际上是去掉了判断禁入点,是否终局之类的那个simulator而已,最重要的胜负判断器并没有去掉,本来是禁入点是直接用simulator判掉不让你下,现在改成你下了就判负而已。

当然,胜负判断器去掉的话,也不可能下的出围棋了。但不去掉胜负判断,只去掉simulator,本质上也就是初期训练时候多几个step而已,稍微学了几个step之后model就能知道哪里是禁入点哪里不是了,然后就和原来的alphago master, alphago zero, alphazero什么的一样了。




  

相关话题

  如何看待Scale AI这样的创业公司? 
  今天的柯洁对战前ai时代的柯洁(比如他拿第一个世界冠军的时候),胜率能有多少,能让先吗? 
  如何客观评价科大讯飞这家公司? 
  如何激怒一位人工智能(机器学习、深度学习、强化学习等)爱好者? 
  游戏《文明 6》和围棋哪个更复杂? 
  苏联计划经济体制能否在大数据与智能决策时代展现出某些优势? 
  如何看待蚂蚁金服原副总裁漆远离职阿里,入职复旦大学、回归学术界? 
  Transformer在工业界的应用瓶颈如何突破? 
  如何看待人工智能攻破德州扑克? 
  分类问题的label为啥必须是 one hot 形式? 

前一个讨论
如何看待帝国理工关于新冠变异种的第一份报告?
下一个讨论
如何看待台湾地区领导人开放含有莱克多巴胺的美猪,台湾人民能阻止的了吗?





© 2025-05-07 - tinynew.org. All Rights Reserved.
© 2025-05-07 - tinynew.org. 保留所有权利