百科问答小站 logo
百科问答小站 font logo



如何评价DeepMind新提出的MuZero算法? 第1页

  

user avatar   rewrgf 网友的相关建议: 
      

感觉没啥新的东西,他虽然声称rule-free,但实际上是去掉了判断禁入点,是否终局之类的那个simulator而已,最重要的胜负判断器并没有去掉,本来是禁入点是直接用simulator判掉不让你下,现在改成你下了就判负而已。

当然,胜负判断器去掉的话,也不可能下的出围棋了。但不去掉胜负判断,只去掉simulator,本质上也就是初期训练时候多几个step而已,稍微学了几个step之后model就能知道哪里是禁入点哪里不是了,然后就和原来的alphago master, alphago zero, alphazero什么的一样了。




  

相关话题

  波士顿动力最新战争机器人,对各国军事平衡产生怎样影响? 
  如何评价野狐的国产围棋 AI「绝艺」? 
  如何评价 DeepMind arXiv 论文公开的 AlphaZero 击败国际象棋和将棋的最强引擎? 
  如果阿尔法狗教人类下棋,会比人类围棋师傅要厉害么? 
  如何看待Capsule Network在NLP领域的潜力? 
  云米在米粉节发布一系列黑科技新品,值得米粉们期待吗? 
  如何看待围棋选手李轩豪疑似使用 AI 作弊? 
  2019年NeurIPS有哪些糟糕的论文? 
  如何评价 MSRA 最新的 Deformable Convolutional Networks? 
  如何看待人工智能系统 Libratus 战胜四位德州扑克顶级选手,获得最终胜利? 

前一个讨论
如何看待帝国理工关于新冠变异种的第一份报告?
下一个讨论
如何看待台湾地区领导人开放含有莱克多巴胺的美猪,台湾人民能阻止的了吗?





© 2025-05-09 - tinynew.org. All Rights Reserved.
© 2025-05-09 - tinynew.org. 保留所有权利