首页

如何评价DeepMind新提出的MuZero算法？第1页

1

rewrgf 网友的相关建议:

感觉没啥新的东西，他虽然声称rule-free，但实际上是去掉了判断禁入点，是否终局之类的那个simulator而已，最重要的胜负判断器并没有去掉，本来是禁入点是直接用simulator判掉不让你下，现在改成你下了就判负而已。

当然，胜负判断器去掉的话，也不可能下的出围棋了。但不去掉胜负判断，只去掉simulator，本质上也就是初期训练时候多几个step而已，稍微学了几个step之后model就能知道哪里是禁入点哪里不是了，然后就和原来的alphago master, alphago zero, alphazero什么的一样了。

如何评价DeepMind新提出的MuZero算法？的其他答案点击这里

1

相关话题

  如何看待 AI 方向 PhD 申请竞争过于激烈的现象？
  机器通过主动学习能为人类生活带来怎样的改变？
  为什么交叉熵（cross-entropy）可以用于计算代价？
  如何看待亚马逊的无人超市产品 Amazon Go?
  如何激怒一位人工智能（机器学习、深度学习、强化学习等）爱好者？
  未来人工智能是否会让大部分人失业，从而引发严重的社会危机？
  现在的BERT等语言模型，最快训练要多久？
  小目飞压到底严厉在什么地方？
  下围棋时，下的不细腻是什么？感觉自己似懂非懂，有大佬详细讲解吗?
  如何评价百度自动驾驶 ApolloAuto 在 Github 上发布的代码？

前一个讨论

如何看待帝国理工关于新冠变异种的第一份报告？

下一个讨论

如何看待台湾地区领导人开放含有莱克多巴胺的美猪，台湾人民能阻止的了吗？

相关的话题

  2021 LG 杯决赛柯洁在第一场比赛赢下申旻埈，如何评价这局比赛？
  国内目前的量化交易是否很少涉及到机器学习？
  机器人同事越来越多，如何避免自己在科技进步过程中被替代？
  我们的工作会被人工智能取代吗？
  语音交互要解决哪些问题，才能摘掉“人工智障”的帽子?
  人工智能，深度学习，是不是继生化环材之后的第五天坑?
  如何看待谷歌 Jeff Dean 用 AI 6 小时就能设计一款芯片，强力碾压集成电路设计专家？
  xgboost原理？
  GAN的生成器是怎么产生图片的？
  Yann LeCun、Geoffrey Hinton或Yoshua Bengio能得图灵奖吗？
  聂卫平和曹薰铉他俩谁对本国围棋贡献大？
  人形机器人的研究的意义是什么？
  计算机大二分方向，人工智能和网络安全哪个好？
  在CV/NLP/DL领域中，有哪些修改一行代码或者几行代码提升性能的算法？
  人形机器人的研究的意义是什么？
  中国人工智能图像识别技术的开创者是谁？
  PyTorch中在反向传播前为什么要手动将梯度清零？
  如何评价Yann LeCun宣称『他已经做好放弃概率论的准备』？
  为什么不训练黑猩猩来代替人民从事体力和简单重复操作呢？
  为什么人工智能用 Python？
  大脑的本质就是一个 CPU 吗？
  国内外有哪些做小样本学习(Few-Shot Learning)的优秀团队？
  中国开发一个主流的手机系统到底能有多难？
  如何看待70岁老教授花费2年时间让收藏在伯克利的中文古籍善本通过达摩院技术，以数字化方式回归故土?
  在元宇宙世界中，我要怎么证明「我是我」？
  如何看待柯洁宣布「这段时间不会再碰围棋」？
  GBDT算法的细节问题？
  如果百年后深度学习最终有了公认的数学理论作为基础，能解释实验中的各类玄学，那这个理论会长什么样子？
  是否有可能使用人工智能在高原、戈壁和沙漠中进行工业生产？
  如何评价教育部发文：AI、算法等2018年进入全国高中课程？

© 2025-06-20 - tinynew.org. All Rights Reserved.
© 2025-06-20 - tinynew.org. 保留所有权利