感觉没啥新的东西,他虽然声称rule-free,但实际上是去掉了判断禁入点,是否终局之类的那个simulator而已,最重要的胜负判断器并没有去掉,本来是禁入点是直接用simulator判掉不让你下,现在改成你下了就判负而已。
当然,胜负判断器去掉的话,也不可能下的出围棋了。但不去掉胜负判断,只去掉simulator,本质上也就是初期训练时候多几个step而已,稍微学了几个step之后model就能知道哪里是禁入点哪里不是了,然后就和原来的alphago master, alphago zero, alphazero什么的一样了。