总的来说,赞同 @Mon1st 的观点。
从机器学习的角度讲,文中使用监督学习的方法,除了头朝向细胞和位置细胞作为训练集,而且需要regularization才能训练出网格细胞的发放模式。后面使用深度强化学习A3C-LSTM网络在虚拟游戏环境中导航进行训练,agent能够“抄近路”,也就是选择较合适的路径。个人觉得是“非常合理”,能够实现的。
从计算神经模型的角度讲,虽然在文中引用并说明了跟生物实验发现一致,但是还是很少解释机理上的问题,比如细胞是如何训练分化出能够产生这种网格发放模式的,在网络中头朝向细胞、边界细胞、网格细胞之间是如何连接来实现功能的,以及解释导航这种高级的空间认知功能。
仔细读来,文章写的很好,图做的很漂亮,是很不错的成果(发在Nature Letter,而不是Article),但是并不是媒体宣传的那样惊为天人的成果,望不要过度宣传,继续静心研究。(有误请轻拍)
主要的启示:Deepmind的宣传部门非常强大。同样的文章换别人是发不到Nature的… [1]
好话我留给别人说,这里只提一点。
网格细胞是位置细胞的特征值。文章中监督学习的信号就是位置细胞和头朝向细胞,据此训练的网络产生网格细胞这个结果并不奇怪或惊人。