如果你做neuroscience的目的是了解大脑,从而解决一些本质的哲学问题的话,我觉得你很大概率可能会后悔。人类大脑之复杂,我们对大脑理解之少,很可能会远远超出你的想象。我是搞数学的,前几年抱着类似的想法花了很多时间去学neuroscience,试图做一点问题,没想到踩了一个巨大的坑。可以简单讲一下我的故事,不是劝退,只是希望你知道做neuroscience的难度。人工神经网络已经是黑盒子了,真正的人类大脑比人工神经网络要困难太多太多。
我踩进去的这个坑是关于大脑视觉皮层的,视觉皮层属于解剖结构和功能都被研究的很透彻的区域,灵长类(确切点说是旧世界猴,视觉皮层的解剖结构和人类类似)的解剖和活体实验数据也比较多。我们做的区域是V1(初级视觉皮层),功能非常简单,视觉信号只是在这里做一些简单的积分就被送到其他的区域去了。和高级一些的功能比如情感、认知等等比起来,对V1做建模和计算要简单得多。和我合作的两位教授也都是大人物,并没有水平不够的问题。
V1在计算神经科学领域属于进展非常好的,一些局部的功能比如方向选择性已经可以在计算模型上很好的重现了。我们最初的想法是建立一个大规模的V1模型,先在计算机上重现一些牵扯到大量神经元的非局部现象,之后再看看能不能做的更深入一点,了解一下V1送到其他区域的信息都做过什么样的加工,这些加工对视觉的感知有什么好处等等。动手之前我自己做过不少测试,感觉计算能力上其实是没有什么问题的。经过一段时间的讨论,我们选择了一个比较容易做的”小问题“,是关于视觉信号的周边抑制现象(surround suppression),简单说就是当大范围的视觉皮层受到刺激的时候,边缘部分的神经元的反应比中心部分更加强烈。为了简化起见,我们只考虑了几百个柱状结构(hypercolumn),每个柱状结构被分成了几十个小的”单元“,每个单元内的神经元触发速率做了平均场近似(mean-field approximation)。这样整一块皮层受到视觉刺激之后的表现可以通过解一个几万个变量的方程而很快得到,在计算上并没有什么障碍。当时我们认为这只是花很少的一点时间写一篇热身性质的小文章,告诉人们当我们看着几米远以外一块碗口大小的光栅(grating)的时候,我们的初级视觉皮层内部到底发生了什么。
然后真正做起来以后发现完全就不是那么回事。所谓的实验数据一般是这样的,把(麻醉后的)猕猴的头盖骨去掉之后在视觉皮层内插上电极,然后一边让猕猴看不同直径的光栅,一边记录收集到的电信号。最后在电极上放电造成一点脑内的疤痕,然后解剖猴脑,看看电极到底扎在了哪一层。至于这段时间内整个视觉皮层上面到底发生了什么,收集到的电信号来自哪一条视觉信号通路,找到的这个神经元和别的神经元是怎么连接的,连接强度如何等等等等,基本上是一抹黑。还有大量作为建模非常需要的解剖学上的信息,实验数据也都很不完整。做了一段时间以后给我的感觉就是大脑太复杂了,我们对大脑的研究又太不充分。好像一群外星人要了解北京在中国政治经济文化上的作用,但是他们的主要研究手段是派人随机地选一条马路在路边坐下数路过的人数。对大脑的研究要想有突破,关键还是收集脑内神经元信息的手段和处理数据的手段要有突破,在这个之前做计算也好,做数学也好,都有点太早了。V1这么简单的区域都这么难,情感、认知这些高级功能更不用说。
我们这个”小问题“的结果就是模型里面一下冒出来几十个未知参数,然后就掉进了调参的烂坑,所有在数学和计算上的经验全都派不上用场。调参的过程就像炼丹一样,这边按下葫芦那边起来瓢。算一遍tuning curve(某个神经元对大小不断变化的光栅的反应曲线)要十几分钟,所以autoML之类自动调参的想法也不是那么行得通。最后折腾了两年多花了大量的时间搞出一组还说得过去的参数,整个过程极其无聊琐碎,既没成就感也没多少技术可言。文章最后能发在哪里,神经生物学圈子里的人到底有多么接受,也都是个问题。因为大量时间被占用,我手里其他的问题也受到了很大的影响。还好是现在,要是读PhD期间碰上这么一件事,估计直接就要退出学术界了。