私以为,kaiming这篇文章的核心精髓就在这,没有se,没有swish之类的奇怪操作,没有奇奇怪怪的数据扩增,就按照正常的情况去搜索各种纯结构组合,只跑100 epochs。
注意一下400M,72.7的结果,有没有发现什么。如果一直关注基础模型设计的人,就会发现,和手工设计的mobilenet v2,shufflenet v2对应的72.6极为接近,而这两个是在350epoch下的结果。
能得出什么结论,其实可以隐约可以看出就在打脸nas,不玩骚操作,大家都公平对比的情况下,搜出来的网络结构,和手工设计的,真没有本质区别。
而最近各种新的文章,本质上想涨点,四个操作,1.加se;2.relu改成prelu或者swish等激活函数;3.加上多尺度信息;4.各种特殊数据扩增,以及更多的epoch。
结论:再怎么高的网络,再怎么惊人的结果,也无非就是基础结构和以上四点的排列组合罢了,至于是nas还是手工设计,没有本质区别。这也是我这几年特别想喷的一个地方,每年几十上百篇nas的顶会文章,作者们真的扪心自问一下,有做出和手工设计差异性的地方吗?
克劳备忘录也好,凯南电报也好,有两大共同点。首先,都是以现实主义的眼光去分析双方的关系。然后,给出的建议都是阳谋,并不是什么不可告人的阴谋,执行起来需要的不是鸡鸣狗盗的小聪明,而是惊人的意志力。
而美国现在战略界现实主义被边缘化,我推测,布热津斯基,基辛格那帮人应该写过不少。不过没所谓,美国能执行大战略的时代过去了。现在这一代精英上半年能管下半年就已经很了不起了。一个需要两代人以上持之以恒去完成的大战略,搞出来他们也执行不了。
冷战时期,从杜鲁门艾森豪威尔到肯尼迪尼克松,最后到李根老布什,个人性格和政治偏好差距不要太大,但是都忠实地完成了他们历史任务,沿着围堵政策做下去。这种战略定力和延续性,世间少见。在中国领导集团上能看见一些相似的东西,但是我们离得距离太近,反而看不清。但在美国精英层身上完全看不到这一点。
个人愚见。