百科问答小站 logo
百科问答小站 font logo



物理专业的学生如何看待机器学习和大数据这些方向呢? 第1页

  

user avatar   lykquitphy 网友的相关建议: 
      

既然是物理如何看待的,我就不按照科班的说法说机器学习了。

先说宏观的相同点:

机器学习同物理相同的地方都在于找到一个目标函数,然后求最小值(或者极小),然后比对实验(测试数据),那个解释的好就用那个。而建立目标函数过程中,建模方式都类似于先拟合少体关系,然后推向多体。比如我要建立两个来自不同物体的像素点的关系,我认为猫的像素点同猫的像素点是”强相关的“,因此可以用一个正系数的二次函数多项式描述两个像素点的耦合。猫和狗的像素点是“不相关的”,因此用一个负系数的二次函数多项式描述像素点的耦合。然后为了建立多个像素点的关系,就需要将这些两体耦合项全都加起来取负号,然后称其为能量函数并尝试最小化它。优化这些多项式系数,就能完成一个图像分割的任务。

不相同点:

机器学习里面相对物理世界最大的不同是对称性的考虑。

现代物理的能量函数是依靠对称性写出来的,而非牛顿时代的少体关系学拟合,然后让其N体化。例如,量子场论基本可以从时空的对称+SU(N) 规范对称写出非常多的拉格朗日量。物理学现行的范式,也是目前大统一理论的范式,就是企图通过更高的对称容纳下更多的自由度,然后通过逐渐的对称破缺,而获得形形色色的世界。传统通过实验观测,拟合少体作用然后N体化的模型在物理领域称之为有效模型,按机器学习的说法,有效模型就是说其泛化能力只能限制在你跑脑袋的那些实验数据上,超出这些数据类型就不能用了。这里特别强调对称破坏,打个比方,一个高维的球的对称性是极高的,但是我们没法观测到任何有意义的信息,任何方向都能解释同样的事情,除非对称破坏,变成一个椭球,由于高维椭球长轴可以取很多方向,这样选择某个方向,便对应于物理世界某个可检验的实验。

这一点机器学习,尤其深度学习都考虑的非常不足。虽说早期图像特征确实考虑各种拉伸不变,旋转不变,但缺乏层次感。到了大部分深度学习中要考虑平移,旋转等不变性,整体每层的变换要融入对称来作的人确实有,感觉太少,估计机器实现问题导致不太主流。

开下个人的脑洞:

我也一直觉得低级别的特征往往是对称程度非常高的,逐层映射过程中,实际每层都带有一定的对称破坏,逐渐形成后面的特征才是有意义的特征。比如第一层是平移旋转不变的,第二层只有平移不变。。。越高级的特征,对称破坏实际也越大。有些事实,正如CNN中第一层一般出来的是线段,feature map中会有各种平移和旋转角度的线段,第二层只有各种平移的角,旋转性质少了很多。越到高级特征,基本没有任何对称可言了。我目前也在思考逐层映射是不是也可以看成是一种对称破缺机制,能不能将这种机制变成一个更加广泛的建模技术。

不过不管咋说:面试了一阵子,感觉码农眼里的机器学习大抵是这样子的:xx分钟写某排序,xx分钟写树翻转,xx分钟写CUDA下的LR,xxxx分钟写个过亿用户行为的随机森林。。。。毕竟现实需求太过残酷,没人愿意废脑子去尝试新的模型方法。哪怕学术界也因为CNN太好用,框架多,去考虑更远的更深人也不多,直接各种CNN到处连跑效果的比比皆是。。。

估计大部分搞物理理解机器学习最难的地方应该是:为何总是有用一堆这么low的模型抠实现细节抠到死的人,会认为自己是搞人工智能的?

还好,我为了饭碗,已经迈过这个心理坎站到码农那边了。。。




  

相关话题

  具有美颜功能的镜子? 
  自然科学和唯心主义是矛盾的吗? 
  什么是数学之美? 
  作为资本家,消费者们是否可以以资本家使用自己的大数据而减少雇佣资本家的佣金? 
  你见过最萌的植物长什么样? 
  有人说能量守恒定律不对,我该怎么反驳它? 
  为什么食肉恐龙多是两条腿? 
  为什么自己照镜子感觉自己长的蛮好看,可是一拍照就觉得不咋的? 
  迁移学习与fine-tuning有什么区别? 
  数学与物理是什么关系? 

前一个讨论
如何评价电影《爵迹》?
下一个讨论
对 Lisp 新手来说,学习哪种方言、使用哪些参考书和开发软件更适合?





© 2024-11-08 - tinynew.org. All Rights Reserved.
© 2024-11-08 - tinynew.org. 保留所有权利