百科问答小站 logo
百科问答小站 font logo



物理专业的学生如何看待机器学习和大数据这些方向呢? 第1页

  

user avatar   lykquitphy 网友的相关建议: 
      

既然是物理如何看待的,我就不按照科班的说法说机器学习了。

先说宏观的相同点:

机器学习同物理相同的地方都在于找到一个目标函数,然后求最小值(或者极小),然后比对实验(测试数据),那个解释的好就用那个。而建立目标函数过程中,建模方式都类似于先拟合少体关系,然后推向多体。比如我要建立两个来自不同物体的像素点的关系,我认为猫的像素点同猫的像素点是”强相关的“,因此可以用一个正系数的二次函数多项式描述两个像素点的耦合。猫和狗的像素点是“不相关的”,因此用一个负系数的二次函数多项式描述像素点的耦合。然后为了建立多个像素点的关系,就需要将这些两体耦合项全都加起来取负号,然后称其为能量函数并尝试最小化它。优化这些多项式系数,就能完成一个图像分割的任务。

不相同点:

机器学习里面相对物理世界最大的不同是对称性的考虑。

现代物理的能量函数是依靠对称性写出来的,而非牛顿时代的少体关系学拟合,然后让其N体化。例如,量子场论基本可以从时空的对称+SU(N) 规范对称写出非常多的拉格朗日量。物理学现行的范式,也是目前大统一理论的范式,就是企图通过更高的对称容纳下更多的自由度,然后通过逐渐的对称破缺,而获得形形色色的世界。传统通过实验观测,拟合少体作用然后N体化的模型在物理领域称之为有效模型,按机器学习的说法,有效模型就是说其泛化能力只能限制在你跑脑袋的那些实验数据上,超出这些数据类型就不能用了。这里特别强调对称破坏,打个比方,一个高维的球的对称性是极高的,但是我们没法观测到任何有意义的信息,任何方向都能解释同样的事情,除非对称破坏,变成一个椭球,由于高维椭球长轴可以取很多方向,这样选择某个方向,便对应于物理世界某个可检验的实验。

这一点机器学习,尤其深度学习都考虑的非常不足。虽说早期图像特征确实考虑各种拉伸不变,旋转不变,但缺乏层次感。到了大部分深度学习中要考虑平移,旋转等不变性,整体每层的变换要融入对称来作的人确实有,感觉太少,估计机器实现问题导致不太主流。

开下个人的脑洞:

我也一直觉得低级别的特征往往是对称程度非常高的,逐层映射过程中,实际每层都带有一定的对称破坏,逐渐形成后面的特征才是有意义的特征。比如第一层是平移旋转不变的,第二层只有平移不变。。。越高级的特征,对称破坏实际也越大。有些事实,正如CNN中第一层一般出来的是线段,feature map中会有各种平移和旋转角度的线段,第二层只有各种平移的角,旋转性质少了很多。越到高级特征,基本没有任何对称可言了。我目前也在思考逐层映射是不是也可以看成是一种对称破缺机制,能不能将这种机制变成一个更加广泛的建模技术。

不过不管咋说:面试了一阵子,感觉码农眼里的机器学习大抵是这样子的:xx分钟写某排序,xx分钟写树翻转,xx分钟写CUDA下的LR,xxxx分钟写个过亿用户行为的随机森林。。。。毕竟现实需求太过残酷,没人愿意废脑子去尝试新的模型方法。哪怕学术界也因为CNN太好用,框架多,去考虑更远的更深人也不多,直接各种CNN到处连跑效果的比比皆是。。。

估计大部分搞物理理解机器学习最难的地方应该是:为何总是有用一堆这么low的模型抠实现细节抠到死的人,会认为自己是搞人工智能的?

还好,我为了饭碗,已经迈过这个心理坎站到码农那边了。。。




  

相关话题

  物理中G=mg,老师说同质量的物体在地球各处重力不同,但m质量是确定的,g=9.8怎么理解? 
  生物圈中的绿色植物可以分为哪四个大类群? 
  如何获取历史降雨数据? 
  如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系? 
  数学与物理领域有哪些糟糕的术语? 
  宇宙是几维的? 
  为什么电子不能移到物体外部? 
  《惊天魔盗团2》里的让雨停住的魔术原理是什么? 
  你在物理学科普书中学到过最令人震惊的知识是怎样的? 
  如何评价清华大学发布的自研深度学习框架-计图(Jittor)? 

前一个讨论
如何评价电影《爵迹》?
下一个讨论
对 Lisp 新手来说,学习哪种方言、使用哪些参考书和开发软件更适合?





© 2024-11-23 - tinynew.org. All Rights Reserved.
© 2024-11-23 - tinynew.org. 保留所有权利