其实09年就已经有相关的工作了,还发表在了science上
Distilling Free-Form Natural Laws from Experimental Data
这篇文章介绍了仅仅利用一些实验记录的raw data,学习出了简谐运动,单摆,双摆等运动的物理规律(具体来说是Hamiltonian and Lagrangian的解析表达式)。
(图来自原paper)
当时机器学习还没现在这么火爆,文章也只是用了symbolic regression的方法定义不同变量之间的偏导作为loss,当时还是引起了不少关注的。只是现在机器学习变得火爆了,但好像反而没什么人关注这个问题了。。。
经评论区指出,今年ICLR有一篇 https://openreview.net/forum?id=BkgRp0FYe¬eId=BkgRp0FYe
类似的工作,用神经网络来学习一个表达式。
数据从来不是它如何解释的,而是这个解释如何传播的。
比如说,股市涨跌和某人膝盖痛苦程度成正比,就算AI把这个规律总结出来,这个解释也不会被传播出去的。