百科问答小站 logo
百科问答小站 font logo



一般来说,三层神经网络可以逼近任何一个非线性函数,为什么还需要深度神经网络? 第1页

  

user avatar   shi-guan-ya 网友的相关建议: 
      

因为从approximation error(拟合误差)的角度,无论是实验结果来看,还是从理论分析来看,大部分情况下“深”都比“宽”更有效。

理论层面的话,分享一篇我比较喜欢的paper里的结果(Why Deep Neural Networks for Function Approximation?,ICLR 2017),作者是UIUC的Shiyu Liang和R. Srikant。

简单来说,这篇文章证明了,如果想要达到 的拟合误差(approximation error),深度为常数(与 无关)的神经网络需要 个神经元,也就是说,shallow neural network的神经元数量随着精度( )的上升多项式增长。然而,深度为 的神经网络只需要 个神经元,也就是说,deep neural network的神经元数量随着精度的上升对数增长。换言之,想要达到同样的拟合误差,更深的神经网络需要的神经元数量远小于层数少的神经网络。


user avatar   zr9558 网友的相关建议: 
      

歪个楼,深度学习的教材里面一般都会提到这个定理。

Universal Approximation Theorem(1989)

Stone-Weierstrass Theorem(1885)

在一百年之前,数学家已经有一个类似的结论,其实用多项式就足够逼近闭区间上面的任意连续函数了。




  

相关话题

  人工「神经网络」技术在信息处理上有何特点,工作原理是什么? 
  老师给了一个神经网络的程序,他之前是跑通了的,但是我迭代几十次或者一百多次就报错。这个怎么解决? 
  从人脑角度来说为什么人画画会越来越准(形准)? 
  如何评价Hinton组的新工作SimCLR? 
  AI(或者说神经网络/深度学习)能够实现科学(尤其是物理学)研究中提出假设这一步嘛? 
  除了深度神经网络已经实现的特性以外,大脑还有哪些特性是值得机器学习领域借鉴的? 
  为何感觉“知识蒸馏”这几年没有什么成果? 
  有尝试用多层自组织特征神经网络(MLSOM)来代替层次分析法(AHP)的吗?会有哪些问题需要注意? 
  如何理解深度学习源码里经常出现的logits? 
  现在人工智能的某些学派,是不是跟中医有些像? 

前一个讨论
如何看待温柔junz最新视频《豫章书院曝光者温柔,深陷“网络暴力”泥潭》 并声称自己一生没有做坏事?
下一个讨论
如何评价「神经网络本质不过是初中生都会的复合函数」?





© 2025-05-09 - tinynew.org. All Rights Reserved.
© 2025-05-09 - tinynew.org. 保留所有权利