百科问答小站 logo
百科问答小站 font logo



神经网络中如果一个重要特征C等于特征A+特征B(算数意义上的相加),选特征的时候还有必要选特征C吗? 第1页

  

user avatar   mastermydestiny 网友的相关建议: 
      

这种情况通常叫做multicollinearity。

一般统计背景的人倾向于不选C,因为他们倾向于independent的feature,这样通过观察coefficient,可以了解每个feature对最终的estimate起到的作用。如果两个feature是collinear的,尤其是此消彼长形的,那完全无法确定这个feature和estimate有什么关系。

但是如果从实际出发,你只关系accuracy。那就加吧。因为加了并不会影响你的prediction power。最后再用regularization就可以控制model的complexity,所以不用担心over fit。

另外,如果你用的是NN,那有多少加多少。




  

相关话题

  请问在金融风控方向,如何运用用户行为序列进行特征设计和挖掘? 
  如何评价余凯在朋友圈发表呼吁大家用 caffe、mxnet 等框架,避免使用 TensorFlow? 
  机器学习(machine learning)在经济学领域是否有应用前景? 
  基于深度卷积神经网络进行人脸识别的原理是什么? 
  如何评价英伟达于 GTC 2021 大会发布的基于 ARM 架构的 Grace CPU? 
  究竟什么是损失函数 loss function? 
  LSTM如何来避免梯度弥散和梯度爆炸? 
  机器学习相关岗位面试中,有哪些加(zhuang)分(bi)项? 
  2021 年各家大厂的 AI Lab 现状如何? 
  全连接层的作用是什么? 

前一个讨论
985电气毕业生进国网到底干什么?
下一个讨论
有哪些由中国团队在顶刊发表的文章创造了巨大的社会经济效益?





© 2025-03-25 - tinynew.org. All Rights Reserved.
© 2025-03-25 - tinynew.org. 保留所有权利