百科问答小站 logo
百科问答小站 font logo



神经网络中如果一个重要特征C等于特征A+特征B(算数意义上的相加),选特征的时候还有必要选特征C吗? 第1页

  

user avatar   mastermydestiny 网友的相关建议: 
      

这种情况通常叫做multicollinearity。

一般统计背景的人倾向于不选C,因为他们倾向于independent的feature,这样通过观察coefficient,可以了解每个feature对最终的estimate起到的作用。如果两个feature是collinear的,尤其是此消彼长形的,那完全无法确定这个feature和estimate有什么关系。

但是如果从实际出发,你只关系accuracy。那就加吧。因为加了并不会影响你的prediction power。最后再用regularization就可以控制model的complexity,所以不用担心over fit。

另外,如果你用的是NN,那有多少加多少。




  

相关话题

  AI在网络安全领域(尤其是威胁检测领域),有什么好的应用场景? 
  算法岗位真的需要顶会才能入场吗? 
  如何评价 MXNet 被 Amazon AWS 选为官方深度学习平台? 
  请问应该怎样去学习图像识别和深度学习? 
  如何评价 DeepMind 在星际中的失利,以及 OpenAI 在 Dota 上的成功? 
  如何理解链接预测(link prediction)? 
  机器学习中使用正则化来防止过拟合是什么原理? 
  如何评价 2018 清华大学特等奖学金计算机大类(贵系、软院、姚班)无人通过一轮筛选? 
  神经网络为什么可以(理论上)拟合任何函数? 
  在CV/NLP/DL领域中,有哪些修改一行代码或者几行代码提升性能的算法? 

前一个讨论
985电气毕业生进国网到底干什么?
下一个讨论
有哪些由中国团队在顶刊发表的文章创造了巨大的社会经济效益?





© 2025-04-15 - tinynew.org. All Rights Reserved.
© 2025-04-15 - tinynew.org. 保留所有权利