百科问答小站 logo
百科问答小站 font logo



神经网络中如果一个重要特征C等于特征A+特征B(算数意义上的相加),选特征的时候还有必要选特征C吗? 第1页

  

user avatar   mastermydestiny 网友的相关建议: 
      

这种情况通常叫做multicollinearity。

一般统计背景的人倾向于不选C,因为他们倾向于independent的feature,这样通过观察coefficient,可以了解每个feature对最终的estimate起到的作用。如果两个feature是collinear的,尤其是此消彼长形的,那完全无法确定这个feature和estimate有什么关系。

但是如果从实际出发,你只关系accuracy。那就加吧。因为加了并不会影响你的prediction power。最后再用regularization就可以控制model的complexity,所以不用担心over fit。

另外,如果你用的是NN,那有多少加多少。




  

相关话题

  如何看待「机器学习不需要数学,很多算法封装好了,调个包就行」这种说法? 
  为何感觉“知识蒸馏”这几年没有什么成果? 
  为什么Bert中的CLS在未fine tune时作为sentence embedding性能非常糟糕? 
  机器学习到底是什么,如何使用这项技术? 
  2019年NeurIPS有哪些糟糕的论文? 
  如何评价B站UP主未明子宣称“知乎搞机器学习模拟拉康的程序员”具备“头脑上的悲剧”? 
  如果人工智能迎来下一个寒冬,你认为会是卡在什么问题上? 
  机器学习门下,有哪些在工业界应用较多,前景较好的小方向? 
  如何用简单易懂的例子解释条件随机场(CRF)模型?它和HMM有什么区别? 
  时间序列和回归分析有什么本质区别? 

前一个讨论
985电气毕业生进国网到底干什么?
下一个讨论
有哪些由中国团队在顶刊发表的文章创造了巨大的社会经济效益?





© 2024-11-24 - tinynew.org. All Rights Reserved.
© 2024-11-24 - tinynew.org. 保留所有权利