百科问答小站 logo
百科问答小站 font logo



既然使用神经网络也可以解决分类问题,那SVM、决策树这些算法还有什么意义呢? 第1页

  

user avatar   insulator 网友的相关建议: 
      

谢邀,赞同 @mileistone 的回答,没有一个模型是万能的,需要根据数据选择适合的模型。

在机器学习中,数据大概可以分成四大类:图像 (Image),序列(Sequence),图(Graph) 和表格(Tabular) 数据。其中,前3类数据有比较明显的模式,比如图像和图的空间局部性,序列的上下文关系和时序依赖等。而表格数据常见于各种工业界的任务,如广告点击率预测,推荐系统等。在表格数据中,每个特征表示一个属性,如性别,价格等等,特征之间一般没有明显且通用的模式。

神经网络适合的是前三类数据,也就是有明显模式的数据。因为我们可以根据数据的模式,设计对应的网络结构,从而高效地自动抽取“高级”的特征表达。如常见的 CNN (卷积神经网络) 就是针对图像而设计的,RNN (循环神经网络) 是为序列数据而设计的。而表格数据,因没有明显的模式,非要用神经网络的话,就只能用低效的全连接网络,一般效果都不太好。在实践中,对于表格数据,除了专门对特定任务设计的网络结构如DeepFM等,更多时候还是用传统机器学习模型。尤其是 GBDT (梯度提升树),因其自动的特征选择能力及动态的模型复杂度,算得上是一个万金油模型,在各种类型的表格数据上都表现很好。但对于表格数据而言,其实特征工程才是更关键的。在给定数据的情况下,模型决定了下限,特征决定了上限。特征工程类似于神经网络的结构设计,目的是把先验知识融入数据,并且让模型更好地理解数据,让模型可以学得更好。

另外,神经网络实质上不算是一个模型,而是一类可以自由“搭积木”的模型。结构不同的神经网络可以认为是不同的模型了。

总结下,no free lunch,没有一个万能的模型,可以直接用于各种数据。有多少人工就有多少智能:用神经网络的话,你需要结构设计;而用传统模型的话,你需要特征工程。


user avatar   lwl1127 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   mileistone 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。




  

相关话题

  天天P图中我的小学生证件照功能怎么实现的?算法是什么样? 
  请教拓扑排序中的一点疑问? 
  有哪些手算对数的方法? 
  生成对抗网络的毕设怎么上手? 
  如何看待swin transformer成为ICCV2021的 best paper? 
  请问这个式子有没有简便算法(写法)? 
  如何看待比 iPad 还大的史上最大芯片问世? 功耗比电磁炉还高有什么用? 
  从算法的角度来看,Elsagate 事件暴露出了「自动推荐」的哪些问题,该如何规避? 
  现在的人工智能是否走上了数学的极端? 
  如何评价Google发布的第二代深度学习系统TensorFlow? 

前一个讨论
怎么写文献综述?
下一个讨论
如何评价MSRA视觉组最新对spatial attention mechanism分析论文?





© 2024-11-24 - tinynew.org. All Rights Reserved.
© 2024-11-24 - tinynew.org. 保留所有权利