首页

机器学习中非均衡数据集的处理方法？第1页

1

huang-xiao-ye-8 网友的相关建议:

做毕设碰到过类似的问题，也算小小研究过，就来不耻回答一下。。

推荐看一下Haibo He, Edwardo A. Garcia的Learning from Imbalanced Data这篇paper，写的很系统也很清晰。

主要包括四大类方法，1Sampling 2Cost Sensitive Methods 3Kernal-Based Methods and Active Learning Methods 4One-Class Learning or Novelty Detection Methods。

Sampling大类说到底就是两种可能。第一种是把多的那个组变少，第二种是把少的那个组变多，以达到平衡的结果。一般比较少用第一种，因为那样容易丢失重要信息。对于第二种，又有很多方法，最简单的是oversampling，由于其局限性，又有很多根据已有的数据生成新数据的方法，比如各种变体的synthetic sampling。

第二种思路是基于把多数组猜成少数组和把少数组猜成多数组的cost是不同的这个事实，来修正数据分布(个人理解可以当成采到样的概率)的方法。

另外，kernal类的模型，还可以通过修改核函数来偏移hyperplane，来抵消不平衡数据造成的hyperplane的偏移。

最后一大类没有看过相关paper，不了解。。

机器学习中非均衡数据集的处理方法？的其他答案点击这里

1

相关话题

  流行音乐大数据自动合成是否可以？
  如何利用 Twitter 开放者平台爬取 Twitter 数据？
  graph convolutional network有什么比较好的应用task？
  Dirichlet Processes 是一个什么样的随机过程？
  从今年校招来看，机器学习等算法岗位应届生超多，竞争激烈，未来 3-5 年机器学习相关就业会达到饱和吗？
  如何学习视频识别技术？
  学习python中的pandas有没有好的教程推荐？
  如何评价贵州的大数据产业布局？会对贵州的经济发展产生什么影响？
  如何理解attention中的Q,K,V？
  特征工程中的「归一化」有什么作用？

前一个讨论

为什么金庸、梁羽生、古龙之后再无武侠小说作家了呢？

下一个讨论

既然蛋蛋（睾丸）对动物的繁殖至关重要，为了降温直接吊在体外可以理解，但为什么不进化出有保护作用的蛋壳？

相关的话题

  如何评价百度自动驾驶 ApolloAuto 在 Github 上发布的代码？
  大数据会骗人吗？有哪些大数据骗人的典型案例？
  在迁移学习中，只有fine-tune和基于实例的迁移可用在小样本上吗，还有其他的小样本迁移方法吗？
  深度学习有哪些好玩的案例？
  机器学习最好的课程是什么？
  如何理解 inductive learning 与 transductive learning?
  当初的生物热，和如今的全民CS全民AI，让你想到了什么？
  GBDT算法的细节问题？
  如何评价论文「Stochastic Training is Not Necessary ...」?
  机器学习中有哪些形式简单却很巧妙的idea？
  熵权法确定权重的原理是不是因为它仅依赖于数据本身的离散性?
  02年就能开发日IP两千万网站的程序员是什么水平？
  如何评价 DeepMind 在北京时间 19 年 1 月 25 日 2 点的《星际争霸 2》项目演示？
  怎么评价高晓松演讲关于5G以及区块链的内容？
  你是如何走上数据分析之路的？
  除了深度学习，机器学习领域近年来还有什么热点吗？
  机器学习算法进行分类时，样本极度不平衡，评估模型要看哪些指标？
  如何才能看得懂变分贝叶斯方法（Variational Bayesian）？
  用人工智能辅助法官判案可行么？
  如何准备数据分析师的面试？
  让人工智能去下路边街头的象棋残局会赢吗？
  近几年有哪些关于机器学习中隐私（Privacy）和安全（Security）相关的研究值得关注?
  如何通俗易懂地介绍 Gaussian Process？
  Jupyter Notebook 有哪些奇技淫巧？
  深度学习（机器学习）的下一步如何发展？
  如何可以通过自学来深入学习机器学习？
  如何看待圆通内鬼致 40 万条公民个人信息被泄露，信息泄露对个人有什么影响？如何保护个人信息安全？
  机器学习中非均衡数据集的处理方法？
  如何评价snowflake这家公司，发展前景如何？
  神经网络的损失函数为什么是非凸的?

© 2025-06-18 - tinynew.org. All Rights Reserved.
© 2025-06-18 - tinynew.org. 保留所有权利