首页

K-means聚类算法中的K如何确定？第1页

1

huangzhe 网友的相关建议:

常用的方法是elbow method（手肘法则）^[1]。选不同的k值，例如从1-9，然后画出每一个k值的“距离之和”和k的关系图。

左轴可以是distortion

或者Inertia

distortion和inertia挺接近，都是衡量每个数据和最近中心点的距离之和，只是计算距离的方式不一样而已。

为什么要选个elbow点呢？毕竟在官方文档^[2]中，是这么说的

The K-means algorithm aims to choose centroids that minimise the inertia, or within-cluster sum-of-squares criterion:

难道不是error越小越好吗？

理论上是，但你想想什么时候error最小？就是n个数据点分成n个簇。这样做clustering失去了意义。

有时候会出现曲线转折不明显的情况，如下：

这时候除了用放大镜找Elbow，也可以用一些容易计算的方法来找最佳K值。

在文章《Understanding of Internal Clustering Validation Measures》^[3]，介绍了Clustering的11种选择最佳值的方法。例如下图方法4-11的optimal value不是min就是max，不用再选elbow。

参考

^Elbow Method for optimal value of k in KMeans https://www.geeksforgeeks.org/elbow-method-for-optimal-value-of-k-in-kmeans/
^2.3. Clustering¶ https://scikit-learn.org/stable/modules/clustering.html
^Understanding of Internal Clustering Validation Measures http://datamining.rutgers.edu/publication/internalmeasures.pdf

K-means聚类算法中的K如何确定？的其他答案点击这里

1

相关话题

  马上计算机研一，想问一下机器学习、深度学习…大家都是怎么入门的？
  attention跟一维卷积的区别是啥？
  如何看待李国杰院士在科学网发文称，国内 AI 研究「顶不了天、落不了地」，该想想了？
  机器学习在Web攻击方向有什么建树吗？
  新手如何实现个简单AutoML框架。有参考的github开源项目介绍吗？
  为什么在实际的kaggle比赛中，GBDT和Random Forest效果非常好？
  如何把梯度传递过Argmax?
  《失控玩家》中的游戏有可能实现出来吗？
  想问下专业人士 OpenCv会被深度学习进一步取代吗进一步取代吗？
  机器学习算法进行分类时，样本极度不平衡，评估模型要看哪些指标？

前一个讨论

机器学习小白来提问：关于联邦学习FedAVG和FedSGD的问题？

下一个讨论

写CUDA到底难在哪？

相关的话题

  强化学习和自适应控制的关系是什么？
  机器学习的算法和普通《算法导论》里的算法有什么本质上的异同？
  神经网络中，bias有什么用，为什么要设置bias，当加权和大于某值时，激活才有意义？
  自然语言处理怎么最快入门？
  一个无监督学习算法，如何判断其好坏呢?
  如何对用户进行聚类分析？
  行为识别常用哪种特征提取？
  人们是如何想到奇异值分解的？
  机器学习如何才能避免「只是调参数」？
  Apple 在设备端对儿童色情图片检测，你怎么看这项功能？
  如果人工智能迎来下一个寒冬，你认为会是卡在什么问题上？
  如何看待学霸君的高考机器人 Aidam 高考全国文科数学卷考了 134 分？
  为什么多方安全计算（或者隐私计算/联邦学习）在中国这么火？
  能否训练一个AI模型来预测房价，寻找投资机会挖掘价值洼地？
  c4.5为什么使用信息增益比来选择特征？
  请解释下variational inference？
  机器学习最好的课程是什么？
  什么是反事实分析呀？
  wasserstein 距离的问题?
  如何看待西安电子科技大学偷偷给贫困生打钱，大数据精准帮助贫困生是否值得推广？
  GBDT算法的细节问题？
  image caption这个方向更偏向NLP还是CV？
  是否有可能使用人工智能在高原、戈壁和沙漠中进行工业生产？
  凸分析和凸优化有什么推荐的教材吗？
  如何评价AWS的图神经网络框架DGL？
  在哪里能找到各行业的分析研究报告？
  编写基于机器学习的程序，有哪些编写和调试的经验和窍门？
  机器学习算法工程师如何自己接项目单干、并赚取比上班多得多的收入？
  image caption这个方向更偏向NLP还是CV？
  如何评价英伟达于 GTC 2021 大会发布的基于 ARM 架构的 Grace CPU？

© 2025-06-26 - tinynew.org. All Rights Reserved.
© 2025-06-26 - tinynew.org. 保留所有权利