首页

如何理解马氏距离，多维Mahalanobis距离是否要用到“互相关张量”来进行描述？第1页

1

frombeijingwithlove 网友的相关建议:

一般谈到马氏距离是不能脱离开样本分布的，题主说的“互相关张量”应该指的是样本的协方差矩阵，这个也是和样本分布密切相关的，来看个例子：

左下角在二维空间中由一个分布产生的方块样本，这个分布的一条等高线如虚线的椭圆框所示，图中还有一个不属于该分布的圆圈样本。这是是一个典型的欧式距离会把分布外样本算的更近的例子，比如把绿色和蓝色样本单拎出来，就是左上角的图，蓝色小圆圈和中心的绿色方块更近了，这是因为单纯的欧式距离无法反应方块的分布。这种情况下，考虑用马氏距离。这里默认方块的分布可以由协方差矩阵很好描述（比如是个多维高斯分布），那对于任意两点x和y马氏距离的计算就是下面：

就是协方差矩阵，这样计算出的距离就像

说的一样不再是各向同性，对于方块的分布而言有个良好性质是分布的等高线上到中心的马氏距离相等了，因为马氏距离包含了方块本身分布的信息。进一步来理解，马氏距离可以表示为下面这样：

其实等效于做了个线性变换，然后在变换后的空间中求了下欧式距离，其中可以表示为，其中是个对角矩阵，对角线元素分别为协方差矩阵本征值的倒数开方，的行向量就是协方差矩阵的本征值。无论多少维，协方差矩阵的计算都是一样的，可以参考wiki上协方差矩阵的定义：

Covariance matrix

。关于为什么，为什么协方差矩阵就是这个椭圆的理解可以参考另一个答案

主成分分析PCA算法：为什么去均值以后的高维矩阵乘以其协方差矩阵的特征向量矩阵就是“投影”？ - 達聞西的回答 - 知乎

如何理解马氏距离，多维Mahalanobis距离是否要用到“互相关张量”来进行描述？的其他答案点击这里

1

相关话题

  如果有第谷的数据，现在的机器学习，深度学习有办法学出开普勒三定律吗？
  如何进行互联网金融运营数据的分析，都有哪些方法？
  两个无偏估计量的方差可能相等吗？如果可能相等，那么此时怎么判断哪个更好呢？
  机器学习包含哪些学习思想？
  如何通俗易懂地讲解什么是 PCA（主成分分析）？
  阶乘的概念能否推广到全体实数，甚至是全体复数？
  为什么「正态分布」在自然界中如此常见？
  医疗大数据的分析和挖掘发展现状如何？未来会有什么样的应用前景？
  机器学习专家与统计学家观点上有哪些不同？
  简单解释一下sparse autoencoder, sparse coding和restricted boltzmann machine的关系？

前一个讨论

电影铁拳中，看到拳击手辉煌的时候能挣很多钱，开好车住豪宅。但是为什么，一旦遇到重大变故，就会一无所有？

下一个讨论

我学编程为什么难？是思维方式不对还是学习方式不对？

相关的话题

  语义网所谓的“本体”的具体例子是什么？
  R语言，累计求和号连续几个∑∑∑∑这样的怎么编码？
  蜗牛从10米深的井底爬，白天爬一米，晚上下落x米，其中x为[0,2]米的随机数，那么爬上的期望是多少？
  如何评价周志华教授新提出的 Deep Forest 模型，它会取代当前火热的深度学习 DNN 吗？
  如何看待王思聪抽奖 113 万，112 位中奖者资料均为女性仅 1 人为男性？抽奖系统可能有哪些规则？
  欧洲有哪些统计机器学习比较强的大学或者研究院的？？
  有什么好的统计学专业的学习网站吗？
  阶乘的概念能否推广到全体实数，甚至是全体复数？
  R语言，累计求和号连续几个∑∑∑∑这样的怎么编码？
  两个无偏估计量的方差可能相等吗？如果可能相等，那么此时怎么判断哪个更好呢？
  如何证明马尔科夫链一定会达到稳态？
  怎么培养数据分析的能力？
  t-sne数据可视化算法的作用是啥？为了降维还是认识数据？
  一把左轮能装六颗子弹，对着脑袋打，是装五发子弹开一枪死亡几率大，还是装一发子弹开五枪死亡几率大？
  只需4组数据，还原你的购物模式，具体算法是怎么实现的？
  数理统计中未知参数的置信区间估计方法中，存在最佳的枢轴量吗？
  机器学习中使用正则化来防止过拟合是什么原理？
  高级计量问题，主要跟线代概率论有关，求大佬解答?
  南京大学LAMDA（周志华）组的实力如何？
  在设计计量经济学模型时，怎么判断是否应该对变量取对数？
  分类机器学习中，某一标签占比太大（标签稀疏），如何学习？
  中心极限定理的适用范围有哪些？
  数据分析和挖掘有哪些公开的数据来源？
  怎样查找股票的历史市盈率数据？
  各种机器学习算法的应用场景分别是什么（比如朴素贝叶斯、决策树、K 近邻、SVM、逻辑回归最大熵模型）？
  有哪些不错的数据报告网站？
  语义网所谓的“本体”的具体例子是什么？
  条件概率属不属于随机变量？为什么？
  如何评价大数据「杀熟」这一现象？
  两个无偏估计量的方差可能相等吗？如果可能相等，那么此时怎么判断哪个更好呢？

© 2025-06-26 - tinynew.org. All Rights Reserved.
© 2025-06-26 - tinynew.org. 保留所有权利