怎么解释「正定矩阵」？第1页

liu-yang-zhou-23 网友的相关建议:

二次型

我们发现，所有的二次齐次式都可以表示为矩阵的形式，例如：

就可以表示为：

显然，这个表示是唯一的：每一个二次型都唯一对应一个对称矩阵 ，反之亦如此. 无论是这个二次齐次式，还是代表它的矩阵，我们都称之为二次型，因为他们指向的是同一件事.

也许你发现了这样一个事实，

当不全为 0 时，这个二次型严格大于 0. 平行地，

定义

当 不是零向量的时候，就会有：

我们将这样的二次型称为正定的，对称矩阵 称为正定矩阵.

特别地，欧氏度量的平方就是最简单的正定二次型，其正定矩阵正是单位阵. 正如我们例子中的配方运算，将一般的正定二次型化为只含有平方项的二次型（对应对角矩阵），这对于一般二次型而言也是对的，这里有一套标准的操作流程，但我就略去不讲了.

其实正定二次型我们并不陌生——

于是，n 元正定二次型实际上就是 n 维空间内的抛物面.

当我们判断多元函数极值时，二次型会发挥巨大的威力，此时它对应的名称为矩阵（黑塞矩阵）. 所谓矩阵，就是如下形式的矩阵（我们仍旧以为例）：

形式上看上去复杂，但实际上很有规律—— 二阶导数的“大家族”. 由于可微函数的混合偏导与求导顺序无关（先对第一个自变量求偏导再对第二个自变量求偏导，和反过来顺序求偏导的结果一样），所以矩阵是对称阵，它不是别人，就是本文伊始的矩阵的二倍—— ！

那么这个矩阵有什么意义吗？当你对进行多元函数的泰勒展开时（其实作为二次多项式已经是泰勒展开了），全体二次多项式构成一个二次型——用矩阵来表示（事实上还差一个，可以类比一元泰勒公式）.

我们用泰勒展开的目的是研究函数有局部近似的形状，正如我们前面所了解正定矩阵的几何意义，如果这个函数局部是一个抛物面的形状，那么它在此处一定取到极值：抛物面开口向上，此时是正定矩阵，就是极小值；朝下就是极大值，此时是负定矩阵.

矩阵就是用来帮助我们判定极值点的类型的工具.

正定二次型的衍生物有马氏距离、协方差矩阵等. 在几何中黎曼度量就是有正定二次型所决定，它是一种更为一般的度量.