我们发现,所有的二次齐次式都可以表示为矩阵的形式,例如:
就可以表示为:
显然,这个表示是唯一的:每一个二次型都唯一对应一个对称矩阵 ,反之亦如此. 无论是这个二次齐次式,还是代表它的矩阵,我们都称之为二次型,因为他们指向的是同一件事.
也许你发现了这样一个事实,
当 不全为 0 时,这个二次型严格大于 0. 平行地,
定义
当 不是零向量的时候,就会有:
我们将这样的二次型称为正定的,对称矩阵 称为正定矩阵.
特别地,欧氏度量的平方就是最简单的正定二次型,其正定矩阵正是单位阵. 正如我们例子中的配方运算,将一般的正定二次型化为只含有平方项的二次型(对应对角矩阵),这对于一般二次型而言也是对的,这里有一套标准的操作流程,但我就略去不讲了.
其实正定二次型我们并不陌生——
于是,n 元正定二次型实际上就是 n 维空间内的抛物面.
当我们判断多元函数极值时,二次型会发挥巨大的威力,此时它对应的名称为 矩阵(黑塞矩阵). 所谓 矩阵,就是如下形式的矩阵(我们仍旧以 为例):
形式上看上去复杂,但实际上很有规律—— 二阶导数的“大家族”. 由于可微函数的混合偏导与求导顺序无关(先对第一个自变量求偏导再对第二个自变量求偏导,和反过来顺序求偏导的结果一样),所以 矩阵是对称阵,它不是别人,就是本文伊始的矩阵的二倍—— !
那么这个 矩阵有什么意义吗?当你对 进行多元函数的泰勒展开时(其实 作为二次多项式已经是泰勒展开了), 全体二次多项式构成一个二次型——用 矩阵来表示(事实上还差一个 ,可以类比一元泰勒公式).
我们用泰勒展开的目的是研究函数有局部近似的形状,正如我们前面所了解正定矩阵的几何意义,如果这个函数局部是一个抛物面的形状,那么它在此处一定取到极值:抛物面开口向上,此时是正定矩阵,就是极小值;朝下就是极大值,此时是负定矩阵.
矩阵就是用来帮助我们判定极值点的类型的工具.
正定二次型的衍生物有马氏距离、协方差矩阵等. 在几何中黎曼度量就是有正定二次型所决定,它是一种更为一般的度量.