百科问答小站 logo
百科问答小站 font logo



怎么解释「正定矩阵」? 第1页

  

user avatar   liu-yang-zhou-23 网友的相关建议: 
      

二次型

我们发现,所有的二次齐次式都可以表示为矩阵的形式,例如:

就可以表示为:

显然,这个表示是唯一的:每一个二次型都唯一对应一个对称矩阵 ,反之亦如此. 无论是这个二次齐次式,还是代表它的矩阵,我们都称之为二次型,因为他们指向的是同一件事.

也许你发现了这样一个事实,

当 不全为 0 时,这个二次型严格大于 0. 平行地,

定义

不是零向量的时候,就会有:

我们将这样的二次型称为正定的,对称矩阵 称为正定矩阵.

特别地,欧氏度量的平方就是最简单的正定二次型,其正定矩阵正是单位阵. 正如我们例子中的配方运算,将一般的正定二次型化为只含有平方项的二次型(对应对角矩阵),这对于一般二次型而言也是对的,这里有一套标准的操作流程,但我就略去不讲了.


意义

其实正定二次型我们并不陌生——

  • 一元正定二次型对应的图像正是开口朝上、顶点在原点的抛物线.


  • 二元正定二次型对应的图像正是开口朝上、顶点在原点的抛物面.

于是,n 元正定二次型实际上就是 n 维空间内的抛物面.


应用

当我们判断多元函数极值时,二次型会发挥巨大的威力,此时它对应的名称为 矩阵(黑塞矩阵). 所谓 矩阵,就是如下形式的矩阵(我们仍旧以 为例):


形式上看上去复杂,但实际上很有规律—— 二阶导数的“大家族”. 由于可微函数的混合偏导与求导顺序无关(先对第一个自变量求偏导再对第二个自变量求偏导,和反过来顺序求偏导的结果一样),所以 矩阵是对称阵,它不是别人,就是本文伊始的矩阵的二倍—— !

那么这个 矩阵有什么意义吗?当你对 进行多元函数的泰勒展开时(其实 作为二次多项式已经是泰勒展开了), 全体二次多项式构成一个二次型——用 矩阵来表示(事实上还差一个 ,可以类比一元泰勒公式).

我们用泰勒展开的目的是研究函数有局部近似的形状,正如我们前面所了解正定矩阵的几何意义,如果这个函数局部是一个抛物面的形状,那么它在此处一定取到极值:抛物面开口向上,此时是正定矩阵,就是极小值;朝下就是极大值,此时是负定矩阵.

矩阵就是用来帮助我们判定极值点的类型的工具.


正定二次型的衍生物有马氏距离、协方差矩阵等. 在几何中黎曼度量就是有正定二次型所决定,它是一种更为一般的度量.




  

相关话题

  计算机专业曾经有哪些方向非常火后来却凉了? 
  如何看待计算机科学几乎渗透到所有学科的研究当中? 
  为什么编程语言语法的设计不往缩小与自然语言的差别的方向发展,或者说在这个方向发展得这么慢呢? 
  穷人家的女孩应该转去计算机专业吗? 
  你在阅读源代码或设计文档时,看到哪些惊艳的技巧? 
  如果世界是虚拟的,有哪些实例可以证明? 
  土木真的没有 IT 行业有前途吗? 
  LU分解法与Gauss消元法两者复杂度的比较,谁跟快? 
  香农是如何想到信息论的? 
  「非洲猪瘟」是一种什么动物疫病,有哪些具体的危害? 

前一个讨论
求烷烃同分异构体数目的通项公式?
下一个讨论
柯洁和吴清源谁更厉害?





© 2024-11-09 - tinynew.org. All Rights Reserved.
© 2024-11-09 - tinynew.org. 保留所有权利