谢邀。
我就按照题主的要求,主要分为代数和几何两个部分谈谈矩阵。
矩阵与线性变换
开门见山,矩阵是线性变换的具体形式.
给定空间 中一组基 ,设一线性变换 ,则 对每个基的作用:
也就是说,
是 的“显灵“——容易证明,虽然在不同的基下,同一个线性变换对应的矩阵是不同的,但是这些不同的矩阵却是相似的,这有点同一个神仙有不同的“化身”的味道.
线性变换的退化
最典型的典型映射 ,即投影映射,是比较直观的退化的线性变换:
设 , ,则
于是
也就是说典型映射 直接让子空间 “坍缩”为零空间,而只保留了子空间 ;子空间 的维数实际上就是 的秩 . 典型映射 在这组基下的矩阵为:
对于一般的线性变换 其实也是同样的道理——让其核空间坍缩为零空间(就像果核一样). 所以得到如下结论是显然的:
由上面公式可知,对于满秩的线性变换,只是将 0 映射为 0,这意味着——
定理 1
非退化的线性变换将一组基映射为另外一组基.
证明
否则, 线性相关,即存在不全为零的系数 ,使得
而上式又等于
但是,满秩的线性变换只将 0 映射为 0,即
这与 是基相矛盾.
顺便说一下, 的矩阵可以看成是退化的 阶方阵,只不过增加的行、列都是零向量.
矩阵与线性方程组
将上面的过程反过来:已知某向量 经过线性变换 后的结果是 ,求 ?
因为
所以
即
于是得到线性方程组 .
以线性变换的角度去理解线性方程组的解的结构,是深刻的——
命题 1
元线性方程组 无解的充要条件为
证明
充分性:假设 ,那么 是一个 维空间 到其 维不变子空间 上的映射,即 . 假设 为方程的解,那么 也包含在 ;但是我们知道 是一个含在维数大于 的子空间的向量,因为 即 与矩阵 的列向量一组基线性无关,故矛盾.
必要性:若方程无解,即
说明 ,即 ,故
矩阵的特征理论
是 的特征向量,意思是 在 方向上的表现就好像是一个伸缩变换(数乘变换):
我们发现零向量恒满足上式,这个平凡的情况我们无需考虑,所以特征向量不包含零向量.
如果某一线性变换 有若干线性无关的特征向量 ,那么将它们扩张为空间 中的一组基 ,
并设 , ,则有
考虑 在子空间 上的作用:
也就是说子空间 在 保持不变. 而考虑 在这组基下的矩阵就会有很别致的感觉:
其中 是一个对角阵
特别的,如果 ,即 有 个线性无关的特征向量,那么矩阵就可以对角化.
矩阵与复数
这个映射看似简单,实际上——
即满足
这是一个同构映射,复数的性质可以完全用矩阵来刻画.
由欧拉公式,
以同构 将之映射为
这个映射被完美地分解为一个伸缩映射 和一个旋转映射 的乘积:
而同构 ,说明了伸缩映射 和一个旋转映射 在实平面同样适用.
讲到这里矩阵的几何性质也展露得差不多了.
特征向量
若线性变换 保持直线 不动, 上的向量 就是特征向量.
例 1
线性变换 在标准正交基 下的矩阵为:
显然在这个线性变换下,保持 x 轴和 y 轴不变.
例 2
并不是总是有特征向量,比如
这个线性变换是旋转变换,以原点为圆心,逆时针旋转 45 度,试想整个平面上所有的直线,有哪个能保持方向不变呢?没有!所以 没有实特征向量.
不过,放到三维空间去看,事实上有一个特征向量在平面上是看不到的,想想地球仪的旋转,保持地轴不动,所以在三维空间旋转的特征方向是与旋转平面正交的方向——关于这个结论可以推广到到酉空间、酉变换上:若 是酉变换 的不变子,那么 也是 的不变子.
例 3
在象限对角线这两个正交的方向上保持不变;更进一步,会发现这样的性质:
验证:
这样的变换被称为对称变换(容易证明),试想平面上的对称变换的特征方向,不正是对称轴方向以及与对称轴正交的方向吗——关于这个结论可以推广到到酉空间、Hermite 变换上:若 是 Hermite 变换 的不变子,那么 也是 的不变子.
利用几何的视角,许多结论是非常直观的. 上面三个例子反映了伸缩、旋转、对称的特征方向的几何意义.
二次型
Hesse 矩阵判断极值的几何意义,就是研究函数在极值点处的近似二次曲面的性质.
行列式与体积
对角矩阵惹人喜爱不是没有原因的,其非常本质的原因是正交性.
由解析几何的知识可知,行列式绝对值表示的是 维平行多面体的体积,即
表示向量 、 所围成的平行四边形面积;
表示 、 、 所围成的平行六面体体积;
如果矩阵是对角阵,那么意味着所求体积是一个(超)长方体体积.
另外, Green 公式的退化版本也可由此初见端倪,考虑平面上一个包含原点、分段光滑的封闭曲线 ,考虑一个以原点以及曲线上两点为顶点微分三角形, , ,那么这个微分三角形的面积(这里我们考虑有向面积,即꩜面积可为负):
当我们把这些微分三角形“积”起来,就是曲线 所围成区域 的面积. 这就是 Green 公式——
令 , 的退化形式.
同理,也可以推出 Gauss 公式的退化形式,这就又涉及到分析的领域了.
多元可微函数的导数
设可微向量值函数 ,记 ,
为其在 处的导数,几何意义则是函数在该点的超切平面,这在低维情况下是显而易见的.
双线性函数
双线性函数从很抽象的高度,将二次型、矩阵的迹、内积等等概念统合到一起加以研究. 其一般的形式为:
其中 是一个矩阵,双线性函数的全部信息都蕴含在其中;当令矩阵为一些特殊矩阵时,双线性函数就会得到十分多彩的性质:
……
我们特别偏爱具有对称性质的双线性函数,并且称之为广义上的“内积”,尽管可能不一定拥有正定性(这意味着没有距离、夹角的概念),但是正交性还是被保留的,我们仍然认为拥有以下性质的向量是正交关系:
被赋予这样内积的空间称为正交空间,正交空间内可能会出现这样的迷之现象,就是非零向量可能和自己正交,这简直是 Bug 的存在!例如,在 Minkowski 空间内,
这样的非零向量被称为迷向向量,在狭义相对论中也称光向量;这样的内积使得在 Lorentz 变换下不变,从而满足相对性原理,保持了时-空间隔的平方不变:
所以“尺缩效应”的数学解释为:尺子在四维空间的时-空间隔是不变的(当尺子静止时,他的时空间隔就是它静止时的长度),但当速度太大接近光速的时候,为了保持“时空长度”不变,所以尺子的“空间长度”旋转到了第四维度中,而我们肉眼能看到的只是“时空长度”在三维空间的投影.
斜对称双线性函数也是很有市场的,配备这样的内积空间称为辛空间,有限维正则(非退化)辛空间一定是偶数维度;Hermite 内积定义了酉空间,将正交性推向了极致……
能说得太多,以后慢慢补充吧。