020 Matrices 矩阵
这一节和下一节讨论必要的矩阵知识。
一般使用粗体大写字母 或粗体大写的希腊字母 表示矩阵。一个有 行 列的矩阵如下
是 的矩阵(matrix)。本章后续会假设矩阵的元素是实数,不过这里讨论的矩阵元素可以是复数。 行 列的元素用 表示。使用记号 也可以表示一个矩阵。
的转置(transpose)用 表示,交换了行和列。因此如果 ,那么 。用记号 表示 的共轭,那么 是 的共轭(conjugate)矩阵。 的共轭矩阵的转置,称为 的伴随(adjoint)矩阵,用 表示。这里的伴随矩阵不是代数余子式的矩阵的转置,后者也称为伴随(adjugate)矩阵。
后续主要研究两类特殊的矩阵。一个是方阵(方块矩阵,square matrix),行数和列数相同,即 ,一个是向量或列向量(column vector),只有一列,即 的矩阵。向量一般用小写字母表示,比如 。 是行向量,只有一行。
矩阵的属性
如果两个 的矩阵 相等,那么对应元素相等,即 。
矩阵所有元素都是零称为零矩阵,用 表示。
两个 的矩阵 的加法定义如下 矩阵的加法满足交换律和结合律
矩阵 乘以实数或复数 定义为 也就是说每一个元素都乘以 。分配律如下 这样可以定义负的 有了负的定义,可以得到减法定义 即
矩阵的积 要求第一个因子的列数与第二个因子的行数相同。如果 分别是 的矩阵,那么 是 的矩阵。 的第 行第 列是 的第 行与 的第 列的元素对应相乘然后求和,即 根据定义,矩阵乘法满足结合律和分配律 一般情况下,乘法不满足交换律。积 和 存在的前提是这两个矩阵都是方阵。即便如此一般情况下
例 1 下面计算两个矩阵的积,并验证不满足交换律。 解: 类似的 很明显
两个向量 的积有几种形式。物理和微积分中常用点积(dot product)
的结果可以是实数或复数。从上面的定义出发,可以得到
还有一种两个维度相同的矢量的积是标量积(scalar product)或内积(inner product),用 。
标量积也可以是实数或者复数。对比 ,如果 所有元素都是实数, 是一样的,两者的关系是
从 这个定义出发,可以得到
即使 有非零的虚部的元素, 的标量积结果也是一个非负数
非负数 通常记作 ,是 的长度(length)或模(magnitude)。只有零向量 的长度是零,即 ,其他向量的长度都是整数。如果 ,那么两个矢量 是正交的(orthogonal)。比如三维空间单位矢量 就是正交的。如果 的一些元素不是实数,那么点积
或许不是实数。对于某些非零矢量, 也可能为零。
比如令
那么
的单位矩阵(identity) 的定义如下
那么对任意矩阵 都有
因此矩阵乘法的交换律成立的前提是有一个矩阵是单位矩阵。
对 的矩阵 而言,如果有另一个矩阵 使得 ,那么 是非奇异的(nonsingular)或可逆的(invertible)。如果存在这样的 ,那么可以证明其是唯一的,称为 的逆矩阵(inverse),记作 ,那么
如果矩阵不存在逆矩阵,那么称为奇异的(singular)或不可逆(noninvertible)。
假定逆矩阵存在,有很多方式求 的逆矩阵 。先讨论使用行列式(determinant)的方法。对于每个元素 ,从矩阵中删除第 行和第 列得到的矩阵的行列式是余子式(minor), 的代数余子式(cofactor)定义为
的行列式记作 ,是沿着某行或者某列得到的各个代数余子式之和。比如对第一行做展开得到
如果 ,那么 可逆,即 存在。如果 ,那么
上面的公式并不是计算 的高效的方式,但是指出了 可逆的条件。这个条件是冲要条件: 等价于 是非奇异的, 等价于 是奇异的。
另一个求解 的方式是对矩阵做初等行变换。
- 交换两行。
- 乘以一个非零的标量。
- 将一行的若干倍加到另外一行上。
通过一系列初等行变换对矩阵变换称之为行简化(row reduction)或高斯消元法(Gaussian elimination)。通过一系列初等行变换可以将非奇异矩阵 变换乘单位矩阵 。可以真名,对 进行同样的操作,得到了 。对增广矩阵(augmented matrix) 进行操作会很高效。
例 2 求矩阵的逆。 解:首先写出增广矩阵 首先将第一列中除了第一行之外的元素变为零,第一行乘以 -3 加到第二行上,第一行乘以 -2 加到第三行上,得到 接着将第二列第二行的元素变成 1,第二行除以 2,得到 将第二列除了第二行的元素变成 0,第二行加到第一行上,第二行乘以 -4 加到第三行上,得到 第三列第三行变成 1,即第三行乘以 -1/5,得到 最后第三列除了第三行的元素都变成 0,第三行乘以 -3/2 加到第一行,第三行乘以 -5/2 加到第二行得到 那么 的逆与 正交,很容易验证答案是否正确。
上面的类似中 比较简单。如果 不是 1,那么需要第一行乘以 将其变成 1。如果 ,需要将第一列中非零元素换到 ,即第一行与某一行交换。如果无法交换,说明第一行每个元素都是 0,那么行列式 ,因此 不可逆,是奇异的。后续每一列处理都类似,与更低的行交换使 不为零,如果无法做到,那么说明 是奇异的,没有逆矩阵。
矩阵函数
有时,向量或者矩阵的元素是实数 的函数。写作 如果矩阵 的每一个元素在 时或者在区间 上连续,那么矩阵 在给定点或指定区间上连续。类似的,如果每一个元素都可微,那么称为 是可微的,那么 即 是 的每个元素求导。类似的,矩阵函数的积分定义如下 比如 那么 很多初等微积分规则也适用于矩阵函数 其中 是常量矩阵。 注意 要保持矩阵乘法的顺序。定义 也适用于向量。
矩阵的一些操作是应用操作与每一个元素,比如乘以一个常数、微分、积分。不过,这对许多操作而言不成立,比如矩阵的平方并不是每个元素平方。