本节主要介绍 线性代数 的基础。
学习线性代数的应用之一就是求解复杂的方程问题,因此本节内容就从 解方程 开始。
本节核心内容是从 row picture (行图像) 和 column picture (列图像) 的角度求解方程。
-
row picture 的角度:将方程的行向量抽出来,画出其 row picture, 通过画图的的方式求出方程的解,即行向量的交点。
-
column picture 的角度:则将方程表示为xA + yB = b,将方程转化为列向量的线性组合,此时,方程的求解转换为找到 (x, y),使得列向量 (A, B) 正确组合得到向量b。
我们首先通过一个例子了解二维方程组(2个未知数,2个方程),如下:
我们首先按 row (行) 将方程组写成矩阵形式:
系数矩阵(A): 将方程组系数按行提取出来,构造完成的一个矩阵。
未知向量(x): 将方程组的未知数提取出来,按列构成一个向量。
向量(b): 将等号右侧结果按列提取,构成一个向量。
因此,原方程可以表示为:
Ax = b
构造完成相应的矩阵形式了,我们将对应的 行图像 画出来。
所谓 行图像,就是在系数矩阵上,一次取一行 构成方程,在坐标系上做出如下图。和我们在初等数学中学习的作图求解方程的过程无异。
从列图像的角度,我们再次求解上面的方程:
在这一次的求解过程中,我们将方程按列提取,使用的矩阵为:
如上所示,我们使用 列向量 构成系数矩阵,将问题转化为: 将向量 与向量 正确组合,使得其结果构成 , 这个过程称为列向量的线性组合(Linear Combination of Columns)
接下来我们使用 列图像 将方程组展现出来,并求解:
即寻找合适的 x,y 使得 x 倍的 (2,-1) + y 倍的 (-1,2)得到最终的向量 (0,3)。很明显能看出来,1 倍 (2,-1) + 2 倍 (-1,2) 即满足条件。
反映在图像上,明显结果正确。
我们再想一下,仅仅对 这个方程,如果我们任意取 x 和 y ,那么我们得到的是什么呢?
很明显,能得到任意方向的向量,这些向量能够布满整个平面。
注:事实上,任取 x 和 y, 可以得到矩阵 A 的列向量的所有线性组合,这个线性组合构成了矩阵 A 的列空间,这个列空间构成了整个二维实空间 R2。从方程的角度看,对于任意的向量 b, Ax = b 始终有解。(后续课程会介绍到)
我们将方程组的维数进行推广,从三维开始,给定三维矩阵如下:
如果我们继续使用上面介绍的 做出行图像 来求解问题,那么会得到一个很复杂的图像。
矩阵如下:
对应方程: Ax = b
如果绘制行图像,很明显这是一个三个平面相交得到一点,我们想直接看出这个点的性质可谓是难上加难。
比较靠谱的思路是先联立其中两个平面,使其相交于一条直线,再研究这条直线与平面相交于哪个点,最后得到点坐标即为方程的解。
这个求解过程对于三维来说或许还算合理,那四维呢?五维甚至更高维数呢?
直观上很难直接绘制更高维数的图像,这种行图像受到的限制也越来越多。
我们使用上面同样的例子:
如果我们使用列图像的思路进行计算,那矩阵形式就变为:
左侧是(矩阵列向量的)线性组合,右侧是线性组合得到的结果,这样一来思路就清晰多了,“寻找正确的线性组合”成为了解题关键。
很明显这个问题是一个特例,我们只需要取 x = 0, y = 0, z = 1 就得到了结果,这在行图像之中并不明显。
使用 列图像 求解方程, 其优势在于这种求解方法更加系统,只需 寻找正确的线性组合,而不用绘制每个行方程的图像之后寻找那个很难看出来的点。
另外一个优势在于这种方法更加灵活,如果我们改变向量 b,如:
只需要重新寻找一个线性组合就够了,但是如果我们使用的是行图像呢?那意味着我 们要完全重画三个平面图像,就简便性来讲,两种方法高下立判。
- 那么,对任意的 b 是不是始终能够求解 Ax = b 这个矩阵方程呢?
从线性组合的角度看,问题可以转化为:对 3*3 的系数矩阵 A,其列的线性组合是不是始终可以覆盖整个三维空间呢?
对于我们举的这个例子来说,一定可以,还有我们上面 2*2 的那个例子,也可以覆盖整个平面,但是有一些矩阵就是不行的。
例如,若矩阵A的所有的列向量都集中在同一个平面内的话,那么其线性组合也将集中在同一个平面内,因此对于大部分不在这个平面内的 b, 均是无法构造出来的,这种情形称为 奇异 。
例如,若三个列向量本身就构成了一个平面,那么这三个向量组合成的向量只能活动在这个平面上,肯定无法覆盖整个三维空间。
这三个向量就构成了一个平面。
以下从列向量与行向量的角度介绍一下矩阵乘法。
这部分内容主要是对线性代数概念的初步了解。
从解方程谈起,从行空间逐步过渡到列空间,可以看到从列空间角度求解方程可以将解方程问题转化为求列向量的线性组合的问题。
最后,从列向量与行向量的角度介绍一下矩阵乘法。