高等代数笔记
rogeryoungh
2023 12 13
目录
第一章 线性方程组的解法 1
1.1 矩阵消元法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 线性方程组的解的情况及其判别准则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 数域 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
第二章 行列式 4
2.1 排列 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 n 阶行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 行列式的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.4 行列式按一行展开 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.5 克莱姆 Cramer 法则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
第三章 线性方程组的解系 10
3.1 n 维向量空间 K
n
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.2 线性相关与无关 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.3 向量组的秩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.4 子空间的基与维数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.5 矩阵的秩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.6 线性方程组有解的充分必要条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.7 齐次线性方程组解集的结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.8 非齐次线性方程组的结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
第四章 矩阵的运算 17
4.1 矩阵的运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
4.2 特殊矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.3 矩阵乘积的秩与行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4.4 可逆矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.5 矩阵的分块 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.6 正交矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.7 K
n
K
s
的线性映射 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
第五章 矩阵的相抵与相似 28
5.1 等价关系与集合的划分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.2 矩阵的相抵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.3 广义逆矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
i
5.4 矩阵的相似 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.5 矩阵的特征值和特征向量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.6 矩阵可对角化的条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.7 实对称矩阵的对角化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
第六章 二次型·矩阵的合同 36
6.1 二次型及其标准型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
6.2 实二次型的规范形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
6.3 正定二次型与正定矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
第七章 多项式环 41
7.1 一元多项式环 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
7.2 整除关系,带余除法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
7.3 最大公因式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
7.4 不可约多项式,唯一因式分解定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
7.5 重因式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
7.6 多项式的根 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
7.7 实数域上的不可约多项式·实系数多项式的根 . . . . . . . . . . . . . . . . . . . . . . . . . . 47
7.8 有理数域上的不可约多项式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7.9 多元多项式环 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7.10 域与域上的一元多项式环 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
第八章 线性空间 51
8.1 F 上的线性空间的基与维数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
8.2 子空间及其交与和,子空间的直和 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
8.3 域上线性空间的同构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
8.4 商空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
第九章 线性映射 57
9.1 线性映射及其运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
9.2 线性映射的核与象 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
9.3 线性映射和线性变换的矩阵表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
9.4 线性变换的特征值和特征向量,线性变换可对角化的条件 . . . . . . . . . . . . . . . . . . 62
9.5 线性变换的不变子空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
9.6 * 线性变换和矩阵的最小多项式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
9.7 幂零变换的 Jordan 标准型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
9.8 线性变换的有理标准型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
9.9 线性函数与对偶空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
第十章 具有度量的线性空间 67
10.1 双线性函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
10.2 欧几里得空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
10.3 正交补,正交投影 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
10.4 正交变换与对称变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
ii
10.5 * 酉空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
10.6 * 正交空间与辛空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
10.7 * 正交群,酉群,辛群 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
索引 76
iii
第一章 线性方程组的解法
1.1 矩阵消元法
形如这样左端都是未知量 x
n
的一次齐次式,右端是常数,
a
1
x
1
+ a
2
x
2
+ ··· + a
n
x
n
= b
像这样的方程称为线性方程。每个未知量前面的数称为系数,右端的项称为常数项。
n
个未知量的线性方程组称为
n
元线性方程组,它的一般形式是
a
11
x
1
+ a
12
x
2
+ ··· + a
1n
x
n
= b
1
a
21
x
1
+ a
22
x
2
+ ··· + a
2n
x
n
= b
2
··· ··· ···
a
s1
x
1
+ a
s2
x
2
+ ··· + a
sn
x
n
= b
s
方程的个数 s 与未知量的个数 n 可以相等,也可以不等。
定义 1.1.1 线性方程组的初等变换
线性方程组的初等变换有三种,分别为:
1. 把一个方程的倍数加到另一个方程上。
2. 互换两个方程的位置。
3. 用一个非零数乘某一个方程。
对于线性方程组, x
1
, ··· , x
n
分别用数 c
1
, ··· , c
n
代入后,每个方程都变成恒等式,那么称 n 元有
序组 (c
1
, ··· , c
n
) 线性方程组的一个解。方程组所有解组成的集合称为这个线性方程组的解集,符合实
际要求的解称为可行解。
通过初等变换能够使线性方程组变为阶梯形方程组,进一步可以变为简化阶梯形方程组,此种形式可
以较方便的看出方程组的解。
定理 1.1.2
初等变换不改变线性方程组的解。
可以把原线性方程组的系数和常数项按次序排成一张表,称为方程组的增广矩阵而只列出系数的方
程组称为系数矩阵
1
定义 1.1.3
sn 个数排成的 s 行(横的)n 列(纵的)表
a
11
a
12
. . . a
1n
a
21
a
22
. . . a
2n
.
.
.
.
.
.
.
.
.
a
s1
a
s2
. . . a
sn
称为一个 s × n 矩阵,记作 A
s×n
A = (a
ij
),它的 (i, j) 元也记作 A(i; j)
特殊的,如果矩阵 A 的行数和列数相等皆为 n,则称它为 n 级方阵或方阵。元素全为 0 的矩阵称为
零矩阵,记作 0
s×n
0
定义 1.1.4 初等行变换
矩阵的初等行变换有三种,分别为:
1. 把一行的倍数加到另一行上。
2. 互换两行的位置。
3. 用一个非零数乘某一行。
矩阵经过初等行变换,可变成阶梯形矩阵,并可进一步化简成简化行阶梯形矩阵。
阶梯形矩阵的特点为
1. 元素全为 0 的行(零行)在下方(如果有的话)
2. 元素不全为 0 的行(非零行),左起第一个不为 0 的元素(主元)成阶梯状排列。
简化行阶梯形矩阵(行最简形矩阵)的特点为
1. 它是阶梯形矩阵;
2. 每个非零行的主元都是 1
3. 每个主元所在的列的其余元素都是 0
在解线性方程组时,可以通过一系列初等行变换,它的增广矩阵化为阶梯形矩阵,甚至继续化简为简
化行阶梯形矩阵,都可简化求解过程。
定理 1.1.5
任意矩阵都可以经过一系列初等行变换化为阶梯形矩阵,也可以变成简化行阶梯形矩阵。
证明 即矩阵消元法。
1.2 线性方程组的解的情况及其判别准则
由于初等变换不改变线性方程组的解,其总可以化为阶梯形方程组。因此设阶梯形方程组有 n 个未知
量,它的增广矩阵 J r 个非零行,J n + 1 列。
1. 若阶梯形方程组中出现 0 = d(其中 d 为非零数)这种方程,即最后一个非零行的主元位于 n + 1
列,则阶梯形方程组无解。
2. 最后一个非零行的主元不位于 n + 1 列。
2
(a) r = n 时,阶梯形方程恰有唯一解。
(b) r < n 时,有无穷多组解。
定理 1.2.1
系数为有理数(实数、复数) n 元线性方程组的解的情况只有三种可能:无解,有唯一解,有无
穷多组解。
若一个线性方程组有解,则称它是相容的;否则称它是不相容的。
1.3 数域
定义 1.3.1
复数集的一个子集 K 是一个数域,那么满足:
1. 0, 1 K
2. a, b K a ± b, ab K
3. a, b K,且 b 6= 0
a
b
K
其中,Q, R, C 都是数域,但整数集 Z 不是数域。
有理数域是最小的数域。
定理 1.3.2
任意数域都包含有理数域。
3
第二章 行列式
2.1 排列
定义 2.1.1
1, 2, ··· , n 组成的一个有序数组称为一个 n 阶排列。
特殊的,排列 12 ···n 也是一个 n 阶排列,称为自然排列。
定义 2.1.2
在一个排列中,如果一对数前面的数大于后面的数,那么它们就称为一个逆序,反之称为正序。
排列中逆序的对数称为这个排列的逆序数。
逆序数为偶数的排列称为偶排列,逆序数的排列称为奇排列。
排列 j
1
j
2
···j
n
的逆序数记为
τ(j
1
j
2
···j
n
)
定义 2.1.3
把排列中某两个数位置互换,得到一个新排列。称这样的一个变换称为一个对换。
定理 2.1.4
对换改变排列的奇偶性。
证明 设对换为 (i, j),分类讨论:
1若所换两数相邻,则不影响后面数字的逆序数。那么若 ij 为一个逆序,则逆序数减 1否则逆序
数加 1,总之逆序数奇偶性改变。
2)若所换两数不相邻,不妨设 i j 之前,排列为
···i k
1
···k
s
j ···
那么有
(i, j) = (i, k
1
) ···(i, k
s
)(i, j)(k
s
, j) ···(k
1
, j)
即任意对换即总可以分解为奇数个相邻对换的积。
任何一个 n 阶排列都可以与自然排列由一系列对换互变,即置换。奇置换可以分解为奇数个对换
积,偶置换可以分解为偶数个对换的积。
4
2.2 n 阶行列式
X
j
1
j
2
···j
n
表示对所有 n 元排列求和。
定义 2.2.1
n 阶行列式
a
11
a
12
. . . a
1n
a
21
a
22
. . . a
2n
.
.
.
.
.
.
.
.
.
a
n1
a
n2
. . . a
nn
=
X
j
1
j
2
···j
n
(1)
τ (j
1
j
2
···j
n
)
a
1j
1
a
2j
2
···a
nj
n
该式称为 n 阶行列式的完全展开式。
若对角线下方的元素全为 0,则称为上三角行列式,即对于所有的 1 i < j n,有 a
ji
= 0
定理 2.2.2
上三角行列式的值为
|A| = a
11
a
22
···a
nn
证明 考虑其完整展开式的任意一项
(1)
τ (j
1
j
2
···j
n
)
a
1j
1
a
2j
2
···a
nj
n
若该项不为 0,则对 1 k n,皆有 j
k
k
因此只有 j
k
= k,只有这一项不为 0
定理 2.2.3
n 级矩阵 A 依据给定排列 i
1
i
2
···i
n
对行指标进行重排得到 A
1
,则 A
1
的行列式为
|A
1
| = (1)
τ (i
1
i
2
···i
n
)
|A|
证明 设一列元素 a
1j
1
a
2j
2
···a
nj
n
经过 s 次相邻互换变为 a
i
1
k
1
a
i
2
k
2
···a
i
n
k
n
,则有
(1)
τ (i
1
i
2
···i
n
)
= (1)
s
(1)
τ (j
1
j
2
···j
n
)
(1)
s
= (1)
τ (k
1
k
2
···k
n
)
从而
(1)
τ (i
1
i
2
···i
n
)+τ (k
1
k
2
···k
n
)
= (1)
s
(1)
τ (j
1
j
2
···j
n
)
(1)
s
= (1)
τ (j
1
j
2
···j
n
)
同理,给定列指标的一个排列 k
1
k
2
···k
n
和对应的矩阵 A
2
,则 n 级矩阵的行列式为
|A
2
| = (1)
τ (k
1
k
2
···k
n
)
|A|
5
2.3 行列式的性质
定理 2.3.1
转置后行列式值不变。
记矩阵 A 转置后的矩阵 A
A
T
证明 设行列式 B = A
T
a
ij
= b
ji
由前文知,按列指标展开 B (注意第 1 个下标是列指标, 2
个下标是行指标)
|B| =
X
i
1
i
2
···i
n
(1)
τ (i
1
i
2
···i
n
)
a
1i
1
a
2i
2
···a
ni
n
按列指标展开 A
|A| =
X
i
1
i
2
···i
n
(1)
τ
(
i
1
i
2
···i
n
)
a
1i
1
a
2i
2
···a
ni
n
因此 |A| = |B|
定理 2.3.2
行列式的一行乘以一个数,等于行列式乘以这个数。
证明 即行列式 B 除了第 i
1
行有 b
i
1
j
= ka
i
1
j
,其他行都有 b
ij
= a
ij
|B| =
X
j
1
j
2
···j
n
(1)
τ (j
1
j
2
···j
n
)
a
1j
1
···(ka
i
1
j
) ···a
nj
n
= k
X
j
1
j
2
···j
n
(1)
τ (j
1
j
2
···j
n
)
a
1j
1
···a
i
1
j
···a
nj
n
= k|A|
定理 2.3.3
除了同一行以外全部相等的两个行列式,与此行替换为这两行的和的行列式相等。
证明 即行列式 A 除了第 i
1
行有 a
i
1
j
= b
i
1
j
+ c
i
1
j
,其他行都有 a
ij
= b
ij
= c
ij
|A| =
X
j
1
j
2
···j
n
(1)
τ (j
1
j
2
···j
n
)
a
1j
1
···(b
i
1
j
+ c
i
1
j
) ···a
nj
n
=
X
j
1
j
2
···j
n
(1)
τ (j
1
j
2
···j
n
)
a
1j
1
···b
i
1
j
···a
nj
n
+
X
j
1
j
2
···j
n
(1)
τ (j
1
j
2
···j
n
)
a
1j
1
···c
i
1
j
···a
nj
n
= |B| + | C|
定理 2.3.4
行列式中有两行互换,行列式反号。
证明 即设行列式 B 为行列式第 k
1
, k
2
两行交换的结果,又
(1)
τ (j
1
···j
k
2
···j
k
1
···j
n
)
= (1)
τ (j
1
···j
k
1
···j
k
2
···j
n
)
6
那么有
|B| =
X
j
1
···j
k
2
···j
k
1
···j
n
(1)
τ (j
1
···j
k
2
···j
k
1
···j
n
)
a
1j
1
···a
k
1
j
k
2
···a
k
2
j
k
1
···a
nj
n
=
X
j
1
···j
k
1
···j
k
2
···j
n
(1)
τ (j
1
···j
k
1
···j
k
2
···j
n
)
a
1j
1
···a
k
1
j
k
1
···a
k
2
j
k
2
···a
nj
n
= −|A|
定理 2.3.5
行列式中有两行相等,行列式为零。
证明 交换这相同的两行,行列式变号,其仍与原来相等,只能为 0
定理 2.3.6
行列式中两行成比例,行列式为零。
证明 提出公因子使两行相等,即为 0
定理 2.3.7
把一行的倍数加到另一行,行列式不变。
证明 一行是另一行的倍数的行列式为 0,合并后自然不变。
2.4 行列式按一行展开
定义 2.4.1 代数余子式
n 阶行列式 |A| 中,划去第 i 行和第 j 列,剩下的元素按原来次序组成的 n 1 阶行列式称为矩阵
A (i, j) 元的余子式。记作
M
ij
=
X
k
1
···k
i1
k
i+1
···k
n
(1)
τ (k
1
···k
i1
k
i+1
···k
n
)
a
1k
1
···a
i1,k
i1
a
i+1,k
i+1
···a
nk
n
其中 j = k
i
,令 A
ij
= (1)
i+j
M
ij
,称 A
ij
A (i, j) 元的代数余子式。
定理 2.4.2
对于 n 阶行列式 |A|
|A| =
n
X
j=1
a
ij
A
ij
=
n
X
i=1
a
ij
A
ij
前者称为 n 阶行列式按第 i 行的展开式,后者称为按第 j 列的展开式。
证明 首先列出 |A| 的行完全展开式,其中 j = k
i
|A| =
X
k
1
···k
i1
jk
i+1
···k
n
(1)
τ (k
1
···k
i1
jk
i+1
···k
n
)
a
1k
1
···a
i1,k
i1
a
ij
a
i+1,k
i+1
···a
nk
n
7
把第 i 行换到第 1 行,第 j 列换到第 1 列,由对换的性质有
(1)
τ (i1···(i1)(i+1)···n)+τ (jk
1
···k
i1
k
i+1
···k
n
)
= (1)
i1
(1)
j1
(1)
τ (k
1
···k
i1
k
i+1
···k
n
)
因此
|A| =
n
X
j=1
a
ij
(1)
i+j
X
k
1
···k
i1
k
i+1
···k
n
(1)
τ (k
1
···k
i1
k
i+1
···k
n
)
a
1k
1
···a
i1,k
i1
a
i+1,k
i+1
···a
nk
n
=
n
X
j=1
a
ij
(1)
i+j
M
ij
=
n
X
j=1
a
ij
A
ij
对于列展开式,转置即可。
定理 2.4.3
对于 n 阶行列式 |A|
n
X
j=1
a
ij
A
kj
= 0(k 6= i)
证明 设矩阵 B k 行与第 i 行相等,因此按第 k 行展开有
|B| =
n
X
j=1
a
kj
A
kj
=
n
X
j=1
a
ij
A
kj
= 0
定义 2.4.4 Vandermonde 行列式
若行列式满足 a
ij
= a
i
j
,则称为 Vandermonde 行列式。其值为(证略)
Y
1j<in
(a
i
a
j
)
2.5 克莱姆 Cramer 法则
对于数域 K n 个方程的 n 元线性方程组,
a
11
x
1
+ a
12
x
2
+ ··· + a
1n
x
n
= b
1
a
21
x
1
+ a
22
x
2
+ ··· + a
2n
x
n
= b
2
··· ··· ···
a
n1
x
1
+ a
n2
x
2
+ · + a
nn
x
n
= b
n
其系数矩阵记作 A,增广矩阵记作
e
A
定理 2.5.1
方程组有唯一解的充要条件是 |A| 6= 0。定义 B
j
为矩阵 A j 列换为常数项后的矩阵,此时解为
|B
1
|
|A|
, ··· ,
|B
n
|
|A|
8
证明 假设行列式有唯一解,由上一章知矩阵
e
A 可以通过初等行变换变化为阶梯型矩阵 J|A| = l|J| 6= 0
9
第三章 线性方程组的解系
3.1 n 维向量空间 K
n
取定一个数域 K,设 n 是任意给定的一个正整数。令
K
n
= {(a
1
, ··· , a
n
) | a
i
K, i = 1, ··· , n }
如果 a
1
= b
1
, ··· , a
n
= b
n
,则称 K
n
中的两个元素:(a
1
, ··· , a
n
), (b
1
, ··· , b
n
) 相等。
K
n
中规定加法运算:
(a
1
, ··· , a
n
) + (b
1
, ··· , b
n
)
:
= (a
1
+ b
1
, ··· , a
n
+ b
n
)
K 的元素与 K
n
的元素之间规定数量乘法运算:
k(a
1
, ··· , a
n
)
:
= (ka
1
, ··· , ka
n
)
不难验证加法和数量乘法运算满足下述八条运算法则:对于 α, β, γ K
n
, k, l K
1. α + β = β + α
2. (α + β) + γ = α + (β + γ)
3. 把元素 (0, ··· , 0) 记作零元素 0,使得
0 + α = α + 0 = α
4. 对于 α = (a
1
, ··· , a
n
) K
n
,定义其负元素
α
:
= (a
1
, ··· , a
n
)
于是有
α + (α) = (α) + α = 0
5. 1α = α
6. (kl)α = k(lα)
7. k(α + β) = kα + kβ
定义 3.1.1 n 维向量空间
数域 K 上所有 n 元有序数组组成的集合 K
n
,连同定义在它上面的加法运算和数量乘法运算,及
其满足的 8 条运算法则一起,称为数域 K 上的一个 n 维向量空间。K
n
的元素称为 n 维向量;设
向量 α = (a
1
, ··· , a
n
),称 a
i
α 的第 i 个分量。
10
n 维向量空间 K
n
中,可以定义减法运算
α β
:
= α + (β)
n 元有序数组写成一行,称为行向量;写成一列,称为列向量,也可以看作行向量的转置。
K
n
可以看成是 n 维行向量组成的向量空间,也可以看作是列向量组成的向量空间。
定义 3.1.2 线性组合
给定向量组 α
1
, ··· , α
s
,再任给 K 中的一组数 k
1
, ··· , k
s
,那么向量
k
1
α
1
+
···
+
k
s
α
s
称为向量组 k
1
, ··· , k
s
的一个线性组合,其中 k
1
, ··· , k
s
称为系数。
定义 3.1.3 线性表出
给定向量组 α
1
, ··· , α
s
,对于 β K
n
,若存在 K 中的一组数 k
1
, ··· , k
s
满足
β = k
1
α
1
+ ··· + k
s
α
s
那么称 β 可以由向量组 α
1
, ··· , α
s
线性表出。
于是可以把数域 K 上的 n 元线性方程组
a
11
x
1
+ a
12
x
2
+ ··· + a
1n
x
n
= b
1
a
21
x
1
+ a
22
x
2
+ ··· + a
2n
x
n
= b
2
··· ··· ···
a
n1
x
1
+ a
n2
x
2
+ ··· + a
nn
x
n
= b
n
写成
x
1
a
11
a
21
···
a
n1
+ x
2
a
12
a
22
···
a
n2
+ ··· + x
n
a
1n
a
2n
···
a
nn
=
b
1
b
2
···
b
n
或者
x
1
α
1
+ ··· + x
n
α
n
= β
其中 α
1
, ··· , α
n
是线性方程组的列向量组,β 是由常数项组成的列向量。因此方程组有解等价于 β 可以
α
1
, ··· , α
n
线性表出。
定义 3.1.4 线性子空间
K
n
的一个非空子集 U K
n
的一个线性子空间,那么满足
1U 对于 K
n
的加法封闭:α, γ U α + γ U
2U 对于 K
n
的乘法封闭:α U, k K kα U
特殊的,{0} 也是 K
n
的一个子空间,称为零子空间。K
n
本身也是 K
n
的一个子空间。
11
α
1
, ··· , α
n
的所有线性组合也是 K
n
的一个子空间,称为 α
1
, ··· , α
n
生成(张成)的子空间,记作
hα
1
, ··· , α
n
i
:
= {k
1
α
1
+ ··· + k
s
α
s
| k
i
K, i = 1, ··· , s }
于是线性方程组有解,等价与 β 可以由 α
1
, ··· , α
n
线性表出,即 β hα
1
, ··· , α
n
i
3.2 线性相关与无关
定义 3.2.1
K
n
中向量组 α
1
, ··· , α
s
称为是线性相关的,如果有 K 中不全为 0 的数 k
1
, ··· , k
s
,使得
k
1
α
1
+ ··· + k
s
α
s
= 0
否则称为线性无关。
即线性无关意味着所有的系数只能都为 0。注意线性相关不意味着每个向量都可以由其他向量线性表
出,该向量前的系数 k 可以为 0
3.3 向量组的秩
定义 3.3.1 极大线性无关组
向量组的一个部分组称为一个极大线性无关组,如果这个部分组本身是线性无关的,但是从这个向
量组的其余向量(如果还有的话)中任取一个添进去,得到的新的部分组都线性相关。
如果向量组 α
1
, ··· , α
s
的每一个向量都可以由向量组 β
1
, ··· , β
r
线性表出,那么称向量组 α
1
, ··· , α
s
可以由向量组线性表出。
定义 3.3.2
如果向量组 α
1
, ··· , α
s
与向量组 β
1
, ··· , β
r
可以互相线性表出,那么称两个向量组等价,记作
{α
1
, ··· , α
s
}
=
{β
1
, ··· , β
r
}
可以证明,这种关系具有三条性质(反身性,对称性,传递性),即是等价关系。
对矩阵作初等行变换,变换前后的行向量组等价,不保证列向量组等价。
那么向量组与它的极大线性无关组等价。
定义 3.3.3
向量组 α
1
, ··· , α
r
的极大线性无关组所含向量的个数称为这个向量组的秩,记作
rank{α
1
, ··· , α
r
}
12
3.4 子空间的基与维数
定义 3.4.1 子空间
U K
n
的一个子空间,如果 α
1
, ··· , α
r
U U 的一个基,那么
1α
1
, ··· , α
r
线性无关。
2
U
中每一个向量都可以由
α
1
,
···
,
α
r
线性表出。
显然,单位向量组 ε
1
, ··· , ε
n
K
n
的一个基,称作标准基。
定理 3.4.2
K
n
的任一非零子空间 U 都有一个基。
定理 3.4.3
K
n
的任空间 U 两个量的等,称 U 数,记 dim
K
U
dim U
定理 3.4.4
向量组 α
1
, ··· , α
s
的一个极大线性无关组是这个向量组生成的子空间的 hα
1
, ··· , α
s
i,从而
dimhα
1
, ··· , α
s
i = rank{α
1
, ··· , α
s
}
3.5 矩阵的秩
定理 3.5.1
阶梯形矩阵 J 的行秩与列秩相等,它们都等于 J 的非零行的个数;并且 J 的主元所在的列构成列
向量的一个极大线性无关组。
定理 3.5.2
矩阵的初等行变换不改变矩阵的行秩和列秩。
定理 3.5.3
矩阵的行秩和列秩相等,统称为矩阵的秩。矩阵 A 的秩记作 rank(A)
定理 3.5.4
非零矩阵的秩等于它的不为零的子式的阶数。
若一个 n 级矩阵的秩如果等于它的级数,那么称为满秩矩阵。
13
定理 3.5.5
A s × n 矩阵,B l × m 矩阵,则
rank
A 0
0 B
!
= rank(A) + rank(B)
定理 3.5.6
A s × n 矩阵,B l × m 矩阵,C s × m 矩阵,则
rank
A C
0 B
!
rank(A) + rank(B)
3.6 线性方程组有解的充分必要条件
定理 3.6.1
数域 K 上有线性方程组
x
1
α
1
+ ··· + x
n
α
n
= β
有解的充分必要条件是:它的系数矩阵与增广矩阵的秩相等。
定理 3.6.2
数域 K n 元线性方程组有解时,如果它的系数矩阵满秩,那么方程组有唯一解;否则方程组有
无穷多个解。
3.7 齐次线性方程组解集的结构
数域 K n 元齐次线性方程组
x
1
α
1
+ ··· + x
n
α
n
= 0
的一个解是 K
n
中的一个向量,称它为齐次线性方程组的一个解向量。
可知齐次线性方程组的解集 W K
n
的一个子空间,称为方程组的一个解空间。
定义 3.7.1
齐次线性方程组有非零解时,如果它的有限多个解 η
1
, ··· , η
t
是其基础解系
1η
1
, ··· , η
t
线性无关。
2)齐次线性方程组的每一个解都可以由 η
1
, ··· , η
t
线性表出。
于是解空间为
W = hη
1
, ··· , η
t
i
14
定理 3.7.2
数域 K n 元齐次线性方程组的解空间 W 的维数为
dim W = n rank(A)
证明 倘若 rank(A) = n,即只有零解,那么 W = {0},此时显然成立。
面设 rank(A) = r < n第一步, A 为简阵,主元 r 列,即
x
1
, ··· , x
r
关于自由变量 x
r+1
, ··· , x
n
的线性关系。
第二步,取 n r 个线性无关向量(最简单就是逐个 1带入 x
r+1
, ··· , x
n
,得到方程组的 n r
个解 η
1
, ··· , η
nr
,显然这些解线性无关。
下证这些解是解空间的基。对于任何一个解 η显然可以关于 x
r+1
, ··· , x
n
n r 个线性无关向量
分解,从而总是可以由 η
1
, ··· , η
r
线性表示。故
dim W = n rank(A)
3.7.3
求解
x
1
+ 3x
2
5x
3
2x
4
= 0
3x
1
2x
2
+x
3
+ x
4
= 0
11x
1
5x
2
x
3
+ 2x
4
= 0
5x
1
+ x
2
+x
3
= 0
第一步,化成简化阶梯型行列式,求出一般解
x
1
= x
3
1
7
x
4
x
2
= 2x
3
+
5
7
x
4
第二步,其中 x
3
, x
4
是自由变量,得到基础解系
η
1
=
1
2
1
0
, η
2
=
1
5
0
7
因此方程组的解集为
W = {k
1
η
1
+ k
2
η
2
}
3.8 非齐次线性方程组的结构
称数域 K n 元齐次线性方程组
x
1
α
1
+ ··· + x
n
α
n
= β
15
的导出组为
x
1
α
1
+ ··· + x
n
α
n
= 0
其的解空间用 W 表示。
定理 3.8.1
如果数域 K n 元齐次线性方程组有解,那么它的解集 U
U = {γ
0
+ η | η W }
其中 γ
0
是非其次线性方程组的一个特解,W 是导出组的解空间用。
3.8.2
求解
x
1
+ 2x
2
3x
3
4x
4
= 5
3x
1
x
2
+5x
3
+ 6x
4
= 1
5x
1
3x
2
+x
3
+ 2x
4
= 11
9x
1
4x
2
x
3
= 17
第一步,化成简化阶梯型行列式,求出一般解
x
1
= x
3
8
7
x
4
1
x
2
= 2x
3
+
18
7
x
4
2
第二步,其中 x
3
, x
4
是自由变量,得到特解和基础解系
γ
0
=
1
2
0
0
, η
1
=
1
2
1
0
, η
2
=
1
5
0
7
因此方程组的解集为
W = {γ
0
+ k
1
η
1
+ k
2
η
2
}
16
第四章 矩阵的运算
4.1 矩阵的运算
数域上 K 两个矩阵的行数、列数都相等,且所有元素对应相等,那么称两个矩阵相等。
定义 4.1.1
设数域 K 上的 s × n 矩阵 A = (a
ij
), B = (b
ij
),令 A, B 的和为
A + B
:
= (a
ij
+ b
ij
)
s×n
定义 4.1.2
设数域 K 上的 s × n 矩阵 A = (a
ij
),令 k K A 的数量乘积为
kA
:
= (ka
ij
)
s×n
不难验证,矩阵的加法和数量乘法满足类似于 n 维向量的 8 条运算法则。
同样定义矩阵的减法
A B
:
= A + (B)
定义 4.1.3
A = (a
ij
)
s×n
, B = (a
ij
)
n×m
,令 A, B 的乘积为
AB =
n
X
k=1
a
ik
b
kj
!
s×m
同样,若 AB BA 几乎都不相等,甚至不一定能够运算。
定理 4.1.4
A = (a
ij
)
s×n
, B = (b
ij
)
n×m
, C = (c
ij
)
m×r
,则
(AB)C = A(BC)
注意到,若 A, B 6= 0,有可能 BA = 0。因此 BA = 0 不能推出 B = 0 A = 0
17
定义 4.1.5 零因子
对于 A,若存 B 6= 0 使 AB = 0么称 A 是一个左因子。果存一个
C 6= 0 使得 CA = 0,那么称 A 是一个右零因子。左零因子和右零因子称为零因子。
特殊的,零矩阵是零因子,称为平凡的零因子。
定理 4.1.6
矩阵的乘法有分配律(左分配律、右分配律)
A(B + C) = AB + AC
(B + C)D = BD + CD
矩阵的乘法不适合消去律,从 AC = BC C 6= 0 不能推出 A = B
主对角线上元素都是 1其余元素都是 0 n 级矩阵称为 n 级单位矩阵,记作 E
n
或者简记作 E(有
些书上记作 I主对角线上元素是同一个数 k其余元素全为 0 n 级矩阵称为数量矩阵,可以记作 kE
因此有
E
s
A
s×n
= A
s×n
, A
s×n
E
n
= A
s×n
A n 级矩阵,则
EA = AE = A
矩阵的乘法与数量乘法满足下述关系式
k(AB) = (kA)B = A(kB)
数量矩阵还有
kE + lE = (k + l)E
k(l E) = (kl)E
(kE)(lE) = (kl)E
矩阵的乘法虽不满足交换律,但若对具体的两个矩阵 A B,也有可能 AB = BA,那么称 A B
可交换。比如数量矩阵与任一同级矩阵可交换
(kE)A = A(kE) = kA
定义 4.1.7
定义 n 级矩阵 A 的非负整数次幂为
A
n
:
= A ···A, A
n+1
:
= AA
n
定理 4.1.8
(A + B)
T
= A
T
+ B
T
, (kA)
T
= kA
T
, (AB)
T
= B
T
A
T
18
如果把 n 元线性方程组的系数矩阵记作 A,称常数项组成的列向量 β,未知量 x
1
, ··· , x
n
组成的
列向量为 X,那么 n 元线性方程组可以写成
AX = β
于是列向量 η 是方程组的 AX = β 的解当且仅当 Aη = β
4.2 特殊矩阵
定义 4.2.1
主对角线以外的元素全为 0 的方阵称为对角矩阵,简记作
diag{d
1
, ··· , d
n
}
定义 4.2.2
只有一个元素是 1,其他元素全为 0 的矩阵称为基本矩阵。(i, j) 元为 1 的基本矩阵记作 E
ij
定义 4.2.3
主对角线下(上)方的元素全为 0 的方阵称为上(下)三角矩阵。
显然 A = (a
ij
) 为上三角矩阵的充分必要条件是
a
ij
= 0 i > j
同样,上三角矩阵也可表述为
A =
n
X
i=1
n
X
j=i
a
ij
E
ij
定义 4.2.4
由单位矩阵经过一次初等行(列)变换得到的矩阵称为初等矩阵。
初等矩阵有且只有三种类型:
P
(
j, i
(
k
))
, P
(
i, j
)
, P
(
i
(
c
))
,其中
c
6
= 0
1. P (j, i(k)) 左乘 A,即把 A 的第 i 行的 k 倍加到第 j 行上。
2. P (j, i(k)) 右乘 A,即把 A 的第 j 列的 k 倍加到第 i 列上。
类似的,用 P (i, j) 左(右)乘 A,就相当于把 A 的第 i 行(列)与第 j 行(列)互换。
P (i(c)) 左(右)乘 A,就相当于用 c A 的第 i 行(列)
定义 4.2.5
一个矩阵 A 如果满足 A
T
= A,那么称 A 是对称矩阵。
定义 4.2.6
如果一个矩阵 A 如果满足 A
T
= A,那么称 A 是斜对称矩阵。
19
4.3 矩阵乘积的秩与行列式
定理 4.3.1
A = (a
ij
)
s×n
, B = (b
ij
)
n×m
,则
rank(AB) min{rank(A), rank(B)}
定理 4.3.2
rank(A + B) rank( A) + rank( B)
证明 显然 A + B 的列向量总是可以由 A B 列向量的极大无关组表出。
定理 4.3.3
A = (a
ij
)
s×n
, B = (b
ij
)
n×m
,则
|AB| = |A||B| = |B||A| = |BA|
定理 4.3.4 Binet Cauchy 公式
A = (a
ij
)
s×n
, B = (b
ij
)
n×m
,则
1. 如果 s > n,那么 |AB| = 0
2. 如果 s n,那么 |AB| 等于 A 的所有 s 阶子式的与相应 s 阶子式的乘积之和,即
|AB| =
X
1v
1
<···<v
s
n
A
1, ··· , s
v
1
, ··· , v
s
· B
v
1
, ··· , v
s
1, ··· , s
定理 4.3.5
rank(A
T
A) = rank(AA
T
) = rank(A)
证明 试证 AX = 0 (A
T
A)X = 0 同解。
假设 η AX = 0 的一个解,显然
(A
T
A)X = A
T
(Aη) = A
T
0 = 0
反之,设 η (A
T
A)X = 0 的一个解,注意到
(Aη)
T
(Aη) = η
T
((A
T
A)η) = 0
即向量 Aη 的长度为 0,故 Aη = 0
定理 4.3.6
A 是一个 s × n 矩阵,且 A 6= 0,证明:A 可以被分解为行列向量的乘积当且仅当 rank(A) = 1
证明 由于秩为 1,因此选取 A 的一个列向量 α
1
,其他的列向量都可以由其表示,故 A = αβ
T
20
4.3.7
如果数域上的 n 级矩阵 A 满足 AA
T
= E,且 |A| = 1,求证:|E + A| = 0
4.4 可逆矩阵
定义 4.4.1
对于数域 K 上的矩阵 A,如果存在数域 K 上的矩阵 B,使得
AB = BA = E
那么称 A 是可逆矩阵(或非奇异矩阵)B 称为 A 的逆矩阵,记作 A
1
易知可逆矩阵一定是方阵,n 级矩阵 A 可逆的充分必要条件是
|A| 6= 0
定义 4.4.2
设矩阵 A = (a
ij
),那么 A 的伴随矩阵为
A
= (A
ij
)
AA
= |A|E
定理 4.4.3
数域 K n 级矩阵 A 可逆的充分必要条件是 |A| 6= 0。当 A 可逆时,
A
1
=
A
|A|
易得,可逆矩阵有如下性质
1. (A
1
)
1
= A
2. (AB)
1
= B
1
A
1
可逆矩阵能够通过初等行变换变成第简化行阶梯形矩阵一定是单位矩阵。
定理 4.4.4
矩阵 A 可逆的充分必要条件是它可以表示成一些初等矩阵的乘积。
用一个可逆矩阵左(右)乘一个矩阵 A不改变 A 的秩。这里给出了求可逆矩阵第逆矩阵的又一种方
法,称为初等变换法。
21
4.4.5
A, B 分别是 n × m, m × n 的矩阵,如果已知 E
n
AB 可逆,求 (E
m
BA)
1
设存在 m 级矩阵 X 使得
(E
m
BA)(E
m
+ X) = E
m
X BAX = BA
直觉指引我们构造 X = BY A,带入有
B( E
m
AB) Y A = BA
因此可以令 Y = (E
m
AB)
1
,故
(E
m
BA)
1
= E
m
+ B( E
n
AB)
1
A
4.4.6
设方阵 A, B 满足 |A|+ |B| = 0 A, B 是对合矩阵, A
2
= B
2
= E证明:那么 A + B, E + AB
都不可逆。
可以得到 |A| = ±1,不妨设 |A| = 1, |B| = 1,则
|A + B| = |A( A + B)| = |E + AB|
= −|(A + B)B| = −|AB + E|
|A + B| = |AB + E| = 0
4.4.7
如果 A
3
= 0,求 (E A)
1
注意到
(E A)(E + A + A
2
) = E A
3
= E
因此
(E A)
1
= E + A + A
2
4.4.8
n 级矩阵 A, B 满足 A + B = AB,求证:E A, E B 都可逆,且 AB = BA
注意到
(E A)(E B) = E A B + AB = E
因此
E = (E B)(E A) = E + BA AB
得到 AB = BA
22
4.5 矩阵的分块
由矩阵 A 的若干行、若干列的交叉位置元素按原来顺序排成的矩阵称为 A 的一个子矩阵。若把分为
若干组,列也分成若干组,从而 A 被分成若干个子矩阵,把 A 看成是由这些子矩阵组成的,这称为矩阵
的分块,这种由子矩阵组成的矩阵称为分块矩阵。
定理 4.5.1
如果 A
11
, A
22
, ··· , A
ss
都是方阵,则
A
11
0 ··· 0
A
21
A
22
··· 0
.
.
.
.
.
.
.
.
.
A
s1
A
s2
··· A
ss
= |A
11
|···|A
ss
|
证明 Laplace 定理即知。
定理 4.5.2
A =
B C
0 D
!
,其中 B, C, D 都是方阵,那么
A
1
=
B
1
B
1
CD
1
0 D
1
!
定理 4.5.3 Sylvester 秩不等式
A, B 分别是 s × n, n × m 的矩阵,则
rank(A) + rank(B) rank(AB) + n
证明
由于矩阵的初等行(列)变换不改变矩阵的秩,构造分块矩阵
n + rank(AB) = rank
E
n
0
0 AB
!
= rank
B E
n
0 A
!
rank(B) + rank(A)
定理 4.5.4
如果 n 级矩阵满足 (A aE)(A bE) = O其中 a 6= b证明:rank(A aE) + rank(A bE) = n
证明 一方面
rank(A aE) + rank(A bE) rank(O) + n = n
另一方面
rank(A aE) + rank(A bE) rank((A aE) (A bE)) = n
因此 rank(A aE) + rank(A bE) = n
23
如果 n 矩阵 A A
2
= A则称 A 幂等矩阵。个直接的论是,A 是幂等阵当且仅
rank(A) + rank(E A) = n
4.5.5
A, B n 级矩阵,有
1|A
| = |A|
n1
2
rank(A
) =
n, rank(A) = n
1, rank(A) = n 1
0, rank(A) < n 1
3
(A
)
= |A|
n2
A
4
(A
1
)
= (A
)
1
=
A
|A|
5
(AB)
= B
A
证明 2 rank(A) = n A 可逆,显然 A
也可逆; rank(A) < n1 时,不存在不为零的 n1 阶子式,
A
= O, rank(A
) = 0; rank(A) = n 1 时,|A| = 0因此 AA
= O于是 rank(A) + rank(A
) n
A 存在不为零的 n 1 阶子式,故 A
6= O,因此 rank(A
) = 1
4.5.6
A, B, C, D 都是数域上的 n 级矩阵,则
A B
C D
= |AD ACA
1
B|
定理 4.5.7 Frobenius 秩不等式
A, B, C 分别是 s × n, n × m, m × t,则
rank(ABC) rank(AB) + rank(BC) rank(B)
定理 4.5.8
n 级矩阵 A 是对合矩阵的充要条件是
rank(E + A) + rank(E A) = n
证明 注意到
n = rank(2E) rank(E A) + rank(E + A) rank(E A
2
) + n
当且仅当 A
2
= E 时等号成立。
24
4.5.9
A 是数域 K 上的 n 级矩阵,且 rank(A) = 1,求证:存在 k 使得 A
2
= kA
证明 因为 rank(A) = 1,因此可以把 A 分解为 A = αβ
T
。从而
A
2
= αβ
T
αβ
T
= (β
T
α)αβ
T
其中 k = β
T
α 为一实数。
4.6 正交矩阵
定义 4.6.1
实数域上的 n 级矩阵 A 如果满足
AA
T
= E
那么称 A 是正交矩阵。
那么其具有如下性质
1. A B 都是 n 级正交矩阵,则 AB 也是正交矩阵。
2. A 是正交矩阵,则 A
1
(即 A
T
)也是正交矩阵。
3. A 是正交矩阵,则 |A| = ±1
引用 Kronecker 记号 δ
ij
,它的含义是
δ
ij
=
1, i = j
0, i 6= j
定理 4.6.2
设实数域上 n 级矩阵 A 的行向量组为 γ
1
, ··· , γ
n
,列向量组为 α
1
, ··· , α
n
,则
γ
i
γ
j
= δ
ij
, α
i
α
j
= δ
ij
, 1 i, j n
定义 4.6.3
R
n
中,任给 α = (a
1
, ··· , a
n
), β = (b
1
, ··· , b
n
),规定
(
α,
β
)
:
=
X
a
n
b
n
= αβ
T
这个二元实值函数 (α, β) 称为 R
n
的一个内积(通常称为标准内积)
可以验证 R
n
的标准内积有下列性质:
1. 对称性 (α, β) = (β, α)
2. 线性性之一 (α + γ, β) = (α, β) + (γ, β)
3. 线性性之二 (kα, β) = k(α, β)
4. 正定性 (α, α) 0,当且仅当 α = 0 时等号成立。
25
可以验证
(k
1
α
1
+ k
2
α
2
, β) = k
1
(α
1
, β) + k
2
(α
2
, β)
(α, k
1
β
1
+ k
2
β
2
) = k
1
(α, β
1
) + k
2
(α, β
2
)
n 维向量空间 R
n
有了标准内积后,就称 R
n
为一个欧几里得空间。其中,向量 α 的长度 |α| 规定为
|α|
:
=
p
(α, α)
不难验证
|kα| = |k||α|
长度为 1 的向量称为单位向量,把非零向量 α 除以 |α| 称为把 α 单位化。
在欧几里得空间 R
n
中,如果 (α, β) = 0,那么称 α β 是正交的,记作 αβ由非零向量组成的
向量组如果其中每两个不同的向量都正交,那么称它们为正交向量组。如果其每个向量都是单位向量,
么称它为正交单位向量组。
特殊的,零向量与任何向量正交,仅由一个非零向量组成的向量组也是正交向量组。
不难验证,欧几里得空间 R
n
n 个向量组成的正交向量组一定是 R
n
的一个基,称它为正交基。
果其每个向量都是单位向量,那么称它为 R
n
的一个标准正交基。
定理 4.6.4
实数域上的 n 级矩阵 A 是正交矩阵的充分必要条件为:A 的行(列)向量组是欧几里得空间 R
n
一个标准正交基。
定理 4.6.5
α
1
, ··· , α
s
是欧几里得空间 R
n
中一个线性无关的向量组,令
β
1
= α
1
β
2
= α
2
(α
2
, β
1
)
(β
1
, β
1
)
β
1
···
β
s
= α
s
s1
X
j=1
(α
s
, β
j
)
(β
j
, β
j
)
β
j
β
1
, ··· , β
s
是正交向量组,并且与 α
1
, ··· , α
s
等价。
这给出了在欧几里得空间 R
n
中从一个线性无关的向量组 α
1
, ··· , α
s
出发,够造出与它等价的一个正
交向量组的方法,这种方法称为施密特 Schmidt 正交化过程,只要再将 β
1
, ··· , β
s
中每个向量单位化,
其就是与原向量组等价的正交单位向量组,就是 R
n
的一个标准正交基。
4.7 K
n
K
s
的线性映射
映射视作熟知的。
f
是集合
S
到集合
S
S 所有元素在 f 下的象组成的集合叫做 f 的值域或者 f
的象,记作 f(S) Im f
26
定义 4.7.1
数域 K 上的向量空间 K
n
K
s
的一个映 σ 如果保持加法和数量乘法,即 α, β K
n
, k K
σ(α + β) = σ(α) + σ(β)
σ(kα) = kσ(α)
那么称 σ K
n
K
s
上的一个线性映射。
A 是数域 K s × n 矩阵,令
A : K
n
K
s
α 7→
定义 4.7.2
σ K
n
K
s
的一个映射,K
n
的一个子集
{α K
n
| σ(α) = 0}
称为映射 σ 的核,记作 Ker σ
不难验证,如果 σ K
n
K
s
的一个线性映射,那么 Ker σ K
n
的一个子空间。
定理 4.7.3
设数域上 K 上齐次线性方程组 AX = 0 的解空间是 W A 对应的线性映射为 A
Ker A = W
因此
dim Ker A + dim Im A = dim K
n
27
第五章 矩阵的相抵与相似
5.1 等价关系与集合的划分
等价关系还是记录一下。
定义 5.1.1
S 是一个非空集合,我们把 S × S 的一个子集 W 叫做 S 的一个二元关系。如果 (a, b) W
那么称 a b W 关系;如果 (a, b) / W ,那么称 a b 没有 W 关系。
a b W 关系时,记作 aW b,或 a b
定义 5.1.2
集合 S 上的一个二元关系 如果具有下述性质:a, b, c S,有
1)反身性 a a
2)对称性 a b b a
3)传递性 a b b c a c
那么称 S 上的一个等价关系。
定义 5.1.3
是集合 S 上的一个等价关系,a S ,令
a
:
= {x S | x a}
a 是由 a 确定的等价类,a 称为等价类 a 的一个代表。
定义 5.1.4
如果集合 S 是一些非空子集 S
i
i I这里 I 表示指标集)的并集,并且其中不相等的子集一定
不相交,那么称集合 {S
i
| i I} S 的一个划分,记作 π(S)
定理 5.1.5
是集合 S 上的一个等价关系,则所有等价类组成的集合是 S 的一个划分,记作 π
(S)
28
定义 5.1.6
集合 S 等价系。有等的集 S 于关 集,
S/
注意,S 的商集 S/ 里的元素是 S 的子集,不是 S 的元素。
是集 S 上的一个价关系,一量或种表达式果对同一个等类里元素是相的,
那么称这种量或表达式是一个不变量。恰好能完全决定等价类的一组不变量称为完全不变量。
5.2 矩阵的相抵
数域 K 上所有 s × n 矩阵组成的集合记作 M
s×n
(K),当 s = n 时简记为 M
n
(K)
定义 5.2.1
对于数域 K 上的 s × n 矩阵 A B,如果 A 经过一系列初等行变换和初等列变换能变成矩阵
B,那么称 A B 是相抵的,记作 A
相抵
B
相抵是集合 M
s×n
(K) 上的一个二元关系,不难验证相抵是一个等价关系,其下矩阵 A 的等价类称为
A 的相抵类。
定理 5.2.2
设数域 K s × n 矩阵 A 的秩为 r,如果 r > 0,那么 A 相抵于下述形式的矩阵
E
r
0
0 0
!
称其为 A 的相抵标准形;如果 r = 0,那么相抵标准形是零矩阵。
定理 5.2.3
数域 K s × n 矩阵 A B 相抵当且仅当它们的秩相等,即矩阵的秩是相抵关系下的完全不
量。
5.3 广义逆矩阵
对于线性方程组 AX = β A 可逆时答案可以被直接表示为 X = A
1
β A 不可逆但方程有解
时,引入广义逆的概念来辅助分析。
定理 5.3.1
A
是数域
K
s
×
n
非零矩阵,则矩阵方程
AXA = A
29
一定有解。如果 rank(A) = r,并且
A = P
E
r
0
0 0
!
Q
其中 P, Q 分别是 K s 级、n 级可逆矩阵,那么矩阵方程的通解为
X = Q
1
E
r
B
C D
!
P
1
其中 B, C, D 分别是数域 K 上任意的 r × (s r), (n r) × r, (n r) × ( s r) 矩阵。
定义 5.3.2 广义逆
A 是数域 K s × n 非零矩阵,则矩阵方程 AXA = A 的每一个解都称为 A 的一个广义逆矩
阵,简称广义逆。用 A
表示。
定理 5.3.3
非齐次线性方程组 AX = β 有解的充分必要条件是
β = AA
β
证明 必要性:设 AX = β 有解 α,则
β = Aα = AA
Aα = AA
β
充分性:若 β = AA
β,显然 A
β AX = β 的解。
定理 5.3.4
非齐次线性方程组 AX = β 有解时,它的通解为
X = A
β
定理 5.3.5
数域 K n 元齐次线性方程组 AX = 0 的通解为
X = (E
n
A
A)Z
其中 A
A 的任意一个广义逆,Z 取遍 K
n
中任意列向量。
定理 5.3.6
数域 K n 元非齐次线性方程组 AX = β 的通解为
X = A
β + (E
n
A
A)Z
其中 A
A 的任意一个广义逆,Z 取遍 K
n
中任意列向量。
30
5.4 矩阵的相似
定义 5.4.1 矩阵相似
A B 都是数域 K n 级矩阵,如果存在数域 K 上一个 n 级可逆矩阵 P ,使得
P
1
AP = B
那么称 A B 是相似的,记作 A B
同样相似是集合 M
s×n
(K) 上的一个二元关系,不难验证相似是一个等价关系,其下矩阵 A 的等价类
称为 A 的相似类。相似的矩阵具有相等的行列式和秩。
定义 5.4.2
n 级矩阵 A = (a
ij
) 的主对角线上元素的称为 A 的迹,记作 tr(A)
不难验证矩阵的迹都有如下性质
tr(A + B) = tr( A) + tr( B)
tr(kA) = k tr(A)
tr(AB) = tr(BA)
定理 5.4.3
相似的矩阵都有相同的迹。
证明 不妨设 A = P
1
BP ,于是
tr(B) = tr(P
1
AP ) = tr((P
1
P )A) = tr(A)
这表明,矩阵的行列式、秩、迹都是相似关系下的不变量,简称为相似不变量。如果 n 级矩阵相似于
一个对角矩阵,那么称 A 可对角化
定理 5.4.4
数域 K n 级矩阵 A 可对角化的充分必要条件是,K
n
中有 n 个线性无关的列向量 α
1
, ··· , α
n
以及 K 中有 n 个数 λ
1
, ··· , λ
n
(它们之中有些可能相等),使得
Aα
i
= λ
i
α
i
, 1 i n
这时,令 P = (α
1
, ··· , α
n
),则
P
1
AP = diag{λ
1
, ··· , λ
n
}
证明 带入 AP = P D,注意到
AP = (Aα
1
, ··· , Aα
n
) = (λ
1
α
1
, ··· , λ
n
α
n
)D = P D
因此存在 Aα
i
= λ
i
α
i
31
5.4.5
如果 n 级矩阵 A 可对角化,求证:A 相似于 A
T
证明 即存在 P 使得 P
1
AP = D,其中 D 是对角阵,从而存在
D
T
= (P
1
AP )
T
= P
T
A
T
(P
T
)
1
因此 A D = D
T
A
T
5.4.6
如果 n 级矩阵 A, B 满足 AB BA = A,求证:A 不可逆。
证明 假设 A 可逆,两边乘 A
1
得到
B A
1
BA = E
从左边来看,有
tr(B A
1
BA) = tr( B) tr(A
1
BA) = tr( B) tr(B) = 0
因此 0 6= tr(E) = n 矛盾,故不可逆。
5.5 矩阵的特征值和特征向量
定义 5.5.1
A 是数域 K 上的一个 n 级矩阵,如果 K
n
中有非零列向量 α 使得
Aα = λ
0
α, λ
0
K
那么称 λ
0
A 的一个特征值,称 α A 的属于特征值 λ
0
的一个特征向量。
注意零向量不是特征向量。
定理 5.5.2
A 是数域 K 上的 n 级矩阵,则
1λ
0
A 的一个特征值当且仅当 λ
0
A 的特征多项式 |λE A| K 中的一个根。
2α A 的属于特征值 λ
0
的一个特征向量当且仅当 α 齐次线性方程 (λ
0
E A)X = 0
一个解。
λ
j
A 的一个特征值,把齐次线性方程组 (λ
j
E A)X = 0 的解空间称为 A 的属于 λ
j
的特征子
空间,其中的全部非零向量都是 A 的属于 λ
j
的全部特征向量。
定理 5.5.3
相似的矩阵有相等的特征多项式。
因此矩阵的特征多项式和特征值都是相似不变量。
32
定理 5.5.4
A n 级矩阵, A 的特征多项式 f (λ) = |λE A| 是一个 n 次多项式, [λ
n
]f = 1, [λ
n1
]f =
tr(A), [λ
0
]f = (1)
n
|A|
定义 5.5.5
A 是数域 K 上的 n 级矩阵,λ
1
A 的一个特征值。 A 的属于 λ
1
的特征子空间的维数叫做
特征值 λ
1
的几何重数,而把 λ
1
作为 A 的特征多项式根的重数叫做 λ
1
的代数重数。代数重数简称
为重数。
定理 5.5.6
λ
1
是数域 K 上的 n 级矩阵 A 的一个特征值,则 λ
1
的几何重数不超过它的代数重数。
5.5.7
A 是一个 n 级正交矩阵,证明:
1. 如果 A 有特征值,那么它的特征值是 1 1
2. 如果 |A| = 1,那么 1 A 的一个特征值;
3. 如果 |A| = 1,且 n 是奇数,那么 1 A 的一个特征值。
证明 1)存在特征值即存在 λ 使得 Aα = λα,得到
α
T
α = (Aα)
T
(Aα) = (λα)
T
(λα) = λ
2
α
T
α
因此 λ = ±1
2)第四章证明过。
3)如果 |A| = 1,那么
|E A| = |AA
T
A| = (1)
n
|E A| = −|E A|
因此 1 是其特征值。
5.5.8
求矩阵的全部特征值和特征向量
A =
2 2 2
2 5 4
2 4 5
首先求出特征多项式
|λE A| = λ
3
12λ
2
+ 21 10 = (λ 1)
2
(λ 10)
解得 λ
1
= 1, λ
2
= 10。首先解方程 (λ
1
E A)X = 0,得到基本解系
α
1
= (2, 1, 0)
T
, α
2
= (2, 0, 1)
T
, α
3
= (1, 2, 2)
T
33
5.6 矩阵可对角化的条件
定理 5.6.1
数域 K n 级矩阵 A 可对角化的充分必要条件是 A n 个线性无关的特征向量 α
1
, ··· , α
n
时令
P = (α
1
, ··· , α
n
)
P
1
AP = diag{λ
1
, ··· , λ
n
}
其中 λ
i
α
i
所属的特征值。上述对角矩阵称为 A 的相似标准形。
定理 5.6.2
λ
1
, λ
2
是数域 K n 级矩阵 A 的不同特征值,α
1
, ··· , α
s
β
1
, ··· , β
r
分别是 A 的属于 λ
1
, λ
2
的线性无关的特征向量,则 α
1
, ··· , α
s
, β
1
, ··· , β
r
线性无关。
定理 5.6.3
λ
1
, ··· , λ
m
是数域 K n 级矩阵 A 的不同特征值,α
j1
, ··· , α
jr
j
A 的属于 λ
j
的线性无关
的特征向量,j = 1, ··· , m,则向量组
α
11
, ··· , α
1r
1
, ··· , α
m1
, ··· , α
1r
m
线性无关。
定理 5.6.4
数域 K n 级矩阵 A 可对角化的充分必要条件是:A 的特征多项式的全部复根都属于 K,并且
A 的每个特征值的几何重数等于它的代数重数。
5.7 实对称矩阵的对角化
若对于 n 级矩阵 A, B,存在一个 n 级正交矩阵 T ,使得 T
1
AT = B,那么称 A 正交相似于 B
定理 5.7.1
实对称矩阵的特征多项式的每一个复根都是实数,从而它们都是特征值。
定理 5.7.2
实对称矩阵 A 的属于不同特征值的特征向量是正交的。
定理 5.7.3
实对称矩阵一定正交相似于对角矩阵。
34
对于 n 级实对称矩阵 A,找一个正交矩阵 T ,使得 T
1
AT 为对角矩阵的步骤如下。
1. 计算 |λE A|,求出它的全部不同的根:λ
1
, ··· , λ
m
,它们是 A 的特征值。
2. 对于每一个特征值 λ
j
,求 (λ
j
E A)X = 0 的一个基础解系 α
j1
, ··· , α
jr
j
;然后把它们 Schmidt
正交化和单位化,得到 η
j1
, ··· , η
jr
j
。它们也是 A 的属于 λ
j
的一个特征向量。
3.
T = (η
11
, ··· , η
1r
1
, ··· , η
m1
, ··· , η
mr
m
)
T n 级正交矩阵,且
T
1
AT = diag{λ
1
, ··· , λ
1
, ··· , λ
m
, ··· , λ
m
}
5.7.4
给定实矩阵 A,求正交矩阵 T 使得 T
1
AT 为对角矩阵
A =
0 2 2
2 3 4
2 4 3
首先求得特征多项式
|λE A| = (λ 1)
2
(λ + 8)
得到特征值为 1, 8,分别求得 (λE A)X = 0 的基础解系
α
1
= (2, 0, 1)
T
, α
2
= (2, 1, 0)
T
, α
3
= (1, 2, 2)
T
正交归一化后得到
η
1
=
2
5
, 0,
1
5
T
, α
2
=
2
3
5
,
5
3
,
4
3
5
!
T
, η
3
=
1
3
,
2
3
,
2
3
T
因此
T =
2
5
2
3
5
1
3
0
5
3
2
3
1
5
4
3
5
2
3
35
第六章 二次型·矩阵的合同
6.1 二次型及其标准型
定义 6.1.1 二次型
数域 K 上的一个 n 元二次型是系数在 K 中的 n 个变量的齐次多项式,它的一般形式是
f(x
1
, ··· , x
n
) =
n
X
i
=1
n
X
j=1
a
ij
x
i
x
j
其中 a
ij
= a
ji
把二次型的系数按原来顺序排成一个 n 级矩阵 A则称 A 是二次型 f(x
1
, ··· , x
n
) 的矩阵,它是对称
矩阵。
再令 X = (x
1
, ··· , x
n
)
T
,则二次型可以写作
f(x
1
, ··· , x
n
) = X
T
AX
Y = ( y
1
, ··· , y
n
)
T
,设 C 是数域 K 上的 n 级可逆矩阵,则关系式
X = CY
变量 x
1
, ··· , x
n
y
1
, ··· , y
n
个非退线换。 C 阵,
X = CY 称为正交替换。
定义 6.1.2
数域上两个 n 元二次型 X
T
AX Y
T
AY ,如果存在一个非退化线性替换 X = CY ,把 X
T
AX
变成 Y
T
BY 那么称二次型 X
T
AX Y
T
BY 等价,记作 X
T
AX
=
Y
T
BY
定义 6.1.3
数域 K 上两个 n 级矩阵 A B,如果存在 K 上的一个 n 级可逆矩阵 C,使得
C
T
AC = B
那么称 A B 合同,记作 A ' B
带入 X
T
AX 可以发现
X
T
AX = (CY )
T
A(CY ) = Y
T
(C
T
AC)Y
36
即二次型 X
T
AX Y
T
AY 等价当且仅当 A, B 合同。
如果二次型 X
T
AX 等价于一个只含平方项的二次型,那么这个只含平方项的二次型称为 X
T
AX
一个标准形。如果 A 合同于一个对角矩阵,则这个对角矩阵称为 A 的一个合同标准型。
对于 n 级实对称矩阵 A,存在 n 级的正交矩阵 T 使得
T
1
AT = diag{λ
1
, ··· , λ
n
}
其中 λ
1
, ··· , λ
n
A 的全部特征值,因此 A 合同于 T
1
AT 从而在 X = T Y 的替换下,得到一个标准
λ
1
y
2
1
+ λ
2
y
2
2
+ ··· + λ
n
y
2
n
定理 6.1.4
数域 K 上的任一对称矩阵都合同于一个对角矩阵。
这意味着数域 K 上任一 n 元二次型都等价于一个只含平方项的二次型。有一个新方法来求得基本型:
对于 X
T
AX,对 A 做初等行列变换,仅对 E 做其中的初等列变换
A
E
!
D
C
!
得到对角矩阵 D = diag d
1
, ··· , d
n
,则
C
T
AC = D
X = CY ,则得到 X
T
AX 的一个标准型。
二次型 X
T
AX 的矩阵 A 的秩就称为二次型 X
T
AX 的秩。
6.1.5
用正交替换把下述实二次型化为标准型
f(x, y, z) = x
2
+ 2y
2
+ 3z
3
4xy 4yz
首先得到矩阵
A =
1 2 0
2 2 2
0 2 3
计算其特征值
|λE A| = (λ 2)(λ 5)(λ + 1)
A 的全部特征值为 λ = 2, 5, 1,对应的基础解系单位化得到
η
1
=
2
3
,
1
3
,
2
3
T
, η
2
=
1
3
,
2
3
,
2
3
T
, η
3
=
2
3
,
2
3
,
1
3
T
T =
2
3
1
3
2
3
1
3
2
3
2
3
2
3
2
3
1
3
37
此处 T 即是正交矩阵,且 T
1
AT = diag{2, 5, 1}。令
(x, y, z)
T
= T (a, b, c)
T
f(x, y, z) = 2a
2
+ 5y
2
z
2
6.2 实二次型的规范形
实数域上的二次型简称为实二次型,n 元实二次型 X
T
AX 经过一个适当的非退化线性替换 X = CY
可以化成下述形式的标准形
d
1
y
2
1
+ ··· + d
p
y
2
p
d
p+1
y
2
p+1
··· d
r
y
2
r
其中 d
i
> 0, i = 1, ··· , r。再做一次非退化线性替换可以变成
z
2
1
+ ··· + z
2
p
z
2
p+1
··· z
2
r
定理 6.2.1
n 元实二次型 X
T
AX 的规范形是唯一的。
定义 6.2.2
在实二次型 X
T
AX 的规范形中,系数为 +1 的平方项个数 p 称为 X
T
AX 的正惯性指数,系数为
1 的平方项个数 r p 称为 X
T
AX 负惯性指数;正惯性指数减去负惯性指数所得的 2p r
称为 X
T
AX 的符号差。
任一 n 级实对称矩阵合同于对角矩阵 diag{1, ··· , 1, 1, ··· , 1, 0, ··· , 0}其中 0 的个数等于 X
T
AX
的正惯性指数,1 的个数等于 X
T
AX 的负惯性指数(也分别称作 A 的惯性指数),这个对角举着称为
A 的合同规范形。
现讨论复数域上的二次型,简称为复二次型。 n 元复二次型 X
T
AX 经过一个适当的非退化线性替
X = CY 变成下述形式的标准形
d
1
y
2
1
+ ··· + d
r
y
2
r
其中 d
i
6= 0, i = 1, ··· , nr 是这个二次型的秩。再做一个非退化线性替换可得
z
2
1
+ ··· + z
2
r
把这个标准形叫做复二次型 X
T
AX 的规范形,显然其完全由其秩决定,故只有一种形式。
6.3 正定二次型与正定矩阵
定义 6.3.1
n 元实二次型 X
T
AX 称为正定的,如果对于 R
n
中任一非零列向量 α,都由 α
T
> 0
38
定理 6.3.2
n 元实二次型 X
T
AX 是正定的当且仅当它的正惯性系数等于 n
定义 6.3.3
实对称矩阵 A 称为正定的,如果实二次型 X
T
AX 是正定的。
正定的实对称矩阵简称为正定矩阵。
定理 6.3.4
实对称矩阵 A 是正定的充分必要条件是 A 的说有顺序主子式全大于 0
定义 6.3.5
实对称矩阵 A 称为半正定(负定,半负定,不定)的,如果实二次型对于 R
n
中任一非零列向量 α
都有
α
T
0 (α
T
< 0, α
T
0)
如果 X
T
AX 既不是半正定的,又不是半负定的,那么称它是不定的。
定义 6.3.6
实对称矩阵 A 称为半正定(负定,半负定,不定)的,如果实二次型 X
T
AX 是半正定(负定,
负定,不定)的。
定理 6.3.7
n 级实对称矩阵 A 是半正定的,当且仅当 A 的所有主子式全非负。
定理 6.3.8
实对称矩阵 A 负定的充分必要条件是:它的奇数阶顺序主子式全小于 0偶数阶顺序主子式全大于
0
定理 6.3.9
设二元实值函数 F (x, y) 有一个稳定点 α = (x
0
, y
0
) (即 F (x, y) (x
0
, y
0
) 的一阶偏导数全
0。设 F (x, y) (x
0
, y
0
) 的一个邻域内有 3 阶连续偏导数。令
H =
F
′′
xx
(x
0
, y
0
) F
′′
xy
(x
0
, y
0
)
F
′′
yx
(x
0
, y
0
) F
′′
yy
(x
0
, y
0
)
!
H F (x, y) (x
0
, y
0
) 处的黑塞Hesse矩阵。如果 H 是正定的,那么 F (x, y) (x
0
, y
0
)
达到极小值。如果 H 是负定的,那么 F (x, y) (x
0
, y
0
) 处达到极大值。
其可推广到 n 元函数的情形: F (x
1
, ··· , x
n
) 有一个稳定点 α = (a
1
, ··· , a
n
) F (x
1
, ··· , x
n
)
39
α 的一个邻域内有 3 阶连续偏导数,令
H = (F
′′
x
i
x
j
(α))
H F (x
1
, ··· , x
n
) α 处的黑塞矩阵。如果 H 正定的,那 F (x
0
, y
0
) 处达到极小值。如果
H 是负定的,那么 F (x
0
, y
0
) 处达到极大值。
40
第七章 多项式环
7.1 一元多项式环
定义 7.1.1 一元多项式
数域 K 上的一元多项式是指如下述的表达式
a
n
x
n
+ ··· + a
1
x + a
0
其中 x 是一个符号(它不属于 K称为不定元,n 是非负整数,a
i
K(i = 0, ··· , n) 称为系数,a
i
x
i
称为 i 次项(i = 1, ··· , na
0
称为零次项或常数项。
两个这种形式的表达式相等规定为它们含有完全相同的项。此时符号 x 为不定元。系数全 0 的多
项式称为零多项式,记作 0
因此元多等当当它次项相等等,即一式的式是
的。
我们常常用 f(x), g(x), h(x), ··· f, g, h, ··· 表示一元多项式。
一元多项式的重要特点是它有次数概念。设
f(x) = a
n
x
n
+ ··· + a
1
x + a
0
如果 a
n
6= 0,那么称 a
n
x
n
f(x) 的首项,称 n f(x) 的次数,记作 deg f(x )
零多项式的次数定义为 −∞,并且规定对于任意 n N
(
−∞
) + (
−∞
)
:
= −∞
(−∞) + n
:
= −∞
−∞ < n
数域 K 上所有一元多项式组成的集合记作 K[x]。在 K[x] 中可以定义加法和乘法运算。
f(x) =
n
X
i=0
a
i
x
i
, g(x) =
m
X
i=0
b
i
x
i
,不妨设 m n,令
f(x) + g(x)
:
=
n
X
i=0
(a
i
+ b
i
)x
i
f(x)g(x)
:
=
m+n
X
s=0
X
i+j=s
a
i
b
j
!
不难验证,一元多项式的加法满足交换律、结合律。同样,其适合消去律
f(x)g(x) = f(x)h(x) f(x) 6= 0 g(x) = h(x)
41
环的基本概念 集合 S 上的一个代数运算,是指 S × S S 的一个映射。
定义 7.1.2
R 是一个非空集合,如果其上定义了加法和乘法两个代数运算,并且满足如下六条运算法则,
a, b, c R
1. 加法结合律 (a + b) + c = a + (b + c)
2. 加法交换律 a + b = b + a
3. R 中有元素 0,使得 a + 0 = a,称 0 R 的零元素。
4. 对于 a,在 R 中有元素 d,使得 a + d = 0,称 d a 的负元素,记作 a
5. 乘法结合律 (ab)c = a(bc)
6. 乘法对于加法的分配律 a(b + c) = ab + ac, (b + c)a = ba + ca
那么称 R 是一个环。
定理 7.1.3
R 中的零元素是唯一的,元素 a 的负元素是唯一的。
于是环上可以定义减法:
a b
:
= a + (b)
若环中的乘法还满足交换律,则称 R 为交换环。
若环 R 中有一个元素 e 具有性质:
ea = ae = a, a R
则称 e R 的单位元,此时称 R 是有单位的单位环。不难证明,在有单位元的环 R 中,单位元是唯一的,
通常记其为 1
如果 R 中有元素 a 对于给定的 b 6= 0 使得 ab = 0,则称 a 为一个左零因子。左、右零因子都简称为
零因子。若存在元素 0 使得
0a = a0 = 0, a R
则称 a 为平凡的零因子,其余的则称为非平凡的。
若环 R 中没有平凡的零因子,那么称 R 是无零因子环。有单位元 1(6= 0) 的无零因子的交换环称为整
环。Z, K, K[x] 都是整环;M
n
(K) 不是整环,因为它不满足乘法交换律,且它有非平凡的零因子。
若环 R 的一个非空子集 R
1
对于 R 的加法和乘法也称为一个环,那么称 R
1
R 的一个子环。明显
R
1
对加法和乘法封闭。
定理 7.1.4
R 的非空子集 R
1
为子环的充要条件为 R
1
对减法与乘法封闭。
定义 7.1.5
设具有单位元 1
的交换环 R 有一个子环 R
1
,若满足
1. 1
R
1
2. 双射 τ : K R
1
,且 τ 保持加法与乘法运算。
那么 R 可看作 K 的一个扩环
42
双射 τ 具有性质:τ(1) = 1
定理 7.1.6
K 是一个数域,R K 的一个扩环,任意给定 t R,令
σ
t
: K[x] R, f (x) =
n
X
i=0
a
i
x
i
7→ f(t)
:
=
n
X
i=0
τ(a
i
)t
i
σ
t
K[x] R 的一个映射, σ
t
保持加法和乘法运算。 σ
t
(x) = t映射 σ
t
称为 x t
入。
7.2 整除关系,带余除法
f(x), g(x) K[x]如果存在 h(x) K[x] 使得 f (x) = h(x)g(x),那么 g(x) 整除 f(x),记作
g(x) | f(x);否则记 g(x) f(x)。称 g(x) f(x) 的一个隐式,f(x) g(x) 的一个倍式。
整除是集合 K[x] 中的一个二元关系,它具有反身性和传递性。
定义 7.2.1
f(x) | g(x) g(x) | f(x),那么称 f(x) g(x) 相伴,记作 f(x) g(x)
f(x) g(x) 当且仅当存在 c K
使得 f(x) = cg(x)
定义 7.2.2 带余除法
f(x), g(x) K[x],且 g(x) 6= 0,则在 K[x] 中存在唯一的一对多项式 h( x) , r(x),使得
f(x) = h(x)g(x) + r ( x) , deg r(x) < deg g(x)
其中 f(x), g(x) 分别叫做被除式、除式。h(x), r(x) 分别叫商式、余式。此式称为除法算式。
整数环 Z 中也有带余除法。
定理 7.2.3
任给 a, b Z, b 6= 0,则存在唯一的一对整数 q, r,使得
a = qb + r, 0 r < |b|
7.3 最大公因式
K[x] 中,若 c(x) | f(x) c(x) | g(x),则称 c(x) f (x) g(x) 的一个公因式。
定义 7.3.1
K
[
x
]
中多项式
f
(
x
)
g
(
x
)
的一个公因式
d
0
(
x
)
如果满足:对于任意的公因
d
(
x
)
,都有
d
(
x
)
|
d
0
(x),那么称 d
0
(x) f(x) 的一个最大公因式。
43
显然两个最大公因式总是相伴的。首项系数为 1 的最大公因式称为 f(x) g(x) 首一最大公因式,
gcd(f(x), g(x)) 或直接表述为 (f (x), g(x))
引理 7.3.2
K[x] 中,如果有
f(x) = h(x)g(x) + r ( x)
那么
f(x) g(x) 的最大公因式
=
g(x) r(x) 的最大公因式
于是可以用辗转相除法求出 f(x) g(x) 的最大公因式,其中 g(x) 6= 0
定理 7.3.3
对于 K[x] 中任意两个多项式 f(x) g(x)存在它们的一个最大公因式 d(x)并且存在 u(x) , v(x)
K[x] 使得
d(x) = u(x)f(x) + v(x)g(x)
定义 7.3.4
K[x] 中若 gcd(f(x), g(x)) = 1,那么称 f(x) g(x) 互素。
于是
定义 7.3.5
K[x] 中多项式 f(x), g(x) 互素的充要条件是:存在 u(x), v(x) K[x],使得
u(x)f(x) + v(x)g(x) = 1
7.4 不可约多项式,唯一因式分解定理
下文中,f(x) K[x] 中一个次数大于 0 的多项式。
定义 7.4.1
f(x) K[x] 中的因式只有 K 中的非零数和 f (x) 相伴元,则称 f (x) 数域 K 上的一个不
可约多项式,否则称为可约的。
定理 7.4.2
p(x) K[x] 中一个次数大于 0 的多项式,则下列命题等价。
1p(x) 是不可约多项式;
2f(x) K[x],有 p(x ) | f (x) (p(x), f (x)) = 1
3)在 K[x] 中,从 p(x) | f(x)g(x) 可推出
p(x) | f(x) p(x) | g(x)
44
4p(x) 不能分解为两个多项式之积。
定理 7.4.3
f(x) 能够唯一的分解为数域 K 上有限多个不可约多项式的乘积。
在整数环 Z 中也有唯一因子分解定理。
定义 7.4.4
一个大于 1 的整数 m,如果其正因数只有 1 和它自身,那么称 m 是一个素数;否则称 m 为合数。
定理 7.4.5
p 为大于 1 的整数,则下列命题等价
1p 是一个素数。
2)对任意整数 a,都有 p | a (p, a) = 1
3)在 Z 中,从 p | ab 可推出 p | a p | b
4p 不能分解为两个较小的正整数之积。
定理 7.4.6 算术基本定理
任意大于 1 的整数 a 都能唯一的分解为有限多个素数的乘积。
7.5 重因式
定义 7.5.1
K[x] 中,不可约多项式 p(x) 果满足 p
k
(x) | f (x) p
k+1
(x) | f (x),则 p(x) 称为 f (x) k
因式,
k = 1 时,称 p(x) f(x) 的单因式。
定义 7.5.2
对于 K[x] 中的多项式
f(x) = a
n
x
n
+ a
n1
x
n1
+ ···a
1
x + a
0
我们定义 f(x) 的导数
f
(x)
:
= na
n
x
n1
+ (n 1)a
n1
x
n2
+ ···a
1
显然一个 n 次多项式的导数是一个 n 1 次多项式;它的 n 阶导数是 K 中的一个非零数。
45
定理 7.5.3
K[x] 中,不可约多项式 p(x) f(x) 的一个 k 1 次重因式, p(x ) f
(x) 的一个 k 1
因式。特别的,f(x) 的单因式不是 f
(x) 的因式。
7.6 多项式的根
定理 7.6.1
K[x] 中,用 x a 去除 f(x) 所得的余式是 f(a)
显然有
定理 7.6.2 Bezout 定理
K[x] 中,x a f(x) 的一次因式当且仅当 a f(x) K 中的一个根。
定理 7.6.3
K[x] 中, f(x) g(x) 的次数都不超过 n如果 K 中有 n + 1 个不同的数 c
1
, ··· , c
n+1
使得
f(c
i
) = g(c
i
),则 f(x) = g(x)
该定理说明了一元多项式 f(x) 与多项式函数 f 等同看待。即映射 f : a 7→ tof(a), a K称为由多
项式 f(x) 诱导的多项式函数,即 K 上的一元多项式函数。
把数域 K 上所有一元多项式函数组成的集合记作 K
pol
,在此集合中规定
(f + g)(a)
:
= f(a) + g(a), (fg)(a)
:
= f(a)g(a)
K
pol
是一个有单位元的交换环,称它为 K 上的一元多项式函数环。
定义 7.6.4
R R
两个环,存在双射 σ : R R
,它保持加法和乘法运算,那么称 σ 是环 R R
的一
个同构映射。此时称 R R
同构,记作 R
=
R
对于数域
K
上,显然有
K[x]
=
K
pol
从而可以把数域 K 上的一元多项式 f(x) 与数域 K 上的一元多项式函数 f 等同起来。
现在研究复数域上的不可约多项式有哪些。设
f(x)
:
= a
n
x
n
+ ··· + a
1
x + a
0
C[x]
deg f(x) = n > 0,假如 f(x) 没有负根,则 z C,有 f (z) 6= 0. 于是函数
Φ(z) =
1
f(z)
的定义域为 C。可以验证,Φ(z) 在复平面 C 的每一个点都有导数,此时称 Φ(z) C 上解析。
46
定理 7.6.5 代数基本定理
每一个次数大于 0 的复系数多项式至少有一个复根。
定理 7.6.6
每一个次数大于 0 的复系数多项式在复数域上都可以唯一的分解成一次因式的乘积。
回到定理:数域 K 上次数不超过 n 的多项式被它在 K 中的 n + 1 个不同元素的值唯一的确定。
定理 7.6.7
c
0
, ··· , c
n
,数域 K n + 1 个不同的数 d
0
, ··· , d
n
K,则 K[x] 中存在唯一的一个次数不超
n 的多项式 f(x) 使得 f(c
i
) = d
i
证明 构造
f(x) =
n
X
i=0
d
i
(x c
0
) ···(x c
i1
)(x c
i+1
) ···(x c
n
)
(c c
0
) ···(c c
i1
)(c c
i+1
) ···(c c
n
)
不难验证 f(c
j
) = d
j
构造出的多项式 f(x) 称为 Lagrange 插值公式。类似的还有 Newton 插值公式。
f(x) = u
0
+ u
1
(x c
0
) + u
2
(x c
0
)(x c
1
) + ··· + u
n
(x c
0
) ···(x c
n1
)
其中系数 u
i
可以用待定系数法求出。不过既然都待定系数了,直接设
f(x) = a
n
x
n
+ ···a
1
x + a
0
解方程组即可,其的系数行列式是 Vandermonde 行列式,于是必有解。
7.7 实数域上的不可约多项式·实系数多项式的根
定理 7.7.1
f(x) 是实系数多项式,如果 c f (x) 的一个复根,那么 c 也是 f(x ) 的一个复根。
定理 7.7.2
实数域上的不可约多项式只有一次多项式和判别式小于 0 的二次多项式。
定理 7.7.3
每一个次数大于 0 的实系数多项式 f(x) 在实数域上都可以唯一地分解称一次因式与判别式小于 0
的二次因式的乘积。
47
7.8 有理数域上的不可约多项式
定义 7.8.1
一个非零的整系数多项式 g(x)如果它的各项系数的最大公因数只有 ±1则称 g(x) 是一个本原多
项式。
显然两个本原多项式 g(x), h(x) Q[x] 中相伴当且仅当 g(x) = ±h(x)
定理 7.8.2 Gauss 引理
两个本原多项式的乘积还是本原多项式。
定理 7.8.3
f(x) = a
n
x
n
+ a
n1
x
n1
+ ··· + a
1
x + a
0
是一个次数 n 大于 0 的整系数多项式。 p/q f(x) 的一个有理根,其中 p, q 互素, p | a
n
, q | a
0
定理 7.8.4 Eisenstein 判别法
f(x) = a
n
x
n
+ a
n1
x
n1
+ ··· + a
1
x + a
0
是一个次数 n 大于 0 的本原多项式。若存在素数 p 使得
1. p | a
i
, i = 0, ···n 1
2. p a
n
p
2
a
0
那么 f(x) Q 上不可约。
定理 7.8.5
f(x) = a
n
x
n
+ a
n1
x
n1
+ ··· + a
1
x + a
0
是一个次数 n 大于 0 的整系数多项式。若存在素数 p 使得
p
|
a
i
, i
= 1
,
···
, n, p
a
0
p
2
a
n
f(x) Q 上不可约。
48
7.9 多元多项式环
定义 7.9.1
K 是一个数域,用不属于 K n 个符号 x
1
, ··· , x
n
作表达式
X
i
1
,···,i
n
a
i
1
,···,i
n
x
i
1
1
···x
i
n
n
其中
a
i
1
···i
n
K 称为系数,表达式每一项称为单项式。两个这种形式的表达式相等当且仅当他们
除去系数为 0 的单项式外含有完全相同的单项式。
7.10 域与域上的一元多项式环
数域 K 上的一元多项式环 K[x] 中有加法和乘法。现在我们试图引进分式的概念。
定义多项式的有序 (f(x), g(x)),其中 g(x) 6= 0,记全体二元组的集合是 T = K[x]
+
× K[x]
+
。我
们约定
(f
1
, g
1
) (f
2
, g
2
) f
1
g
2
= g
1
f
2
于是 T 上有了等价关系。 T 上等价关系 商集为 K(x)其中的元素 (f, g) 也可记作 f/g定义 K(x)
上的加法
(f
1
, g
1
) + (f
2
, g
2
)
:
=
f
1
g
2
+ g
1
f
2
g
1
g
2
(f
1
, g
1
) · (f
2
, g
2
)
:
=
f
1
f
2
g
1
g
2
定义加法逆元 (f, g)
:
= (f, g) 和乘法逆元 (f, g)
1
:
= (g, f)可以验证 (f, 1) f 有相同的性状,我们
可以令其相等,从而把多项式嵌入到分式内。于是可以在 K(x) 上定义减法和除法。
可以发现 K(x) 与有理数集 Q 有很多的相似之处。抽象出域的概念。
定义 7.10.1
一个有单位元 1(6= 0) 的交换环 F 如果它的每个非零元都可逆,那么称 F 是一个域。
K(x) 中的元素 f/g 记称 K 上的一元分式,其中 f 称为分子,g 称为分母。定义分式 f/g 的次数
deg f deg g特殊的,分式 0/1 的次数为 −∞如果分式的分子与分母是互素的,那么称它是既约分
式。
类似于一元分式域的构造方法,我们可以构造出 n 元分式域,记作 K(x
1
, ··· , x
n
)
一般的,设 m 是大于 1 的正整数,在 Z 中规定
a b (mod m) m | a b
这给出了 Z 上的模 m 同余关系。模 m 同余关系具有性质:若 a b (mod m), c d (mod m),则
i = {a Z | a i (mod m)} = {km + i | k Z}
该关系划分出 Z 的商集 Z
m
Z/(m)
Z
m
中可以规定加法和乘法运算
i + j
:
= i + j, ij
:
= ij
49
不难验证,Z
m
十一个有单位元 1(6= 0) 的交换环,称为模 m 剩余环类。
p 是素数,则 Z
p
是一个域,称为模 p 剩余类域。
定义 7.10.2
设域
F
的单位元为
e
,如果对任意
n
N
+
都有 ne 6= 0,则称 F 的特征 char F = 0。若存在素数
p 使得 pe = 0,而对于 0 < l < p le 6= 0,则 char F = p
定理 7.10.3 中国剩余定理
m
1
, ··· , m
s
是两两互素的正整数,b
1
, ··· , b
s
是任意给定的 s 个整数,则同余方程组
x b
i
(mod m
i
), i = 1, ··· , s
Z 中必有解,并且如果 c d 是两个解,那么
c d (mod
Y
m
i
)
50
第八章 线性空间
8.1 F 上的线性空间的基与维数
定义 8.1.1 线性空间
设非空集合 V ;设数域 F 。在其上有向量的加法和纯量与向量的乘法。若满足以下公理
A1 加法结合律:(α + β) + γ = α + (β + γ)
A2 加法交换律:α + β = β + α
A3 加法存在单位元 0α + 0 = α
A4 加法逆元的存在性:对任意的 α V 总存在 α V ,使得 α + (α) = 0
M1 乘法结合律:λ(µα) = (λµ)α
M2 乘法存在单位元 11α = 1
D1 分配律 1λ(α + β) = λα + λβ
D2 分配律 2(λ + µ)α = λα + µα
那么称 V 是域 F 上的一个线性空间,V 的元素称为向量,F 的元素称为纯量。
8 大运算法则可以推导出线性空间 V 的一些简单性质。
定理 8.1.2
线性空间 V 中零元素是唯一的。
对于 V 中的一组向量,α
1
, ··· , α
s
,域 F 中的一组元素 k
1
, ··· , k
s
,作纯量乘法和加法可得
k
1
α
1
+ ··· + k
s
α
s
称该向量为 α
1
, ··· , α
s
的一个线性组合。
α
1
, ··· , α
s
这样有次序的有限多个向量称 V 一个向量组。若 V 中的一个向量 β 可以表示成
向量组 α
1
, ··· , α
s
的一个线性组合,那么称 β 可以由向量组 α
1
, ··· , α
s
线性表出。
定义 8.1.3 线性相关
对于向量组 α
1
, ··· , α
s
,若存在一组不全为 0 的元素 k
1
, ··· , k
s
使得
k
1
α
1
+ ··· + k
s
α
s
= 0
则称该向量组线性相关。
51
定义 8.1.4
在域 F 上的线性空间 V 中,向量组 α
1
, ··· , α
s
的一个部分组称为一个极大线性无关组,若这个组
本身是线性无关的,但是从这个向量组的其余向量(如果还有的话)中任取一个添加进去,得到的
新的部分组都线性无关。
定义 8.1.5
如果向量组 α
1
, ··· , α
s
的每一个向量都可以由向量组 β
1
, ··· , β
r
线性表出,那么称向量组 α
1
, ··· , α
s
可以由向量组 β
1
, ··· , β
r
线性表出。如果向量组 α
1
, ··· , α
s
β
1
, ··· , β
r
可以互相线性表出,则称
两个向量组等价,记作
{α
1
, ··· , α
s
}
=
{β
1
, ··· , β
r
}
显然一个向量组与其任意一个极大线性无关组等价。
定理 8.1.6
设域 F 上的线性空间 V 中向量组 β
1
, ··· , β
r
可以由向量组 α
1
, ··· , α
s
线性表出,如果 r > s,那
么向量组 β
1
··· , β
r
线性相关。
容易据此推出,一个向量组的任意两个极大无关组所含的向量个数相等。
定义 8.1.7
向量组的极大线性无关组所含的向量个数称为这个向量组的秩。
定义 8.1.8
V 是域 F 上的线性空间,V 中的向量集 S 如果满足下述两个条件:
1)向量集 S 是线性无关的。
2V 中每一个向量都可以由向量集 S 线性表出。
那么称 S V 的一个基。当 S 是有限集时,把 S 的元素排序得到一个向量组,此时称这个向
组是 V 的一个有序基,简称基。
只含有零向量的线性空间的基为空集。
定理 8.1.9
任意域上的任意线性空间都存在一个基。
定义 8.1.10
V 是域 F 上的线性空间,如果 V 有一个基包含有限多个向量,那么称 V 是有限维的;如果 V
有一个基包含无穷多个向量,那么称 V 是无限维的。
如果域 F 上的线性空间 V 是有限维的,那么 V 的任意两个基所含向量的个数相等。
如果域 F 上的线性空间 V 是无限维的,那么 V 的任意一个基都包含无穷多个向量。
52
定义 8.1.11
设域 F 的线性空间 V V 有限维的,那么 V 一个基所含向量的个数称为 V 维数,
记作 dim
F
V 或简记 dim V ;若 V 是无限维的,那么记 dim V =
设域 F 上的线性空间 V ,给定两个基
α
1
, ··· , α
n
; β
1
, ··· , β
n
V 中向量 α 在这两个基下的坐标分别为
X = ( x
1
, ··· , x
n
)
T
, Y = (y
1
, ··· , y
n
)
T
8.2 子空间及其交与和,子空间的直和
设域 F 上的线性空间 V ,若 U V 下的加法和纯量乘法封闭,则称 U V 的子空间。
不难验证 dim U dim V
可以构造包含向量组 α
1
, ··· , α
s
最小的子空间:
hα
1
, ··· , α
s
i
:
= {k
1
α
1
+ ··· + k
s
α
s
| k
i
F }
也记作 L(α
1
, ··· , α
s
),称作由 α
1
, ··· , α
s
生成(张成)的线性子空间。
容易发现,向量组 α
1
, ··· , α
s
的一个极大线性无关组就是 hα
1
, ··· , α
s
i 的一个基,从而
dimhα
1
, ··· , α
s
i = rank{α
1
, ··· , α
s
}
定理 8.2.1
V
1
, V
2
都是域 F 上线性空间 V 的子空间,则 V
1
V
2
也是 V 的子空间。
然而 V
1
V
2
并不是 V 的一个线性子空间。构造包含 V
1
V
2
的一个子空间可以定义
V
1
+ V
2
:
= {α
1
+ α
2
| α
1
V
1
, α
2
V
2
}
不难验证,V
1
+ V
2
V 的子空间。
定理 8.2.2
设域 F 上的线性空间 V 的有限维子空间 V
1
, V
2
,则 V
1
V
2
, V
1
+ V
2
也是有限维的,且
dim V
1
+ dim V + 2 = dim( V
1
+ V
2
) + dim(V
1
V
2
)
定义 8.2.3 直和
设域 F 上线性空间 V 的两个子空间 V
1
, V
2
,若 V
1
+ V
2
中每个向量都能被唯一的表示为
α = α
1
α
2
, α
1
V
1
, α
2
V
2
则和 V
1
+ V
2
被称为直和,记作 V
1
V
2
。称 V
1
, V
2
互为补空间。
53
定理 8.2.4
设域 F 上线性空间 V 的两个子空间 V
1
, V
2
,下列命题等价
1)和 V
1
+ V
2
是直和。
2)和 V
1
+ V
2
中零向量的表法唯一。
3V
1
V
2
= 0
定理 8.2.5
设域 F 上线性空间 V 的两个有限维子空间 V
1
, V
2
,下列命题等价
1)和 V
1
+ V
2
是直和。
4dim(V
1
+ V
2
) = dim V
1
+ dim V
2
5V
1
的一个基与 V
2
的一个基合起来是 V
1
+ V
2
的一个基。
定义 8.2.6
设域 F 上线性空间 V 的子空间 V
1
, ··· , V
s
如果和 V
1
+ ···+ V
s
中每个向量 α 都能唯一的表示为
α = α
1
+ ··· + α
s
, α
i
V
i
那么和 V
1
+ ··· + V
s
称为直和,记作 V
1
··· V
s
s
M
i=1
V
i
8.3 域上线性空间的同构
定义 8.3.1 同构
设域 F 上的线性空间 V V
,若存在双射 σ : V V
且保持加法与纯量加法两种运算,即对于
任意 α, β V, k F
σ(α + β) = σ(α) + σ(β), σ(kα) = kσ(α )
那么称 σ V V
的一个同构映射,此时称 V V
是同构的,记作 V
=
V
定理 8.3.2
F 上两个有限维线性空间同构的充要条件是他们的维数相等。
有限域的元素个数 设有限域 F 的单位元是 e。若 char F = 0 F 中必然存在无穷多个元素 e, 2e, ···
因此 char p 必然是一个素数。设域 F 的特征为素数 p,令
F
p
= {0, e, 2e, ··· , (p 1)e}
不难证明 F
p
对于 F 的减法、乘法封闭,因此 F
p
F 一个子环,且 F
p
是一个交换环。任取 F 的一
个非零元 ie,由于 p i 因此 (i, p) = 1。从而存在 u, v Z 使得 ui, vp = 1。于是
e = (ui + vp)e = uie + vpe = (ue)( ie )
54
u = lp + r, 0 r < p
ue = (lp + r)e = lpe + re = re F
p
因此 ie F
p
中有逆元 re,从而 F
p
是一个域。从而 F 可以看作 F
p
上的线性空间,其中加法是域 F
加法,纯量加法是 F
p
中元素做 F 的乘法。由于 F 只含有有限多个元素,因此 F 也一定是有限维的。
不妨设为 n 维,则 F
=
F
n
p
。于是 F F
n
p
有一个双射 σ,从而 |F | = |F
n
p
|。由于
F
n
p
= {(a
1
, ··· , a
n
) | a
i
F
p
}
因此 |F
n
p
| = p
n
从而 |F | = p
n
。我们得到了
定理 8.3.3
F 是任意有限域,则 F 的元素个数是一个素数 p 的方幂,其中 p 是域 F 的特征。
8.4 商空间
为了在线性空间 V 上建立一个二元关系且使它是一个等价关系,可以先取 V 的一个子空间 W 然后
规定
α β α β W
这样就在 V 上建立了一个二元关系 ,不难验证其就是等价关系。对于 α V α 的等价类 α
α = {β V | β α} = {α + γ | γ W }
{α + γ | γ W } α + W ,称它为 W 的一个陪集,α 称为这个陪集的代表。从而
α + W = β + W α = β α β α β W
因此一个陪集 α + W 的代表不唯一。
对于上述等价关系 ,商集 V/ 记作 V /W ,称它是 V 对于子空间 W 的商集。即
V /W = {α + W | α V }
尝试在 V/W 中规定加法与纯量乘法运算
(α + W ) + (β + W )
:
= (α + β) + W
k(α + W )
:
= kα + W
不难验证,V/W 是域 F 上的一个线性空间,称作 V 对于 W 的商空间,其中的元素是 V 的一个等价类
而不是向量。
定理 8.4.1
设域 F 上的一个有限维线性空间 V ,若 W V 的一个子空间,则
dim(V /W ) = dim V dim W
余维数 有时会遇到线性空间 V 和它的子空间 W 都是无限维,而商空间 V/W 却是有限的情形。
55
定义 8.4.2 余维数
设域 F 上的线性空间 V 的一个子空间,若 V W 的商空间是有限维,那么 dim(V/W ) 称为
空间 W V 中的余维数,记作 codim
V
W
标准映射 设域 F 上的线性空间 V 及其子空间 W ,则有 V 到商空间 V /W 有一个很自然的映射
π : α 7→ α + W
称它为标准映射或典范映射。不难验证它是满射。
W 不是零子空间时,π 不是单射,商空间 V/W 的一个元素 α + W π 下的原像集是 W 的一个
陪集 α + W 。这表明 π 保持加法和纯量乘法运算。
定理 8.4.3
F 上线性空间 V 的任意子空间 W 的任意子空间 W 都有补空间。
56
第九章 线性映射
9.1 线性映射及其运算
定义 9.1.1 线性映射
设域 F 上两个线性空间 V, V
,若映射 A : V V
保持加法运算和纯量乘法运算,即
A(α + β) = A(α) + A(β), A(kα) = kA(α)
则称 A V V
的一个线性映射。
线性空间 V 到自身的线性映射通常称为 V 上的线性变换, F 上线性空间 V F 的线性映射称为
V 上的线性函数。
A(α) 也可写成 Aα
特殊的, V 映射到 V
的零向量是零映射,记作 0V 上映射到自身的变换叫做恒等变换,记作 I
映射 α kα 的变换叫由 k 决定的数乘变换,记作 k
定积分 J(f( x )) =
Z
b
a
f(x) dx 也是 C[a, b] R 的一个线性映射。
线性映射的存在性
定理 9.1.2
设域 F 上的线性空间 V, V
,且 V 是有限维的。从 V 中取一个 α
1
, ··· , α
n
,从 V
任意取定 n
个向量 γ
1
, ··· , γ
n
(可以有相同),令
A : V V
, α =
n
X
i=1
α
i
α
i
7→
n
X
i=1
α
i
γ
i
A V V
的一个线性映射,且 A(α
i
) = γ
i
设域 F 上的线性空间 V 有两个子空间 U, W V = U W 。任取 α V ,设 α = α
1
+ α
2
, α
1
U, α
2
W 。令
P
U
: V V, α 7→ α
1
P
U
V 上的一个线性变换。称 P
U
是平行于 W U 上的投影,它满足
P
U
(α) =
α, α U
0, α W
可以证明,满足该式的投影变换是唯一的。
57
类似的,定义 P
W
(α) = α
2
,称它为平行于 U W 的投影。
定义 9.1.3 幂等变换
线性空间 V 上的线性变换 A 如果满足 A
2
= A,则称 A 是幂等变换。
定义 9.1.4
线性空间 V 上的两个线性变换 A, B 如果满足 AB = BA = 0,则称 A B 正交。
任取 α V ,设 α = α
1
+ α
2
, α
1
U, α
2
W ,则
P
2
U
(α) = P
U
(P
U
(α)) = α
1
= P
U
(α)
P
2
W
(α) = P
W
(P
W
(α)) = α
1
= P
W
(α)
P
U
P
W
(α) = P
U
(α
2
) = 0 = P
W
(α
1
) = P
W
P
U
(α)
由此得出
P
2
U
= P
U
, P
2
W
= P
W
, P
U
线性映射的运算 设域 F 上的线性空间 V, V
把所有 V V
的线性映射所组成的集合记作 Hom(V, V
)
同样有 Hom V, V
设域 F 上的线性空间 V, U, W ,其中 A Hom(V, U), B Hom(U, W )。线性映射作为映射,有映射
的乘法 BA
A Hom(V, V
) 可逆,则 A V V
的一同构映射,从而 A
1
V
V 的同步映射。于是
A
1
Hom(V
, V )
A, B Hom(V, V
),由于陪域 V
是线性空间,因此可以定义加法和纯量乘法如下
(A + B)α
:
= Aα + Bα, (kA)α
:
= k(Aα)
显然其运算结果都是线性映射,称 A + B A B 的和,kA k A 的纯量乘积。
不难验证,Hom(V, V
) 是域 F 上的线性空间。特别的,Hom(V, V ) 是一个有单位元的环,还可证明
其上变换的乘法与纯量加法满足
k(AB) = (kA)B = A(kB)
于是有
定义 9.1.5 代数
设域 F 上的线性空间 A 对于其上的加法和纯量乘法是一个有单位元的交换环,且
k(αβ) = (kα)β = α(kβ), k F, α, β A
那么称 A 是一个(结合)代数,把线性空间 A 的维数称为代数 A 的维数。
容易看出,Hom(V, V ) 是域 F 上的代数,M
n
(F ) 也是域 F 上的代数。
因此可以在 Hom(V, V ) 上定义 A 的正整数幂
A
m
:
= A
m
· A, A
0
= I
58
容易验证
A
m
· A
n
= A
m+n
, (A
m
)
n
= A
mn
f(x) = a
0
+ a
1
x + ··· + a
m
x
m
F [x],用 A 代入得
f(A) = a
0
I + a
1
A + ··· + a
m
A
m
显然 f(A) Hom(V, V ),称 f(A) A 的多项式。
A 的所有多项式的全体记作 F [A],不难发现其是 Hom(V, V ) 的一个子环,且 F [A] 是交换环。
F [A] 中所有数乘变换组成的集合是 F [A] F [A] 的一个子环,且域 F 到这个子环之间存在双射
τ : k 7→ k
双射 τ 保持加法与乘法运算,因此 F [A] 可以看作 F 的一个扩环。于是 F 上一元多项式中的不定元 x
以用 F [A] 中任意元素代入,从而在 F [x] 中关于加法和乘法的等式在 F [A] 中也成立。
更多的,我们还有镜面反射变换
R
U
= I 2P
W
平移变换
T
a
: f(x) 7→ f(x + a)
利用 Taylor 公式不难发现
f(x + a) = f(x) + aA +
a
2
2!
f
′′
(x) + ··· +
a
n1
(n 1)!
f
(n1)
(x)
=
I + aD +
a
2
2!
D + ··· +
a
n1
(n 1)!
D
(n1)
f(x)
即平移 T
a
是导数 D 的一个多项式。
9.2 线性映射的核与象
定义 9.2.1
设域 F 上的线性空间 V, V
其中 A : V V
V
的零向量在 A 下的原象集称为 A 的和,
Ker A,即
Ker A
:
= {α V | Aα = 0}
A 的象(值域)记作 Im A AV
命题 9.2.2
设域 F 上线性空间 V, V
的线性映射 A : V V
,则
1A 是单射当且仅当 Ker A = 0
2A 是满射当且仅当 Im A = V
定理 9.2.3
设域 F 上线性空间 V, V
的线性映射 A : V V
,则
V / Ker A
=
Im A
59
定理 9.2.4
设域 F 上线性空间 V, V
V 是有限维的。设线性映射 A : V V
Ker A Im A 都是有
限维的,且
dim(Ker A) + dim(Im A) = dim(V )
V 是有限维时,线性映射 A : V V
A 的核的维数也称为 A 的测度。A 的象 Im A 的维数
称为 A 的秩,记作 rank(A)
9.3 线性映射和线性变换的矩阵表示
设域 F 上的有限维线性空间 V, V
其上的线性映射 A : V V
dim V = n, dim V
= s我们知
A 被其在 V 上的一个基所确定,不妨取 V 上的一个基 α
1
, ··· , α
n
A 完全被 Aα
1
, ··· , Aα
n
决定。
Aα
i
V
,因此在 V
中取一个基 η
1
, ··· , η
s
Aα
i
被它在基 η
1
, ··· , η
s
下的坐标所决定,形式的记作
(Aα
1
, Aα
2
, ··· , Aα
n
) = (η
1
, η
2
, ··· , η
n
)
a
11
a
11
··· a
1n
a
21
a
22
··· a
2n
.
.
.
.
.
.
.
.
.
a
s1
a
s1
··· a
sn
s × n A它的 j Aα
j
η
1
, ··· , η
s
下的标。 A 线 A V
α
1
, ··· , α
n
V
的基 η
1
, ··· , η
s
下的矩阵。于是线性映射 A 有了矩阵表示。
通常把 (Aα
1
, ··· , Aα
n
) 记成 A(α
1
, ··· , α
n
) 于是上式可以记成
A(α
1
, ··· , α
n
) = (α
1
, ··· , α
n
)A
对于 V 上的线性变换 A,由于 Aα
i
V ,因此 Aα
i
可以用 V 的基 α
1
, ··· , α
n
线性表出,于是有
(Aα
1
, Aα
2
, ··· , Aα
n
) = (α
1
, α
2
, ··· , α
n
)
a
11
a
11
··· a
1n
a
21
a
22
··· a
2n
.
.
.
.
.
.
.
.
.
a
n1
a
n1
··· a
nn
把右端的
n
级矩阵记作
A
,它的第
j
列就是
A
α
j
α
1
,
···
, α
n
下的坐标。称
A
是线性映射
A
V
α
1
, ··· , α
n
下的矩阵。于是线性映射 A 有了矩阵表示。
A(α
1
, ··· , α
n
) = (α
1
, ··· , α
n
)A
设域 F n 维线性空间 V 上的幂等变换,有
V = Im A Ker A
A Ker A Im A 影。 Im A α
1
, ··· , α
r
Ker A
β
1
, ··· , β
nr
α
1
, ··· , α
r
, β
1
, ··· , β
nr
V 的一个基,由于 A 是平行于 Ker A Im A 上的投影,
Aα
i
= α
i
, Aβ
j
= 0
60
从而幂等变换 A 在基 α
1
, ··· , α
r
, β
1
, ··· , β
nr
下的矩阵 A
A =
E
r
0
0 0
!
其中 r = rank(A) = dim(Im A) = rank(A)
Hom(V, V
) M
s×n
(F ) 的关系,Hom(V, V ) M
n
(F ) 的关系
定理 9.3.1
设域 F 上的 n 维线性空间 V s 维的线性空间 V
,则线性映射 A : V V
与它在 V 的一个基
V
的一个基下的矩阵 A 的对应 σ 是线性空间 Hom(V, V
) M
s×n
(F ) 的同构映射,从而
Hom(V, V
)
=
M
s×n
(F )
dim(Hom(V, V
)) = sn = (dim V )(dim V
)
特别的有
Hom(V, V )
=
M
n
(F )
dim(Hom(V, V )) = sn = (dim V )
2
注意到 Hom(V, V ) M
n
(F ) 都是域 F 的代数,它们都有加法、纯量乘法、乘法运算,可以证明
σ 映射保持乘法运算
σ(AB) = AB = σ(A)σ(B)
因此 σ Hom(V, V ) M
n
(F ) 的同构映射。
定义 9.3.2
设域 F 上的代数 F, F
,如果存在双射 σ : M M
,使得 σ 既是线性空间 M M
的同构映射,
又是环 M M
的同构映射,那么称代数 M M
是同构的,并且称 σ 是代数 M M
的一个
同构映射。
定理 9.3.3
设域 F n 维线性空 V 上的线变换 AA 它在 V 一个的矩 A 的对代数
Hom V, V ) M
n
(F ) 的同构映射,从而代数 Hom(V, V ) M
n
(F ) 是同构的。
向量在线性映射(或线性变换)下的象的坐标
设域 F 上的 n 维线性空间和 s 维线性空间,线性映射 A : V V
V 的一个基 α
1
, ··· , α
n
V
的一个基 η
1
, ··· , η
s
下的矩阵为 A。设 V 中向量 α 在基 α
1
, ··· , α
n
下的坐标为 X,有
Aα = (η
1
, ··· , η
n
)AX
Aα 在基 η
1
, ··· , η
s
下的坐标为 AX
特别的,设线性空间 V 中的一组基 α
1
, ··· , α
n
其上的线性变换 A 在此基下的矩阵为 A。把向量 α
在此基下的坐标记作 X,有
Aα = (α
1
, ··· , α
n
)AX
61
即向量 A 在此基下的坐标是 AX
若向量 γ 在基 α
1
, ··· , α
n
下的坐标为 Y ,则
Aα = γ AX = Y
线性变换在不同基下的矩阵之间的关系
定理 9.3.4
设域 F 上的 n 维线性空间,线性变换 A 在基 α
1
, ··· , α
n
下的矩阵 A,在基 η
1
, ··· , η
s
下的矩
阵为 B,从基 α
1
, ··· , α
n
到基 η
1
, ··· , η
s
的过度矩阵为 S,则
B = S
1
AS
即同一个线性变换 A V 的不同基下的矩阵是相似的。
由于行列式、秩、迹都是相似关系下的不变量,因此我们把 A V 基下的矩阵 A 的行列式、秩、
迹分别叫做线性变换 A 的行列式、秩、迹,依次记作 det(A), rank(A), tr(A)
9.4 线性变换的特征值和特征向量,线性变换可对角化的条件
定义 9.4.1
设域 F 上的线性空间 V 上的一个线性变换 A,若 V 中存在一个非零向量 ξ,存在 λ
0
F 使得
Aξ = λ
0
ξ
则称 λ
0
是线性变换 A 的一个特征值,称 ξ A 的属于特征值 λ
0
的一个特征向量。
对于几何空间 V ,那么 A ξ 的作用是把 ξ 拉伸或压缩 λ
0
倍。
定理 9.4.2
设域 F n 为线空间 V 上的线性变 A 可对角化且仅 A n 线性无的特
ξ
1
, ··· , ξ
n
,此时 A ξ
1
, ··· , ξ
n
下的矩阵为
diag{λ
1
, ··· , λ
n
}
其中 λ
i
ξ
i
所属的特征值。该矩阵称为 A 的标准型。除了主对角线上元素的排列次序外,A
标准型是由 A 唯一决定的。
设域 F 上线性空间 V 上的线性变换 Aλ
0
A 的一个特征值,令
V
λ
0
:
= {α V | Aα = λ
0
α}
易验证 V
λ
0
V 的一个子空间,称 V
λ
0
是数域特征值 λ
0
的特征子空间。且
V
λ
0
= Ker(λ
0
I A)
62
命题 9.4.3
F n 维线性空间 V 上的线性变换 A 可对角化当且仅当下式成立
V = V
λ
1
··· V
λ
s
其中 λ
1
, ··· , λ
s
A 全部的不同的特征值。
由于 n 维线性空间 V 上线性变换 A V 的不同基下的矩阵是相似的,而相似的矩阵有相等的多项
式,因此我们把 A V 的一个基下的矩阵 A 的特征多项式称为线性变换 A 的特征多项式。设 λ
i
A
的一个特征值, λ
i
作为特征多项式的根的重数叫做 λ
i
的代数重数, A 的属于特征值 λ
i
的特征子空
V
λ
i
的维数叫做 λ
i
的几何重数。
因此 A 可标准化当且仅当 A 的标准型为对角矩阵,其主对角线上的元素是 A 全部特征值,且每
个特征值 λ
i
出现的次数等于它的几何重数。即当 A 可对角化时,A 的特征多项式为
(λ λ
1
)
r
1
···(λ λ
s
)
r
s
定理 9.4.4
F n 维线性空间 V 上的线性变换 A 可对角化当且仅当 A 的特征多项式在 F [λ] 中可分解成
(λ λ
1
)
l
1
···(λ λ
s
)
l
s
其中 λ
1
, ··· , λ
s
两两不等,其诶 A 的每个特征值 λ
i
的几何重数等于它的代数重数。
9.5 线性变换的不变子空间
定义 9.5.1 不变子空间
设域 F 上的线性空间 V 上的线性变换 A V 的子空间 W 如果满足对任意 α W 都有 Aα W
那么称 W A 的不变子空间,简称为 A- 子空间。
设线性空间 V 上的可交换线性变换 A, B,容易验证 Ker B, Im B, B 的特征子空间都是 A- 子空间
定理 9.5.2
设域 F n 维线性空间 V 上的线性变换 A A V 的一个基下的矩阵为分块对角矩阵当且仅
V 能被分解为 A 的非平凡不变子空间的直和:V = W
1
··· W
s
,并且 A
i
A | W
i
W
i
下的矩阵。
定理 9.5.3
设域 F 上的线性空间 V 上的线性变换 A,若在 K[x] 中有
f(x) = f
1
(x) ···f
s
(x)
f
1
(x), ··· , f
s
(x) 两两互素,则
Ker f(A) = Ker f
1
(A) ··· Ker f
s
(A)
63
定义 9.5.4 零化多项式
设域 F 上线性空间 V 上的线性变换 A F 上的一元多项式 f(A) = 0那么称 f (x) A 的一
个零化多项式。
dim V = 0,则 dim(Hom(V, V )) = n
2
,从而
I, A, A
2
, ··· , A
n
2
一定线性相关,于是存在一组不全为 0 的元素 k
0
, ··· , k
n
2
使得
k
0
I + k
1
A + k
2
A
2
+ ··· + k
n
2
A
n
2
= 0
f(x) = k
0
+ k
1
x + k
2
x
2
+ ··· + k
n
2
x
n
2
,则有 f(A) = 0,于是 f(x) A 的一个零化多项式。
定义 9.5.5
F 上的 n 级矩阵 A,若 f (x) F [x] 使得 f(A) = 0,那么称 f (x) A 的一个零化多项式。
定理 9.5.6 Hamilton - Cayley 定理
设域 F 上的 n 级矩阵,则 A 的特征多项式 f (λ) A 的一个零化多项式。
利用该定理可以把 V 解为 A 的非平凡不变子空间的直和:设 A 的特征多项式 f(λ) F [λ] 中分
解为
f(λ) = p
r
1
1
(λ) ···p
r
s
s
(λ)
其中 p
i
(λ) F 上两两不等的首一不可约多项式,则
V = Ker(p
r
1
1
(A)) ··· Ker(p
r
s
s
(A))
如果 f(λ) 可以分解为
f(λ) = (λ λ
1
)
r
1
···(λ λ
s
)
r
s
其中 λ
i
F 中两两不等的元素,则
V = Ker((A λ
1
I)
r
1
) ··· Ker((A λ
s
I)
r
s
)
其中 Ker((A λ
j
I)
r
j
) 称为 A 的根子空间。
9.6 * 线性变换和矩阵的最小多项式
定义 9.6.1 最小多项式
设域 F 线性空 V 的一个线性变换 A 的所有非零的零化多项式中,次数最低的首项系数为 1
的多项式称为 A 的最小多项式。
64
9.7 幂零变换的 Jordan 标准型
定义 9.7.1
η W ,且存在一个正整 t 使得 B
t1
η 6= 0 , B
t
η = 0 则称子空 hB
t1
η, Bη, ηi 是由 η
成的 B- 强循环子空间。
定理 9.7.2
设域 F r 维线性空间 W 上的幂零变换 B,其幂零指数 l,则 W 能分解成 dim W
0
B-
循环子空间的直和,其中 W
0
B 的属于特征值 0 的特征子空间。
定理 9.7.3
设域 F r 维线性空间 W 上的幂零变换,其幂零指数为 l W 中存在一个基使得 B 在此基下
的矩阵 B 为一个 Jordan 形矩阵,其中每个 Jordan 块的主对角元都是 0且级数不超过 lJordan
块的总数等于 dim(Ker B) = r rank(B)t Jordan 块的个数 N (t)
N(t) = rank(B
t+1
) + rank(B
t1
) 2 rank(B
t
)
B 称为 B Jordan 标准型。除了 Jordan 块的排列次序外,B Jordan 标准型是唯一的。
9.8 线性变换的有理标准型
9.9 线性函数与对偶空间
定义 9.9.1 线性函数
设域 F 上的线性空间 V ,映射 f : V F 若对任意的 k F, α, β V 满足
f(α + β) = f(α) + f(β)
f(kα) = kf(α)
那么称 f V 上的线性函数。
例如,令
tr : M
n
(F ) F, A = (a
ij
) 7→
n
X
i=1
a
ii
容易验证 tr M
n
(F ) 上的线性函数,称它为迹函数。
V 是域 F 上的线性空间,由于 V 的线性函数可看成 V F 的映射,因此可以把 V 所有线
性函数的全集记作 Hom(V, F )。它是域 F 上的一个线性空间,称它为 V 上的线性函数空间。
容易看出 Hom(V, f)
=
V ,任取 f Hom(V, F ) 由于 f 完全被它在 V 的一个基 α
1
, ··· , α
n
决定,
因此对应法则
σ : Hom(V, F ) F
n
, f 7→ (f (α
1
), ··· , f(α
n
))
是一映射, σ 是满射、单射,且保加法纯量算,因 σ Hom(V, F ) F
n
上的构映
射,从而 σ
1
Hom(V, F ) F
n
的同构映射。 F
n
中取标准基 ε
1
, ··· , ε
n
σ
1
(ε
1
), ··· , σ
1
(ε
1
)
65
Hom(V, F ) 的一个基。
f
i
= σ
1
(ε
i
),则 σ(f
i
) = ε。于是有 f
i
(α
j
) = δ
ij
Hom(V, F ) 的这个基 f
1
, ··· , f
n
称为 V 的基 α
1
, ··· , α
n
的对偶基,把 Hom(V, F ) 称为 V 对偶空
间,记作 V
定理 9.9.2
设域 F n 线性空间 V ,在 V 中取两个基:α
1
, ··· , α
n
β
1
, ··· , β
n
V
中相对应的对偶基
分别为 f
1
, ··· , f
n
g
1
, ··· , g
n
。如果 V α
1
, ··· , α
n
到基 β
1
, ··· , β
n
的过渡矩阵是 A,那么
V
中基 f
1
, ··· , f
n
到基 g
1
, ··· , g
n
的过渡矩阵 B
B = (A
1
)
T
设域 F n 维线性空间 V ,取 V 一个基 α
1
, ··· , α
n
,在 V
中取相应的对偶基 f
1
, ··· , f
n
。映射
σ : V V
, α =
n
X
i=1
x
i
α
i
7→
n
X
i=1
x
i
f
i
是一个同构映射, α σ 下的像记作 f
α
α
V 中任意向量 β =
P
n
i=1
y
i
α
i
由于 f
i
(β) = y
i
此有
f
α
(β) =
n
X
i=1
x
i
f
i
!
=
n
X
i=1
x
i
f
i
(β) =
n
X
i=1
x
i
y
i
这表明 α σ 下的像 f
α
β 处的函数值等于 α β 的坐标的对应分量乘积之和。
进一步地,我们可以考虑对偶空 V
的对偶空间 (V
)
,简记 V
∗∗
,称 V
∗∗
V 的双重对偶
间,有
V
=
V
=
V
∗∗
α
1
, ··· , α
n
V 的一个基,V
中相应的对偶基为 f
1
, ··· , f
n
。设同构映射
σ : V V
, α 7→ f
α
同理,有同构映射
τ : V
V
∗∗
, f
α
7→ α
∗∗
任取 f V ,有
f
α
=
n
X
i=1
x
i
f
i
, f =
n
X
i=1
f(α
i
)f
i
从而
α
∗∗
(f) =
n
X
i=1
x
i
f(α
i
) = f
n
X
i=1
x
i
α
i
!
= f(α)
由于 (τσ)α = τ(σα) = τ(f
α
) = α
∗∗
因此 α
∗∗
(f) 的值不依赖于 V 中基的选择。我们称这种不依赖于基的
选择的同构映射为标准同构或自然同构。即 τσ : V V
∗∗
是自然同构。
于是 V V
互为对偶空间。
66
第十章 具有度量的线性空间
10.1 双线性函数
定义 10.1.1 双线性函数
设域 F 上的线性空间 V 映射 f : V ×V F 如果对任意的 k
1
, k
2
F 和任意的 β
1
, α
2
, β
1
, β
2
, α, β
V
1f(k
1
α
1
+ k
2
α
2
, β) = k
1
f(α
1
, β) + k
2
f(α
2
, β)
2f(α, k
1
β
1
+ k
2
β
2
) = k
1
f(α, β
1
) + k
2
f(α, β
2
)
那么称 f V 上一个双线性函数,f 也写成 f(α, β)
即当 β 固定时,映射 α 7→ f(α, β) V 上的一个线性函数,记作 β
R
即当 α 固定时,映射 β 7→ f(α, β) V 上的一个线性函数,记作 α
L
设域 F n 维线性空间 V 中取一个基 α
1
, ··· , α
n
,设 V 中向量 α, β 在此基下的坐标为
X = ( x
1
, ··· , x
n
)
T
, Y = (y
1
, ··· , y
n
)
T
f V 上的一个双线性函数,则
f(α, β) = f
n
X
i=1
x
i
α
i
,
n
X
j=1
y
j
α
j
!
=
n
X
i=1
n
X
j=1
x
i
y
j
f(α
i
, α
j
)
A =
f(α
1
, α
1
) f (α
1
, α
2
) ··· f(α
1
, α
n
)
f(α
2
, α
1
) f (α
2
, α
2
) ··· f(α
2
, α
n
)
.
.
.
.
.
.
.
.
.
f(α
n
, α
1
) f(α
n
, α
2
) ··· f(α
n
, α
n
)
A
是双线性函数
f
在基
α
1
,
···
, α
n
下的度量矩阵,它是由
f
及基
α
1
,
···
, α
n
唯一决定的。于是有
f(α, β) = X
T
AY
反之,任给域 F 上一个 n 级矩阵 A = (a
ij
),定义映射 f : V × V F 如下
f(α, β) = X
T
AY =
n
X
i=1
n
X
j=1
a
ij
x
i
y
j
f V 上的一个双线性函数,且 f 在基 α
1
, ··· , α
n
下的度量矩阵为 A
因此若 X
T
AY = X
T
BY ,则 A = B
称表达式 X
T
AY X Y 的双线性形。
67
定理 10.1.2
设域 F n 维线性空间 V 上的一个双线性函数,取 V 中两个基 α
1
, ··· , α
n
β
1
, ··· , β
n
,设
(β
1
, ··· , β
n
) = (α
1
, ··· , α
n
)P
f 在这两个基的度量矩阵分别为 A, B,则
B = P
T
AP
f V 的不同基下的度量矩阵是合同的,他们有相同的秩,于是称度量矩阵的秩 f 的矩阵秩,
记作 rank
m
f
设域 F 上线性空间 V 上双线性函数 f,则称 V
的子空间
hα
L
, β
R
| α, β V i
称为 f 的秩空间,把 f 的秩空间的维数称为 f 的秩,记作 rank f
可以证明,f 的矩阵秩不超过 f 的秩。
定义 10.1.3
设域 F 上线性空间 V 上的双线性函数 f,则 V 的子集
{α V | f (α, β) = 0}
称为 f V 中的做根,记作 rad
L
V V 的另一个子集
{β V | f(α, β) = 0}
称为 f V 中的右根,记作 rad
R
V
容易验证,f V 中的左根和右根都是 V 的子空间。
定义 10.1.4
如果 V 上双线性函数 f 的做根和右根都是零子空间,那么称 f 是非退化的。
定理 10.1.5
F n 维线性空间 V 上的双线性函数 f 是非退化的,当且仅当 f V 的一个基下的度量矩阵
是满秩矩阵。
定义 10.1.6
设域 F 上线性空间 V 上的一个双线性函数,如果
f(α, β) = f(β, α)
那么称 f 是对称的,如果
f(α, β) = f(β, α)
68
那么称 f 是反对称的(斜对称的)
定理 10.1.7
设特征不为 2 的域 F n 维线性空间 V 上的对称双线性函数 f ,则 V 中存在一个基使得 f 在此
基下的度量矩阵为对角矩阵,
定理 10.1.8
设特征不为 2 的域 F n 维线性空间 V 上的反对称双线性函数 f,则存在 V 的一个基,把它记
δ
1
, δ
1
, ··· , δ
r
, δ
r
, η
1
, ··· , η
s
(其中 0 2r n, s = n 2r,使得 f 在这个基下的度量矩阵具
有形式
diag
(
0 1
1 0
!
, ··· ,
0 1
1 0
!
, 0, ··· , 0
)
定义 10.1.9
设域 F 上的线性空间 V ,映射 q : V F 称为 V 上的二次函数,如果存在 V 上的一个对称双线
性函数 f,使得
q(α) = f(α, α)
显然,对于一个对称双线性函数 f 就有唯一的一个二次函数 q
定理 10.1.10
设特征不 2 的域 F 上的线性空间 V q V 的一个二次函数,则存 V 上唯一的对称双线
性函数 f 使得
f(α, α) = q(α)
于是设域 F n 维线性空间 V 上的对称双线性函数 f 和其对应的二次函数 q f V 的一个基
α
1
, ··· , α
n
下的度量矩阵 A = (a
ij
),则对于 α = (α
1
, ··· , α
n
)X, β = ( α
1
, ··· , α
n
)Y ,有
f(α, β) = X
T
AY
从而有
q(α) = f(α, α) = X
T
AX
q 在基 α
1
, ··· , α
n
下的表达式是 n 元二次型 X
T
AX称其中的对称矩阵 A 为二次函数 q 在基 α
1
, ··· , α
n
下的矩阵。于是可以用二次型的理论研究双线性函数,也可以用对称双线性函数来研究二次型。
定理 10.1.11 惯性定理
实数域上任意一个 n 元二次型都可以经过非退化线性替换化成规范形,并且规范形是唯一的。
69
定理 10.1.12 Witt 消去律的推广
设特征不为 2 的域 F 上的 n 级对称矩阵 A
1
, A
2
m 级对称矩阵 B
1
, B
2
。如果
A
1
0
0 B
1
!
'
A
2
0
0 B
2
!
A
1
' A
2
,那么 B
1
' B
2
双线性函数空间
定义 10.1.13
设域 F 上的线性空间 V 我们把 V 上所有双线性函数组成的集合记作 T
2
(V )容易验证 T
2
(V )
域函数的加法和纯量乘法成为域 F 上的一个线性空间,称为 V 上的双线性函数空间。
定理 10.1.14
设特征不为 2 的域 F 上的线性空间,则
T
2
(V ) = S
2
(V ) A
2
(V )
10.2 欧几里得空间
定义 10.2.1 正定的
设实线性空间 V 上的对称双线性函数,如果对任意 α V f(α, α) 0等号成立当且仅当 α = 0
那么称 f 是正定的。
定义 10.2.2 内积
设实数域 R 上的一个线性空间 V V 上的一个正定的对称双线性函数称为 V 上的一个内积。
习惯上把内积 f(α, β) 记作 (α, β)
定义 10.2.3
设实数域 R 上的一个线性空间 V 若给定了 V 上的一个内积,那么称 V 是一个实内积空间。有限
维的实内积空间称为欧几里得 Euclid 空间,并且把线性空间 V 的维数称为 Euclid 空间 V 的维数。
实内积空间中的度量概念
定义 10.2.4
非负实数
p
(α, α) 称为向量 α 的长度,记作 |α|
长度为 1 的向量称为单位向量。如果 α 6= 0那么
α
|α|
是一个单位向量。 α 变成
α
|α|
称为把 α 单位
化。
70
定理 10.2.5 Cauchy - Schwarz 不等式
在实内积空间 V 对任意向量 α, β
|(α, β)| |α||β|
等号成立当且仅当 α, β 线性相关。
命题 10.2.6 Cauchy 不等式
对于任意的两组实数 α
1
, ··· , α
n
β
1
, ··· , β
n
|a
1
b
1
+ ··· + a
n
b
n
|
q
a
2
1
+ ··· + a
2
n
q
b
2
1
+ ··· + b
2
n
等号成立当且仅当 (α
1
, ··· , α
n
) (β
1
, ··· , β
n
) 线性相关。
命题 10.2.7 Schwarz 不等式
对于任意的 f, g C[a, b]
Z
b
a
f(x)g(x) dx
2
Z
b
a
f
2
(x) dx
Z
b
a
g
2
(x) dx
等号成立当且仅当 (α
1
, ··· , α
n
) (β
1
, ··· , β
n
) 线性相关。
定义 10.2.8
实内积空间 V 中,两个非零向量 α β 的夹角 hα, βi 规定为
hα, βi
:
= arccos
(α, β)
|α||β|
定义 10.2.9
在实内积空间 V 中,若 (α, β) = 0,那么称 α β 正交,记作 αβ
命题 10.2.10
在实内积空间 V 中,三角形不等式成立,即对于任意的 α, β V
|α + β| |α| + |β|
命题 10.2.11
在实内积空间 V 中,勾股定理成立,即如果 α β 正交,则
|α + β|
2
= |α|
2
+ |β|
2
71
命题 10.2.12
在实内积空间 V 中,余弦定理成立,即对于三个非零向量 α, β, γ 满足 γ = β α,则
|γ|
2
= |α|
2
+ |β|
2
2|α||β|coshα, βi
定义 10.2.13
E 一个非空集合,若其上存在映射 d : E × E R,如果对任意 x, y, z E 都有1)对
性:d(x, y) = d(y, x)2)正性:d(x, y) 0等号当且 x = y3角形式:
d(x, z) d(x, y) + d ( y, z)那么称 d 是一个距离,称集合 E 是一个度量空间, d(x, y) 称为 x
y 之间的距离。
定义 10.2.14
n Euclid 空间 V 中,由 n 个两两正交的非零向量组成的基称为 V 的一个正交基,若该基皆
为单位向量,称为 V 的一个标准正交基。
由于内积是正定的对称双线性函数,因 V 中存在一个基 η
1
, ··· , η
n
使得内积在此基下的度量矩
为单位矩阵 I。从而
(η
i
, η
j
) = δ
ij
因此 η
1
, ··· , η
n
V 的一个标准正交基。
更具体的,取
V
的一个基
α
1
,
···
, α
n
β
1
=
α
,且
β
n
= α
n
n1
X
j=1
(α
n
, β
j
)
(β
j
, β
j
)
β
j
β
1
, ··· , β
n
V 的一个正交基。令
η
i
=
β
i
|β
i
|
η
1
, ··· , η
n
V 的一个标准正交基。
第一步称为 Schmidt 正交化,第二步称为单位化。
定理 10.2.15
η
1
, ··· , η
n
n Euclid 空间 V 的一个标准正交基,则对于任意的 α V
α =
n
X
i=1
(α, η
i
)η
i
α 在标准正交基 η
1
, ··· , η
n
下的坐标的第 i 个分量等于 (α, η
i
)此式称为 α Fourier 展开,其中
每个系数 (α, η
i
) 都称为 α Fourier 系数。
72
定义 10.2.16
设实内积空间 V, V
,若存在双射 σ : V V
使得对于任意的 α, β V k R
σ(α + β) = σ(α) + σ(β)
σ(kα) = kσ(α)
(α, β) = (σ(α), σ(β))
那么称 σ V V
的一个同构映射,此时称 V V
同构,记作 V
=
V
σ 保持加法和数量乘法,那么称为线性同构;若线性同构还保持内积,则称它为一个保距同构。
定理 10.2.17
两个 Euclid 空间同构的充要条件是它们的维数相同。
10.3 正交补,正交投影
定义 10.3.1
设实内积空 V 的一个非空子集 S。把 V S 中每一个向量都正交的所有向量的全体称 S
的正交补,记作 S
。即
S
:
= {α V | (α, β) = 0 }
定理 10.3.2
设实内积空间 V 的一个有限维子空间 U ,则
V = U U
设实内积空间 V 一个子空间, V = U U
,那么有平行 U
U 的投 P
U
。我们把
这个 P
U
称作 V U 的正影; α P
U
下的 α
1
称为 α U 正交影。
α = α
1
+ α
2
P
U
(α) = α
1
α α
1
U
定理 10.3.3
设实内积空间 V 的一个子空间 U,且 V = U U
,则对于 α V ,则 α
1
= P
U
(α) U 的充要
条件是
d(α, α
1
) d(α, γ)
定义 10.3.4
设实内积空间 V 的子空间 U ,若对于 α V 存在 δ U
d(α, δ) d(α, γ)
73
那么称 δ α U 上的最佳逼近元。
设实内积空间 V 的一个无限维子空间 U ,如果 α V U 上的最佳逼近元存在(此时必唯一),那
么称 δ α U 上的正交投影。如果 V 中每个向量 α 都有在 U 上的正交投影 δ那么把 α 对应到 δ
映射称为 V U 上的正交投影。
10.4 正交变换与对称变换
定义 10.4.1
设实内积空间 V 到自身的满射 A,如果保持向量的内积不变,即
(Aα, Aβ) = (α, β)
那么称 A V 上的一个正交变换。
命题 10.4.2
正交变换 A 具有特性:
1)保持向量长度。
2)保持两个非零向量的夹角不变。
3)保持正交性。
4)一定是线性变换。
5)保持向量间的距离不变。
6)一定是单射,一定可逆。
定理 10.4.3
n Euclid 空间 V 上的线性变换 AA V 的标准正交基下的矩阵为 A,则下列描述等价:
1A 是正交变换。
2A V 的标准正交基映成标准正交基。
3A 是正交矩阵。
由于正交矩阵 A 的行列式为 ±1,则把行列式为 1 的矩阵称为第一类(或旋转),行列式等于 1
称为第二类的。
n 维线性空间的任意一个 n 1 维子空间称为一个超平面。
定义 10.4.4
n Euclid 空间 V 中的一个单位向量,P V hηi 上的正交投影,令
A = I 2P
A 称为关于超平面 hηi
的镜面反射。
74
定义 10.4.5
实内积空间 V 上的变换 A 如果满足
(Aα, β) = (α, Aβ)
那么称 A V 上的对称变换。
10.5 * 酉空间
在复数域中引入度量概念。若复线性空间 V 上的双线性函数 f 具有性质
f(α, β) = f(β, α)
这个性质称为 Hermite 性。
10.6 * 正交空间与辛空间
定义 10.6.1
设域 F 上的线性空间 V 上的一个对称双线性函数 f,那么称 f V 上的一个内积(或度量)
V 是一个正交空间。用 (V, f) 表示。
如果 f 是非退化的,则称 (V, f ) 是正则的,否则称为非正则的。
定义 10.6.2
在正交空间 (V, f) 中,如果 f(α, β) = 0,那么称 α β 正交,记作 αβ
在正交空间 (V, f) 中,一个非零向量 α 称为迷向的,如果 f(α, α) = 0,否则称为非迷向的。
正交空间 (V, f ) 含一个迷向向量,则 (V, f ) 称为迷向的,否则为非迷向的。 V 中所有非零向量
都是迷向的,则称为全迷向的。
10.7 * 正交群,酉群,辛群
定义 10.7.1
G 是一个非空集合,若 G 上的乘法运算满足
1)结合律:a(bc) = (ab)c
2)单位元:存在 e G 使得 ea = ae = a
3)逆元:任取 a G 总存在 b G 使得 ab = ba = 1
那么称 G 是一个群。
如果群 G 的运算还满足交换律,那么称 G 为交换群,或 Abel 群。
75
索引
不变子空间, 63
Cauchy - Schwarz 不等式, 71
初等行变换, 2
代数, 58
代数重数, 33, 63
代数余子式, 7
广义逆, 30
, 59
, 42
极大线性无关组, 12, 52
几何重数, 33, 63
矩阵相似, 31
可对角化, 31
零化多项式, 64
幂等变换, 58
内积, 70
Schmidt 正交化, 72
商空间, 55
双线性函数, 67
特征多项式, 32
特征向量, 32
特征值, 32
同构, 54
线性变换, 57
线性函数, 65
线性空间, 51
线性相关, 51
线性映射, 57
一元多项式, 41
, 49
余维数, 56
整除, 43
正定的, 70
直和, 53
自然同构, 66
最佳逼近元, 73
最小多项式, 64
76