复数域上任意方阵都相似于上三角阵

此文写于2015年5月20日.现补充了几个例题,整理在此.

 

我们证明如下定理:

定理1  复数域上的任意一个{n(n\geq 1)}阶方阵必定相似于一个上三角矩阵.

为了证明该命题,只用证明,

定理1的变式 对于任一线性变换{T_{n}:\mathbf{C}^{n}\rightarrow \mathbf{C}^{n}}来说,存在复线性空间{\mathbf{C}^n}的一组 基{(\mathbf{v}_1,\cdots,\mathbf{v}_n)},使得{\forall k\in \{1,\cdots,n\}},{T_{n}(\mathbf{v}_k)\in \hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)}.其中{\hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)}是由向量{\mathbf{v}_1,\cdots,\mathbf{v}_k}张成的线性空间.此时,我们称线 性变换{T_n}是可上三角化的.

证明:我们归纳地说明这个事实.首先,当{n=1}时命题显然成立.设当{n=k(k\geq 1)}时命题仍然成立.则当{n=k+1}时,根据代数基本定理,线性映射{T_{k+1}}必 然有一特征值{\lambda_{k+1}}和对应于该特征值的某个特征向量{\mathbf{v}_{k+1}},使 得

\displaystyle T_{k+1}(\mathbf{v}_{k+1})=\lambda_{k+1}\mathbf{v}_{k+1}.\ \ \ \ \ (1)

{\{\mathbf{v}_1,\cdots,\mathbf{v}_k,\mathbf{v}_{k+1}\}}{\mathbf{C}^n}的一组基.{\forall T(\mathbf{v})\in \hbox{span}(T_{k+1}(\mathbf{v}_1),\cdots,T_{k+1}(\mathbf{v}_k))},其中 {\mathbf{v}\in \hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)},有唯一 的{a_1,\cdots,a_{k+1}\in \mathbf{C}},使 得

\displaystyle T_{k+1}(\mathbf{v})=a_1\mathbf{v}_1+\cdots+a_n\mathbf{v}_n+a_{n+1}\mathbf{v}_{k+1} \ \ \ \ \ (2)

这样就建立了一个 从{\hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)}{\hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)}的线性映 射

\displaystyle G:\mathbf{v}\rightarrow a_1\mathbf{v}_1+\cdots+a_n\mathbf{v}_k. \ \ \ \ \ (3)

根据归纳假 设,线性映射{G}是可上三角化的,即存 在{\hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)}的一组 基{\{\mathbf{w}_1,\cdots,\mathbf{w}_k\}},使得

\displaystyle \begin{cases} G(\mathbf{w}_1)\in\hbox{span}(\mathbf{w}_1),\\ G(\mathbf{w}_2)\in\hbox{span}(\mathbf{w}_1,\mathbf{w}_2),\\ \vdots\\ G(\mathbf{w}_k)\in\hbox{span}(\mathbf{w}_1,\cdots,\mathbf{w}_k). \end{cases}

于是,结合式(2)和式(3),可得

\displaystyle \begin{cases} T_{k+1}(\mathbf{w}_1)\in\hbox{span}(\mathbf{v}_{k+1},\mathbf{w}_1),\\ T_{k+1}(\mathbf{w}_2)\in\hbox{span}(\mathbf{v}_{k+1},\mathbf{w}_1,\mathbf{w}_2),\\ \vdots\\ T_{k+1}(\mathbf{w}_k)\in\hbox{span}(\mathbf{v}_{k+1},\mathbf{w}_1,\cdots,\mathbf{w}_k). \end{cases}

再加 上(1),因此,在基 {(\mathbf{v}_{k+1},\mathbf{w}_1,\cdots,\mathbf{w}_k)}下,线性映 射{T_{k+1}}是呈现上三角化形式的.这样,根据数学归纳法,我们已经对一切正 整数{n}证明了这个命题. \Box

例 1 找到一个上三角矩阵{U},使得矩阵{A= \begin{bmatrix} 2&4&3\\ -4&-6&-3\\ 3&3&1 \end{bmatrix} }与矩阵{U}相似.

解:{\mathbf{C}^{3}}的一组基 为{\mathcal{A}=\{\mathbf{e}_1,\mathbf{e}_2,\mathbf{e}_3\}}.且设存在线 性变换 {T:\mathbf{C}^3\rightarrow \mathbf{C}^{3}},满足{[T]_{\mathcal{A}}^{\mathcal{A}}=A}.

首先求矩阵{A}的特征值.设矩阵{A}的特征值是{\lambda},则

\displaystyle \begin{vmatrix} 2-\lambda&4&3\\ -4&-6-\lambda&-3\\ 3&3&1-\lambda \end{vmatrix}=0,

解得{\lambda=1}{\lambda=-2}.特征值{1}对应的某个特征向量是{ \mathbf{v}_1=\begin{bmatrix} 1\\ -1\\ 1 \end{bmatrix}_{\mathcal{A}} }.

然后,在{\mathbf{C}^3}中寻找到另外两个向量{\mathbf{v}_2,\mathbf{v}_3},使 得{\mathbf{v}_1,\mathbf{v}_2,\mathbf{v}_3}线性无关.设 {\{\mathbf{v}_1,\mathbf{v}_2,\mathbf{v}_3\}}形成基{\mathcal{B}}.不妨令{\mathbf{v}_2= \begin{bmatrix} 1\\ -1\\ 0 \end{bmatrix}_{\mathcal{A}} },{\mathbf{v}_3= \begin{bmatrix} 0\\ 1\\ 0 \end{bmatrix}_{\mathcal{A}}. } 则线性变换{T}在基{\mathcal{B}}下的矩阵

\displaystyle [T]_{\mathcal{B}}^{\mathcal{B}}= \begin{bmatrix} 1&0&3\\ 0&-2&1\\ 0&0&-2 \end{bmatrix}.

因此

\displaystyle [T]_{\mathcal{A}}^{\mathcal{A}}=A=[I]_{\mathcal{B}}^{\mathcal{A}}[T]_{\mathcal{B}}^{\mathbf{\mathcal{B}}}[I]_{\mathcal{A}}^{\mathcal{B}}= \begin{bmatrix} 1&1&0\\ -1&-1&1\\ 1&0&0 \end{bmatrix} \begin{bmatrix} 1&0&3\\ 0&-2&1\\ 0&0&-2 \end{bmatrix} \begin{bmatrix} 1&1&0\\ -1&-1&1\\ 1&0&0 \end{bmatrix}^{-1}.

\Box

例 2 找到一个上三角矩阵{U},使得矩阵{A= \begin{bmatrix} 4&-9\\ 4&-8 \end{bmatrix} }{U}相似.

解:{\mathbf{C}^2}的一组基为 {\mathcal{A}=\{\mathbf{e}_1,\mathbf{e}_2\}}.且线性变换 {T:\mathbf{C}^2\rightarrow \mathbf{C}^2}在该基下的矩阵为{[T]_{\mathcal{A}}^{\mathcal{A}}=A}.设矩阵{A}的特征值是{\lambda},则

\displaystyle \begin{vmatrix} 4-\lambda&-9\\ 4&-8-\lambda \end{vmatrix}=0,

解得{\lambda=-2}.特征值{-2}对应的一个特征向量是{ \mathbf{v}_{1}=\begin{bmatrix} 3\\ 2 \end{bmatrix}_{\mathcal{A}} }.我们再寻找另外一个向量{\mathbf{v}_2= \begin{bmatrix} 1\\ 0 \end{bmatrix}_{\mathcal{A}} },使得{\mathbf{v}_1,\mathbf{v}_2}线性无关,也形成{\mathbf{C}^2}的一组基 {\mathcal{B}=\{\mathbf{v}_1,\mathbf{v}_2\}}.则

\displaystyle [T]_{\mathcal{B}}^{\mathcal{B}}= \begin{bmatrix} -2&2\\ 0&-2 \end{bmatrix}.

因此

\displaystyle A=[T]_{\mathcal{A}}^{\mathcal{A}}=[I]_{\mathcal{B}}^{\mathcal{A}}[T]_{\mathcal{B}}^{\mathcal{B}}[I]_{\mathcal{A}}^{\mathcal{B}}= \begin{bmatrix} 3&1\\ 2&0 \end{bmatrix} \begin{bmatrix} -2&2\\ 0&-2 \end{bmatrix} \begin{bmatrix} 3&1\\ 2&0 \end{bmatrix}^{-1}.

\Box

Tags: , ,

Reply

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据

%d 博主赞过: