Schur分解

You are currently browsing articles tagged Schur分解.

下面我们求矩阵

\displaystyle A= \begin{bmatrix} -2&2&2\\ 2&1&4\\ 2&4&1 \end{bmatrix}

的Schur分解.设线性变换{T:\mathbf{C}^3\rightarrow \mathbf{C}^3}{\alpha_0=(\mathbf{e}_1,\mathbf{e}_2,\mathbf{e}_3)}下的矩阵 {[T]_{\alpha_0}^{\alpha_0}=A}.

易求得{A}的特征值是{-3,-3,6}.{A}的特征值{-3}对应于某个单位 特征向量{\mathbf{v}_1^{(1)}= \begin{bmatrix} \frac{-2}{\sqrt{5}}\\ \frac{1}{\sqrt{5}}\\ 0 \end{bmatrix}_{\alpha_{0}} }.然后再在{\mathbf{C}^3}中选取两个向量{\mathbf{v}_2^{(1)},\mathbf{v}_3^{(1)}},使得 {\alpha_{1}=(\mathbf{v}_1^{(1)},\mathbf{v}_2^{(1)},\mathbf{v}_3^{(1)})}构成 {\mathbf{C}^3}的一组单位正交基底.不妨令

\displaystyle \mathbf{v}_2^{(1)}= \begin{bmatrix} \frac{1}{\sqrt{5}}\\ \frac{2}{\sqrt{5}}\\ 0 \end{bmatrix}_{\alpha_{0}},\mathbf{v}_3^{(1)}= \begin{bmatrix} 0\\ 0\\ 1 \end{bmatrix}_{\alpha_{0}}.

则线性变换{T}在基{\alpha_1}下的矩阵为

\displaystyle A_1= \begin{bmatrix} -3&0&0\\ 0&2&\frac{10}{\sqrt{5}}\\ 0&\frac{10}{\sqrt{5}}&1 \end{bmatrix}.

然后将矩阵{A_1}的第{1}列和第{1}行去掉,得到其子矩阵

\displaystyle B_1= \begin{bmatrix} 2&\frac{10}{\sqrt{5}}\\ \frac{10}{\sqrt{5}}&1 \end{bmatrix}.

事实上,{\mbox{span}\{\mathbf{v}_2^{(1)},\mathbf{v}_{3}^{(1)}\}}形成{\mathbf{C}^3} 的一个二维子空间{W^2}.且{\beta_{1}=(\mathbf{v}_2^{(1)},\mathbf{v}_3^{(1)})}形成{W^2}的一组基 底.存在线性变换{G_1:W^2\rightarrow W^2},使得{G_1}在基{\beta_1}下的矩阵 {[G_1]_{\beta_1}^{\beta_1}}就是矩阵{B_1}.矩阵{B_1}的特征值为{-3,6}.特 征值{-3}对应于某个单位特征向量{ \begin{bmatrix} -\frac{2}{3}\\ \frac{\sqrt{5}}{3} \end{bmatrix}_{\beta_1} }. 因此矩阵{A}的特征值{-3}还对应于某个单位特征向量{\mathbf{v}_2^{(2)}= \begin{bmatrix} 0\\ -\frac{2}{3}\\ \frac{\sqrt{5}}{3} \end{bmatrix}_{\alpha_1} }.

{\alpha_2=(\mathbf{v}_1^{(1)},\mathbf{v}_2^{(2)},\mathbf{v}_3^{(2)})} 构成{\mathbf{C}^3}的一组单位正交基底,不妨设{\mathbf{v}_3^{(2)}= \begin{bmatrix} 0\\ \frac{\sqrt{5}}{3}\\ \frac{2}{3} \end{bmatrix}_{\alpha_1} }.线性变换{T}在基{\alpha_2}下的矩阵为

\displaystyle [T]_{\alpha_2}^{\alpha_2}= \begin{bmatrix} -3&0&0\\ 0&-3&0\\ 0&0&6 \end{bmatrix}.

\displaystyle \begin{array}{rcl} \alpha_2&=&\left( \begin{bmatrix} 1\\ 0\\ 0 \end{bmatrix}_{\alpha_1}, \begin{bmatrix} 0\\ -\frac{2}{3}\\ \frac{\sqrt{5}}{3} \end{bmatrix}_{\alpha_1}, \begin{bmatrix} 0\\ \frac{\sqrt{5}}{3}\\ \frac{2}{3} \end{bmatrix}_{\alpha_1} \right) \\&=&\left( \begin{bmatrix} -\frac{2}{\sqrt{5}}\\ \frac{1}{\sqrt{5}}\\ 0 \end{bmatrix}_{\alpha_0}, \begin{bmatrix} \frac{-2}{3 \sqrt{5}}\\ \frac{-4}{3 \sqrt{5}}\\ \frac{\sqrt{5}}{3} \end{bmatrix}_{\alpha_0}, \begin{bmatrix} \frac{1}{3}\\ \frac{2}{3}\\ \frac{2}{3} \end{bmatrix}_{\alpha_{0}} \right) \end{array}

因此矩阵

\displaystyle A=[I]_{\alpha_{2}}^{\alpha_{0}}[T]_{\alpha_2}^{\alpha_{2}}[I]_{\alpha_0}^{\alpha_2}= \begin{bmatrix} -\frac{2}{\sqrt{5}}&\frac{1}{\sqrt{5}}&0\\ -\frac{2}{3 \sqrt{5}}&-\frac{4}{3 \sqrt{5}}&\frac{\sqrt{5}}{3}\\ \frac{1}{3}&\frac{2}{3}&\frac{2}{3} \end{bmatrix}^{T} \begin{bmatrix} -3&0&0\\ 0&-3&0\\ 0&0&6 \end{bmatrix}\begin{bmatrix} -\frac{2}{\sqrt{5}}&\frac{1}{\sqrt{5}}&0\\ -\frac{2}{3 \sqrt{5}}&-\frac{4}{3 \sqrt{5}}&\frac{\sqrt{5}}{3}\\ \frac{1}{3}&\frac{2}{3}&\frac{2}{3} \end{bmatrix}

这就是实对称矩阵{A}的Schur分解.

事实上,对于任意的Hermite矩阵{A}来说,由 Schur分解定理,都存在酉矩阵{O}和上三角矩阵{U},使得{A=\overline{O}^{T}UO},因此 {\overline{A}^{T}=\overline{O}^{T}\overline{U}^{T}O},由于 {\overline{A}^T=A},因此{U=\overline{U}^T},表明上三角矩阵{U}只能是实对 角矩阵{D}.可见,Hermite矩阵{A}的特征值都是实数.

特别地,当{A}是实对称矩阵时,由实对称矩阵{A}进行Schur分解的过程可以断 定,{A}必定存在一组互相正交的单位特征向量.

Tags: ,

在此我们通过一个实例来解释如何将任意一个方阵酉相似到上三角矩阵,即求方阵 的Schur分解.以方阵

\displaystyle A= \begin{bmatrix} 4&3&0&0\\ -3&-2&0&0\\ 1&2&-3&-2\\ 4&3&8&5 \end{bmatrix}

为例.在博文举例说明将任意方阵相似到上三角矩阵的步骤中,我们介绍了将矩阵A 相似到上三角矩阵的方法.只需将该方法再加上一个QR分解的步骤,便可以 将方阵{A}酉相似到上三角矩阵,这样就得到了矩阵A 的Schur分解.

让我们继续那篇博文.已得

\displaystyle A=MR_{1}M^{-1}=\begin{bmatrix} 0&0&1&1\\ 0&0&-1&0\\ 1&-3&-1&0\\ -2&8&1&0 \end{bmatrix} \begin{bmatrix} 1&-4&-\frac{1}{2}&\frac{35}{2}\\ 0&1&-\frac{1}{2}&\frac{9}{2}\\ 0&0&1&3\\ 0&0&0&1 \end{bmatrix} \begin{bmatrix} 0&0&1&1\\ 0&0&-1&0\\ 1&-3&-1&0\\ -2&8&1&0 \end{bmatrix}^{-1}. \ \ \ \ \ (1)

下面将矩阵

\displaystyle M=\begin{bmatrix} 0&0&1&1\\ 0&0&-1&0\\ 1&-3&-1&0\\ -2&8&1&0 \end{bmatrix}

进行QR分解.令向量{\mathbf{u}_i}是矩阵{M}的第{i}列向量.令 {\mathbf{v}_1=\mathbf{u}_1},令

\displaystyle \mathbf{v}_2=\mathbf{u}_2-\frac{\mathbf{u}_2^T\mathbf{v}_1}{\mathbf{v}_1^T\mathbf{v}_1}\mathbf{v}_1=\mathbf{u}_2+\frac{19}{5}\mathbf{v}_1= \begin{bmatrix} 0\\ 0\\ \frac{4}{5}\\ \frac{2}{5} \end{bmatrix},

用矩阵语言表示即

\displaystyle \begin{bmatrix} |&|&|&|\\ \mathbf{v}_1&\mathbf{v}_2&\mathbf{u}_3&\mathbf{u}_4\\ |&|&|&| \end{bmatrix}= \begin{bmatrix} |&|&|&|\\ \mathbf{u}_1&\mathbf{u}_2&\mathbf{u}_3&\mathbf{u}_4\\ |&|&|&| \end{bmatrix} \begin{bmatrix} 1&\frac{19}{5}&0&0\\ 0&1&0&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix}.

\displaystyle \mathbf{v}_3=\mathbf{u}_3-\frac{\mathbf{u}_3^T\mathbf{v}_1}{\mathbf{v}_1^T\mathbf{v}_1}\mathbf{v}_1-\frac{\mathbf{u}_3^T\mathbf{v}_2}{\mathbf{v}_2^T\mathbf{v}_2}\mathbf{v}_2=\mathbf{u}_3+\frac{3}{5}\mathbf{v}_1+\frac{1}{2}\mathbf{v}_2= \begin{bmatrix} 1\\ -1\\ 0\\ 0 \end{bmatrix}

用矩阵语言表示即

\displaystyle \begin{bmatrix} |&|&|&|\\ \mathbf{v}_1&\mathbf{v}_2&\mathbf{v}_3&\mathbf{u}_4\\ |&|&|&| \end{bmatrix}= \begin{bmatrix} |&|&|&|\\ \mathbf{v}_1&\mathbf{v}_2&\mathbf{u}_3&\mathbf{u}_4\\ |&|&|&| \end{bmatrix} \begin{bmatrix} 1&0&\frac{3}{5}&0\\ 0&1&\frac{1}{2}&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix}.

\displaystyle \mathbf{v}_4=\mathbf{u}_4-\frac{\mathbf{u}_4^T\mathbf{v}_1}{\mathbf{v}_1^T\mathbf{v}_1}\mathbf{v}_1-\frac{\mathbf{u}_4^T\mathbf{v}_2}{\mathbf{v}_2^T\mathbf{v}_2}\mathbf{v}_2-\frac{\mathbf{u}_4^T\mathbf{v}_3}{\mathbf{v}_3^T\mathbf{v}_{3}}\mathbf{v}_3=\mathbf{u}_4-\frac{1}{2}\mathbf{v}_3= \begin{bmatrix} \frac{1}{2}\\ \frac{1}{2}\\ 0\\ 0 \end{bmatrix}

用矩阵语言表示即

\displaystyle \begin{bmatrix} |&|&|&|\\ \mathbf{v}_1&\mathbf{v}_2&\mathbf{v}_3&\mathbf{v}_4\\ |&|&|&| \end{bmatrix}= \begin{bmatrix} |&|&|&|\\ \mathbf{v}_1&\mathbf{v}_2&\mathbf{v}_3&\mathbf{u}_4\\ |&|&|&| \end{bmatrix} \begin{bmatrix} 1&0&0&0\\ 0&1&0&0\\ 0&0&1&-\frac{1}{2}\\ 0&0&0&1 \end{bmatrix}.

因此

\displaystyle \begin{bmatrix} |&|&|&|\\ \mathbf{u}_1&\mathbf{u}_2&\mathbf{u}_3&\mathbf{u}_4\\ |&|&|&| \end{bmatrix}= \begin{bmatrix} |&|&|&|\\ \mathbf{v}_1&\mathbf{v}_2&\mathbf{v}_3&\mathbf{v}_4\\ |&|&|&| \end{bmatrix} \begin{bmatrix} 1&0&0&0\\ 0&1&0&0\\ 0&0&1&\frac{1}{2}\\ 0&0&0&1 \end{bmatrix} \begin{bmatrix} 1&0&-\frac{3}{5}&0\\ 0&1&-\frac{1}{2}&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix} \begin{bmatrix} 1&-\frac{19}{5}&0&0\\ 0&1&0&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix},

\displaystyle \begin{bmatrix} 0&0&1&1\\ 0&0&-1&0\\ 1&-3&-1&0\\ -2&8&1&0 \end{bmatrix}= \begin{bmatrix} 0&0&1&\frac{1}{2}\\ 0&0&-1&\frac{1}{2}\\ 1&\frac{4}{5}&0&0\\ -2&\frac{2}{5}&0&0 \end{bmatrix} \begin{bmatrix} 1&-\frac{19}{5}&-\frac{3}{5}&0\\ 0&1&-\frac{1}{2}&0\\ 0&0&1&\frac{1}{2}\\ 0&0&0&1 \end{bmatrix},

上式可化为

\displaystyle M=\begin{bmatrix} 0&0&1&1\\ 0&0&-1&0\\ 1&-3&-1&0\\ -2&8&1&0 \end{bmatrix}=QR_2= \begin{bmatrix} 0&0&\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\ 0&0&-\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\ \frac{\sqrt{5}}{5}&\frac{2 \sqrt{5}}{5}&0&0\\ -\frac{2 \sqrt{5}}{5}&\frac{\sqrt{5}}{5}&0&0 \end{bmatrix} \begin{bmatrix} \sqrt{5}&-\frac{19 \sqrt{5}}{5}&-\frac{ 3 \sqrt{5}}{5}&0\\ 0&\frac{2 \sqrt{5}}{5}&-\frac{\sqrt{5}}{5}&0\\ 0&0&\sqrt{2}&\frac{\sqrt{2}}{2}\\ 0&0&0&\frac{\sqrt{2}}{2} \end{bmatrix},

这样就得到了矩阵{M}的QR分解.将矩阵{M}的QR分解代入表达式(1),可 得{A=MR_1M^{-1}=Q(R_2R_1R_2^{-1})Q^{-1}},化简即

\displaystyle A= \begin{bmatrix} 0&0&\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\ 0&0&-\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\ \frac{\sqrt{5}}{5}&\frac{2 \sqrt{5}}{5}&0&0\\ -\frac{2 \sqrt{5}}{5}&\frac{\sqrt{5}}{5}&0&0 \end{bmatrix} \begin{bmatrix} 1&-10&- \frac{3 \sqrt{10}}{10}&-\frac{11\sqrt{10}}{10}\\ 0&1&- \frac{\sqrt{10}}{10}&\frac{13\sqrt{10}}{10}\\ 0&0&1&6\\ 0&0&0&1 \end{bmatrix}\begin{bmatrix} 0&0&\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\ 0&0&-\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\ \frac{\sqrt{5}}{5}&\frac{2 \sqrt{5}}{5}&0&0\\ -\frac{2 \sqrt{5}}{5}&\frac{\sqrt{5}}{5}&0&0 \end{bmatrix}^{T}.

(一些关键数据:

\displaystyle R_2^{-1}= \begin{bmatrix} \frac{\sqrt{5}}{5}&\frac{19 \sqrt{5}}{10}&\frac{5 \sqrt{2}}{4}&-\frac{5 \sqrt{2}}{4}\\ 0&\frac{\sqrt{5}}{2}&\frac{\sqrt{2}}{4}&-\frac{\sqrt{2}}{4}\\ 0&0&\frac{\sqrt{2}}{2}&-\frac{\sqrt{2}}{2}\\ 0&0&0&\sqrt{2} \end{bmatrix}.

) 这样就得到了矩阵{A}的Schur分解.

Tags: ,