实对称矩阵

You are currently browsing articles tagged 实对称矩阵.

矩阵的奇异值分解,任意秩为$r$的$m\times n$矩阵$A$都可以分解成如下形式:
$$
A=UDV^T,
$$
其中$U$是$m\times m$的正交矩阵,$V$是$n\times n$的正交矩阵,
$$
D=
\begin{bmatrix}
\bm{\Sigma}&\bm{O}\\
\bm{O}&\bm{O}
\end{bmatrix},
$$

$$
\bm{\Sigma}=
\begin{bmatrix}
\sigma_1&~&~&~\\
~&\sigma_2&~&~\\
~&~&&\ddots&~\\
~&~&~&~&\sigma_{r}
\end{bmatrix},
$$
$\forall 1\leq i\leq r$,$\sigma_i> 0$.

将矩阵$A$的奇异值分解变形如下:
$$
AV=UD,
$$
该式的意义非常鲜明.设正交矩阵$V$的第$i$个列向量为$\bm{v}_i$($1\leq i\leq r$),则向量$\bm{v}_i$经过矩阵$A$的作用,映射为向量$\sigma_{i}\bm{u}_i$,其中$\bm{u}_i$是矩阵$U$的第$i$个列向量.而 对于任意的$r_{j}$经过矩阵$A$的作用,映射为零向量.

矩阵$V$的前$r$个列向量形成矩阵$A$的行空间的基底,矩阵$U$的前$r$个列向量形成矩阵$A$的列空间的基底.

考虑矩阵$A$奇异值分解的转置
$$
A^T=VD^TU^T,
$$
该式可改写为
$$
A^TU=VD^T.
$$
该式的意义也非常鲜明.设正交矩阵$U$的第$i$个列向量为$\bm{u}_i(1\leq i\leq r)$,则向量$\bm{u}_{i}$经过矩阵$A^T$的作用,映射为向量$\sigma_i\bm{v}_i$,其中$\bm{v}_i$是矩阵$V$的第$i$个列向量.而对于任意的$r<j\leq m$,矩阵$U$的第$j$个列向量$\bm{u}_j$经过矩阵$A$的作用,映射为零向量.

由上面的分析,可作如下的映射图示:$\forall 1\leq i\leq r$,
$$
\bm{v}_i\stackrel{A}{\longrightarrow}\sigma_i\bm{u}_i\stackrel{A^{T}}{\longrightarrow}\sigma_i^2\bm{v}_i, $$ 即,$\forall 1\leq i\leq r$,向量$\bm{v}_{i}$在矩阵$A^TA$的作用下,会映射为向量$\sigma_i^2\bm{v}_i$.而当$j>r$时,向量$\bm{v}_j$在矩阵$A^TA$的作用下会映射为零向量.

这说明,如果忽略向量的伸长(包括反向伸长)作用,则对于向量$\bm{v}_{i}(\forall 1\leq i\leq r)$来说,矩阵$A$和矩阵$A^T$的作用效果是互逆的.这是对矩阵转置的一种直观理解.特别地,当$A$是对称矩阵时,$A=A^T$,说明对称矩阵$A$对$\bm{v}_i$的作用和矩阵$A$本身对$\bm{v}_i$的作用是互逆的,这只能说明,对于对称矩阵$A$来说,它的作用只能是伸长(或反向伸长)向量$\bm{v}_i$,这正是实对称矩阵的谱分解定理.这是对于对称矩阵的一种直观理解.

Tags: , ,

下面我们求矩阵

\displaystyle A= \begin{bmatrix} -2&2&2\\ 2&1&4\\ 2&4&1 \end{bmatrix}

的Schur分解.设线性变换{T:\mathbf{C}^3\rightarrow \mathbf{C}^3}{\alpha_0=(\mathbf{e}_1,\mathbf{e}_2,\mathbf{e}_3)}下的矩阵 {[T]_{\alpha_0}^{\alpha_0}=A}.

易求得{A}的特征值是{-3,-3,6}.{A}的特征值{-3}对应于某个单位 特征向量{\mathbf{v}_1^{(1)}= \begin{bmatrix} \frac{-2}{\sqrt{5}}\\ \frac{1}{\sqrt{5}}\\ 0 \end{bmatrix}_{\alpha_{0}} }.然后再在{\mathbf{C}^3}中选取两个向量{\mathbf{v}_2^{(1)},\mathbf{v}_3^{(1)}},使得 {\alpha_{1}=(\mathbf{v}_1^{(1)},\mathbf{v}_2^{(1)},\mathbf{v}_3^{(1)})}构成 {\mathbf{C}^3}的一组单位正交基底.不妨令

\displaystyle \mathbf{v}_2^{(1)}= \begin{bmatrix} \frac{1}{\sqrt{5}}\\ \frac{2}{\sqrt{5}}\\ 0 \end{bmatrix}_{\alpha_{0}},\mathbf{v}_3^{(1)}= \begin{bmatrix} 0\\ 0\\ 1 \end{bmatrix}_{\alpha_{0}}.

则线性变换{T}在基{\alpha_1}下的矩阵为

\displaystyle A_1= \begin{bmatrix} -3&0&0\\ 0&2&\frac{10}{\sqrt{5}}\\ 0&\frac{10}{\sqrt{5}}&1 \end{bmatrix}.

然后将矩阵{A_1}的第{1}列和第{1}行去掉,得到其子矩阵

\displaystyle B_1= \begin{bmatrix} 2&\frac{10}{\sqrt{5}}\\ \frac{10}{\sqrt{5}}&1 \end{bmatrix}.

事实上,{\mbox{span}\{\mathbf{v}_2^{(1)},\mathbf{v}_{3}^{(1)}\}}形成{\mathbf{C}^3} 的一个二维子空间{W^2}.且{\beta_{1}=(\mathbf{v}_2^{(1)},\mathbf{v}_3^{(1)})}形成{W^2}的一组基 底.存在线性变换{G_1:W^2\rightarrow W^2},使得{G_1}在基{\beta_1}下的矩阵 {[G_1]_{\beta_1}^{\beta_1}}就是矩阵{B_1}.矩阵{B_1}的特征值为{-3,6}.特 征值{-3}对应于某个单位特征向量{ \begin{bmatrix} -\frac{2}{3}\\ \frac{\sqrt{5}}{3} \end{bmatrix}_{\beta_1} }. 因此矩阵{A}的特征值{-3}还对应于某个单位特征向量{\mathbf{v}_2^{(2)}= \begin{bmatrix} 0\\ -\frac{2}{3}\\ \frac{\sqrt{5}}{3} \end{bmatrix}_{\alpha_1} }.

{\alpha_2=(\mathbf{v}_1^{(1)},\mathbf{v}_2^{(2)},\mathbf{v}_3^{(2)})} 构成{\mathbf{C}^3}的一组单位正交基底,不妨设{\mathbf{v}_3^{(2)}= \begin{bmatrix} 0\\ \frac{\sqrt{5}}{3}\\ \frac{2}{3} \end{bmatrix}_{\alpha_1} }.线性变换{T}在基{\alpha_2}下的矩阵为

\displaystyle [T]_{\alpha_2}^{\alpha_2}= \begin{bmatrix} -3&0&0\\ 0&-3&0\\ 0&0&6 \end{bmatrix}.

\displaystyle \begin{array}{rcl} \alpha_2&=&\left( \begin{bmatrix} 1\\ 0\\ 0 \end{bmatrix}_{\alpha_1}, \begin{bmatrix} 0\\ -\frac{2}{3}\\ \frac{\sqrt{5}}{3} \end{bmatrix}_{\alpha_1}, \begin{bmatrix} 0\\ \frac{\sqrt{5}}{3}\\ \frac{2}{3} \end{bmatrix}_{\alpha_1} \right) \\&=&\left( \begin{bmatrix} -\frac{2}{\sqrt{5}}\\ \frac{1}{\sqrt{5}}\\ 0 \end{bmatrix}_{\alpha_0}, \begin{bmatrix} \frac{-2}{3 \sqrt{5}}\\ \frac{-4}{3 \sqrt{5}}\\ \frac{\sqrt{5}}{3} \end{bmatrix}_{\alpha_0}, \begin{bmatrix} \frac{1}{3}\\ \frac{2}{3}\\ \frac{2}{3} \end{bmatrix}_{\alpha_{0}} \right) \end{array}

因此矩阵

\displaystyle A=[I]_{\alpha_{2}}^{\alpha_{0}}[T]_{\alpha_2}^{\alpha_{2}}[I]_{\alpha_0}^{\alpha_2}= \begin{bmatrix} -\frac{2}{\sqrt{5}}&\frac{1}{\sqrt{5}}&0\\ -\frac{2}{3 \sqrt{5}}&-\frac{4}{3 \sqrt{5}}&\frac{\sqrt{5}}{3}\\ \frac{1}{3}&\frac{2}{3}&\frac{2}{3} \end{bmatrix}^{T} \begin{bmatrix} -3&0&0\\ 0&-3&0\\ 0&0&6 \end{bmatrix}\begin{bmatrix} -\frac{2}{\sqrt{5}}&\frac{1}{\sqrt{5}}&0\\ -\frac{2}{3 \sqrt{5}}&-\frac{4}{3 \sqrt{5}}&\frac{\sqrt{5}}{3}\\ \frac{1}{3}&\frac{2}{3}&\frac{2}{3} \end{bmatrix}

这就是实对称矩阵{A}的Schur分解.

事实上,对于任意的Hermite矩阵{A}来说,由 Schur分解定理,都存在酉矩阵{O}和上三角矩阵{U},使得{A=\overline{O}^{T}UO},因此 {\overline{A}^{T}=\overline{O}^{T}\overline{U}^{T}O},由于 {\overline{A}^T=A},因此{U=\overline{U}^T},表明上三角矩阵{U}只能是实对 角矩阵{D}.可见,Hermite矩阵{A}的特征值都是实数.

特别地,当{A}是实对称矩阵时,由实对称矩阵{A}进行Schur分解的过程可以断 定,{A}必定存在一组互相正交的单位特征向量.

Tags: ,