五月 2018

You are currently browsing the monthly archive for 五月 2018.

在博文有复特征值的实矩阵蕴含旋伸中,我们证明 了若{A}{2\times 2}实矩阵,且有复特征值 {\lambda=a-bi(b\neq 0)}及对应的复特征向量{\mathbf{v}},那么

\displaystyle A=PCP^{-1},

其中{P= \begin{bmatrix} \Re \mathbf{v}&\Im \mathbf{v} \end{bmatrix},C= \begin{bmatrix} a&-b\\ b&a \end{bmatrix}. }

只是,在那篇博文里,我们的证明是使用了复矩阵.现在我们仅使用实矩阵来证明 这个结论.

首先,我们考虑如下问题:已知实矩阵{A}的复特征值和对应的复特征向量,把矩阵 {A}恢复出来.做法如下:因为{A}有特征值{a+bi}以及{a+bi}对应的特征向量 {\mathbf{v}=\Re \mathbf{v}+i\Im \mathbf{v}},因此

\displaystyle A(\mathbf{v})=(a+bi)(\Re \mathbf{v}+i\Im \mathbf{v})=(a\Re \mathbf{v}-b\Im \mathbf{v})+i(b\Re \mathbf{v}+a\Im \mathbf{v}). \ \ \ \ \ (1)

而且,矩阵{A}必有特征值{a-bi}以及{a-bi}对应的特征向量 {\overline{\mathbf{v}}=\Re \mathbf{v}-i\Im \mathbf{v}},因此

\displaystyle A(\overline{\mathbf{v}})=(a-bi)(\Re \mathbf{v}-i\Im \mathbf{v})=(a\Re \mathbf{v}-b\Im \mathbf{v})-i(b\Re \mathbf{v}+a\Im \mathbf{v}) \ \ \ \ \ (2)

(1)+(2),再除以{2},可得

\displaystyle A\left(\frac{\mathbf{v}+\overline{\mathbf{v}}}{2}\right)=A(\Re \mathbf{v})=\frac{A(\mathbf{v})+A(\overline{\mathbf{v}})}{2}=a\Re \mathbf{v}-b\Im \mathbf{v}, \ \ \ \ \ (3)

(1)(2),再除以{2i},可得

\displaystyle A\left(\frac{\mathbf{v}-\overline{\mathbf{v}}}{2i}\right)=A(\Im \mathbf{v})=\frac{A(\mathbf{v})-A(\overline{\mathbf{v}})}{2i}=b\Re \mathbf{v}+a\Im \mathbf{v}, \ \ \ \ \ (4)

 

 

向量{\Re \mathbf{v}}{\Im\mathbf{v}}必定是线性无关的.否 则,{A\left(\frac{\mathbf{v}+\overline{\mathbf{v}}}{2}\right)}{A\left(\frac{\mathbf{v}-\overline{\mathbf{v}}}{2i}\right)}会线性相关, 即存在不全为零的复数{k_1,k_2},使得

\displaystyle k_1A\left(\frac{\mathbf{v}+\overline{\mathbf{v}}}{2}\right)+k_2A\left(\frac{\mathbf{v}-\overline{\mathbf{v}}}{2i}\right)=\mathbf{0},

\displaystyle A\left(k_1 \frac{\mathbf{v+\overline{\mathbf{v}}}}{2}+k_2 \frac{\mathbf{v}-\overline{\mathbf{v}}}{2i}\right)=\mathbf{0}.

因为{\Im \mathbf{v}}是非零向量(否则A不会是实矩阵),因此{\mathbf{v}}{\overline{\mathbf{v}}}必 定线性无关,因此{\mathbf{v+\overline{\mathbf{v}}}}{\mathbf{v}-\overline{\mathbf{v}}}线性无关.因此

\displaystyle k_1 \frac{\mathbf{v+\overline{\mathbf{v}}}}{2}+k_2 \frac{\mathbf{v}-\overline{\mathbf{v}}}{2}\neq \mathbf{0},

这表明,{A}将由向量\mathbf{v}和向量\overline{\mathbf{v}}张成的2维空间中的一个非零向量作用成了一个零向量,这是不可能的(想想为什么?).矛盾.可见,{\Re \mathbf{v}}{\Im \mathbf{v}}线性无关.这个结论表明,{\Re \mathbf{v}}{\Im \mathbf{v}}可以形成{\mathbf{C}^2}的一组基.

 

 

设线性变换{T:\mathbf{C}^2\rightarrow \mathbf{C}^2}在单位正交基底 {\mathcal{A}=\{\mathbf{e}_1,\mathbf{e}_2\}}下的矩阵是{A},则在基底 {\mathcal{B}=\{\Re \mathbf{v},\Im \mathbf{v}\}}下, 线性变换{T}的矩阵是{[T]_{\mathcal{B}}^{\mathcal{B}}= \begin{bmatrix} a&-b\\ b&a \end{bmatrix}=C, } 我们知道,

\displaystyle [T]_{\mathcal{A}}^{\mathcal{A}}=[I]_{\mathcal{B}}^{\mathcal{A}}[T]_{\mathcal{B}}^{\mathcal{B}}[I]_{\mathcal{A}}^{\mathcal{B}},

{A=PCP^{-1}}.

Tags: ,

设空间直角坐标系中有点{A(x_1,y_1,z_1)},以及点{B(x_2,y_2,z_2)}.让我们求 出以{OA,OB}为邻边的平行四边形的面积,其中点{O}是坐标原点{(0,0,0)}.

为此,构造线段{OC},使得线段{OC}{OA,OB}张成的平面垂直.则以 {OA,OB,OC}为棱的平行六面体的体积在数值上等于以{OA,OB}为邻边的平行四 边形的面积,再乘以线段{OC}的长度.

向量{\overrightarrow{OC}}的坐标可以为

\displaystyle \left( \begin{vmatrix} y_1&z_1\\ y_2&z_2 \end{vmatrix},- \begin{vmatrix} x_1&z_1\\ x_2&z_2 \end{vmatrix}, \begin{vmatrix} x_1&y_1\\ x_2&y_2 \end{vmatrix} \right),

(这是因为,

\displaystyle \begin{array}{rcl} \overrightarrow{OC}\cdot \overrightarrow{OA}&=&x_1 \begin{vmatrix} y_1&z_1\\ y_2&z_2 \end{vmatrix}-y_1 \begin{vmatrix} x_1&z_1\\ x_2&z_2 \end{vmatrix}+z_1 \begin{vmatrix} x_1&y_1\\ x_2&y_2 \end{vmatrix} \\&=& \begin{vmatrix} x_1&y_1&z_1\\ x_1&y_1&z_1\\ x_2&y_2&z_2 \end{vmatrix} \\&=&0. \end{array}

说明{\overrightarrow{OC}}垂直于{\overrightarrow{OA}},基于类似的理由,{\overrightarrow{OC}}垂直于 {\overrightarrow{OB}}.)

此时,以{OC,OA,OB}为棱的平行六面体的体积{V}

\displaystyle \begin{vmatrix} \begin{vmatrix} y_1&z_1\\ y_2&z_2 \end{vmatrix}&- \begin{vmatrix} x_1&z_1\\ x_2&z_2 \end{vmatrix}& \begin{vmatrix} x_1&y_1\\ x_2&y_2 \end{vmatrix}\\ x_1&y_1&z_1\\ x_2&y_2&z_2 \end{vmatrix}= \begin{vmatrix} y_1&z_1\\ y_2&z_2 \end{vmatrix}^2+ \begin{vmatrix} x_1&z_1\\ x_2&z_2 \end{vmatrix}^2+ \begin{vmatrix} x_1&y_1\\ x_2&y_2 \end{vmatrix}^2.

因此以{OA,OB}为邻边的平行四边形的面积,等于上述平行六面体的体积,除以 {OC}的长度{|OC|},即为

\displaystyle \frac{V}{|OC|}=\frac{\begin{vmatrix} y_1&z_1\\ y_2&z_2 \end{vmatrix}^2+ \begin{vmatrix} x_1&z_1\\ x_2&z_2 \end{vmatrix}^2+ \begin{vmatrix} x_1&y_1\\ x_2&y_2 \end{vmatrix}^2}{\sqrt{\begin{vmatrix} y_1&z_1\\ y_2&z_2 \end{vmatrix}^2+ \begin{vmatrix} x_1&z_1\\ x_2&z_2 \end{vmatrix}^2+ \begin{vmatrix} x_1&y_1\\ x_2&y_2 \end{vmatrix}^2}}=\sqrt{\begin{vmatrix} y_1&z_1\\ y_2&z_2 \end{vmatrix}^2+ \begin{vmatrix} x_1&z_1\\ x_2&z_2 \end{vmatrix}^2+ \begin{vmatrix} x_1&y_1\\ x_2&y_2 \end{vmatrix}^2}

:这种方法可以推广到高维情形.我们会有后续博文.

Tags:

同事替她亲戚问我一道初中几何题,题目及我的解答如下:

题目: 将两块全等的三角板按如图1所示摆放,其中{\angle A_1CB_1=\angle ACB=90^{\circ}},{\angle A_1=\angle A=30^{\circ}}.

  • 将图1中的{\triangle A_1B_1C}顺时针旋转{45^{\circ}}得图2,点 {P_1}{A_1C}{AB}的交点,点{Q}{A_1B_1}{BC}的交点,求证:{CP_1=CQ}.

  • 在图2中,若{AP_1=2},则{CQ}等于多少?
  • 在图3中,在{B_1C}上取一点{E},连接{BE,P_1E},设{BC=1},当{BE\perp P_1B}时,求{\triangle P_1BE}面积的最大值.

 

 

 

 

 

解:

  • \displaystyle \begin{cases} \angle CB_1Q=\angle CBP_1=60^{\circ}\\ B_1C=BC\\ \angle B_1CQ=\angle BCP_1=45^{\circ} \end{cases}\Rightarrow \triangle B_1CQ\cong \triangle BCP_1\Rightarrow CP_1=CQ.

  • 如图4所示,过点{P_1}{CA}的垂线,垂足为{H}.则 {P_1H=\frac{1}{2}P_1A=1}(直角三角形{30^{\circ}}内角所对的直角边长度 为斜边长度的一半).则{CP_1=\sqrt{2}P_1H=\sqrt{2}}.因此{CQ=CP_1=\sqrt{2}}.

  • {\triangle A_1CB_1}以点{C}为旋转中心顺时针旋转{\alpha}度角.过点{P_1}{CA}的垂线,垂足为{H}.设{AP_1=x},则 {P_1H=\frac{1}{2}AP_1=\frac{x}{2}},{AH=\sqrt{3}P_1H=\frac{\sqrt{3}}{2}x}.所 以{CH=CA-AH=\sqrt{3}-\frac{\sqrt{3}}{2}x},所以

    \displaystyle \tan\alpha=\frac{P_1H}{CH}=\frac{\frac{x}{2}}{\sqrt{3}-\frac{\sqrt{3}}{2}x},

    解得{x=\frac{2 \sqrt{3}\tan\alpha}{1+\sqrt{3}\tan\alpha}}.所以

    \displaystyle BP_1=AB-AP_1=2-\frac{2 \sqrt{3}\tan\alpha}{1+\sqrt{3}\tan\alpha}=\frac{2}{1+ \sqrt{3}\tan\alpha}.

    如图5所示,因为{\angle EBP_1+\angle ECP_1=90^{\circ}+90^{\circ}=180^{\circ}},所以{B,E,C,P_1}四点共圆.或者 可以这么看,取{EP_1}的中点{M},因为{\triangle EBP_1}是直角三角形,所以 {BM=\frac{1}{2}EP_1=EM=P_1M}(直角三角形斜边上的中线等于斜边一半),同 理,{CM=EM=P_1M}.因此,

    \displaystyle BM=EM=CM=P_1M,

    照样可得{B,E,C,P_1}四点共圆,且点{M}是圆心.

因此{\angle BP_1E=\angle BCE=\alpha}(同弧所对的圆周角相等).因此

\displaystyle \frac{BE}{BP_1}=\tan\alpha,

可得

\displaystyle BE=BP_1\tan\alpha=\frac{2\tan\alpha}{1+\sqrt{3}\tan\alpha}.

因此

\displaystyle \begin{array}{rcl} S_{\triangle EBP_1}&=&\frac{1}{2}BE\cdot BP_1 \\&=&\frac{1}{2} \times\frac{2\tan\alpha}{1+\sqrt{3}\tan\alpha}\cdot \frac{2}{1+\sqrt{3}\tan\alpha} \\&=&\frac{2\tan\alpha}{(1+\sqrt{3}\tan\alpha)^2} \\&=&\frac{2\tan\alpha}{1+3\tan\alpha^2+2 \sqrt{3}\tan\alpha} \\&=&\frac{2}{\frac{1}{\tan\alpha}+3\tan\alpha+2 \sqrt{3}} \\&=&\frac{2}{(\frac{1}{\tan\alpha}+3\tan\alpha-2 \sqrt{3})+4 \sqrt{3}} \\&=&\frac{2}{(\sqrt{\frac{1}{\tan\alpha}}-\sqrt{3\tan\alpha})^{2}+4 \sqrt{3}} \\&\leq& \frac{2}{4 \sqrt{3}}=\frac{\sqrt{3}}{6}. \end{array}

等号当且仅当{\tan\alpha=\frac{\sqrt{3}}{3}},即{\alpha=30^{\circ}}时取到. \Box

我们知道,

\displaystyle 2^n=C_n^0+C_n^1+\cdots+C_n^k+\cdots+C_n^n.

因此,

\displaystyle \begin{array}{rcl} 2^0+2^1+\cdots+2^n&=&C_0^0 \\&+&(C_1^0+C_1^1) \\&+&(C_2^0+C_2^1+C_2^2) \\&+&\cdots \\&+&(C_n^0+C_n^{1}+C_n^{2}+\cdots+C_n^n) \\&=&(C_0^0+C_1^0+C_2^0+\cdots+C_n^0) \\&+&(C_1^1+C_2^1+\cdots+C_n^1) \\&+&(C_2^2+C_3^2+\cdots+C_n^2) \\&+&\cdots \\&+&(C_{n-1}^{n-1}+C_n^{n-1}) \\&+&C_n^n. \end{array}

利用杨辉三角中呈现的组合恒等式

\displaystyle C_{r}^{r}+C_{r+1}^{r}+\cdots+C_n^{r}=C_{n+1}^{r+1},

可将上式进一步化为

\displaystyle C_{n+1}^1+C_{n+1}^2+\cdots+C_{n+1}^n+C_{n+1}^{n+1}=2^{n+1}-1.

因此

\displaystyle 2^0+2^1+\cdots+2^n=2^{n+1}-1.

更加一般地,当{p\neq 1}时,由二项式定理,

\displaystyle p^n=[1+(p-1)]^n=C_n^0(p-1)^{0}+C_n^1(p-1)^1+\cdots+C_n^k(p-1)^k+\cdots+C_n^n(p-1)^{n},

因此,

\displaystyle \begin{array}{rcl} p^0+p^1+\cdots+p^n&=&C_0^0(p-1)^0 \\&+&[C_1^0(p-1)^0+C_1^1(p-1)^1] \\&+&[C_2^0(p-1)^0+C_2^1(p-1)^1+C_2^2(p-2)^2] \\&+&\cdots \\&+&[C_n^0(p-1)^0+C_n^1(p-1)^1+\cdots+C_n^n(p-1)^n] \\&=&(C_0^0+C_1^0+C_2^0+\cdots+C_n^0)(p-1)^0 \\&+&(C_1^1+C_2^1+\cdots+C_n^1)(p-1)^1 \\&+&\cdots\\&+&(C_{n-1}^{n-1}+C_n^{n-1})(p-1)^{n-1} \\&+&C_n^n(p-1)^n \\&=&C_{n+1}^1(p-1)^0+C_{n+1}^2(p-1)^1+\cdots+C_{n+1}^n(p-1)^{n-1}+C_{n+1}^{n+1}(p-1)^n \\&=&[C_{n+1}^1(p-1)^1+C_{n+1}^2(p-1)^2+\cdots+C_{n+1}^n(p-1)^{n}+C_{n+1}^{n+1}(p-1)^{n+1}]/(p-1) \\&=&\frac{[1+(p-1)]^{n+1}-1}{p-1}. \\&=&\frac{p^{n+1}-1}{p-1}. \end{array}

Tags:

在国内的所有课本里,二项式定理只不过是排列组合公式的一个应用,从而轻而易举地得到了二项式定理。但是这无法体现实际的数学探究过程,更像是探究完毕后的一个总结升华。就像唐僧师徒要去西天取经,经书由孙悟空一个筋斗翻到西天灵山,再翻一个筋斗就取回来了,没有人会从这样的一个取经过程中获益。

 

如果叫一个新人来探究二项式展开,他一开始不太可能想到这种方法。事实上,他更可能是从研究杨辉三角开始。纵观数学史,不同的文明在研究二项式展开的时候,不约而同地发明了杨辉三角。说明作为合理探究的一部分,研究杨辉三角对于二项式定理来说,是必经之路。在此,我们打造以杨辉三角为核心的二项式定理教学,带领学生领略完整的数学探究的过程。其中最主要的一点是,如何通过猜想和归纳,得到二项式系数的公式。如下是非常简略的大纲(我也没那么多时间和耐心把这个大纲细致化和完整化)

 

 

我们在初中知道完全平方公式

\displaystyle (a+b)^2=a^2+2ab+b^2.

在完全平方公式的基础上,可得{(a+b)^3}的展开式:

\displaystyle \begin{array}{rcl} (a+b)^3&=&(a+b)^2(a+b) \\&=&(a^2+2ab+b^2)(a+b) \\&=&a^3+a^2b+2a^2b+2ab^2+b^2a+b^3 \\&=&a^3+3a^2b+3ab^2+b^3. \end{array}

下面从递推的角度来研究{(a+b)^n}的展开式,其中{n}是任意的正整数.先待定系 数,设

\displaystyle (a+b)^n=\sum_{k=0}^{n} T_{n,k}a^{n-k}b^k,

\displaystyle (a+b)^{n+1}=\sum_{k=0}^{n+1}T_{n+1,k}a^{n+1-k}b^{k}.

由于

\displaystyle \begin{array}{rcl} (a+b)^{n+1}&=&(a+b)^n(a+b) \\&=&\left(\sum_{k=0}^{n}T_{n,k}a^{n-k}b^k\right)\left(a+b\right) \\&=&\sum_{k=0}^nT_{n,k}a^{n+1-k}b^k+\sum_{k=0}^nT_{n,k}a^{n-k}b^{k+1} \\&=&T_{n,0}a^{n+1}+\sum_{k=0}^{n-1} (T_{n,k+1}+T_{n,k})a^{n-k}b^{k+1}+T_{n,n}b^{n+1}, \end{array}

因此{T_{n+1,0}=T_{n,0}},{T_{n+1,n+1}=T_{n,n}},除此之外,{\forall 0\leq k\leq n-1},都有

\displaystyle T_{n+1,k+1}=T_{n,k+1}+T_{n,k}. \ \ \ \ \ (1)

且由于{(a+b)^{0}=1},{(a+b)^1=a+b},因此 {T_{0,0}=1},{T_{1,0}=1,T_{1,1}=1}.将{T_{n,k}}放在第{n+1}行第{k+1}个位置,可得杨辉三角数阵. 递推式(1)是数阵产生的主要公式.

下面我们研究{T_{n,k}}的公式.

定理 1 对于任意正整数{n\geq 2},以及满足{k<n}的正整数{k},有 {T_{n,k}=\sum_{i=k-1}^{n-1}T_{i,k-1}}.

证明: 使用数学归纳法.

  • {n=k+1}时,{T_{k+1,k}=T_{k,k-1}+T_{k,k}=T_{k,k-1}+1=T_{k,k-1}+T_{k-1,k-1}},此时命题成立.
  • 假设当{n=p}时命题成立,其中{p\in \mathbf{N}}{p\geq k+1}.即

    \displaystyle T_{p,k}=\sum_{i=k-1}^{p-1}T_{i,k-1},

    则当 {n=p+1}时,

    \displaystyle T_{p+1,k}=T_{p,k}+T_{p,k-1}=\sum_{i=k-1}^{p-1}T_{i,k-1}+T_{p,k-1}=\sum_{i=k-1}^{p}T_{i,k-1}.

    由数学归纳法,命题成立.

\Box

推论1 {\forall n\in \mathbf{N}},{T_{n,0}=1}.

证明: {T_{n,0}=T_{n-1,0}=\cdots=T_{1,0}=1}. \Box

推论2 {\forall n\geq 1},{T_{n,1}=n}.

证明: 由定理1,

\displaystyle T_{n,1}=\sum_{i=0}^{n-1}T_{i,0}=\sum_{i=0}^{n-1}1=n.

\Box

推论3 {\forall n\geq 2},{T_{n,2}=\frac{n(n-1)}{2}}.

证明: 由定理1,

\displaystyle T_{n,2}=\sum_{i=1}^{n-1}T_{i,1}=\sum_{i=1}^{n-1}i=\frac{n(n-1)}{2}.

\Box

做到这一步,一般人就无法继续做下去了,因为

\displaystyle T_{n,3}=\sum_{i=2}^{n-1}T_{i,2}=\sum_{i=2}^{n-1}\frac{i(i-1)}{2}

的公式很难猜,{T_{n,k}}的一般公式就更难猜了.于是我们采用另一种 思路来研究杨辉三角,不再研究杨辉三角相邻项的和差关系,取而代之地,是研究 杨辉三角相邻项的比例关系.从杨辉三角第{2}行开始,将前一项除以后一项,得到 一个新的数表,新数表前几行如下.

由此猜测

\displaystyle T_{n,k}:T_{n,k+1}=k+1:n-k.

证明:{n} 使用数学归纳法.

  • {n=1}时,{T_{1,0}:T_{1,1}=1:1}.
  • 假设当{n=p}时,{\forall 0\leq k\leq p},都有 {T_{p,k}:T_{p,k+1}=k+1:p-k}.其中{p\geq 1}{p\in \mathbf{N}}.则

    \displaystyle \begin{array}{rcl} T_{p+1,k+1}:T_{p+1,k+2}&=&(T_{p,k}+T_{p,k+1}):(T_{p,k+1}+T_{p,k+2}) \\&=&\frac{p+1}{k+1}T_{p,k}:\frac{p+1}{k+2}T_{p,k+1}\\&=&\frac{1}{k+1}T_{p,k}:\frac{1}{k+2}T_{p,k+1} \\&=&k+2:p-k \end{array}

由数学归纳法,命题成立. \Box

因此,我们有如下结论:

\displaystyle \begin{array}{rcl} T_{n,k}&=&\frac{n-k+1}{k}T_{n,k-1} \\&=&\frac{n-k+1}{k}\frac{n-k+2}{k-1}T_{n,k-2} \\&=&\cdots \\&=&\frac{(n-k+1)(n-k+2)\cdots n}{k(k-1)(k-2)\cdots 1}T_{n,0} \\&=&\frac{(n-k+1)(n-k+2)\cdots n}{k(k-1)(k-2)\cdots 1}1 \\&=&\frac{n!}{(n-k)!k!} \end{array}

其实在这方面做得最好的还是Pascal的原始论文:Pascal的论文下载.

Tags: ,

受博文x_1+x_2+……+x_r=n的非负整数解的个数的启发,下面我们给出组合数C_n^m的几何意义.

1. m=2的情形

如图1,是一个等腰直角三角形的点阵,其直角边上有{n-1}个点.如果把这个点阵放 在平面直角坐标系中,可以用点集

\displaystyle \{(x,y)|x+y\leq n-2,x,y\in \mathbf{N}\}

来描述.

该点阵第{1}列有{n-1}个点,第{2}列有{n-2}个点,……,第{k}列有{n-k}个 点,……,第{n-1}列有{1}个点,因此该点阵中所有点的数目是

\displaystyle 1+2+\cdots+(n-1)=\frac{n(n-1)}{2}=C_n^2,

恰好是从{n}个不同元素中任意选取{2}个元素的所有选法总数.这是个巧合吗? 不是,可以作如下解释:

{n}个不同的元素是{a_1,a_2,\cdots,a_{n}}.从这{n}个元素任取两个元素,记 这两个元素为{a_i}{a_j},其中{i<j}.则所有取法可分类如下:

  • {i=1}时,{j}可以取{2,\cdots,n},共有{n-1}种取法.这{n-1}种取法对应于 图1中点阵第{1}列的{n-1}个点,即对应于点集{\{(x,y)|x=0,x+y\leq n-2,y\in \mathbf{N}\}}中的{n-1}个点.
  • {i=2}时,{j}可以取{3,\cdots,n},共有{n-2}种取法.这{n-2}种取法对应于 图1中点阵第{2}列的{n-2}个点,即对应于点集{\{(x,y)|x=1,x+y\leq n-2,y\in \mathbf{N}\}}中的{n-2}个点.
  • {\vdots}
  • {i=p}时,{j}可以取{p+1,\cdots,n},共有{n-p}种取法.这{n-p}种取法对应于 图1中点阵第{p}列的{n-p}个点,即对应于点集{\{(x,y)|x=p-1,x+y\leq n-2,y\in \mathbf{N}\}}中的{n-p}个点.
  • {\vdots}
  • {i=n-1}时,{j}只能等于{n},共有{1}种取法.这{1}种取法对应于图1中点阵 第{n-1}列,即最后一列中的{1}个点,即对应于点集{\{(x,y)|x=n-1,x+y\leq n-1,y\in \mathbf{N}\}}中的{1}个点.

由于从{n}个不同元素中任意选取{2}个元素共有{C_n^2}种取法,因此图1中的点 集也必有{C_n^2}个点.

2. m=3的情形

我们再来看图2,是空间中的一个三棱锥点阵.该三棱锥有三条互相垂直的棱,且这 三条互相垂直的棱上都有{n-2}个点.将该三棱锥恰当地放在空间直角坐标系中,可 以用点集{\{(x,y,z)|x+y+z\leq n-3,x,y,z\in \mathbf{N}\}}表示.下面我们来 说明,该点集中点的数目是{C_n^3}.

设有{n}个互不相同的元素{a_1,a_2,\cdots,a_n}.从这{n}个元素中任取{3}个元 素,记这{3}个元素为{a_i,a_j,a_k},且{i<j<k}.则所有取法可分类如下:

  • {i=1}时,只用在{a_{2},\cdots,a_{n}}中选取{a_j}{a_k},共有 {C_{n-1}^{2}}种选法,这和三棱锥点阵从上往下数第{n-2}层的点的数目是一样的,即和点集{\{(x,y,z)|z=0,x+y+z\leq n-3,x,y,z\in \mathbf{N}\}}中点的数目是一样的.
  • {\vdots}
  • {i=p}时,只用在{a_{p+1},\cdots,a_n}中选取{a_j}{a_k},共有 {C_{n-p}^{2}}种选法,这和三棱锥点阵从上往下数第{n-p-1}层的点的数目是 一样的,即和点集{\{(x,y,z)|z=p-1,x+y+z\leq n-3,x,y,z\in \mathbf{N}\}} 中点的数目是一样的.
  • {\vdots}
  • {i=n-2}时,{a_j,a_k}只有一种选法,即{j=n-1,k=n}的选法.这和三棱锥 点阵第从上往下数第{1}层的点的数目是一样的.

由于从{n}个不同元素中任意选取{3}个元素共有{C_n^3}种取法,因此图2种的点 集也必有{C_n^3}个点.

3. 一般情形

下面,我们使用数学归纳法证明,{m}维空间中的点集

\displaystyle \{(x_1,x_2,\cdots,x_m)|x_1+x_2+\cdots+x_m\leq n-m,x_1,x_2,\cdots,x_m\in \mathbf{N}\}

中共有{C_n^m}个点.

{m=1}时,{x_1\leq n-1}显然有{n=C_n^1}个解,它们分别是 {0,1,\cdots,n-1}.可见{m=1}时命题成立.

假设当{m\leq k},其中{k\in \mathbf{N}^{+}},点集{\{(x_{1},x_{2},\cdots,x_{m})|x_1+x_{2}+\cdots+x_m\leq n-m,x_1,x_2,\cdots,x_m\in \mathbf{N}\}}中都有{C_n^m}个点.则当{m=k+1}时,点集{\{(x_{1},\cdots,x_{m},x_{m+1})|x_1+\cdots+x_m+x_{m+1}\leq n-(m+1),x_1,\cdots,x_m,x_{m+1}\in \mathbf{N}\}}有如下情形

  • {x_{m+1}=0}时,由归纳假设, \{(x_1,x_2,\cdots,x_m,0)|x_1+\cdots+x_m\leq (n-1)-m,x_1,\cdots,x_m\in \mathbf{N}\} 中有{C_{n-1}^{m}}个点.
  • {x_{m+1}=1}时,由归纳假 设,\{(x_1,x_2,\cdots,x_m,1)|x_1+\cdots+x_m\leq (n-2)-m,x_1,\cdots,x_{m}\in \mathbf{N}\}中有{C_{n-2}^{m}}个点.
  • {\vdots}
  • {x_{m+1}=p}时,由归纳假 设,\{(x_1,x_2,\cdots,x_m,p)|x_1+\cdots+x_m\leq (n-p)-m,x_1,\cdots,x_m\in \mathbf{N}\}中有{C_{n-(p+1)}^{m}}个点.
  • {\vdots}
  • {x_{m+1}=n-(m+1)}时,由归纳假设 \{(x_1,x_2,\cdots,x_m,n-(m+1))|x_1+\cdots+x_m\leq 0,x_{1},\cdots,x_{m}\in \mathbf{N}\}中有{C_m^m=1}个点.

综上可见,由归纳假设,点集 {\{(x_1,x_2,\cdots,x_m,x_{m+1})|x_1+\cdots+x_{m+1}\leq n-(m+1),x_{1},\cdots,x_{m+1}\in \mathbf{N}\}}中共有

\displaystyle C_m^m+C_{m+1}^m+\cdots+C_{m+k}^m+\cdots+C_{n-1}^m

个点.

然后使用组合方法证明,

\displaystyle C_m^m+C_{m+1}^m+\cdots+C_{m+k}^m+\cdots+C_{n-1}^m=C_{n}^{m+1}.

{n}个互不相同的东西{a_1,a_2,\cdots,a_{n}}中任意选取{m+1}个元素,共有 {C_n^{m+1}}种选法.设选 出的元素为{a_{i_1},a_{i_2},\cdots,a_{i_{m+1}}},且设{i_1<i_2<\cdots<i_{m+1}}.

  • {i_1=1}时,{a_{i_{2}},\cdots,a_{i_{m+1}}}只能在 {a_{2},\cdots,a_{n}}中选,有{C_{n-1}^m}种选法
  • {\vdots}
  • {i_1=k}时,{a_{i_2},\cdots,a_{i_{m+1}}}只能在 {a_{k+1},\cdots,a_n}中选,有{C_{n-k}^{m}}种选法.
  • {\vdots}
  • {i_1=n-m}时,{a_{i_2},\cdots,a_{i_{m+1}}}只能在 {a_{n-m+1},\cdots,a_n}中选,有{C_m^m}种选法.

因此,

\displaystyle C_m^m+C_{m+1}^m+\cdots+C_{m+k}^m+\cdots+C_{n-1}^m=C_n^{m+1}.

可见,点集{\{(x_1,x_2,\cdots,x_m,x_{m+1})|x_1+\cdots+x_{m+1}\leq n-(m+1),x_1,\cdots,x_{m+1}\in \mathbf{N}\}}中共有{C_n^{m+1}}个点.

由数学归纳法,命题得证.

Tags:

 

题目: 求方程{x_1+x_2+\cdots+x_{r}=n}非负整数解的个数,其中{n}{r}都是正整数.

解: 首先我们归纳出{x_1+x_2+\cdots+x_{r}=n}的非负整数解的个数公式.

{r=1}时,{x_1=n}显然只有一个非负整数解.

再解决{r=2}的情形.即探讨{r_{1}+r_{2}=n}非负整数解的个数.此时显然有{n+1} 个非负整数解.

{r=3}时,探讨{r_{1}+r_{2}+r_{3}=n}非负整数解的个数.当{r_{3}=0}时,有 {n+1}个非负整数解,{r_{3}=1}时,有{n}个非负整数解,……,{r_{3}=k}时,有{n-k+1}个非负整数解,……,{r_{3}=n}时,有{1}个非负整数解.因此当{r=3}时,非负整数解的个数是

\displaystyle 1+2+\cdots+(n+1)=\frac{(n+1)(n+2)}{2}.

{r=4}时,探讨{r_1+r_2+r_3+r_4=n}非负整数解的个数.当{r_4=0}时,有 {\frac{(n+1)(n+2)}{2}}个非负整数解.当{r_4=1}时,有{\frac{n(n+1)}{2}}个非负整数解,……,{r_4=k}时,有{\frac{(n-k+1)(n-k+2)}{2}}个非负整数解,……,{r_4=n}时,有 {\frac{1\times 2}{2}}个非负整数解.因此当{r=4}时,非负整数解的个数是

\displaystyle \begin{array}{rcl} \frac{1}{2}\sum_{i=1}^{n+1}i(i+1) &=&\frac{1}{2}\times \frac{1}{3}\sum_{i=1}^{n+1}[i(i+1)(i+2)-(i-1)i(i+1)] \\&=&\frac{1}{6}(n+1)(n+2)(n+3) \end{array}

下面,我们用第二数学归纳法证明,方程{x_1+x_2+\cdots+x_{r}=n}的非负整数解的个 数是

\displaystyle \frac{1}{(r-1)!}(n+1)(n+2)\cdots (n+r-1)=\frac{(n+r-1)!}{n!(r-1)!}=C_{n+r-1}^{n}.

  • {r=1}时,{1=C_{n+1-1}^n},命题成立.
  • 设当{r\leq k(k\in \mathbf{N}^+)}时,{x_1+x_2+\cdots+x_k=n}都有{C_{n+k-1}^{n}}个非负整数解.然后探讨{x_1+x_2+\cdots+x_k+x_{k+1}=n}的非负整数解的个数.当{x_{k+1}=0}时, 有{C_{n+k-1}^{n}}个非负整数解,当{x_{k+1}=1}时,有{C_{n+k-2}^{n-1}}个非负整数解,……, 当{x_{k+1}=p}时,有{C_{(n-p)+(k-1)}^{n-p}}个非负整数解,……,当{x_{k+1}=n}时, 有{C_{(n-n)+(k-1)}^{n-n}=1}个非负整数解.因此{x_1+x_2+\cdots+x_{k+1}=n}的非负整数解的总数是

    \displaystyle \begin{array}{rcl} C_{k-1}^0+C_k^1+C_{k+1}^2+\cdots+C_{k+(n-1)}^n&=&(C_{k-1}^0+C_k^1)+C_{k+1}^2+\cdots+C_{k+(n-1)}^n \\&=&C_{k+1}^1+C_{k+1}^2+C_{k+2}^3+\cdots+C_{k+(n-1)}^n \\&=&(C_{k+1}^1+C_{k+1}^2)+C_{k+2}^3+\cdots+C_{k+(n-1)}^n \\&=&C_{k+2}^2+C_{k+2}^3+\cdots+C_{k+(n-1)}^n \\&\vdots& \\&=&C_{k+(n-2)}^{n-1}+C_{k+(n-1)}^{n} \\&=&C_{n+k}^{n}. \end{array}

    注意在上面的过程中反复运用了组合数的公式

    \displaystyle C_{n+1}^m=C_n^m+C_{n}^{m-1}.

    由数学归纳法,命题对任意正整数r成立.\Box

Tags:

如下定理来自David C.Lay的《线性代数及其应用》第5.5节.该定理表明,有复特征值的实2阶矩阵和平面上的旋伸矩阵相似.

定理 设{A}{2\times 2}实矩阵,有复特征值{\lambda=a-bi(b\neq 0)}及对应的 {\mathbb{C}^2}中的复特征向量{\mathbf{v}},那么

\displaystyle A=PCP^{-1},

其中{P=[\Re \mathbf{v},\Im \mathbf{v}]},{C= \begin{bmatrix} a&-b\\ b&a \end{bmatrix} }.{\Re \mathbf{v}}代表向量{\mathbf{v}}的实部向量,{\Im \mathbf{v}}代表 {\mathbf{v}}的虚部向量.

证明: 设矩阵{A}对应于 {\lambda_{1}=a-bi}的复特征向量{\mathbf{v}_{1}= \begin{bmatrix} u_1\\ v_1 \end{bmatrix}+i \begin{bmatrix} u_2\\ v_2 \end{bmatrix}, }其中{u_1,v_1,u_2,v_2\in \mathbf{R}}.实矩阵{A}必定还有特征值 {\lambda_2=\overline{\lambda_1}=a+bi},{\lambda_2}对应于特征向量{\mathbf{v}_2= \begin{bmatrix} u_1\\ v_1 \end{bmatrix}-i \begin{bmatrix} u_2\\ v_2 \end{bmatrix}. }

矩阵{C= \begin{bmatrix} a&-b\\ b&a \end{bmatrix} }有两个特征值,其中特征值{a-bi}对应于特征向量{\mathbf{w}_1= \begin{bmatrix} 1\\ i \end{bmatrix}, }特征值{a+bi}对应于特征向量{ \mathbf{w}_{2}=\begin{bmatrix} 1\\ -i \end{bmatrix} }.

记矩阵{C}的特征向量{\{\mathbf{w}_1,\mathbf{w}_2\}}形成基底{\mathcal{C}},矩阵{A}的特征向量{\{\mathbf{v}_1,\mathbf{v}_2\}}形成基底{\mathcal{A}}.且设标准正交基底{\{\mathbf{e}_1,\mathbf{e}_2\}}{\mathcal{E}}.设线性变 换{T_{1}:\mathbb{C}^2\rightarrow\mathbb{C}^2}在标准正交基底{\mathcal{E}}下的矩阵为 {A},即{[T_{1}]_{\mathcal{E}}^{\mathcal{E}}=A},设线性变换{T_2}在标准正交基{\mathcal{E}}下的矩阵为{C},即{[T_2]_{\mathcal{E}}^{\mathcal{E}}=C}.则{[T_{1}]_{\mathcal{A}}^{\mathcal{A}}=[T_{2}]_{\mathcal{C}}^{\mathcal{C}}= \begin{bmatrix} a-bi&0\\ 0&a+bi \end{bmatrix} }.

下面研究矩阵{A}{C}的关系,即研究矩阵 {[T_1]_{\mathcal{E}}^{\mathcal{E}}}和矩阵 {[T_2]_{\mathcal{E}}^{\mathcal{E}}}的关系.

\displaystyle [T_1]_{\mathcal{E}}^{\mathcal{E}}=[I]_{\mathcal{A}}^{\mathcal{E}}[T_1]_{\mathcal{A}}^{\mathcal{A}}[I]_{\mathcal{E}}^{\mathcal{A}},

\displaystyle [T_2]_{\mathcal{E}}^{\mathcal{E}}=[I]_{\mathcal{C}}^{\mathcal{E}}[T_2]_{\mathcal{C}}^{\mathcal{C}}[I]_{\mathcal{E}}^{\mathcal{C}},

结合 {[T_1]_{\mathcal{A}}^{\mathcal{A}}=[T_2]_{\mathcal{C}}^{\mathcal{C}}} 可得

\displaystyle [T_1]_{\mathcal{E}}^{\mathcal{E}}=[I]_{\mathcal{A}}^{\mathcal{E}}[I]_{\mathcal{E}}^{\mathcal{C}}[T_2]_{\mathcal{E}}^{\mathcal{E}}[I]_{\mathcal{C}}^{\mathcal{E}}[I]_{\mathcal{E}}^{\mathcal{A}}=([I]_{\mathcal{A}}^{\mathcal{E}}[I]_{\mathcal{E}}^{\mathcal{C}})[T_2]_{\mathcal{E}}^{\mathcal{E}}([I]_{\mathcal{A}}^{\mathcal{E}}[I]_{\mathcal{E}}^{\mathcal{C}})^{-1}

\displaystyle [I]_{\mathcal{A}}^{\mathcal{E}}[I]_{\mathcal{E}}^{\mathcal{C}}= \begin{bmatrix} u_1+iu_2&u_1-iu_2\\ v_1+iv_2&v_1-iv_2 \end{bmatrix} \begin{bmatrix} 1&1\\ i&-i \end{bmatrix}^{-1}=\begin{bmatrix} u_1+iu_2&u_1-iu_2\\ v_1+iv_2&v_1-iv_2 \end{bmatrix} \begin{bmatrix} \frac{1}{2}&-\frac{i}{2}\\ \frac{1}{2}&\frac{i}{2} \end{bmatrix}= \begin{bmatrix} u_1&u_2\\ v_1&v_2 \end{bmatrix}=P.

因此

\displaystyle A=PCP^{-1}.

\Box

Tags: ,

题目 1 求证:{A_n^k+kA_n^{k-1}=A_{n+1}^k}.

解: 除了使用排列数{A_n^{m}}的公式证明之外,这个恒等式其实还有实际的排列意义.

考虑{n+1}个两两不同的数{a_1,a_2,\cdots,a_{n+1}}.从这{n+1}个数中任意选取{k}个数,再把这{k}个数按照一定的次序排成一列,共有{A_{n+1}^k}种方法.

还可以从另外一个角度看待这个问题.从{n+1}个数中选取{k}个数依次排成一列这件事,可以分为两类情况.

  • 第一类:这{k}个数是从{a_1,a_2,\cdots,a_n}中选的,再按顺序排成一列,共有 {A_n^k}种方法.
  • 第二类:这{k}个数中有{a_{n+1}}.从{a_1,a_2,\cdots,a_n}中选取{k-1}个数,排成一列,共 有{A_n^{k-1}}种排法,再把{a_{n+1}}插入该列{k-1}个数,可以把a_{n+1}放在第1个位置,第2个位置,……,第k个位置,共有{k}种插法.因此 由乘法原理第二类共有{kA_n^{k-1}}种方法.

由加法原理,{A_{n+1}^k=A_n^k+kA_n^{k-1}}. \Box

 

题目2:如图,四边形{ABCD}是矩形,图中其它各线或平行于{AB},或平行 于{BC},则图中共有几个矩形?  

我们来探索一般的问题.设图中共有{m}根竖线,其中{AB}是竖线{S_0},一直 到{DC}是竖线{S_{m-1}}.设图中有{n}根横线,其中{BC}是横线{H_{0}},一直 到{AD}是横线{H_{n-1}}.记竖线{S_{i}}和横线{H_{j}}的交点为{(i,j)}.

解法1: 我们来计算右上顶点为{(i,j)}的矩形有多少个.右上顶点为{(i,j)}的矩形,它 的横向宽度有{1,\cdots,i}种选择,纵向长度有{1,\cdots,j}种选择.因此由分 步乘法原理,共有{ij}个矩形以点{(i,j)}为右上顶点.求和

\displaystyle \sum_{0\leq i\leq m-1,0\leq j\leq n-1}ij=\frac{m(m-1)}{2}\frac{n(n-1)}{2}.

即可得所有矩形的数目.在上图中,{m=13,n=7},因此共有{1638}个矩形. \Box

解法2: 每个矩形都被其四个顶点{(i_1,j_1),(i_2,j_1),(i_1,j_2),(i_2,j_2)}所确 定,其中{0\leq i_1,i_{2}\leq m-1,0\leq j_1,j_2\leq n-1}.这里共涉及 {i_1,i_2,j_1,j_2}四个数.其中选出{i_1,i_2}(没有顺序要求)共有 {{m\choose 2}}种方法,选出{j_1,j_2}(没有顺序要求)共有{{n\choose 2}}种 方法.因此确定一个矩形共有

\displaystyle {n\choose 2}{m\choose 2}=\frac{m(m-1)}{2}\frac{n(n-1)}{2}.

种方法. \Box

题目3 (如下解法错在哪儿?) 若将{6}名教师派送到{4}所中学支教,要求每所中学至少分得{1}名教师,至多{2} 名,则不同的派送方案种数为?

:由于每个中学至少要安排一名老师,因此先选出{4}个老师,安排到 {4}所中学,共有{A_6^4}种安排方法.还剩下两名老师选择四个学校,共有{A_4^2} 种选法.因此总共有

\displaystyle A_6^4\times A_4^{2}=4320

种分派方法.

解: 上述解法有重复.举个例子.记{6}名教师为{A,B,C,D,E,F},{4}所学校记为{1,2,3,4}.先从{6}名教师中选择{4}名教师安排到{4}所学校,一种安排方案是

\displaystyle A\rightarrow 1,B\rightarrow 2,C\rightarrow 3,D\rightarrow 4.

还要把{E,F}两个教师安排到四所学校中的两所学校,不妨设{E\rightarrow 3},{F\rightarrow 4}.

这样的方案和如下方案是等同的:

  • 先安排{A\rightarrow 1,B\rightarrow 2,E\rightarrow 3,D\rightarrow 4},再安排 {C\rightarrow 3},{F\rightarrow 4}.
  • 先安排{A\rightarrow 1,B\rightarrow 2},{C\rightarrow 3},{F\rightarrow 4},再安排{E\rightarrow 3},{D\rightarrow 4}.
  • 先安排{A\rightarrow 1,B\rightarrow 2,E\rightarrow 3,F\rightarrow 4},再安排{C\rightarrow 3,D\rightarrow 4}.

上面的四种情况被我们的解答认为是不同的情况,但实际上它们是同一种.因此实 际答案应该是{\frac{1}{4}A_6^4A_4^2=1080}种情况. \Box

题目4 同样是题目3,下面的解法错在哪?

:由于必有两所学校会被分配到两位老师,因此先把{6}位老师进行 分组.先从{6}位老师中任选两位老师,形成一组,有{C_6^2}种选法,再从剩下 的{4}位老师中任选两位老师,形成一组,有{C_4^2}种选法.最后的两位老师各自 形成一组.这样就有{4}组老师.把这{4}组老师分配到{4}所中学,共有{A_4^4}种 分法.由分步乘法原理,共有

\displaystyle C_6^2C_4^2A_4^4=2160

种方案.

解: 还是举例子.记{6}名教师分别是{A,B,C,D,E,F},{4}所学校分别是甲、乙、丙、 丁.先从{6}名教师中取{2}名教师,如果取的是{A,B}.再从剩下的{4}名教师中 取{2}名教师,如果取的是{C,D}.最后剩下两名教师{E,F}各自形成一个团队.这 四个团队在分配给四所学校之前,没有顺序要求.

这就和下面的选法重复:先从{6}名教师中选取{C,D},形成一个团队,再从剩下的 {4}名教师中选取{A,B},形成一个团队,然后{E,F}各自形成一个团队.因此应该把算出来的答案再除以{2},得到{1080}. \Box

题目5 (2014浙江高考){(1+x)^6(1+y)^4}的展开式中,记{x^my^n}项的系数为{f(m,n)},则{f(3,0)+f(2,1)+f(1,2)+f(0,3)=(~~)}

  • A.{45}
  • B.{60}
  • C.{120}
  • D.{210}

 

解法1: {f(m,n)=C_6^mC_4^n},因此

\displaystyle f(3,0)+f(2,1)+f(1,2)+f(0,3)=C_6^3C_4^0+C_6^2C_4^1+C_6^1C_4^2+C_6^0C_4^3=120.

\Box

解法2:{x^3y^0,x^2y^1,x^1y^2,x^0y^3}的系数之和,与{(1+x)^6(1+x)^4=(1+x)^{10}}{x^3}项的系数相同,所以{f(3,0)+f(2,1)+f(1,2)+f(0,3)=C_{10}^3=120}. \Box

注5.1:如上两个证明殊途同归,导致如下等式成立

\displaystyle C_6^3C_4^0+C_6^2C_4^1+C_6^1C_4^2+C_{6}^{0}C_{4}^{3}=C_{10}^3.

更加一般地,有如下恒等式成立:

\displaystyle C_{m+n}^k=C_m^kC_n^0+C_m^{k-1}C_n^1+\cdots+C_m^{k-p}C_{n}^{p}+\cdots+C_m^0C_n^k.

不难理解如上恒等式的组合意义.作为一个特例,当{m=n=k}时,可得

\displaystyle \begin{array}{rcl} C_{2n}^n&=&C_n^nC_n^0+C_n^{n-1}C_n^1+\cdots+C_n^{n-p}C_n^{p}+\cdots+C_n^0C_n^n \\&=&(C_n^0)^2+(C_n^1)^2+\cdots+(C_n^{p})^2+\cdots+(C_n^n)^2. \end{array}

Tags:

此文写于2015年5月20日.现补充了几个例题,整理在此.

 

我们证明如下定理:

定理1  复数域上的任意一个{n(n\geq 1)}阶方阵必定相似于一个上三角矩阵.

为了证明该命题,只用证明,

定理1的变式 对于任一线性变换{T_{n}:\mathbf{C}^{n}\rightarrow \mathbf{C}^{n}}来说,存在复线性空间{\mathbf{C}^n}的一组 基{(\mathbf{v}_1,\cdots,\mathbf{v}_n)},使得{\forall k\in \{1,\cdots,n\}},{T_{n}(\mathbf{v}_k)\in \hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)}.其中{\hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)}是由向量{\mathbf{v}_1,\cdots,\mathbf{v}_k}张成的线性空间.此时,我们称线 性变换{T_n}是可上三角化的.

证明:我们归纳地说明这个事实.首先,当{n=1}时命题显然成立.设当{n=k(k\geq 1)}时命题仍然成立.则当{n=k+1}时,根据代数基本定理,线性映射{T_{k+1}}必 然有一特征值{\lambda_{k+1}}和对应于该特征值的某个特征向量{\mathbf{v}_{k+1}},使 得

\displaystyle T_{k+1}(\mathbf{v}_{k+1})=\lambda_{k+1}\mathbf{v}_{k+1}.\ \ \ \ \ (1)

{\{\mathbf{v}_1,\cdots,\mathbf{v}_k,\mathbf{v}_{k+1}\}}{\mathbf{C}^n}的一组基.{\forall T(\mathbf{v})\in \hbox{span}(T_{k+1}(\mathbf{v}_1),\cdots,T_{k+1}(\mathbf{v}_k))},其中 {\mathbf{v}\in \hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)},有唯一 的{a_1,\cdots,a_{k+1}\in \mathbf{C}},使 得

\displaystyle T_{k+1}(\mathbf{v})=a_1\mathbf{v}_1+\cdots+a_n\mathbf{v}_n+a_{n+1}\mathbf{v}_{k+1} \ \ \ \ \ (2)

这样就建立了一个 从{\hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)}{\hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)}的线性映 射

\displaystyle G:\mathbf{v}\rightarrow a_1\mathbf{v}_1+\cdots+a_n\mathbf{v}_k. \ \ \ \ \ (3)

根据归纳假 设,线性映射{G}是可上三角化的,即存 在{\hbox{span}(\mathbf{v}_1,\cdots,\mathbf{v}_k)}的一组 基{\{\mathbf{w}_1,\cdots,\mathbf{w}_k\}},使得

\displaystyle \begin{cases} G(\mathbf{w}_1)\in\hbox{span}(\mathbf{w}_1),\\ G(\mathbf{w}_2)\in\hbox{span}(\mathbf{w}_1,\mathbf{w}_2),\\ \vdots\\ G(\mathbf{w}_k)\in\hbox{span}(\mathbf{w}_1,\cdots,\mathbf{w}_k). \end{cases}

于是,结合式(2)和式(3),可得

\displaystyle \begin{cases} T_{k+1}(\mathbf{w}_1)\in\hbox{span}(\mathbf{v}_{k+1},\mathbf{w}_1),\\ T_{k+1}(\mathbf{w}_2)\in\hbox{span}(\mathbf{v}_{k+1},\mathbf{w}_1,\mathbf{w}_2),\\ \vdots\\ T_{k+1}(\mathbf{w}_k)\in\hbox{span}(\mathbf{v}_{k+1},\mathbf{w}_1,\cdots,\mathbf{w}_k). \end{cases}

再加 上(1),因此,在基 {(\mathbf{v}_{k+1},\mathbf{w}_1,\cdots,\mathbf{w}_k)}下,线性映 射{T_{k+1}}是呈现上三角化形式的.这样,根据数学归纳法,我们已经对一切正 整数{n}证明了这个命题. \Box

例 1 找到一个上三角矩阵{U},使得矩阵{A= \begin{bmatrix} 2&4&3\\ -4&-6&-3\\ 3&3&1 \end{bmatrix} }与矩阵{U}相似.

解:{\mathbf{C}^{3}}的一组基 为{\mathcal{A}=\{\mathbf{e}_1,\mathbf{e}_2,\mathbf{e}_3\}}.且设存在线 性变换 {T:\mathbf{C}^3\rightarrow \mathbf{C}^{3}},满足{[T]_{\mathcal{A}}^{\mathcal{A}}=A}.

首先求矩阵{A}的特征值.设矩阵{A}的特征值是{\lambda},则

\displaystyle \begin{vmatrix} 2-\lambda&4&3\\ -4&-6-\lambda&-3\\ 3&3&1-\lambda \end{vmatrix}=0,

解得{\lambda=1}{\lambda=-2}.特征值{1}对应的某个特征向量是{ \mathbf{v}_1=\begin{bmatrix} 1\\ -1\\ 1 \end{bmatrix}_{\mathcal{A}} }.

然后,在{\mathbf{C}^3}中寻找到另外两个向量{\mathbf{v}_2,\mathbf{v}_3},使 得{\mathbf{v}_1,\mathbf{v}_2,\mathbf{v}_3}线性无关.设 {\{\mathbf{v}_1,\mathbf{v}_2,\mathbf{v}_3\}}形成基{\mathcal{B}}.不妨令{\mathbf{v}_2= \begin{bmatrix} 1\\ -1\\ 0 \end{bmatrix}_{\mathcal{A}} },{\mathbf{v}_3= \begin{bmatrix} 0\\ 1\\ 0 \end{bmatrix}_{\mathcal{A}}. } 则线性变换{T}在基{\mathcal{B}}下的矩阵

\displaystyle [T]_{\mathcal{B}}^{\mathcal{B}}= \begin{bmatrix} 1&0&3\\ 0&-2&1\\ 0&0&-2 \end{bmatrix}.

因此

\displaystyle [T]_{\mathcal{A}}^{\mathcal{A}}=A=[I]_{\mathcal{B}}^{\mathcal{A}}[T]_{\mathcal{B}}^{\mathbf{\mathcal{B}}}[I]_{\mathcal{A}}^{\mathcal{B}}= \begin{bmatrix} 1&1&0\\ -1&-1&1\\ 1&0&0 \end{bmatrix} \begin{bmatrix} 1&0&3\\ 0&-2&1\\ 0&0&-2 \end{bmatrix} \begin{bmatrix} 1&1&0\\ -1&-1&1\\ 1&0&0 \end{bmatrix}^{-1}.

\Box

例 2 找到一个上三角矩阵{U},使得矩阵{A= \begin{bmatrix} 4&-9\\ 4&-8 \end{bmatrix} }{U}相似.

解:{\mathbf{C}^2}的一组基为 {\mathcal{A}=\{\mathbf{e}_1,\mathbf{e}_2\}}.且线性变换 {T:\mathbf{C}^2\rightarrow \mathbf{C}^2}在该基下的矩阵为{[T]_{\mathcal{A}}^{\mathcal{A}}=A}.设矩阵{A}的特征值是{\lambda},则

\displaystyle \begin{vmatrix} 4-\lambda&-9\\ 4&-8-\lambda \end{vmatrix}=0,

解得{\lambda=-2}.特征值{-2}对应的一个特征向量是{ \mathbf{v}_{1}=\begin{bmatrix} 3\\ 2 \end{bmatrix}_{\mathcal{A}} }.我们再寻找另外一个向量{\mathbf{v}_2= \begin{bmatrix} 1\\ 0 \end{bmatrix}_{\mathcal{A}} },使得{\mathbf{v}_1,\mathbf{v}_2}线性无关,也形成{\mathbf{C}^2}的一组基 {\mathcal{B}=\{\mathbf{v}_1,\mathbf{v}_2\}}.则

\displaystyle [T]_{\mathcal{B}}^{\mathcal{B}}= \begin{bmatrix} -2&2\\ 0&-2 \end{bmatrix}.

因此

\displaystyle A=[T]_{\mathcal{A}}^{\mathcal{A}}=[I]_{\mathcal{B}}^{\mathcal{A}}[T]_{\mathcal{B}}^{\mathcal{B}}[I]_{\mathcal{A}}^{\mathcal{B}}= \begin{bmatrix} 3&1\\ 2&0 \end{bmatrix} \begin{bmatrix} -2&2\\ 0&-2 \end{bmatrix} \begin{bmatrix} 3&1\\ 2&0 \end{bmatrix}^{-1}.

\Box

Tags: , ,

« Older entries