2021-10-02

【線形代数学入門】二次曲線、二次曲面

線形代数

1. 記事の目的
下記の記事で二次形式について述べた。本記事では、二次形式を用いて、二次曲線および二次曲面を分類する。分類は、数学の主要な問題の一つである。

2. 幾何ベクトルの座標変換
空間(平面)の座標系とは、一点 $O$ と、幾何ベクトル空間 $V^3$ ( $V^2$ )の一つの基底 $E=\{\boldsymbol{e}_1,\boldsymbol{e}_2,\boldsymbol{e}_3 \}$ ( $E=\{\boldsymbol{e}_1,\boldsymbol{e}_2 \}$ )との組 $(O;E)$ である。

$E=\{\boldsymbol{e}_1,\boldsymbol{e}_2,\boldsymbol{e}_3 \}$ ( $E=\{\boldsymbol{e}_1,\boldsymbol{e}_2 \}$ )、 $E^{\prime}=\{\boldsymbol{e}_1^{\prime},\boldsymbol{e}_2^{\prime},\boldsymbol{e}_3^{\prime} \}$ ( $E^{\prime}=\{\boldsymbol{e}_1^{\prime},\boldsymbol{e}_2^{\prime} \}$ )として、二つの座標系 $(O;E)$ 、 $(O^{\prime};E^{\prime})$ があるとき、 $V^3$ ( $V^2$ )の基底の取り換え $E\rightarrow E^{\prime}$ の行列を $T=(t_{ij})$ とする。即ち

$\boldsymbol{e}_i^{\prime}=\displaystyle\sum_{j=1}^{3(2)}t_{ji}\boldsymbol{e}_j$

である。点 $O^{\prime}$ の、座標系 $(O;E)$ に関する位置ベクトルを

$\boldsymbol{t}_0= \begin{pmatrix} t_1 \\ t_2 \\ t_3 \end{pmatrix} \ \ ( \boldsymbol{t}_0= \begin{pmatrix} t_1 \\ t_2 \\ t_3 \end{pmatrix} )$

とする。点 $P$ の座標系 $(O;E)$ 、 $(O^{\prime};E^{\prime})$ に関する位置ベクトルを、それぞれ

$\boldsymbol{x}= \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} , \ \ \boldsymbol{y}= \begin{pmatrix} y_1 \\ y_2 \\ y_3 \end{pmatrix} \ \ ( \boldsymbol{x}= \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} , \ \ \boldsymbol{y}= \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} )$

とすると、 $\overrightarrow{(OP)}=\overrightarrow{(OO^{\prime})}+\overrightarrow{(O^{\prime}P)}$ であるから、

$\begin{split} \displaystyle\sum_{i=1}^{3(2)} x_i\boldsymbol{e}_i&=\displaystyle\sum_{i=1}^{3(2)} t_i\boldsymbol{e}_i+\displaystyle\sum_{i=1}^{3(2)} y_i\boldsymbol{e}_i^{\prime} \\ &=\displaystyle\sum_{i=1}^{3(2)} t_i\boldsymbol{e}_i+\displaystyle\sum_{j=1}^{3(2)} \left( \displaystyle\sum_{i=1}^{3(2)} y_it_{ji} \right)\boldsymbol{e}_j \end{split}$

である。したがって、

$\boldsymbol{x}=\boldsymbol{t}_0+T\boldsymbol{y}\tag{1}$

である。また、

$\tilde{\boldsymbol{x}}=\begin{pmatrix} x \\ 1 \end{pmatrix}, \ \ \tilde{\boldsymbol{y}}=\begin{pmatrix} y \\ 1 \end{pmatrix}, \ \ \tilde{T}= \begin{pmatrix} T & \boldsymbol{t}_0 \\ ^t\boldsymbol{0} & 1 \end{pmatrix}$

とおくと、

$\tilde{\boldsymbol{x}}=\tilde{T}\tilde{\boldsymbol{y}}\tag{2}$

特に、 $(O;E)$ 、 $(O^{\prime};E^{\prime})$ がともに直交座標系( $E, E^{\prime}$ が正規直交基底 )ならば、 $T$ は直交行列である(下記の記事を参照)。

camelsan.hatenablog.com

3. 二次曲線と二次曲面の定義
空間(平面)における二次曲面(二次曲線)とは、ある座標系に関する座標の二次の多項式の零点の集合のことである。

座標変換の式(1)から、座標の二次の多項式は、越の座標系に関しても二次の多項式なので、二次曲面(二次曲線)は、座標系に無関係な概念である。

二次曲面(q)がある直交座標系に関し、

$(q) \ \ : \ \ a_{11}x_1^2+a_{22}x_2^2+2a_{12}x_1x_2+2b_1x_1+2b_2x_2+c=0$

で与えられるとする。

$A= \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}, \ \ a_{21}=a_{12}, \ \ \boldsymbol{b}= \begin{pmatrix} b_1 \\ b_2 \end{pmatrix}$

とすれば、

$(q) \ \ : \ \ A[\boldsymbol{x}]+2(\boldsymbol{x}, \boldsymbol{b})+c=0 \tag{3}$

と表される。さらに

$\tilde{A}= \begin{pmatrix} A & \boldsymbol{b} \\ ^t\boldsymbol{b} & c \end{pmatrix}$

とおけば

$(q) \ \ : \ \ \tilde{A}[\tilde{\boldsymbol{x}}]=0\tag{4}$

となる。

二次曲面(Q)

$\begin{split} (Q) \ \ : \ \ a_{11}x_1^2&+a_{22}x_2^2+a_{33}x_3^2+2a_{12}x_1x_2+2a_{13}x_1x_3+2a_{23}x_2x_3 \\ &+2b_1x_2+2b_2x_2+2b_3x_3+c=0 \end{split}$

に対しても、

$A= \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{pmatrix}, \ \ a_{ij}=a_{ji}, \ \ \boldsymbol{b}= \begin{pmatrix} b_1 \\ b_2 \\ b_3 \end{pmatrix}, \ \ \tilde{A}= \begin{pmatrix} A & \boldsymbol{b} \\ ^t\boldsymbol{b} & c \end{pmatrix}$

とおけば、

$\begin{split} &(Q) \ \ : \ \ A[\boldsymbol{x}]+2(\boldsymbol{b}, \boldsymbol{x})+c=0 \\ &(Q) \ \ : \ \ \tilde{A}[\tilde{\boldsymbol{x}}] \end{split}$

と表すことができる・

式(3) ～(6)の変形結果から、二次曲線および二次曲面は、 $A, \tilde{A}$ の階数および符号によって分類される。

${\rm{sgn}}A=(p,q)$ 、 ${\rm{sgn}}\tilde{A}=(\tilde{p},\tilde{q})$ とするとき、 $p\ge q$ 、 $\tilde{p}\ge \tilde{q}$ と仮定してもよい。((q)または(Q)を標準形に変形したとき、両辺に $-1$ をかけることで、 $p\ge q$ の場合に帰着することができる。)

直交座標変換

$\tilde{\boldsymbol{x}}=\tilde{T}\tilde{\boldsymbol{y}}$

により、(q)または(Q)は、

$\tilde{A}[\tilde{\boldsymbol{x}}]=^t\tilde{T}\tilde{A}\tilde{T}[\tilde{\boldsymbol{y}}]$

と変形される。 $\tilde{T}$ を適当に選び、 $^t\tilde{T}\tilde{A}\tilde{T}$ がなるべく簡単な形になるように変形する。このとき下記の記事の定理4.2より、 $A, \tilde{A}$ の符号は一定である。

camelsan.hatenablog.com

まず、直交行列 $T$ を適当に選べば、 $^t\tilde{T}\tilde{A}\tilde{T}$ は対角行列になるので、座標変換 $\boldsymbol{x}=T\boldsymbol{y}$ を施すことで、最初から $A$ は対角行列であるとして良い。

4. 二次曲線の分類

$(q) \ \ : \ \ \tilde{A}[\tilde{\boldsymbol{x}}]=0, \ \ \tilde{A}= \begin{pmatrix} \alpha_1 & 0 & b_1 \\ 0 & \alpha_2 & b_2 \\ b_1 & b_2 & c \end{pmatrix}$

と変形しておく。
(1) $r(A)=2$ のとき
$\alpha_1\neq 0$ かつ $\alpha_2\neq 0$ で、

$(q) \ \ : \ \ a_{11}x_1^2+a_{22}x_2^2+2a_{12}x_1x_2+2b_1x_1+2b_2x_2+c=0$

より、座標変換 $x_1=y_1-\frac{b_1}{\alpha_1}$ 、 $x_2=y_2-\frac{b_2}{\alpha_2}$ を施すと、

$\begin{split} &\alpha_1(y_1-\frac{b_1}{\alpha_1})^2+\alpha_2(y_2-\frac{b_2}{\alpha_2})^2+2b_1(y_1-\frac{b_1}{\alpha_1})+2b_2(y_2-\frac{b_2}{\alpha_2})+c=0 \\ &\alpha_1(y_1^2-\frac{2y_1b_1}{\alpha_1}+\frac{b_1^2}{\alpha_1^2})+\alpha_1(y_2^2-\frac{2y_2b_2}{\alpha_2}+\frac{b_2^2}{\alpha_2^2})+2b_1y_1-\frac{2b_1^2}{\alpha_1}+2b_2y_2-\frac{2b_2^2}{\alpha_2}+c=0 \\ &\alpha_1y_1^2-2y_1b_1+\frac{b_1^2}{\alpha_1}+\alpha_2y_2^2-2y_2b_2+\frac{b_2^2}{\alpha_2}+2b_1y_1-\frac{2b_1^2}{\alpha_1}+2b_2y_2-\frac{2b_2^2}{\alpha_2}+c=0 \\ &\alpha_1y_1^2+\alpha_2y_2^2+(\frac{b_1^2}{\alpha_1}+\frac{b_2^2}{\alpha_2}+c-\frac{2b_1^2}{\alpha_1}-\frac{2b_2^2}{\alpha_2})=0 \\ &\alpha_1y_1^2+\alpha_2y_2^2+(c-\frac{b_1^2}{\alpha_1}-\frac{b_2^2}{\alpha_2})=0 \end{split}$

となる。 $y_1, y_2$ を改めて $x_1, x_2$ 、 $c^{\prime}=c-\frac{b_1^2}{\alpha_1}-\frac{b_2^2}{\alpha_2}$ とおくと

$(q) \ \ : \ \ \alpha_1x_1^2+\alpha_2x_2^2+c^{\prime}=0$

が得られる。下記で、 $a_1=\sqrt{|\alpha_1|}$ 、 $a_2=\sqrt{|\alpha_2|}$ とおく

$(q) \ \ : \ \ \begin{pmatrix} x_1 & x_2 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1 & 0 & 0 \\ 0 & \alpha_2 & 0 \\ 0 & 0 & \alpha_3 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ 1 \end{pmatrix} =0$

より、改めて

$A= \begin{pmatrix} \alpha_1 & \\ & \alpha_2 \end{pmatrix}$

とおく。

① ${\rm{sgn}}A=(2,0)$ のとき
(ア) ${\rm{sgn}}\tilde{A}=(3,0)$ のとき
$\alpha_1, \alpha_2, c^{\prime} > 0$ より、(q)の左辺は $>0$ となり、解 $(x_1, x_2)$ は存在しない。よって、(q)は空集合。
(イ) ${\rm{sgn}}\tilde{A}=(2,1)$ のとき
$\alpha_1, \alpha_2 > 0$ 、 $, c^{\prime} \lt 0$ より、 $d=\sqrt{-c^{\prime}}$ とおくと、(q)は楕円

$a_1^2x_1^2+a_2^2x_2^2=d^2$

である。 (ウ) ${\rm{sgn}}\tilde{A}=(2,0)$ のとき
$\alpha_1, \alpha_2 > 0$ 、 $, c^{\prime} = 0$ より、(q)は、

$a_1^2x_1^2+a_2^2x_2^2=0$

より、 $(x_1,x_2)=(0,0)$ の一点である。
(エ) ${\rm{sgn}}\tilde{A}=(1,1)$ のとき
$\alpha_1, \alpha_2 > 0$ より正の固有値が一つのみのときは存在しないので、この場合はない。
(オ) ${\rm{sgn}}\tilde{A}=(1,0)$ のとき
$\alpha_1, \alpha_2 > 0$ より正の固有値が一つのみのときは存在しないので、この場合はない。
② ${\rm{sgn}}A=(1,1)$ のとき
(ア) ${\rm{sgn}}\tilde{A}=(3,0)$ のとき
$\alpha_1$ と $\alpha_2$ のうち少なくとも一つ負の固有値が含まれるので、この場合はない。
(イ) ${\rm{sgn}}\tilde{A}=(2,1)$ のとき
・ $\alpha_1 > 0,\ \ \alpha_2 \lt 0, \ \ c^{\prime}\lt 0$ のとき、 $d=\sqrt{-c^{\prime}}$ として(q)は双曲線

$a_1^2x_1^2-a_2^2x_2^2=d^2$

である。・ $\alpha_1 \lt 0,\ \ \alpha_2 \lt 0, \ \ c^{\prime}\lt 0$ のとき、 $d=\sqrt{-c^{\prime}}$ として(q)は双曲線

$\begin{split} &-a_1^2x_1^2+a_2^2x_2^2=d^2 \\ &a_1^2x_1^2-a_2^2x_2^2=-d^2 \end{split}$

である。
(ウ) ${\rm{sgn}}\tilde{A}=(2,0)$ のとき
$\alpha_1\neq 0$ 、 $\alpha_2\neq 0$ より、 $c^{\prime}=0$ だが、 $\alpha_1, \alpha_2$ の一方は負なので、この場合はない。
(エ) ${\rm{sgn}}\tilde{A}=(1,1)$ のとき
$\alpha_1>0, \alpha_2 \lt 0, c^{\prime}=0$ または、 $\alpha_1\lt 0, \alpha_2 > 0, c^{\prime}=0$ で、このとき(q)は

$a_1^2x_1^2-a_2^2x_2^2=0$

となる(相交わる２直線)。 (オ) ${\rm{sgn}}\tilde{A}=(1,0)$ のとき
$\alpha_1\neq 0$ 、 $\alpha_2\neq 0$ より、零でない固有値は少なくとも２つなので、この場合はない。
③ ${\rm{sgn}}A=(1,0)$ のとき
$\alpha_1\neq 0$ 、 $\alpha_2\neq 0$ よりこの場合はない。
(2) $r(A)=1$ のとき
$\alpha_1\neq 0$ 、 $\alpha_2= 0$ として、座標系の平行移動 $x_1=y_1-\frac{b_1}{\alpha_1}$ を行うと(q)は、

$\begin{split} &\begin{pmatrix} y_1-\frac{b_1}{\alpha_1} & x_2 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1 & 0 & b_1 \\ 0 & 0& b_2 \\ b_1 & b_2 & c \end{pmatrix} \begin{pmatrix} y_1-\frac{b_1}{\alpha_1} \\ x_2 \\ 1 \end{pmatrix} \\ &= \begin{pmatrix} y_1-\frac{b_1}{\alpha_1} & x_2 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1y_1 \\ b_2 \\ b_1y_1-\frac{b_1^2}{\alpha_1}+b_2x_2+c \end{pmatrix} \\ &=\alpha_1y_1^2-y_1b_1+b_2x_2+b_1y_1-\frac{b_1^2}{\alpha_1} \\ &=\alpha_1y_1^2+2b_2x_2+c-\frac{b_1^2}{\alpha_1} \end{split}$

$y_1$ を改めて $x_1$ 、 $c^{\prime}=c-\frac{b_1^2}{\alpha_1}$ とおけば

$(q) \ \ : \ \ \alpha_1x_1^2+2b_2x_2+c^{\prime}=0$

が得られる。

$(q) \ \ : \ \ \begin{pmatrix} x_1 & x_2 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1 & 0 & 0 \\ 0 & 0 & b_2 \\ 0 & b_2 & c^{\prime} \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ 1 \end{pmatrix} =0$

より改めて

$A= \begin{pmatrix} \alpha_1 & 0 \\ 0 & 0 \end{pmatrix}, \ \ \tilde{A}= \begin{pmatrix} \alpha_1 & 0 & 0 \\ 0 & 0 & b_2 \\ 0 & b_2 & c^{\prime} \end{pmatrix}$

とおく。
① ${\rm{sgn}}A=(2,0)$ のとき
$0$ でない $A$ の固有値は一つのみなので、このような場合はない。
② ${\rm{sgn}}A=(1,1)$ のとき
①と同じ理由で、この場合はない。
③ ${\rm{sgn}}A=(1,0)$ のとき
(ア) ${\rm{sgn}}\tilde{A}=(3,0)$ のとき
$b_2=0$ とすると、 $\tilde{A}$ の $0$ でない固有値の数は2以下となり矛盾。よって、 $b_2\neq 0$ である。また、 $c^{\prime}\neq 0$ とすると、 $\tilde{A}$ を基本変形することにより $0$ でない固有値の数が２以下となり矛盾。よって $c^{\prime}=0$ である。従って(q)は、

$\begin{split} 0&= \begin{pmatrix} x_1 & x_2 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1 & 0 & 0 \\ 0 & 0 & b_2 \\ 0 & b_2 & 0 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ 1 \end{pmatrix} \\ &= \begin{pmatrix} x_1 & x_2 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1x_1 \\ b_2 \\ b_2x_2 \end{pmatrix} \\ &=\alpha_1x_1+2b_2x_2 \end{split}$

で、 $b^{\prime}=-\frac{2b_2}{\alpha_1}$ とおくと、放物線

$x_1^2=b^{\prime}x_2$

となる。
(イ) ${\rm{sgn}}\tilde{A}=(2,1)$ のとき
(ア)と同様にして $b_2\neq 0$ 、 $c^{\prime}=0$ である。 $b_2 > 0$ のとき負の固有値が存在しないので、 $b_2 \lt 0$ である。このとき、負の固有値が２つとなり、この場合はない。
(ウ) ${\rm{sgn}}\tilde{A}=(2,0)$ のとき
$c^{\prime}=0$ とする。 $b_2\neq 0$ とすると $\tilde{A}$ の $0$ でない固有値の数は３となり ${\rm{sgn}}\tilde{A}=(2,0)$ と矛盾する。 $b_2=0$ とすると、 $\tilde{A}$ の $0$ でない固有値の数は１となりこれも ${\rm{sgn}}\tilde{A}=(2,0)$ と矛盾する。よって $c^{\prime}\neq 0$ である。
$b_2\neq 0$ とすると、基本変形により $\tilde{A}$ の零でない固有値は $\alpha_1,b_2,b_2$ の３つとなり矛盾。よって $b_2\neq 0$ である。よって(q)は、

$\alpha_1x_1^2+c^{\prime}$

で左辺は $>0$ なので、空集合である。
(エ) ${\rm{sgn}}\tilde{A}=(1,1)$ のとき
$b_2\neq 0$ とすると、 $c^{\prime}=0$ のとき、 $\tilde{A}$ の $0$ でない固有値は３つとなり矛盾。また、 $c^{\prime}\neq 0$ とすると基本変形により、 $\tilde{A}$ の $0$ でない固有値は３つとなり矛盾。よって、 $b_2=0$ である。このとき、 $\alpha_1 > 0$ より、 $c^{\prime} \lt 0$ である。 $d=\sqrt{-\frac{c^{\prime}}{\alpha_1}}$ とおくと(q)は平行二直線

$x_1^2=d^2$

となる。
(オ) ${\rm{sgn}}\tilde{A}=(1,0)$ のとき
$b_2\neq 0$ または $c^{\prime}\neq 0$ とすると、 $\tilde{A}$ の固有値の数は２以上であるので矛盾。よって、 $b_2=c^{\prime}=0$ である。このとき(q)は直線

$x_1^2=0$

となる。
(3) $r(A)=0$ のとき
$\alpha_1=\alpha_2=0$ より、(q)は、

$b_1x_1+b_2x_2+c=0$

となり(q)は一次式となり、この場合はない。よって、以上で二次曲線の分類が完了した。

(2)③(オ)のとき $A[\boldsymbol{x}]=0$ は一次式と同値であるから除く。さらに空集合および一点を除けば、二次曲線は五種類

$\begin{split} &(1)①(イ) \ \ 楕円 \ \ : \ \ a_1^2+a_2^2=d^2 \\ &(1)②(イ) \ \ 双曲線 \ \ : \ \ a_1^2-a_2^2=\pm d^2 \\ &(1)②(エ) \ \ 相交わる二直線 \ \ : \ \ a_1^2-a_2^2=0 \\ &(2)③(ア) \ \ 放物線 \ \ : \ \ x_1^2=b^{\prime} \\ &(2)③(エ) \ \ 平行二直線 \ \ : \ \ x_1^2=d^2 \end{split}$

に分類される。この中で、 $A[\boldsymbol{x}$ ]が２つの一次式の積に分解される場合である(1)②(エ)、(2)③(エ)以外のものを本来の二次曲線という。それらは楕円、双曲線、放物線で尽くされる。

5. 二次曲面の分類

$\tilde{A}[\boldsymbol{x}]=0, \ \ A= \begin{pmatrix} \alpha_1 & 0 & 0 \\ 0 & \alpha_2 & 0 \\ 0 & 0 & \alpha_3 \end{pmatrix}, \ \ \tilde{A}= \begin{pmatrix} \alpha_1 & 0 & 0 & b_1 \\ 0 & \alpha_2 & 0 & b_2\\ 0 & 0 & \alpha_3 & b_3 \\ b_1 & b_2 & b_3 & c \end{pmatrix}$

とし、 $a_i=\sqrt{|\alpha_i|} \ \ (i=1,2,3)$ とおく。
(1) $r(A)=3$ のとき
平行移動 $x_i=y_i-\frac{b_i}{\alpha_i} \ \ (i=1,2,3)$ により、(Q)は、

$\begin{split} &\begin{pmatrix} y_1-\frac{b_1}{\alpha_1} & y_2-\frac{b_2}{\alpha_2} & y_3-\frac{b_3}{\alpha_3} & 1 \end{pmatrix} \begin{pmatrix} \alpha_1 & 0 & 0 & b_1 \\ 0 & \alpha_2 & 0 & b_2\\ 0 & 0 & \alpha_3 & b_3 \\ b_1 & b_2 & b_3 & c \end{pmatrix} \begin{pmatrix} y_1-\frac{b_1}{\alpha_1} \\ y_2-\frac{b_2}{\alpha_2} \\ y_3-\frac{b_3}{\alpha_3} \\ 1 \end{pmatrix} \\ &= \begin{pmatrix} y_1-\frac{b_1}{\alpha_1} & y_2-\frac{b_2}{\alpha_2} & y_3-\frac{b_3}{\alpha_3} & 1 \end{pmatrix} \begin{pmatrix} \alpha_1y_1 \\ \alpha_2y_2 \\ \alpha_3y_3 \\ b_1y_1+b_2y_2+b_3y_3-\frac{b_1^2}{\alpha_1}-\frac{b_2^2}{\alpha_2}-\frac{b_3^2}{\alpha_3}+c \end{pmatrix} \\ &=\alpha_1y_1 + \alpha_2y_2 + \alpha_3y_3 + 2b_1y_1+2b_2y_2+2b_3y_3+c-\frac{b_1^2}{\alpha_1}-\frac{b_2^2}{\alpha_2}-\frac{b_3^2}{\alpha_3} \end{split}$

となる。 $y_i$ を改めて $x_i$ と書き、 $c^{\prime}=c-\frac{b_1^2}{\alpha_1}-\frac{b_2^2}{\alpha_2}-\frac{b_3^2}{\alpha_3}$ とおくと、

$(Q) \ \ : \ \ \alpha_1x_1^2+\alpha_2x_2^2+\alpha_3x_3^2+c^{\prime}=0 \ \ (\alpha_i \neq 0)$

となる。

$(Q) \ \ : \ \ \begin{pmatrix} x_1 & x_2 & x_3 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1 & 0 & 0 & 0 \\ 0 & \alpha_2 & 0 & 0 \\ 0 & 0 & \alpha_3 & 0 \\ 0 & 0 & 0 & c^{\prime} \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \\ 1 \end{pmatrix}$

より改めて

$\tilde{A}= \begin{pmatrix} \alpha_1 & 0 & 0 & 0 \\ 0 & \alpha_2 & 0 & 0 \\ 0 & 0 & \alpha_3 & 0 \\ 0 & 0 & 0 & c^{\prime} \end{pmatrix}$

とおく。
① ${\rm{sgn}}A=(3,0)$ のとき
(ア) ${\rm{sgn}}\tilde{A}=(4,0)$ のとき
$\alpha_i > 0$ 、 $c^{\prime} > 0$ より(Q)の左辺は $>0$ なので、空集合である。
(イ) ${\rm{sgn}}\tilde{A}=(3,1)$ のとき
$\alpha_i > 0$ 、 $c^{\prime} \lt 0$ より $d=\sqrt{-c^{\prime}}$ とおくと、(Q)は楕円面

$a_1^2x_1^2+a_2^2x_2^2+a_3^2x_3^2=d^2 \ \ (d > 0)$

である。
(ウ) ${\rm{sgn}}\tilde{A}=(3,0)$ のとき
$c^{\prime}=0$ より(Q)は一点 $(x_1,x_2,x_3)=(0,0,0)$ である。
(エ) ${\rm{sgn}}\tilde{A}=(2,2)$ のとき
正の固有値は３つあるので、この場合はない。
(オ) ${\rm{sgn}}\tilde{A}=(2,1)$ のとき
(エ)と同様にこの場合はない。
(カ) ${\rm{sgn}}\tilde{A}=(2,0)$ のとき
(エ)と同様にこの場合はない。
(キ) ${\rm{sgn}}\tilde{A}=(1,1)$ のとき
(エ)と同様にこの場合はない。
(ク) ${\rm{sgn}}\tilde{A}=(1,0)$ のとき
(エ)と同様にこの場合はない。
② ${\rm{sgn}}A=(2,1)$ のとき
(ア) ${\rm{sgn}}\tilde{A}=(4,0)$ のとき
$\alpha_1, \alpha_2, \alpha_3$ のうちいずれかは $0$ であるが一方で、 $\tilde{A}$ すべての固有値は $0$ にならない必要があるので、この場合は起こりえない。
(イ) ${\rm{sgn}}\tilde{A}=(3,1)$ のとき
$\alpha_1 >0, \alpha_2>0, \alpha_3 \lt 0$ とすると、 $c^{\prime} > 0$ である必要がある。 $d=\sqrt{c^{\prime}}$ とおくと(Q)は二葉双曲線

$a_1^2x_1^2+a_2^2x_2^2-a_3^2x_3^2=-d^2$

である。
(ウ) ${\rm{sgn}}\tilde{A}=(3,0)$ のとき
$\alpha_i\neq 0 \ \ (i=1,2,3)$ より、 $c^{\prime}=0$ である必要があるが、 $\alpha_i$ のうちどれかは負なので、この場合はない。
(エ) ${\rm{sgn}}\tilde{A}=(2,2)$ のとき
$\alpha_1 >0, \alpha_2>0, \alpha_3 \lt 0$ とすると、 $c^{\prime} \lt 0$ である必要がある。 $d=\sqrt{-c^{\prime}}$ とおくと(Q)は一葉双曲線

$a_1^2x_1^2+a_2^2x_2^2+a_3^2x_3^2=d^2$

である。
(オ) ${\rm{sgn}}\tilde{A}=(2,1)$ のとき
$\alpha_1 >0, \alpha_2>0, \alpha_3 \lt 0$ とすると、 $c^{\prime} = 0$ である必要がある。このとき(Q)は楕円錐面

$a_1^2x_1^2+a_2^2x_2^2-a_3^2x_3^2=0$

である。
(カ) ${\rm{sgn}}\tilde{A}=(2,0)$ のとき
$\alpha_i\neq 0 \ \ (i=1,2,3)$ より、 $0$ でない固有値が３つあるので、この場合はない。
(キ) ${\rm{sgn}}\tilde{A}=(1,1)$ のとき
(カ)と同様にこの場合はない。
③ ${\rm{sgn}}A=(2,0)$ のとき
$\alpha_i\neq 0 \ \ (i=1,2,3)$ より $0$ でない固有値が３つあるので、この場合はない。
④ ${\rm{sgn}}A=(1,1)$ のとき
③と同様に、この場合はない。
⑤ ${\rm{sgn}}A=(1,0)$ のとき
③と同様に、この場合はない。
(2) $r(A)=2$ のとき
$\alpha_1\neq 0, \alpha_2\neq 0, \alpha_3= 0$ とし、 $x_i=y_i-\frac{b_i}{\alpha_i} \ \ (i=1,2)$ とすると、(Q)は

$\begin{split} &\begin{pmatrix} y_1-\frac{b_1}{\alpha_1} & y_2-\frac{b_2}{\alpha_2} & x_2 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1 & 0 & 0 & b_1 \\ 0 & \alpha_2 & 0 & b_2 \\ 0 & 0 & 0 & b_3 \\ b_1 & b_2 & b_3 & c \end{pmatrix} \begin{pmatrix} y_1-\frac{b_1}{\alpha_1} \\ y_2-\frac{b_2}{\alpha_2} \\ x_2 \\ 1 \end{pmatrix} \\ &= \begin{pmatrix} y_1-\frac{b_1}{\alpha_1} & y_2-\frac{b_2}{\alpha_2} & x_2 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1y_1 \\ \alpha_2y_2 \\ b_3 \\b_1y_1+b_2y_2+b_3y_3+c-\frac{b_1^2}{\alpha_1}-\frac{b_2^2}{\alpha_2} \end{pmatrix} \\ &=\alpha_1y_1^2 + \alpha_2y_2^2 + 2b_3y_3 +c-\frac{b_1^2}{\alpha_1}-\frac{b_2^2}{\alpha_2} \end{split}$

より、 $y_1, y_2$ を改めて[texx_1,x_2]とし、 $c^{\prime}=c-\frac{b_1^2}{\alpha_1}-\frac{b_2^2}{\alpha_2}$ とすると

$(Q) \ \ : \ \ \alpha_1x_1^2+\alpha_2x_2^2+2b_3x_3+c^{\prime}=0$

となる。

$(Q) \ \ : \ \ \begin{pmatrix} x_1 & x_2 & x_3 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1 & 0 & 0 & 0 \\ 0 & \alpha_2 & 0 & 0 \\ 0 & 0 & 0 & b_3 \\ 0 & 0 & b_3 & c^{\prime} \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \\ 1 \end{pmatrix}$

より。改めて

$\begin{pmatrix} \alpha_1 & 0 & 0 & 0 \\ 0 & \alpha_2 & 0 & 0 \\ 0 & 0 & 0 & b_3 \\ 0 & 0 & b_3 & c^{\prime} \end{pmatrix}$

とおく。
① ${\rm{sgn}}A=(3,0)$ のとき
$A$ の $0$ でない固有値は２つなので、この場合はない。
② ${\rm{sgn}}A=(2,1)$ のとき
①と同様にこの場合はない。 ③ ${\rm{sgn}}A=(2,0)$ のとき
(ア) ${\rm{sgn}}\tilde{A}=(4,0)$ のとき
$b_3=0$ のとき、 $0$ でない固有値は３個以下となり矛盾するので、 $b_3\neq 0$ である。 $c^{\prime}\neq 0$ とすると、 $\tilde{A}$ は基本変形により次の形に変形される

$\tilde{A}= \begin{pmatrix} \alpha_1 & & & \\ & \alpha_2 & & \\ & & -\frac{b_3^2}{c^{\prime}} & \\ &&&c^{\prime} \end{pmatrix}$

このとき $\tilde{A}$ は少なくとも１つ負の固有値を持つことになるので矛盾。よって、 $c^{\prime}=0$ となる。従って(Q)は、

$\begin{split} &\begin{pmatrix} x_1 & x_2 & x_3 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1 & 0 & 0 & 0 \\ 0 & \alpha_2 & 0 & 0 \\ 0 & 0 & 0 & b_3 \\ 0 & 0 & b_3 & 0 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \\ 1 \end{pmatrix} \\ &=\alpha_1x_1^2+\alpha_2x_2^2+2b_3x_3 \end{split}$

より、 $b^{\prime}=-2b_3$ と置くことにより、楕円放物面

$a_1^2x_1^2+a_2^2x_2^2=b^{\prime}x_3 \ \ (b^{\prime}\neq 0)$

となる。
(イ) ${\rm{sgn}}\tilde{A}=(3,1)$ のとき
$b_3\neq 0$ で、 $c^{\prime}=0$ とすると負の固有値は0個または2個となるので矛盾。よって $c^{\prime}\neq 0$ である。このとき(Q)は $x_3\rightarrow x_3-\frac{c^{\prime}}{2b_3}$ の平行移動を行うことにより、楕円放物面

$a_1^2+a_2^2=b^{\prime}x_3 \ \ (b^{\prime}\neq 0)$

により(ア)と同じ場合になる。
(ウ) ${\rm{sgn}}\tilde{A}=(3,0)$ のとき
$b_3\neq 0$ とすると $\tilde{A}$ の固有値の数は４となり矛盾。よって $b_3=0$ 、 $c^{\prime} >0$ である必要がある。よって(Q)の左辺は $>0$ となり空集合である。
(エ) ${\rm{sgn}}\tilde{A}=(2,2)$ のとき
(ア)と同様に、 $c^{\prime}=0$ であり、 $b_3 \lt 0$ である必要がある。このとき(ア)と同じ場合になる。
(オ) ${\rm{sgn}}\tilde{A}=(2,1)$ のとき
$b_3\neq 0$ とすると $\tilde{A}$ の固有値の数は４となり矛盾。よって $b_3=0$ である。このとき $c^{\prime} > 0$ である必要がある。 $d=\sqrt{-c^{\prime}}$ とおくと、(Q)は楕円柱面

$a_1^2x_1^2+a_2^2x_2^2=d^2 \ \ (d > 0)$

となる。
(カ) ${\rm{sgn}}\tilde{A}=(2,0)$ のとき
$b_3\neq 0$ または $c^{\prime}\neq 0$ のとき、 $\tilde{A}$ の固有値の数は３以上となるので矛盾。よって、 $b_3=0$ かつ $c^{\prime}=0$ である。このとき(Q)は

$a_1^2x_1^2+a_2^2x_2^2=0$

で $x_1=x_2=0$ がなす集合

$\{(0,0,x_3) \ : \ x_3\in\mathbb{R} \}$

である。即ち直線である。
(キ) ${\rm{sgn}}\tilde{A}=(1,1)$ のとき
(カ)と同様にして[ tex:b_=0]かつ $c^{\prime}=0$ である。このとき $\tilde{A}$ の２つの固有値 $\alpha_1, \alpha_2$ は正なので矛盾。よってこの場合はない。
(ク) ${\rm{sgn}}\tilde{A}=(1,0)$ のとき
$\tilde{A}$ の固有値の数は少なくとも２つなので、この場合はない。
④ ${\rm{sgn}}A=(1,1)$ のとき
$\alpha_1 >0$ 、 $\alpha_2 \lt 0$ とする。
(ア) ${\rm{sgn}}\tilde{A}=(4,0)$ のとき
$\tilde{A}$ は少なくとも１つの負の固有値を持つので矛盾。よってこの場合はない。
(イ) ${\rm{sgn}}\tilde{A}=(3,1)$ のとき
$c^{\prime}\neq 0$ とすると $\tilde{A}$ は２つの負の固有値をもつので矛盾。よって、 $c^{\prime}=0$ である。このとき $b^{\prime}=-2b_3$ とおくと、(Q)は双曲放物面

$a_1^2x_1^2-a_2^2x_2^2=b^{\prime}x_3 \ \ (b^{\prime}\neq 0)$

となる。
(ウ) ${\rm{sgn}}\tilde{A}=(3,0)$ のとき
$b_3\neq 0$ のとき $\tilde{A}$ の固有値の数は４となり矛盾。よって $b_3=0$ である。このとき $\tilde{A}$ には少なくとも負の固有値が１つあるので矛盾。よってこの場合はない。
(エ) ${\rm{sgn}}\tilde{A}=(2,2)$ のとき
$c^{\prime}=0$ のとき $\tilde{A}$ の負の固有値の数は１または３より矛盾。よって、 $c^{\prime}\neq 0$ である。また $b_3=0$ のとき $\tilde{A}$ の固有値の数は３となり矛盾。よって $b_3\neq 0$ である。このとき(Q)は $x_3\rightarrow x_3-\frac{c^{\prime}}{2b_3}$ の平行移動を行うことで双曲放物面

$a_1^2x_1^2-a_2^2x_2^2=b^{\prime}x_3$

となる。
(オ) ${\rm{sgn}}\tilde{A}=(2,1)$ のとき
$b_3\neq 0$ のとき、 $\tilde{A}$ の固有値の数は４となるので矛盾。よって $b_3=0$ である。このとき $c^{\prime} > 0$ である必要がある。このとき $d=-c^{\prime}$ として(Q)は双曲柱面

$a_1^2x_1^2-a_2^2x_2^2=d \ \ (d\neq 0)$

となる。
(カ) ${\rm{sgn}}\tilde{A}=(2,0)$ のとき
$b_3\neq 0$ または $c^{\prime}\neq 0$ のとき $\tilde{A}$ の固有値の数は３以上となり矛盾。よって $b_3=0$ かつ $c^{\prime}=0$ である。 $\tilde{A}$ は少なくとも１つ負の固有値をもつのでこの場合はない。
(キ) ${\rm{sgn}}\tilde{A}=(1,1)$ のとき
(カ)と同様に $b_3=c^{\prime}=0$ である。このとき(Q)は相交わる二平面

$a_1^2x_1^2-a_2^2x_2^2=0$

である。 (ク) ${\rm{sgn}}\tilde{A}=(1,0)$ のとき
$\tilde{A}$ には少なくとも０でない２つの固有値が存在するのでこの場合はない。
(3) $r(A)=1$ のとき
$\alpha_1\neq 0$ 、 $\alpha_2=\alpha_3=0$ とする。 $x_1=y_1-\frac{b_1}{\alpha_1}$ とすると(Q)は、

$\begin{split} &\begin{pmatrix} y_1-\frac{b_1}{\alpha_1} & x_2 & x_3 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1 & 0 & 0 & b_1 \\ 0 & 0 & 0 & b_2 \\ 0 & 0 & 0 & b_3 \\ b_1 & b_2 & b_3 & c \end{pmatrix} \begin{pmatrix} y_1-\frac{b_1}{\alpha_1} \\ x_2 \\ x_3 \\ 1 \end{pmatrix} \\ &= \begin{pmatrix} y_1-\frac{b_1}{\alpha_1} & x_2 & x_3 & 1 \end{pmatrix} \begin{pmatrix} \alpha_1y_1 \\ b_2 \\ b_3 \\ b_1y_1+b_2x_2+b_3x_3+c-frac{b_1^2}{\alpha_1} \end{pmatrix} \\ &=\alpha_1y_1^2+2b_2x_2+2b_3x_3+c-\frac{b_1^2}{\alpha_1} \end{split}$

より、 $y_1$ を改めて $x_1$ とおき、[tex:c^{\prime}=c-\frac{b_1²}{\alpha_1}]とおくと

$(Q) \ \ : \ \ \alpha_1y_1^2+2b_2x^2+2b_3x_3+c-\frac{b_1^2}{\alpha_1}$

となる。改めて

$\tilde{A}= \begin{pmatrix} \alpha_1 & 0 & 0 & 0 \\ 0 & 0 & 0 & b_2 \\ 0 & 0 & 0 & b_3 \\ 0 & b_2 & b_3 & c \end{pmatrix}$

とおく。
① ${\rm{sgn}}A=(3,0)$ のとき
固有値の数が１のためこの場合はない。
② ${\rm{sgn}}A=(2,1)$ のとき
①と同様にこの場合はない。
③ ${\rm{sgn}}A=(2,1)$ のとき
①と同様にこの場合はない。
④ ${\rm{sgn}}A=(1,1)$ のとき
①と同様にこの場合はない。
⑤ ${\rm{sgn}}A=(1,0)$ のとき
$\alpha_1 > 0$ である。
(ア) ${\rm{sgn}}\tilde{A}=(4,0)$ のとき
$b_2\neq 0$ とすると $r(A)=3$ となり矛盾。また、 $b_2=0$ としても $r(A)\le 3$ となり矛盾。よってこの場合はない。
(イ) ${\rm{sgn}}\tilde{A}=(3,1)$ のとき
(ア)と同様にこの場合はない。
(ウ) ${\rm{sgn}}\tilde{A}=(3,0)$ のとき
$c^{\prime}\neq 0$ とすると $\tilde{A}$ は、

$\begin{pmatrix} \alpha_1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & -\frac{b_3^2}{c^{\prime}} & 0 \\ 0 & 0 & 0 & c^{\prime} \end{pmatrix}$

と基本変形される。このとき少なくとも負の固有値が１つあるので矛盾。よって $c^{\prime}=0$ である。よって、

$(Q) \ \ : \ \ \alpha_1x_1^2+2b_2x_2+2b_3x_3=0$

である。

$\begin{pmatrix} x_1^{\prime} \\ x_2^{\prime} \\ x_3^{\prime} \end{pmatrix} = \begin{pmatrix} 1 & 0 & 0 \\ 0 & \frac{1}{b_2} & \frac{1}{b_3} \\ 0 & -\frac{1}{b_2} & \frac{1}{b_3} \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix}$

の変数変換をした後、 $b^{\prime}=^\frac{2b_2}{\alpha_1}$ とおくと(Q)は放物柱面

$x_1^2=b^{\prime}x_2$

となる。
(エ) ${\rm{sgn}}\tilde{A}=(2,2)$ のとき
(ア)と同様にしてこの場合はない。
(オ) ${\rm{sgn}}\tilde{A}=(2,1)$ のとき

の変数変換により、(Q)は放物柱面

$x_1^2=b^{\prime}x_2$

となる。
(カ) ${\rm{sgn}}\tilde{A}=(2,0)$ のとき
$b_2\neq 0$ または $b_3\neq 0$ のとき $r(A)=3$ より矛盾。よって、 $b_2=b_3=0$ である。このとき $c^{\prime} > 0$ である必要がある。このとき(Q)の左辺は $> 0$ より空集合である。
(キ) ${\rm{sgn}}\tilde{A}=(1,1)$ のとき
(オ)と同じ理由により $b_2=b_3=0$ である。このとき $c^{\prime} \lt 0$ である必要がある。 $d~\sqrt{-c^{\prime}}$ とおくと(Q)は平行二平面

$x_1^2=d^2$

である。
(ク) ${\rm{sgn}}\tilde{A}=(1,0)$ のとき
$b_2\neq 0$ または $b_3\neq 0$ または $c^{\prime}\neq 0$ であれば $r(A)\ge 1$ より矛盾。よって $b_2=b_3=c^{\prime}=0$ である。このとき(Q)は平面

$x_1^2=0$

である。

以上で二次曲面の分類が完了する。(3)⑤(ク)の場合は一次方程式と同値であるから除く。さらに空集合および一点をのぞけば、二次曲面は、11種類に分類される。そのうち $r(\tilde{A})=4$ のもの(楕円面、一葉双曲面、二葉双曲面、楕円放物面、双曲放物面)を本来の二次曲面という。

6. 参考文献
[1] 線型代数入門

線型代数入門（基礎数学） [ 斎藤正彦 ]

価格:2,090円
(2021/12/6 21:07時点)
感想(2件)

2021-09-29

【線形代数学入門】二次形式

線形代数

1. 記事の目的
本記事では、二次形式について述べる。二次形式の零点全体は、放物線などの図形である。二次形式を用いることで、放物線などの二次曲線の分類を代数的(文字式の変形によって)に行うことができる。二次形式には標準形と呼ばれる形がある。この際に対称変換の理論が必要になる。対象変換については下記の記事を参照。

camelsan.hatenablog.com

2. 多項式
まず、1変数の多項式を定義する。
一つの文字 $x$ と、 $\mathbb{R}$ の元 $a_0, a_1, \dots, a_n$ から作られる式

$\displaystyle\sum_{i=0}^n a_ix^i = a_0+a_1x+\dots+a_nx^n \tag{1}$

を文字 $x$ の $\mathbb{R}$ -係数多項式という。 $n$ を多項式(1)の次数という。

次に多変数の多項式を定義する。最初に単項式を定義する。
$n$ 個の文字 $x_1,x_2,\dots,x_n$ と $\mathbb{R}$ の元 $a$ から作られる式

$ax_1^{p_1}x_2^{p_2}\dots x_n^{p_n} \ \ (p_i\ge 0) \tag{2}$

を $n$ 変数 $x_1,x_2,\dots,x_n$ の単項式という。 $p=p_1+p_2+\dots+p_n$ を単項式(2)の総次数という。個々の $p_i$ は単項式(2)の $x_i$ に関する次数と呼ばれる。

いくつかの単項式を記号 $+$ で結んだ式

$\displaystyle\sum_{(p_1,p_2,\dots,p_n)} a_{p_1,p_2,\dots,p_n} x_1^{p_1}x_2^{p_2}\dots x_n^{p_n} \tag{3}$

を $n$ 変数 $x_1,x_2,\dots,x_n$ の多項式という。多項式(3)に含まれる $0$ でない係数を持つ単項式の総次数の最大のものを、多項式(3)の総次数という。

多項式の核単項式の総次数がすべて等しいとき、その多項式を、斉次多項式という。このとき各探鉱しの総次数が $n$ のとき、 $n$ 次の斉次多項式と呼ぶこととする。

3. 二次形式
$n$ 個の変数 $x_1,x_2,\dots,x_n$ に関する実変数の2次の斉次多項式を、二次形式という。即ち

$F(x_1,x_2,\dots,x_n)=\displaystyle\sum_{i,j=1}^n a_{ij} x_ix_j$

である。ここで、 $a_{ii}$ は[tex:x_i²]の係数であるから一意的に決まる。しかし、 $x_ix_j=x_jx_i$ より、 $a_{ij} \ \ (i\neq j)$ は一意に定まらない( $x_ix_j$ の係数は $(a_{ij}+a_{ji})$ となり、和の分け方の不確定性により $a_{ij}$ は一意に決定できない )。今後、

$a_{ij}=a_{ji}$

という条件をつける(これにより $x_ix_j$ の係数は $2a_{ij}$ となり、 $a_{ij}$ が一意に定まる)。

例3.1
$n=3$ のとき

$\begin{split} F(x_1,x_2,x_3)&=\displaystyle\sum_{i,j=1}^3 a_{ij}x_ix_j \\ &=a_{11}x_1^2+a_{22}x_2^2+a_{33}x_3^2+2a_{12}x_1x_2+2a_{13}x_1x_3+2a_{23}x_2x_3 \end{split}$

二次形式の係数から作られる行列 $A=(a_{ij})$ を二次形式 $F$ の行列という。 $a_{ij}=a_{ji}$ より $A^t=A$ なので $A$ は実対称行列である。

$\boldsymbol{x}= \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}$

とすれば

$F(x_1,x_2,\dots,x_n)=F(\boldsymbol{x})=^t\boldsymbol{x}A\boldsymbol{x}$

と表される。これを、対称行列 $A$ によって定まる二次形式という意味で、

$A[\boldsymbol{x}]=^t\boldsymbol{x}A\boldsymbol{x}$

と表す。

例3.2
$n=3$ のとき、

$A= \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{12} & a_{22} & a_{23} \\ a_{13} & a_{23} & a_{33} \end{pmatrix}, \ \ \boldsymbol{x}= \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix}$

とすると

$\begin{split} A[\boldsymbol{x}]&= \begin{pmatrix} x_1 & x_2 & x_3 \end{pmatrix} \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{12} & a_{22} & a_{23} \\ a_{13} & a_{23} & a_{33} \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} \\ &=\begin{pmatrix} x_1 & x_2 & x_3 \end{pmatrix} \begin{pmatrix} a_{11}x_1+a_{12}x_2+a_{13}x_3 \\ a_{12}x_1+a_{22}x_2+a_{23}x_3 \\ a_{13}x_1+a_{23}x_2+a_{33}x_3 \end{pmatrix} \\ &=a_{11}x_1^2+a_{12}x_1x_2+a_{13}x_1x_3 \\ &+a_{12}x_1x_2+a_{22}x_1^2+a_{23}x_2x_3 \\ &+a_{13}x_1x_3+a_{23}x_1x_3+a_{33}x_3^2 \\ &=a_{11}x_1^2+a_{22}x_2^2+a_{33}x_3^2+2a_{12}x_1x_2+2a_{13}x_1x_3+2a_{23}x_2x_3 \end{split}$

これは、例3.1の $F(x_1,x_2,x_3)$ と一致する。

4. 二次形式の標準形
二つの変数ベクトル

$\boldsymbol{x}= \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}, \ \ \boldsymbol{y}= \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{pmatrix}$

が正則行列 $P$ によって、

$\boldsymbol{x}=P\boldsymbol{y}$

なる関係で呼ばれているとする。

$G(\boldsymbol{y})=F[\boldsymbol{x}]$

とおくと $G(\boldsymbol{y})$ は $\boldsymbol{y}$ の二次形式である。実際、

$\begin{split} G(\boldsymbol{y})&=F[\boldsymbol{x}] \\ &=^t\boldsymbol{x}A\boldsymbol{x} \\ &=^t(P\boldsymbol{y})A(P\boldsymbol{y}) \\ &=^t\boldsymbol{y}(^tPAP)\boldsymbol{y} \\ &=^tPAP[\boldsymbol{y}] \end{split}$

即ち、 $G(\boldsymbol{y})$ は対称行列 $^tPAP$ によって定まる二次形式である。

二次形式 $F(\boldsymbol{x})$ が与えられたとき、適当な変数ベクトル $\boldsymbol{y}=P\boldsymbol{x}$ ( $P$ は正則行列 )を見つけて、 $G(\boldsymbol{y})$ をなるべく簡単な二次形式にすることを考える。

特に、 $P$ が直交行列ならば、 $^tP=P^{-1}$ なので、次の定理が成り立つ。
定理4.1
二次形式 $F(\boldsymbol{x})=A[\boldsymbol{x}$ ]に対し、適当な直交行列 $P$ をとって、 $\boldsymbol{x}=P\boldsymbol{y}$ とすれば、

$F(\boldsymbol{x})=G(\boldsymbol{y})=\alpha_1y_1^2+\alpha_2y_2^2+\dots+\alpha_ny_n^2\tag{5}$

となる。但し、 $\alpha_1,\alpha_2,\dots,\alpha_n$ は、 $A$ の(重複をこめた)固有値である。
証明：下記の記事の定理2.3より、 $A$ は対称行列なので、 $P^{-1}AP$ が対角行列で、しかもその対角成分が $A$ の固有値 $\alpha_1,\alpha_2,\dots,\alpha_n$ であるものが存在する。

camelsan.hatenablog.com

よって、

$\begin{split} F(\boldsymbol{x})&=G(\boldsymbol{x})=^t\boldsymbol{y}(P^{-1}AP)\boldsymbol{y} \\ &=\alpha_1y_1^2+\alpha_2y_2^2+\dots+\alpha_ny_n^2 \end{split}$

である。

定理4.1で、

$\begin{split} \alpha_1,\alpha_2,\dots,\alpha_p > 0, \alpha_{p+1}, \alpha_{p+2},\dots, \alpha_{p+q} < 0 \\ \alpha_{p+q+1}=\alpha_{p+q+2}=\dots=\alpha_n=0 \end{split}$

となるように調整し、

$y_i=\frac{1}{\sqrt{\alpha_i}}z_i \ \ (1\le i\le p), \ \ y_j=\frac{1}{\sqrt{\alpha_j}}z_j \ \ (p+1\le j\le p+q)$

により変数変換を行うと、

$\begin{split} F(\boldsymbol{x})&=G(\boldsymbol{y})=H(\boldsymbol{z}) \\ &=z_1^2+z_2^2+\dots+z_p^2-z_{p+1}^2-\dots-z_{p+q}^2 \end{split}$

となる。これを二次形式 $F(\boldsymbol{x})$ の標準形という。

このとき次の標準形の一意性が成り立つ。
定理4.2 (シルヴェスタの慣性法則)
二次形式の標準形は一意に定まる。即ち、変数にどんな正則線型変換を施して標準形に写しても、正負の数 $p,q$ は一定である。
証明：2通りの変数変換

$\boldsymbol{x}=P\boldsymbol{y}, \ \ \boldsymbol{x}=Q\boldsymbol{z}$

によって、２通りの標準形

$\begin{split} F(\boldsymbol{x})&=G(\boldsymbol{y})=y_1^2+y_2^2+\dots+y_p^2-y_{p+1}^2-\dots-y_{p+q}^2 \\ &=H(\boldsymbol{z})=z_1^2+z_2^2+\dots+z_s^2-z_{s+1}^2-\dots-z_{s+t}^2 \end{split}$

を得たとする。このとき、 $p+q=s+t=r(A)$ ( $A$ の階数) である。
$p > s$ と仮定する。 $x_1,x_2,\dots,x_n$ に関する連立方程式

$\begin{split} y_i &= 0 \ \ (i=p+1,p+2,\dots, n) \\ z_j&=0 \ \ (j=1,2,\dots,s) \end{split}$

は自明でない解 $a_1,a_2,\dots,a_n$ を持つ。実際、方程式の個数は $n-P+s$ であり、 $p-s>0$ より、変数の数 $n$ より小さいため、下記の記事の定理7.1より成り立つ。

camelsan.hatenablog.com

$P^{-1}= \begin{pmatrix}a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix}=\begin{pmatrix}b_1 \\ b_2 \\ \vdots \\ b_p \\ 0 \\ \vdots \\ 0 \end{pmatrix}, \ \ Q^{-1} \begin{pmatrix}a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix}=\begin{pmatrix}0 \\ \vdots \\ 0 \\ c_{s+1} \\ \vdots \\ c_n \end{pmatrix}$

の形なので、

$F(\boldsymbol{a})=b_1^2+b_2^2+\dots+b_p^2=-c_{s+1}^2-c_{s+2}^2-\dots-c_n^2$

である。左辺は $\ge$ で、右辺は $\le$ なので、両辺は $0$ でなければならない。よって、

$b_1=b_2=\dots=b_p=0$

となり、 $a_1,a_2\dots,a_n$ が自明でない解であることに反する。従って $p\le s$ である。 $p$ と $s$ を入れ替えて、 $p\ge s$ も言えるので、 $p=s$ である。

一意に決まる $p,q$ の組 $(p,q)$ を二次形式 $F(\boldsymbol{x})=A[\boldsymbol{x}$ ]の符号という。 $p$ は実対称行列 $A$ の正の固有値の数、 $q$ は負の固有値の数である。

二次形式が正値(半正値)であることを定義する。
定義
$\boldsymbol{x}$ でない任意のベクトル $\boldsymbol{x}$ に対して、 $F(\boldsymbol{x})>0$ (または $F(\boldsymbol{x})\ge0$ )が成立するとき、二次形式 $F(\boldsymbol{x})$ は正値(または半正値)であるという。

$F(\boldsymbol{x})=^t\boldsymbol{x}A\boldsymbol{x}=(A\boldsymbol{x},\boldsymbol{x})$ であるから、下記の記事の定理4.1より、二次形式が正値(または半正値)であることと、実対称行列 $A$ が正値(または半正値)であることは同値である。さらに、 $p=n \ \ (q=0)$ が成り立つことと同値である。

camelsan.hatenablog.com

二次形式の正値性を小行列式によって判定することができる。

$A= \begin{pmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \dots & a_{nn} \end{pmatrix}$

に対し、

$A= \begin{pmatrix} a_{11} & a_{12} & \dots & a_{1k} \\ a_{21} & a_{22} & \dots & a_{2k} \\ \vdots & \vdots & & \vdots \\ a_{k1} & a_{k2} & \dots & a_{kk} \end{pmatrix}$

とおく( $k=1,2,\dots,n$ )。

定理4.3
二次形式 $A[\boldsymbol{x}$ ]が正値であるためには、 $|A_k| > 0 \ \ (k=1,2,\dots,n)$ が成り立つことが必要かつ十分な条件である。
証明： $A[\boldsymbol{x}$ ]が正値ならば、

$\begin{split} &\begin{pmatrix} ^t\boldsymbol{x}_k & ^t\boldsymbol{x}_{n-k} \end{pmatrix} \begin{pmatrix} A_k & B \\ \boldsymbol{c} & A_{n-k} \end{pmatrix} \begin{pmatrix} \boldsymbol{x}_k \\ \boldsymbol{x}_{n-k} \end{pmatrix} \\ &= \begin{pmatrix} ^t\boldsymbol{x}_kA_k+^t\boldsymbol{x}_{n-k}\boldsymbol{c} & ^t\boldsymbol{x}_kB+^t\boldsymbol{x}_{n-k}A_{n-k} \end{pmatrix} \begin{pmatrix} \boldsymbol{x}_k \\ \boldsymbol{x}_{n-k} \end{pmatrix} \\ &=^t\boldsymbol{x}_kA_k\boldsymbol{x}_k+^t\boldsymbol{x}_{n-k}\boldsymbol{c}\boldsymbol{x}_k+^t\boldsymbol{x}_kB\boldsymbol{x}_{n-k}+^t\boldsymbol{x}_{n-k}A_{n-k}\boldsymbol{x}_{n-k} \end{split}$

より、

$\boldsymbol{x}= \begin{pmatrix} x_1 \\ \vdots \\ x_k \\ 0 \\ \vdots \\ 0 \end{pmatrix}, \ \ \boldsymbol{x}_k= \begin{pmatrix} x_1 \\ \vdots \\ x_k \end{pmatrix} \neq 0$

として、 $0 \lt ^t\boldsymbol{x}A\boldsymbol{x}=^t\boldsymbol{x}_kA_k\boldsymbol{x}_k$ となるので、 $A_k$ も正値である。
よって、ある直交行列 $P_k$ があって、

$P_k^{-1}A_kP_k= \begin{pmatrix} \alpha_1 & & \\ & \ddots & \\ & & \alpha_k \end{pmatrix} \ \ (\alpha_1,\dots,\alpha_k > 0)$

となる。よって、

$|A_k|=|P_k^{-1}A_kP|=\alpha_1\dots\alpha_k > 0 \ \ (k=1,\dots,n)$

である。
逆を $n$ に関する数学的帰納法によって証明する。 $n=1$ のとき、 $x\neq 0$ に対し、

$F(x)=ax^2$

より、 $F(x) > 0$ であるためには $a>0$ であることが必要十分条件なので、 $0\lt |A_1|=a$ より成り立つ。 $n=1$ のとき成り立つと仮定すれば、 $A_{n-1}[\boldsymbol{x}$ ]は正値である。

$A= \begin{pmatrix} A_{n-1} & \boldsymbol{b} \\ ^t\boldsymbol{b} & c \end{pmatrix}$

と区分けしておく(行列の区分けは下記の記事を参照)。

camelsan.hatenablog.com

$P= \begin{pmatrix} E_{n-1} & A_{n-1}^{-1}\boldsymbol{b} \\ ^t\boldsymbol{0} & 1 \end{pmatrix}$

とおくと、[tex:^tA{n-1}=A{n-1}]を用いて、

$\begin{split} ^tP \begin{pmatrix} A_{n-1} & \boldsymbol{0} \\ ^t\boldsymbol{0} & c-A_{n-1}^{-1}[\boldsymbol{b}] \end{pmatrix} P&= \begin{pmatrix} E_{n-1} & \boldsymbol{0} \\ ^t\boldsymbol{b}A_{n-1}^{-1} & 1 \end{pmatrix} \begin{pmatrix} E_{n-1} & \boldsymbol{0} \\ ^t\boldsymbol{0} & c-A_{n-1}^{-1}[\boldsymbol{b}] \end{pmatrix} \begin{pmatrix} E_{n-1} & A_{n-1}^{-1}\boldsymbol{b} \\ ^t\boldsymbol{0} & 1 \end{pmatrix} \\ &= \begin{pmatrix} A_{n-1} & \boldsymbol{0} \\ ^t\boldsymbol{b} & c-^t\boldsymbol{b}A_{n-1}^{-1}\boldsymbol{b} \end{pmatrix} \begin{pmatrix} E_{n-1} & A_{n-1}^{-1}\boldsymbol{b} \\ ^t\boldsymbol{0} & 1 \end{pmatrix} \\ &= \begin{pmatrix} A_{n-1} & \boldsymbol{b} \\ ^t\boldsymbol{b} & c \end{pmatrix} \end{split} \tag{6}$

となる。定理4.1から、 $P$ による変数変換の前後で、二次形式の正値性は変化しないので、

$B= \begin{pmatrix} A_{n-1} & \boldsymbol{0} \\ ^t\boldsymbol{0} & c-A_{n-1}^{-1}[\boldsymbol{b}] \end{pmatrix}$

が正値であることを言えばよい。式(6)の両辺の行列式をとると、区分けと行列式の定理と、直交行列の行列式は常に $1$ 、即ち $|^tP|=|P|=1$ より、

$|A|=|A_{n-1}|\cdot (c-A_{n-1}^{-1}[\boldsymbol{b}])$

仮定より、 $|A|>0, \ \ |A_{n-1}|>0$ であるから、 $d=c-A_{n-1}^{-1}[\boldsymbol{b}] > 0$ である。 $\boldsymbol{0}$ でない $n$ 項列ベクトル $\boldsymbol{x}$ を

$\boldsymbol{x}= \begin{pmatrix} \boldsymbol{x}^{\prime} \\ x_n \end{pmatrix}$

と区分けすれば

$\begin{split} B[\boldsymbol{x}] &= \begin{pmatrix} ^t\boldsymbol{x}^{\prime} & x_n \end{pmatrix} \begin{pmatrix} A_{n-1} & \boldsymbol{0} \\ ^t\boldsymbol{0} & d \end{pmatrix} \begin{pmatrix} \boldsymbol{x}^{\prime} \\ x_n \end{pmatrix} \\ &= \begin{pmatrix} ^t\boldsymbol{x}^{\prime}A_{n-1} & dx_n \end{pmatrix} \begin{pmatrix} \boldsymbol{x}^{\prime} \\ x_n \end{pmatrix} \\ &=^t\boldsymbol{x}^{\prime}A_{n-1}\boldsymbol{x}^{\prime}+dx_n^2 > 0 \end{split}$

即ち $B$ は正値である。

$\boldsymbol{0}$ でない任意のベクトル $\boldsymbol{x}$ に対して、 $F(\boldsymbol{x})\lt 0$ (または $F ( \boldsymbol{x} ) \ge 0$ )となるような二次形式は負値(または半負値)であると言われる。 $A[\boldsymbol{x}$ ]が負値であるのは、丁度 $(-A)[\boldsymbol{x}$ ]が正値のときなので、定理4.3から、から次の定理が得られる。

定理4.4
二次形式 $A[\boldsymbol{x}$ ]が負値であるためには、 $(-1)^k|A|_k>0 \ \ (k=1,2,\dots,n)$ が成り立つことが必要かつ十分な条件である。

5. 参考文献
[1] 線型代数入門

線型代数入門（基礎数学） [ 斎藤正彦 ]

価格:2,090円
(2021/12/6 21:07時点)
感想(2件)

2021-09-26

【線形代数学入門】対称変換

線形代数

1. 記事の目的
下記の記事で、エルミート変換について述べた。本記事ではエルミート変換を実数上のベクトル空間に制限したものである、対称変換について述べる。

camelsan.hatenablog.com

2. 対称変換の対角化
実数上の線形空間 $V$ の線型変換 $T$ の特性根は、実数とは限らないため、固有ベクトルが存在しない場合がある。そのため常に実数上のベクトル空間の線型変換が対角化可能であるとは限らない(可能なものが対称変換である)。

定義
実数上のベクトル空間 $V$ (これをユークリッド空間と呼んだ)の対称変換 $T$ が、 $V$ の任意の2元 $\boldsymbol{x}, \boldsymbol{y}$ に対し

$(T\boldsymbol{x}, \boldsymbol{y})=(\boldsymbol{x}, T\boldsymbol{y})$

を満たすとき、 $T$ を対称変換という。

$T$ が対称変換ならば、 $V$ の任意の正規直交基底に関する $T$ を行列によって表示した場合の、行列は実対称行列となる。逆に、ある正規直交基底に関して実対称行列で表現されるような変換は、対称変換である。

実対称行列は、エルミート行列であるから、下記の記事の定理4.1の(1)より、その特性根はすべて実数である。

camelsan.hatenablog.com

従って、対称変換の特性根はすべて固有値である。

実対称変換の固有値と固有空間に関して次が成り立つ。
定理2.1
実計量ベクトル空間 $V$ の対称変換 $T$ の相異なる固有値を $\beta_1,\beta_2,\dots,\beta_k$ とし、対応する固有空間を $W_1.W_2,\dots,W_k$ とすると、 $W_1.W_2,\dots,W_k$ は互いに直交し

$V=W_1\oplus W_2\oplus\dots\oplus W_k$

となる。
証明： ${\rm{dim}}V$ に関する数学的帰納法で証明する。 ${\rm{dim}}V=0$ のとき、 $V=\{ \boldsymbol{0} \}$ で、 $\boldsymbol{0}$ でない固有ベクトルは存在しない。よって、 $V=\{ \boldsymbol{0} \}$ で定理が成立する。 ${\rm{dim}}V\ge 1$ とする。このとき、少なくとも一つの固有値が存在するので、 $k\ge 1$ である。
$W_1^{\bot}$ は $T$ -不変である。実際、 $\boldsymbol{x}\in W_1^{\bot}$ ととれば、任意の $\boldsymbol{y}\in W_1$ に対し、

$(T\boldsymbol{x}, \boldsymbol{y})=(\boldsymbol{x}, T\boldsymbol{y})=\beta_1 (\boldsymbol{x}, \boldsymbol{y})=0$

となる。 $T$ の $W_1^{\bot}$ への制限を $T_1$ とすれば、 $T_1$ は対称変換で、 ${\rm{dim}}W_1^{\bot}\le {\rm{dim}}V-1$ より、 $\beta_2,\dots,\beta_k$ がその相異なる固有値である。 $\beta_2,\dots,\beta_k$ に対する $T_1$ の固有空間を、 $W_2^{\prime},\dots,W_k^{\prime}$ とすれば、数学的帰納法の仮定により、これらは互いに直交し、 $W_1^{\bot}$ は $W_2^{\prime},\dots,W_k^{\prime}$ の直和となる。従って、 $W_1, W_2^{\prime},\dots,W_k^{\prime}$ は互いに直交し、

$V=W_1\oplus W_2^{\prime}\oplus\dots\oplus W_k^{\prime}$

である。 $i=2,\dots,k$ に対し、 $\boldsymbol{x}\in W_1^{\prime}$ とすると、 $\boldsymbol{x}$ は $\beta_i$ の固有ベクトルであるから、 $\boldsymbol{x}\in W_i$ である。よって、 $W_i^{\prime}\subset W_i$ である。ここで、ある $i=2,\dots,k$ に対し $W_i\neq W_i^{\prime}$

$V=W_1\oplus W_2^{\prime}\oplus\dots\oplus W_k^{\prime}\subsetneq W_1\oplus W_2\oplus\dots\oplus W_k\subseteq V$

より、 ${\rm{dim}}V \lt {\rm{dim}}V$ となり、矛盾。よって $W_i^{\prime}\neq W_i$ である。従って、

$V=W_1\oplus W_2\oplus\dots\oplus W_k$

となる。

定理2.1から次の定理が導かれる。
定理2.2
実計量ベクトル食う案 $V$ の線型変換 $T$ が適当な正規直交基底に関して対角行列で表現されるためには、 $T$ が対象変換であることが必要かつ十分な条件である。
証明： $T$ が対称変換のとき、定理2.1から、固有ベクトルからなる正規直交基底が存在する。このとき、このとき、この正規直交基底に関して $T$ を行列で表現すると対角行列となる。逆に $T$ が対角行列で表現されれば、 $T$ は対称変換である。

定理2.2を行列で表すと次のようになる。
定理2.3
実正方行列 $A$ に対し、 $P^{-1}AP$ が対角行列になるような直交行列 $P$ が存在するためには、 $A$ が対称行列であることが必要かつ十分な条件である。
証明： $A$ が実対称行列のとき、定理2.2を $\mathbb{R}^n$ に適用すると、正規直交基底 $\boldsymbol{p}_1,\boldsymbol{p}_2,\dots,\boldsymbol{p}_n$ が存在する。このとき $P=(\boldsymbol{p}_1 \ \boldsymbol{p}_2 \ \dots \ \boldsymbol{p}_n)$ とすると、下記の記事の定理2.3より、 $P$ は直交行列である。

camelsan.hatenablog.com

また、 $P$ は単位ベクトルからなる $\mathbb{R}^n$ の基底 $\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n$ から $\boldsymbol{p}_1,\boldsymbol{p}_2,\dots,\boldsymbol{p}_n$ への変換行列である。下記の記事4節の式(3)より(２つの変換行列を同じ $P$ として)

$\Lambda = P^{-1}AP$

となる。ここで、 $\Lambda$ は $A$ の固有値からなる対角行列である。

camelsan.hatenablog.com

逆に、 $P^{-1}AP=\Lambda$ が対角行列と仮定すると、

$A=P\Lambda P^{-1}$

より、 $P$ は直交行列なので、 $^tP=P^{-1}$ であるから、

$\begin{split} ^{t}A &=^{t}{(P\Lambda P^{-1})} \\ &=^{t}P{^{-1}} ^{t}\Lambda ^{t}P \\ &=P\Lambda P^{-1}=A \end{split}$

より、 $A$ は対称行列である。

3. 対称変換のスペクトル分解
エルミート変換と同様にして、対称変換もスペクトル分解が可能である。
$V$ を実計量ベクトル空間、 $W$ をその部分空間とするとき、 $V$ の任意の元 $\boldsymbol{x}$ は、

$\boldsymbol{x}=\boldsymbol{x}^{\prime}+\boldsymbol{x}^{\prime\prime}, \ \ \boldsymbol{x}^{\prime}\in W, \boldsymbol{x}^{\prime\prime}\in W^{\bot}$

の形に一意に表される。 $V$ の線型変換

$P:V\rightarrow V; \boldsymbol{x}\mapsto \boldsymbol{x}^{\prime}$

を $V$ の $W$ への射影子という。

次の同値条件が成り立つ。
定理3.1
実計量ベクトル空間 $V$ の線型変換 $P$ が、 $V$ のある部分空間 $W$ への射影子であるためには、 $P$ が対称変換であって、 $P^2=P$ が成り立つことが必要かつ十分な条件である。
証明：下記の記事の定理2.1の証明と全く同じである。

camelsan.hatenablog.com

スペクトル分解は次のようになる。
定理3.2
実計量ベクトル空間 $V$ の対称変換 $T$ の相異なる固有値を、 $\beta_1,\beta_2,\dots,\beta_k$ とすれば、次の条件を満たす射影子 $P_1,P_2,\dots,P_k$ が一意的にさ定まる。

$P_1+P_2+\dots+P_k=I, \ \ P_iP_j=0 \ \ (i\neq j)\tag{1}$

$T=\beta_1P_1+\beta_2P_2+\dots+\beta_kP_k\tag{2}$

これを対称変換 $T$ のスペクトル分解という。
逆に、(1)を満たす射影子 $P_1,P_2,\dots,P_k$ および相異なる実数 $\beta_1,\beta_2,\dots,\beta_k$ があるとき、(2)によって定義される線型変換 $T$ は対称変換である。
証明：下記の記事の定理3.1の証明と全く同じである。

camelsan.hatenablog.com

4. 正値対称変換
定義
対称変換 $T$ の固有値がすべて正(または非負)であるとき、 $T$ を正値(または半正値)対称変換という。

次の同値条件がある。
定理4.1
対称変換 $T$ が正値(または半正値)であるためには、 $\boldsymbol{0}$ でない任意のベクトル $\boldsymbol{x}$ に対して、 $(T\boldsymbol{x}, \boldsymbol{x})$ が正(または非負)であることが必要かつ十分な条件である。
証明：下記の記事の定理2.1の証明と全く同じである。

camelsan.hatenablog.com

任意の線型変換 $T$ に対し、ある正規直交基底に関する $T$ の行列による表示を $A$ とする。このとき、 $^tA$ で表現される線型変換を $T^{\ast}$ で表し、 $T$ の随伴変換という。 $T^{\ast}$ は、任意のベクトル $\boldsymbol{x}, \boldsymbol{y}$ に対して

$(T^{\ast}\boldsymbol{x}, \boldsymbol{y})=(\boldsymbol{x}, T\boldsymbol{y})$

が成り立つことで特徴づけられる。

次の２つの定理は下記の記事の定理2.2と定理2.3と全く同様に証明できる。

camelsan.hatenablog.com

定理4.2
$T$ が対称変換ならば、 $T^2$ は半正値対称変換である。特に、 $T$ が正値ならば $T^2$ は正値である。逆に $T$ が正値(または半正値)対称変換ならば $S^2=T$ となるような正値(または半正値)対称変換がただ一つ存在する。

定理4.3
実計量ベクトル空間の正則線型変換 $T$ は、正値対称変換と直交変換の積として一意的に表される。

定理4.3を行列で述べると次のようになる。
定理4.4
実正則行列は、正値実対称行列と直交行列との積として一意的に表される。

5. 参考文献
[1] 線型代数入門

線型代数入門（基礎数学） [ 斎藤正彦 ]

価格:2,090円
(2021/12/6 21:07時点)
感想(2件)

2021-09-24

【線形代数学入門】エルミート変換

線形代数

1. 記事の目的
下記の記事で、正規変換の特別な場合であるエルミート変換を導入し、固有値の言葉で特徴づけた。本記事では、エルミート変換について詳細に述べる。

camelsan.hatenablog.com

2. 正値エルミート変換
エルミート変換が正値であることを述べる。 $T$ をユニタリ空間 $V$ のエルミート変換とする。 $T^{\ast}=T$ より任意の $\boldsymbol{x},\boldsymbol{y}\in V$ に対して

$(T\boldsymbol{x}, \boldsymbol{y})=(\boldsymbol{x}, T\boldsymbol{y})$

が成り立つ。特に

$(T\boldsymbol{x}, \boldsymbol{x})=(\boldsymbol{x}, T\boldsymbol{x})=\overline{(T\boldsymbol{x}, \boldsymbol{x})}$

より、 $(T\boldsymbol{x}, \boldsymbol{x})$ は実数である。また、下記の記事の定理4.1より、 $T$ の固有値はすべて実数である。

camelsan.hatenablog.com

定義
エルミート変換 $T$ の固有値がすべて正(または非負)のとき、 $T$ を正値(または半正値)エルミート変換という。

エルミート変換の正値性に関して次の同値条件がある。
定理2.1
エルミート変換 $T$ が正値(または半正値)であるためには、 $\boldsymbol{0}$ でない任意のベクトル $\boldsymbol{x}$ に対して $(T\boldsymbol{x}, \boldsymbol{x})$ が正(または非負)であることが必要かつ十分な条件である。
証明：エルミート変換 $T$ が正値(または半正値)であると仮定する。 $T$ の固有ベクトルからなる $V$ の正規直交基底 $\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n$ をとり、 $T$ の固有値を $\alpha_1,\alpha_2,\dots,\alpha_n$ とする。このとき $\boldsymbol{0}$ でない任意のベクトル $\boldsymbol{x}$ を

$\boldsymbol{x}=x_1\boldsymbol{e}_1+x_2\boldsymbol{e}_2+\dots+x_n\boldsymbol{e}_n$

と表せば、

$\begin{split} (T\boldsymbol{x},\boldsymbol{x}) &= (\displaystyle\sum_{i=1}^nx_i\alpha_i\boldsymbol{e}_i, \displaystyle\sum_{i=1}^nx_i\boldsymbol{e}_i) \\ &= \displaystyle\sum_{i=1}^n\alpha_i |x_i|^2 \ \ > 0 \ \ (\ge 0) \end{split}$

が成り立つ。逆に、 $\boldsymbol{0}$ でない任意の $\boldsymbol{x}$ に対して、 $(T\boldsymbol{x}, \boldsymbol{x})$ が正(または非負)ならば、とくに

$(T\boldsymbol{e}_i,\boldsymbol{e}_i)=(\alpha_i\boldsymbol{e}_i,\boldsymbol{e}_i)=\alpha_i$

もすべて正(または非負)である。

上記の定理から次のことが言える。
$T$ がエルミート変換ならば、 $T^2$ は半正値エルミート変換である。実際、 $\boldsymbol{0}$ でない任意のベクトル $\boldsymbol{z}$ に対して、

$\begin{split} (T^2\boldsymbol{x}, \boldsymbol{y})&=(T\boldsymbol{x},T\boldsymbol{y})=(\boldsymbol{x},T^2\boldsymbol{y}) \\ (T^2\boldsymbol{z}, \boldsymbol{z})&=(T\boldsymbol{z},T\boldsymbol{z}) \ge 0 \end{split}$

より成り立つ。

特に $T$ が正値エルミート変換のとき、 $T^2$ も正値エルミート変換であり( $T$ の固有値を $\alpha$ とすると、 $T^2$ の固有値は $\alpha^2$ なので)、この逆に対応する次の定理も成り立つ。
定理2.2
ユニタリ空間 $V$ のエルミート変換を $T$ とする。 $T$ が正値(または半正値)ならば、 $S^2=T$ となるような正値(または半正値)エルミート変換 $S$ が存在する。
証明： $T$ が正値(または半正値)とする。 $T$ のスペクトル分解を、

$T=\beta_1P_1+\beta_2P_2+\dots+\beta_kP_k$

とする(スペクトル分解に関しては下記の記事を参照)。

camelsan.hatenablog.com

$\beta_i>0 \ \ (\beta_i \ge 0)$ であるから、

$S=\sqrt{\beta_1}P_1+\sqrt{\beta_2}P_2+\dots+\sqrt{\beta_k}P_k$

とおけば、 $P_i^2=P_i$ 、 $P_iP_j=0 \ \ (i\neq j)$ より、 $S^2=T$ である。 $\boldsymbol{0}$ でない任意のベクトル $\boldsymbol{x}$ に対して

$\boldsymbol{x}=\boldsymbol{x}_1+\boldsymbol{x}_2+\dots+\boldsymbol{x}_k$

とする。ただし、 $\boldsymbol{x}_i$ は、固有値 $\beta_i$ に関する固有空間の元である。このとき、

$\begin{split} (S\boldsymbol{x}, \boldsymbol{x})&=(\displaystyle\sum_{i=1}^k\sqrt{\beta_i}\boldsymbol{x}_i, \boldsymbol{x}_i) \\ &=\displaystyle\sum_{i=1}^k\sqrt{\beta_i}(\boldsymbol{x}_i, \boldsymbol{x}_i)>0 \ \ (\ge 0) \end{split}$

となるので、 $S$ は正値(または半正値)エルミート変換である。
$S$ の一意性を証明する。もう一つの正値(または半正値)エルミート変換 $S^{\prime}$ があって、 ${S^{\prime}}^2=T$ であるとする。下記の記事定理3.4の(2)と $S^{\prime}$ の正値性(または半正値性)より、 $S^{\prime}$ の相異なる固有値は $\sqrt{\beta_1},\sqrt{\beta_2},\dots,\sqrt{\beta_k}$ であるから、 $S^{\prime}$ のスペクトル分解は、

$S^{\prime}=\sqrt{\beta_1}P_1^{\prime}+\sqrt{\beta_2}P_2^{\prime}+\dots+\sqrt{\beta_k}P_k^{\prime}$

の形である。

camelsan.hatenablog.com

これから、 ${S^{\prime}}^2=T$ より、 $T$ のスペクトル分解

$T=\beta_1P_1^{\prime}+\beta_2P_2^{\prime}+\dots+\beta_kP_k^{\prime}$

が得られるから、スペクトル分解の一意性より $P_i=P_i^{\prime} \ \ (i=1,2,\dots,k)$ である。従って $S=S^{\prime}$ である。

定理2.2の $S$ を $\sqrt{T}$ と表すことにする。このことから、正則な線型変換に対する次の分解定理が得られる。

定理2.3
ユニタリ空間 $V$ の任意の正則線型変換 $T$ は、正値エルミート変換 $H$ とユニタリ変換 $U$ との積として一意的に表される。
証明：任意のベクトル $\boldsymbol{x}, \boldsymbol{y}$ に対し、

$(TT^{\ast}\boldsymbol{x}, \boldsymbol{y})=(T^{\ast}\boldsymbol{x}, T^{\ast}\boldsymbol{y})=(\boldsymbol{x}, TT^{\ast}\boldsymbol{y})$

より、

$(TT^{\ast})^{\ast}=TT^{\ast}$

となり、 $TT^{\ast}$ はエルミート変換である。また、 $\boldsymbol{0}$ でない任意のベクトル $\boldsymbol{x}$ に対し、

$(TT^{\ast}\boldsymbol{x}, \boldsymbol{x})=(T^{\ast}\boldsymbol{x}, T^{\ast}\boldsymbol{x})\ge 0$

である。また、 $(TT^{\ast}\boldsymbol{x}, \boldsymbol{x})=0$ と仮定すると、

$(T^{\ast}\boldsymbol{x}, T^{\ast}\boldsymbol{x})=0$

より、 $T^{\ast}\boldsymbol{x}=\boldsymbol{0}$ である。 $T$ が正則なので、 $T^{\ast}$ も正則であり、 $\boldsymbol{x}=\boldsymbol{0}$ となる。これは $\boldsymbol{x}$ が $\boldsymbol{0}$ ではないことに矛盾する。従って、

$(TT^{\ast}\boldsymbol{x}, \boldsymbol{x})\neq 0$

であり、

$(TT^{\ast}\boldsymbol{x}, \boldsymbol{x})> 0$

なので、 $TT^{\ast}$ は正値エルミート変換である。よって、定理2.2から、 $H=\sqrt{TT^{\prime}}$ は正値エルミート変換である。 $U=H^{-1}T$ とおくと、

$\begin{split} UU^{\ast}&=(H^{-1}T)(H^{-1}T)^{\ast} \\ &=H^{-1}TT^{\ast}H^{-1} \\ &=H^{-1}H^2H^{-1} = I \end{split}$

即ち、 $U$ はユニタリ変換である。よって、 $T=HU$ と分解される。また、もう一つの分解 $T=_1U_1$ があるとすれば、 $H_1=HUU_1^{-1}$ 、 $H_1=H_1^{\ast}=(U_1^{-1})^{\ast}U^{\ast}H^{\ast}$ であるので、このとき

$\begin{split} H_1^2&=H_1H_1 \\ &=(HUU_1^{-1})((U_1^{-1})^{\ast}U^{\ast})H^{\ast} \\ &=HH^{\ast} \\ &=H^2 \end{split}$

従って、 $H=H_1$ である。これから、 $U=U_1$ も得られる。

定理2.3を行列の言葉で述べると次のようになる。
定理2.4
任意の正則行列は、正値エルミート行列とユニタリ行列との積として一意的に表される。

3. 参考文献
[1] 線型代数入門

線型代数入門（基礎数学） [ 斎藤正彦 ]

価格:2,090円
(2021/12/6 21:07時点)
感想(2件)

2021-09-23

【線形代数学入門】正規変換のスペクトル分解

線形代数

1. 記事の目的
下記の記事で正規変換とその対角化について述べた。本記事では、射影子と呼ばれるものを用いて、正規変換を分解する方法(スペクトル分解)について述べる。スペクトル分解の応用として、正規変換がエルミート変換およびユニタリ変換になるための条件を述べる。

2. 射影子
ユニタリ空間 $V$ の部分空間を $W$ とする。 $W$ の直交補空間を $W^{\bot}$ とすれば下記の記事の定理4.1より

$V=W\oplus W^{\bot}$

である。

camelsan.hatenablog.com

即ち、 $V$ の任意の元 $\boldsymbol{x}$ は、

$\boldsymbol{x}=\boldsymbol{x}^{\prime}+\boldsymbol{x}^{\prime\prime}, \ \ \boldsymbol{x}^{\prime}\in W, \ \ \boldsymbol{x}^{\prime\prime}\in W^{\bot}$

と一意的に表される。このとき

$P:V\rightarrow V;\boldsymbol{x}\mapsto\boldsymbol{x}^{\prime}$

は線型変換である。 $P$ を $V$ の $W$ への射影子という。

$V$ の線型変換がある部分空間の射影子となるための条件が次のように述べられる。

定理2.1
ユニタリ空間 $V$ の線型変換 $P$ が、ある部分空間 $W$ への射影子であるためには、

$P^2=P, \ \ P^{\ast}=P\tag{1}$

が成り立つことが必要かつ十分な条件である。
証明： $P$ が $W$ への射影子であると仮定する。 $\boldsymbol{x}\in V$ として、

$\boldsymbol{x}=\boldsymbol{x}^{\prime}+\boldsymbol{x}^{\prime\prime}, \ \ \boldsymbol{x}^{\prime}\in W, \ \ \boldsymbol{x}^{\prime\prime}\in W^{\bot}$

と表すと、

$\begin{split} P^2\boldsymbol{x}&=P^2(\boldsymbol{x}^{\prime}+\boldsymbol{x}^{\prime\prime})=P(\boldsymbol{x}^{\prime})=P(\boldsymbol{x}^{\prime}+\boldsymbol{0})=\boldsymbol{x}^{\prime} \\ P\boldsymbol{x}&=P(\boldsymbol{x}^{\prime}+\boldsymbol{x}^{\prime\prime})=\boldsymbol{x}^{\prime} \end{split}$

より、 $P^2=P$ である。 $P^{\ast}=P$ を証明する。 $\boldsymbol{x},\boldsymbol{y}\in V$ を、

$\boldsymbol{x}=\boldsymbol{x}^{\prime}+\boldsymbol{x}^{\prime\prime},\boldsymbol{y}=\boldsymbol{y}^{\prime}+\boldsymbol{y}^{\prime\prime}, \ \ \boldsymbol{x}^{\prime}, \boldsymbol{y}^{\prime}\in W, \ \ \boldsymbol{x}^{\prime\prime}, \boldsymbol{y}^{\prime\prime} \in W^{\bot}$

と表せば、

$\begin{split} (P\boldsymbol{x}, \boldsymbol{x})=(\boldsymbol{x}^{\prime}, \boldsymbol{y}^{\prime}+\boldsymbol{y}^{\prime\prime})&=(\boldsymbol{x}^{\prime}, \boldsymbol{y}^{\prime})+(\boldsymbol{x}^{\prime}, \boldsymbol{y}^{\prime\prime}) \\ &=(\boldsymbol{x}^{\prime}, \boldsymbol{y}^{\prime}) \\ &=(\boldsymbol{x}^{\prime}, \boldsymbol{y}^{\prime})+(\boldsymbol{x}^{\prime\prime}, \boldsymbol{y}^{\prime}) \\ &=(\boldsymbol{x}^{\prime}+\boldsymbol{x}^{\prime\prime}, \boldsymbol{y}^{\prime}) \\ &=(\boldsymbol{x}, P\boldsymbol{y}) = (P^{\prime}\boldsymbol{x}, \boldsymbol{y}) \end{split}$

より、 $P^{\ast}=P$ である。逆に $P$ が式(1)を満たすとき、 $W=P(V)$ とおく。 $\boldsymbol{x}^{\prime}\in W$ ならば、 $V$ のある元 $\boldsymbol{x}_0$ により、 $\boldsymbol{x}^{\prime}=P\boldsymbol{x}_0$ と書けるので、

$P\boldsymbol{x}^{\prime}=P^2\boldsymbol{x}_0=P\boldsymbol{x}_0=\boldsymbol{x}^{\prime}$

また、 $\boldsymbol{x}^{\prime\prime}\in W^{\bot}$ ならば、 $V$ の任意の元 $\boldsymbol{y}$ に対し、 $P\boldsymbol{y}\in W$ であるから、

$(P\boldsymbol{x}^{\prime\prime}, \boldsymbol{y})=(P^{\ast}\boldsymbol{x}^{\prime\prime}, \boldsymbol{y})=(\boldsymbol{x}^{\prime\prime}, P\boldsymbol{y})=0$

となり、 $P\boldsymbol{x}^{\prime\prime}~\boldsymbol{0}$ となる。従って、 $\boldsymbol{x}=\boldsymbol{x}^{\prime}+\boldsymbol{x}^{\prime\prime} \ \ (\boldsymbol{x}^{\prime}\in W, \boldsymbol{x}^{\prime\prime}\in W^{\bot})$ に対して、

$P\boldsymbol{x}=P\boldsymbol{x}^{\prime}+P\boldsymbol{x}^{\prime\prime}=\boldsymbol{x}^{\prime}$

が成り立つ。即ち $P$ は $V$ の $W=P(V)$ への射影子となる。

２つの射影子に関して、次が成り立つ。
定理2.2
$W_1,W_2$ をユニタリ空間 $V$ の部分空間、 $P_1,P_2$ をそれぞれ $W_1,W_2$ への射影子とする。 $W_1$ と $W_2$ が直交するためには、 $P_1P_2=0$ (または $P_2P_1=0$ )が成立することが必要かつ十分な条件である。
証明： $W_1$ と $W_2$ が直交するとき、 $\boldsymbol{x}\in W_2$ とし、任意の $\boldsymbol{y}\in W_1$ をとると、

$(\boldsymbol{x}, \boldsymbol{y})=0$

より、 $\boldsymbol{x}\in W_1^{\bot}$ である。即ち、 $W_2\subset W_1^{\bot}$ である。このとき[tex\boldsymbol{x}\in V]に対し、 $\boldsymbol{x}=\boldsymbol{x}^{\prime}+\boldsymbol{x}^{\prime\prime} \ \ (\boldsymbol{x}^{\prime}\in W_2, \boldsymbol{x}^{\prime\prime}\in W_2^{\bot})$ とすると、

$P_1P_2\boldsymbol{x}=P_1\boldsymbol{x}^{\prime}=P_1(\boldsymbol{0}+\boldsymbol{x}^{\prime})=\boldsymbol{0}$

よって、 $P_1P_2=0$ である。逆に、 $P_1P_2=0$ ならば、 $\boldsymbol{x}_1\in W_1$ 、 $\boldsymbol{x}_2\in W_2$ に対し、

$\begin{split} (\boldsymbol{x}_1,\boldsymbol{x}_2)&=(P_1\boldsymbol{x}_1,P_2\boldsymbol{x}_2) \\ &=(\boldsymbol{x}_1,P_1^{\prime}P_2\boldsymbol{x}_2) \\ &=(\boldsymbol{x}_1,P_1P_2\boldsymbol{x}_2) \\ &=0 \end{split}$

となる。 $P_2P_1$ に関しても、上記の証明で $W_1$ と $W_2$ を入れ替えれば証明できる。

3. スペクトル分解
$T$ がユニタリ空間 $V$ の正規変換であるとする。 $T$ の相異なる固有値すべてを $\beta_1,\beta_2,\dots,\beta_k$ 、対応する固有空間を $W_1,W_2,\dots,W_k$ とする。下記の記事、定理3.7より、 $W_1,W_2,\dots,W_k$ は互いに直交し、

$V=W_1\oplus W_2\oplus \dots \oplus W_k$

である。

camelsan.hatenablog.com

$W_i$ への射影子を $P_i$ とすれば、定理2.2と合わせると、

$P_1+P_2+\dots +P_k=I, \ \ P_iP_j=0 \ \ (i\neq j)\tag{2}$

$T=\beta_1P_1+\beta_2P_2+\dots+\beta_kP_k\tag{3}$

が成り立つ。これを正規変換 $T$ のスペクトル分解という。

正規変換のスペクトル分解に関し、次の定理が成り立つ。
定理3.1
ユニタリ空間 $V$ の正規変換 $T$ に対し、 $T$ の相異なる固有値 $\beta_1,\beta_2,\dots,\beta_k$ とすれば、(2)、(3)をみたす射影子 $P_1,P_2,\dots,P_k$ が一意的に決まる。逆に(2)を満たす射影子 $P_1,P_2,\dots,P_k$ と相異なる複素数 $\beta_1,\beta_2,\dots,\beta_k$ があるとき、(3)によって定義される線型変換 $T$ は正規変換である。
証明：スペクトル分解の一意性を証明する。射影子 $P_1^{\prime},P_2^{\prime},\dots,P_k^{\prime}$ によるもう一つのスペクトル分解

$P_1^{\prime}+P_2^{\prime}+\dots +P_k^{\prime}=I, \ \ P_i^{\prime}P_j^{\prime}=0 \ \ (i\neq j)$

$T=\beta_1P_1^{\prime}+\beta_2P_2^{\prime}+\dots+\beta_kP_k^{\prime}$

があったとする。 $P_i,P_i^{\prime}$ がそれぞれ $W_i,W_i^{\prime}$ への射影子であるとする。 $\boldsymbol{x}^{\prime}\in W_i^{\prime}$ とすると、

T(\boldsymbol{x}^{\prime})=\beta_i\boldsymbol{x}^{\prime}

で、 $\boldsymbol{x}^{prime}$ は $T$ の固有値 $\beta_i$ に対する固有ベクトルである。よって $\boldsymbol{x}^{\prime}\in W_i$ である。即ち、

$W_i^{\prime}\subseteq W_i$

となる。ある $i$ で $W_i^{\prime}\neq W_i$ 即ち、 $W_i^{\prime}\subsetneq W_i$ とすると、

$V=\displaystyle\oplus_{i=1}^k W_i^{\prime}\subsetneq \displaystyle\oplus_{i=1}^k W_i=V$

より矛盾。従って、任意の $i$ で、 $W_i=W_i^{\prime}$ である。したがって、 $P_i=P_i^{\prime}$ である。(2)をみたす射影子 $P_1,P_2,\dots,P_k$ があるとき、(3)によって定義される線型変換 $T$ は正規変換となる。実際、

$TT^{\ast}=\beta_1\overline{\beta_1}P_1+\beta_2\overline{\beta_2}P_2+\dots+\beta_k\overline{\beta_k}P_k=T^{\ast}T$

である。

4. エルミート変換とユニタリ変換
ユニタリ空間 $V$ の線型変換を $T$ とする。 $T^{\ast}$ をその随伴変換とする。
$T^{\ast}=T$ をみたすとき、 $T$ をエルミート変換という。
$T^{\ast}=T^{-1}$ をみたすとき、 $T$ をユニタリ変換という。

エルミート変換とユニタリ変換はともに、正規変換である。

正規変換がエルミート変換およびユニタリ変換になるための条件は次のように述べられる。
定理4.1
$T$ ユニタリ空間 $V$ の正規変換であるとする。
(1) $T$ がエルミート変換 $\iff$ $T$ の固有値がすべて実数
(2) $T$ がユニタリ変換 $\iff$ $T$ の固有値がすべて絶対値 $1$ の複素数
証明： $T$ のスペクトル分解を、

$T=\beta_1P_1+\beta_2P_2\dots+\beta_kP_k$

とすると、

$\begin{split} T^{\prime}&=\overline{\beta_1}P_1^{\prime}+\overline{\beta_2}P_2^{\prime}\dots+\overline{\beta_k}P_k^{\prime} \\ &=\overline{\beta_1}P_1+\overline{\beta_2}P_2\dots+\overline{\beta_k}P_k \end{split}$

である。
(1)

$\begin{split} Tがエルミート変換 &\iff T^{\ast}=T \\ &\iff \beta_i = \overline{\beta_i} \ \ (i=1,\dots,k) \\ &\iff \beta_iは実数 \ \ (i=1,\dots,k) \end{split}$

より成り立つ。
(2)

$\begin{split} Tがユニタリ変換 &\iff T^{\ast}=T^{-1} \\ &\iff T^{\ast}T=I \\ &\iff I=|\beta_1|^2P_1+|\beta_2|^2P_2+\dots+|\beta_k|^2P_k \\ &\iff |\beta_i|^2=1 \ \ (i=1,\dots,k) \end{split}$

より成り立つ(下から2段目の $\Rightarrow$ は、 $W_1,\dots,W_k$ の元を順に写すことで得られる)。

5. 参考文献
[1] 線型代数入門

線型代数入門（基礎数学） [ 斎藤正彦 ]

価格:2,090円
(2021/12/6 21:07時点)
感想(2件)

2021-09-20

【線形代数学入門】正規変換

線形代数

1. 記事の目的
下記の記事で、計量ベクトル空間について述べた。

camelsan.hatenablog.com

計量ベクトル空間の間の線型変換の対角化について述べる。特に、正規変換と呼ばれる変換の対角化について述べる。対角化については下記の記事を参照。

camelsan.hatenablog.com

2. 正規変換の定義
$V$ をユニタリ空間(つまり常に $\mathbb{C}$ 上で、計量が入っているものと仮定する)、 $T$ を $V$ の線型変換とする。
ある正規直交基底に関して $T$ を表現する行列を $A$ とする。このとき

$A^*=^t\overline{A}$

で表現される $V$ の線型変換を $T$ の随伴変換といい、 $T^{\ast}$ で表す。 $T^{\ast}$ は次の定理で述べられるような条件でも特徴づけられる。

定理2.1
$V$ をユニタリ空間、 $T$ を $V$ の線型変換とする。
$T^*$ が $T$ の随伴変換であることの必要かつ十分な条件は、任意の $\boldsymbol{x},\boldsymbol{y}\in V$ に対して

$(T^*\boldsymbol{x}, \boldsymbol{y})=(\boldsymbol{x}, Y\boldsymbol{y})$

が成り立つことである。
証明： $T^*$ が $T$ の随伴変換であるとき、 $V$ の基底を $(\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n;\varphi)$ をとって、 $T$ を基底 $(\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n;\varphi)$ に関して、表示した行列を $A$ とすると、 $T^{\ast}$ の行列表示は $A^{\ast}$ である。このとき

$(A^{\ast}\varphi(\boldsymbol{x}), \varphi(\boldsymbol{y}))=^t\varphi(\boldsymbol{x})^tA^t\overline{\varphi(\boldsymbol{y})}=(\varphi(\boldsymbol{x}), A\varphi(\boldsymbol{y}))$

の両辺を $\varphi^{-1}$ で写すと( $\varphi^{-1}$ は計量同型なので、計量を保つ )

$(T^{\ast}\boldsymbol{x}, \boldsymbol{y})=(\boldsymbol{x}, T\boldsymbol{y})$

となる。逆に

$(T^{\ast}\boldsymbol{x}, \boldsymbol{y})=(\boldsymbol{x}, T\boldsymbol{y}) \tag{1}$

が成り立つとき、 $T$ を基底 $(\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n;\varphi)$ に関して表現した行列を $A$ 、 $T^{\ast}$ を表現した行列を $B$ とすると、式(1)の両辺を $\varphi$ で写すと、

$(B\varphi(\boldsymbol{x}), \varphi(\boldsymbol{y}))=(\varphi(\boldsymbol{x}), A\varphi(\boldsymbol{y}))=(A^{\ast}\varphi(\boldsymbol{x}), \varphi(\boldsymbol{y}))$

となる。よって、

$B=A^{\ast}$

より、[tex^{\ast}]を基底 $(\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n;\varphi)$ で表現した行列は $A^{\ast}$ となり、 $tT^{\ast}$ は随伴行列である。

定理2.1から、式(1)を成り立たせるような $T^{\ast}\boldsymbol{x}$ は一つしか存在しないので、随伴行列 $T^{\ast}$ は、正規直交基底の取り方には無関係である。

正規変換を定義する。
定義
$T$ をユニタリ空間 $V$ の線型変換とする。このとき

$T^{\ast}T=TT^{\ast}$

が成り立つ[tex;T]を、正規変換という。

$n$ 次正方行列 $A$ が正規行列であるとは、

$A^{\ast}A=AA^{\ast}$

を満たすことである。よって、正規変換の、任意の正規直交基底に関する行列は、正規行悦である。

3. 正規変換の対角化
任意の正規変換は、適当な正規直交基底に関して対角行列によって表現されることを証明する。

まず、次の定理を証明する。
定理3.1
複素線形ベクトル空間 $V$ の２つの線型変換 $S, T$ が交換可能ならば、 $S, T$ は少なくとも一つの共通な固有ベクトルをもつ。
証明： $T$ のある固有値 $\alpha$ に対する固有空間を $W_\alpha$ とする。このとき $\boldsymbol{x}\in W_{\alpha}$ とすると、

$T(S\boldsymbol{x})=S(T\boldsymbol{x})=S(\alpha\boldsymbol{x})=\alpha (S\boldsymbol{x})$

である。よって、 $S\boldsymbol{x}\in W_\alpha$ となる。 $S$ の定義域を $W_\alpha$ に制限した写像を

$S_{W_\alpha}:W_\alpha\rightarrow W_{\alpha}; \boldsymbol{x}\mapsto S\boldsymbol{x}$

とする。ここで、上で証明したことから、 $S_{W_\alpha}$ の値域は $W_\alpha$ となる。よって、 $S_{W_\alpha}$ は $W_\alpha$ の線型変換であり、その固有ベクトル $\boldsymbol{a}$ をとると(固有方程式を考えれば、少なくとも一つ複素数の解を持つので、固有値を持ち、その固有ベクトルがある)、 $\boldsymbol{a}$ は $S$ の固有ベクトルであり、 $\boldsymbol{a}\in W_\alpha$ でもあるので、 $T$ の固有ベクトルでもある。

次の定理を証明するために、不変部分空間の概念を導入する。
定義
$V$ を $\mathbb{R}$ (または $\mathbb{C}$ )上のベクトル空間として、 $T$ を $V$ の線型変換とする。また、 $W$ を $V$ の部分空間とする。このとき

$T(W)\subset W$

が成り立つとき、 $W$ は $T$ による不変部分空間(または $T$ -不変部分空間)であるという。

次の定理を証明する。
定理3.2
$n$ 次元ユニタリ空間 $V$ の2つの線型変換 $S,T$ が交換可能ならば、次のような $V$ の部分空間の列 $W_0,W_1,\dots,W_n$ が存在する。
(1) $W_i \ \ (i=0,1,\dots,n)$ は $T$ -不変部分空間かつ $S$ -不変部分空間である。
(2) $\{\boldsymbol{0}\}=W_0\subset W_1\subset \dots \subset W_{n-1}\subset W_n=V$
(3) ${\rm{dim}}W_i={\rm{dim}}W_{i-1}+1 \ \ (i=1,2,\dots,n)$
証明： $n=1$ のとき、 $W_0=\{\boldsymbol{0}\}, \ \ W_1=V$ とすると成り立つ。
${\rm{dim}}V=n-1$ のときに主張が成り立つと仮定する。 $S,T$ の随伴変換をそれぞれ $S^{\ast}, T^{\ast}$ とすると、任意の $\boldsymbol{x}, \boldsymbol{y}\in V$ に対し

$\begin{split} (T^{\ast}S^{\ast}\boldsymbol{x}, \boldsymbol{y})&=(S^{\ast}\boldsymbol{x}, T\boldsymbol{y}) \\ &=(\boldsymbol{x}, ST\boldsymbol{y}) \\ &=(\boldsymbol{x}, TS\boldsymbol{y}) \\ &=(T^{\ast}\boldsymbol{x}, S\boldsymbol{y}) \\ &=(S^{\ast}T^{\ast}\boldsymbol{x}, \boldsymbol{y}) \end{split}$

より、 $T^{\ast}S^{\ast}=S^{\ast}T^{\ast}$ となる。即ち $T^{\ast}$ と $S^{\ast}$ は交換可能である。定理3.1より、 $T^{\ast}$ と $S^{\ast}$ に共通な固有ベクトルが存在し、それを $\boldsymbol{a}$ とする。

$W_{n-1}=\{\boldsymbol{x}\in V:(\boldsymbol{x}, \boldsymbol{a})=0\}$

とする( $W_{n-1}$ は $\boldsymbol{a}$ と直交する $V$ のベクトル全体 )。
$W_{n-1}$ は $T$ -不変かつ $S$ -不変である。実際、 $\boldsymbol{x}\in W_{n-1}$ とすると、

$\begin{split} (\boldsymbol{a}, T\boldsymbol{x})&=(T^{\ast}\boldsymbol{a}, \boldsymbol{x}) \\ &=\alpha(\boldsymbol{a}, \boldsymbol{x}) \\ &=0 \end{split}$

ここで、 $\alpha$ は $\boldsymbol{a}$ に対する $T^{\ast}$ の固有値である。よって、 $T\boldsymbol{x}\in W_{n-1}$ であり、 $W_{n-1}$ は $T$ -不変である。 $T$ を $S$ にして同じ議論ができるので、 $W_{n-1}$ は $S$ -不変である。 $T, S$ の $W_{n-1}$ への制限を $T^{\prime}, S^{\prime}$ とすると、 $T^{\prime}$ と $S^{\prime}$ は交換可能である(もともとの $T$ と $S$ が交換可能であるため)。また、

$\begin{split} V&=\langle \boldsymbol{a} \rangle\oplus \langle \boldsymbol{a} \rangle^{\bot} \\ &=\langle \boldsymbol{a} \rangle\oplus W_{n-1} \end{split}$

より、

$n={\rm{dim}}V={\rm{dim}}\langle \boldsymbol{a} \rangle + {\rm{dim}}W_{n-1}=1+{\rm{dim}} W_{n-1}$

なので、

${\rm{dim}}W_{n-1}=n-1$

である。数学的帰納法の仮定より、次のような $W_{n-1}$ の部分空間の列 $W_0,W_1,\dots,W_{n-1}$ が存在する。 (1) $W_i \ \ (i=0,1,\dots,n-1)$ は $T^{\prime}$ -不変部分空間かつ $S^{\prime}$ -不変部分空間である。
(2) $\{\boldsymbol{0}\}=W_0\subset W_1\subset \dots \subset W_{n-1}\subset W_{n-1}$
(3) ${\rm{dim}}W_i={\rm{dim}}W_{i-1}+1 \ \ (i=1,2,\dots,n-1)$
このとき、 $V$ の部分空間の列 $W_0,W_1,\dots,W_{n-1},W_n=V$ が定理の条件を満たす。

定理3.2を行列の言葉で述べると次のようになる。
定理3.3
2つの正方行列 $A, B$ が交換可能ならば、適当なユニタリ行列 $U$ が存在して、 $U^{-1}AU, U^{-1}BU$ は同時に、上三角行列となる。特に、 $A=B$ として、任意の正方行列 $A$ に対して $U^{-1}AU$ が上三角行列になるようなユニタリ行列 $U$ が存在する。
証明：正方行列 $C$ の対角線の左下にある成分がすべて $0$ であるとき、 $C$ を上三角行列であるという。即ち

$C= \begin{pmatrix} c_{11} & c_{12} & \dots & c_{1n} \\ 0 & c_{22} & \dots & c_{2n} \\ \vdots & \vdots& & \vdots \\ 0 & 0 & \dots & c_{nn} \end{pmatrix}$

定理3.2において、 $V=\mathbb{C}^n$ 、 $T=T_A$ 、 $S=T_B$ とする。 $W_i$ の元で、 $W_{i-1}$ と直交する長さ $1$ のベクトル $\boldsymbol{u}_i$ をとると、 $\mathbb{C}^n$ の正規直交基底 $\boldsymbol{u}_1, \boldsymbol{u}_2,\dots, \boldsymbol{u}_n$ に関する $T_A, T_B$ の行列はともに上三角行列である(各 $W_i$ は $S, T$ -不変であるため)。 $U=(\boldsymbol{u}_1 \ \ \boldsymbol{u}_2 \ \ \dots \ \ \boldsymbol{u}_n)$ とすれば、その行列表示は、 $U^{-1}AU, U^{-1}BU$ である。

固有値に関して次の定理が成り立つ。
定理3.4
(1) $A, B$ が交換可能ならば、 $A+B$ (あるいは $AB$ )の固有値は $A$ の固有値と $B$ の固有値との和(あるいは積)である。
(2) $A$ の固有値を(重複をこめて) $\alpha_1,\alpha_2,\dots,\alpha_n$ とすると、 $A^k$ の固有値は、 $\alpha_1^k,\alpha_2^k,\dots,\alpha_n^k$ である。
証明：上三角行列の特性根、即ち固有値は、対角成分である。実際、

$C= \begin{pmatrix} c_{11} & c_{12} & \dots & c_{1n} \\ 0 & c_{22} & \dots & c_{2n} \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \dots & c_{nn} \end{pmatrix}$

とすると、

$\begin{split} \Phi_C(c)&= \begin{vmatrix} x-c_{11} & x-c_{12} & \dots & x-c_{1n} \\ 0 & x-c_{22} & \dots & x-c_{2n} \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \dots & x-c_{nn} \end{vmatrix} &=(x-c_{11}) \begin{vmatrix} x-c_{22} & x-c_{23} & \dots & x-c_{2n} \\ 0 & x-c_{32} & \dots & x-c_{3n} \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \dots & x-c_{nn} \end{vmatrix} &=\dots \\ &=(x-c_{11})(x-c_{22})\dots (x-c_{nn}) \end{split}$

より成り立つ。ここで、２番目の等式に関して下記の記事の6節定理(A)を利用した。

camelsan.hatenablog.com

(1) 定理3.3より、 $U^{-1}AU, \ \ U^{-1}BU$ がともに上三角行列となるように $U$ を選べば、

$\begin{split} U^{-1}(A+B)U &= U^{-1}AU + U^{-1}BU \\ U^{-1}(AB)U &= (U^{-1}AU) (U^{-1}BU) \end{split}$

より、これらの式と $U^{-1}CU$ と $C$ の固有値が等しいことと、上三角行列の固有値は対角成分に等しいことから成り立つ。
(2) (1)の積の主張から成り立つ。

ここまで準備して、本記事の目的の主張である次の定理が証明できる。
定理3.5
ユニタリ空間 $V$ の線型変換 $T$ が、適当な正規直交基底に関して対角行列によって表現されるためには、 $T$ が正規変換であることが必要かつ十分な条件である。
証明： $TT^{\ast}=T^{\ast}T$ が成り立つならば定理3.4より、適当な正規直交基底に関する $T, T^{\ast}$ の行列による表現 $A, A^{\ast}$ はともに、上三角行列となる。 $A^{\ast}=^t\overline{A}$ が上三角行列ならば、 $A$ は下三角行列

$\begin{split} a_{11} & 0 & \dots & 0 \\ a_{21} & a_{22} & \dots & 0 \\ \dots & \dots & & \dots \\ a_{n1} & a_{n2} & \dots & a_{nn} \end{split}$

である。従って、 $A$ は上三角行列かつ下三角行列であり、結局 $A$ は対角行列でなければならない。
逆に、ある正規直交基底に関する $T$ の行列 $A$ が対角行列ならば、 $AA^{\ast}=A^{\ast}A$ であるから、 $TT^{\ast}=T^{\ast}T$ が成り立つ。

定理3.5を行列の言葉で述べると次のようになる。
定理3.6
正方行列 $A$ に対し、 $U^{-1}AU$ が対角行列になるようなユニタリ行列 $U$ が存在するためには、 $A$ が正規行列であることが必要かつ十分な条件である。

定理3.5から次の定理が導かれる。
定理3.7
ユニタリ空間 $V$ の正規変換 $T$ の相異なる固有値に対する固有値に対する固有ベクトルは互いに直交する。 $\beta_1,\beta_2,\dots,\beta_k$ を $T$ の相異なる固有値の全体とし、 $W_1,W_2,\dots,W_k$ を対応する固有空間とすれば、それらは互いに直交し、

$V=W_1\oplus W_2\oplus\dots \oplus W_k$

となる。
証明：定理3.5より、 $T$ の固有ベクトルのみからなる正規直交基底 $\langle \boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n \rangle$ が存在する。このうち、 $\beta_i$ に対する固有ベクトルだけから生成される部分空間が $W_i$ である。よって、

$V=W_1\oplus W_2\oplus\dots \oplus W_k$

となる。

4. 参考文献
[1] 線型代数入門

線型代数入門（基礎数学） [ 斎藤正彦 ]

価格:2,090円
(2021/12/6 21:07時点)
感想(2件)

2021-09-19

【線形代数学入門】固有値と固有ベクトル

線形代数

1. 記事の目的
本記事では、線形空間の固有値と固有ベクトルについて述べる。本記事では、 $K=\mathbb{R}$ または $\mathbb{C}$ とする。

2. 固有値と固有ベクトルの定義
$V$ を $K$ 上の線形空間、 $T$ を $V$ の線型変換とする。
$T$ をで写しても、方向が変わらないベクトル、即ち

$T\boldsymbol{x}=\alpha\boldsymbol{x} \ \ (\alpha\in K)$

となる $0\neq\boldsymbol{x}\in V$ を、固有ベクトル、このときの数 $\alpha$ を固有値という。
$\boldsymbol{x}$ のことを $T$ の固有値 $\alpha$ に対する固有ベクトルと言ったりもする。

$\alpha$ が $T$ の固有値であるとき、 $\alpha$ に対する $T$ の固有値のベクトル全部と、零ベクトル $\boldsymbol{0}$ 、の集合

$W_\alpha = \{\boldsymbol{x}\in V | T\boldsymbol{x}=\alpha\boldsymbol{x} \}\cup\{\boldsymbol{0}\}$

を、固有値 $\alpha$ に対する $T$ の固有空間という。

行列に対する固有値、固有ベクトルは次のように定義される。
$A$ が $n$ 次正方行列であるとき、 $\mathbb{C}^n$ の線型変換

$T_A : \mathbb{C}^n\rightarrow \mathbb{C}^n ; \boldsymbol{x}\mapsto A\boldsymbol{x}$

の固有値、固有ベクトル、固有空間を、それぞれ行列 $A$ の固有値、固有ベクトル、固有空間という。

$T$ が複素線形空間 $V$ の線型変換であるとき、 $V$ の基底 $(\boldsymbol{e}_1,\boldsymbol{e}_2,\dots, \boldsymbol{e}_n;\varphi)$ に関する $T$ を表現した行列を $A$ とする。但し、

$\varphi:V\rightarrow \mathbb{C}^n;x_1\boldsymbol{e}_1+x_2\boldsymbol{e}_2+\dots+x_n\boldsymbol{e}_n\mapsto \begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix}$

である。このとき、 $T$ と $A$ の固有値は一致し、固有ベクトル、固有空間は $\varphi$ によって写り合う。

固有ベクトルと線型独立性に関して、次の定理が成り立つ。
定理2.1
$V$ を $K$ 上のベクトル空間、 $T$ を $V$ の線型変換とする。このとき、 $T$ の相異なる固有値に対する固有ベクトルは線型独立である。
証明： $\beta_1,\beta_2,\dots,\beta_k$ を相異なる固有値、 $\boldsymbol{x}_1,\boldsymbol{x}_2,\dots,\boldsymbol{x}_k$ を対応する固有ベクトルとする。 $\boldsymbol{x}_1,\boldsymbol{x}_2,\dots,\boldsymbol{x}_k$ が線形従属であったと仮定する。このとき $\boldsymbol{x}_1,\boldsymbol{x}_2,\dots,\boldsymbol{x}_{i-1}$ は線型独立だが、 $\boldsymbol{x}_1,\boldsymbol{x}_2,\dots,\boldsymbol{x}_{i-1},\boldsymbol{x}_i$ は線形従属であるような $i \ \ (2\le i \le k)$ が存在する。このとき、

$\boldsymbol{x}_i=c_1\boldsymbol{x}_1+c_2\boldsymbol{x}_2+\dots+c_{i-1}\boldsymbol{x}_{i-1}\tag{1}$

と表される。式(1)の両辺を $T$ で写すと、

$\beta_i\boldsymbol{x}_i=c_1\beta_1\boldsymbol{x}_1+c_2\beta_2\boldsymbol{x}_2+\dots+c_{i-1}\beta_{i-1}\boldsymbol{x}_{i-1}\tag{2}$

である。一方、式(1)の両辺に $\beta_i$ をかけると、

$\beta_i\boldsymbol{x}_i=c_1\beta_i\boldsymbol{x}_1+c_2\beta_i\boldsymbol{x}_2+\dots+c_{i-1}\beta_i\boldsymbol{x}_{i-1}\tag{3}$

となる。式(2)、(3)より、

$c_1(\beta_1-\beta_i)\boldsymbol{x}_1+c_2(\beta_2-\beta_i)\boldsymbol{x}_2+\dots+c_{i-1}(\beta_{i-1}-\beta_i)\boldsymbol{x}_{i-1}=\boldsymbol{0}$

である。 $\boldsymbol{x}_1,\boldsymbol{x}_2,\dots,\boldsymbol{x}_{i-1}$ は線型独立なので、

$c_j(\beta_j-\beta_i)=0 \ \ (j=1,2,\dots,i-1)$

となる。仮定により、 $\beta_i\neq\beta_j$ より、 $c_j=0 \ \ (j=1,2,\dots,i-1)$ である。従って、式(1)より、 $\boldsymbol{x}_i=\boldsymbol{0}$ となり、 $\boldsymbol{x}_i$ が固有ベクトル( $\neq\boldsymbol{0}$ )であるという仮定に矛盾する。よって、 $\boldsymbol{x}_1,\boldsymbol{x}_2,\dots,\boldsymbol{x}_k$ は線型独立である。

定理2.1から、 $T$ の相異なる固有値 $\beta_1,\beta_2,\dots,\beta_k$ に対する固有空間を $W_1,W_2,\dots,W_k$ とすると、和空間 $W_1+W_2+\dots+W_k$ は直和である。実際( $k=2$ のときに証明する)、 $\boldsymbol{x}\in W_1\cap W_2$ で、 $\boldsymbol{x}\neq \boldsymbol{0}$ とすると、

$T\boldsymbol{x}=\beta_1\boldsymbol{x}, \ \ T\boldsymbol{x}=\beta_2\boldsymbol{x}$

である。よって、 $(\beta_1-\beta_2)\boldsymbol{x}=\boldsymbol{0}, \ \ \beta_1\neq\beta_2$ より $\boldsymbol{x}\neq\boldsymbol{0}$ となり矛盾。従って、 $W_1\cap W_2=\{\boldsymbol{0}\}$ となり、下記の記事の定理3.1より $W_1+W_2=W_1\oplus W_2$ である。

camelsan.hatenablog.com

しかし、直和 $W_1\oplus W_2\oplus \dots\oplus W_k$ は $V$ 全体に一致するとは限らない。固有空間の和が全体に一致するための条件は次のように述べられる。
定理2.2
$V$ を $K$ 上のベクトル空間、 $T$ を $V$ の線型変換とする。
$T$ が適当な基底に関して対角行列で表現されるためには、

$V=W_1\oplus W_2\oplus \dots\oplus W_k$

が成り立つことが必要かつ十分な条件である。
証明：基底 $(\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n;\varphi)$ に関する $T$ の行列 $A$ が対角行列

$A= \begin{pmatrix} \alpha_1 & & & \Huge{0} \\ & \alpha_2 & & \\ &&\ddots& \\ \Huge{0} & & & \alpha_n \end{pmatrix}$

であると仮定する。 $T_A=\varphi\circ T\circ \varphi^{-1}$ であるから、

$\begin{split} \varphi(T\boldsymbol{e}_i)&=T_A(\varphi(\boldsymbol{e}_i))= \begin{pmatrix} \alpha_1 & & & & \Huge{0} \\ & \ddots & & & \\ &&\alpha_i& & \\ & & & \ddots & \\ \Huge{0} & & & & \alpha_n \end{pmatrix} \begin{pmatrix} 0 \\ \vdots \\ 1 \\ \vdots \\ 0 \end{pmatrix} \\ &=\alpha_i \begin{pmatrix} 0 \\ \vdots \\ 1 \\ \vdots \\ 0 \end{pmatrix} =\alpha_i\varphi(\boldsymbol{e}_i) \end{split}$

従って、 $T\boldsymbol{e}_i=\alpha_i\boldsymbol{e}_i$ である。即ち $\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n$ はすべてTの固有ベクトルである。固有値 $\alpha_i$ に対応する固有空間を $W_i$ とし、 $V$ の基底の内で $\alpha_i$ を固有値に持つものを、 $\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_i$ とする。このとき、

$\langle \boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_i \rangle\subset W_i$

である。ここで、

$\langle \boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_i \rangle\neq W_i$

と仮定すると、 $\boldsymbol{v}\in W_i$ で、 $v\notin \langle \boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_i \rangle$ となる元が存在する。 $\boldsymbol{v}$ は $\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_i$ 以外の $V$ の基底の線型結合で表される。しかし、それらは $\alpha_i$ 以外の固有値に対応する固有ベクトルであるため、これは $\boldsymbol{v}\in W_i$ に矛盾する。よって、

$\langle \boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_i \rangle= W_i$

である。従って、 $V$ の基底は $T$ のいずれかの固有空間を生成する基底となるので、

$V=W_1\oplus W_2\oplus\dots\oplus W_k$

となる。逆に、

$V=W_1\oplus W_2\oplus\dots\oplus W_k$

とする。各 $W_i$ の基底を集めることで $T$ の固有ベクトルからなる $V$ の基底 $\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n$ が存在する。このとき $T\boldsymbol{e}_i=\alpha_i\boldsymbol{e}_i$ より、基底 $\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n$ に関して $T$ を表現した行列は対角行列

$\begin{pmatrix} \alpha_1 & & & \Huge{0} \\ & \alpha_2 & & \\ &&\ddots& \\ \Huge{0} & & & \alpha_n \end{pmatrix}$

に等しい。

定理2.2を行列の言葉で表現すると次のようになる。
定理2.3
(1) $n$ 次正方行列 $A$ に対し、適切な(複素)正則行列 $P$ をとって、 $P^{-1}AP$ が対角行列になるようにするためには、 $n$ 個の線型独立な固有ベクトルが存在することが必要かつ十分な条件である。
(2) $\boldsymbol{p}_1,\boldsymbol{p}_2,\dots,\boldsymbol{p}_n$ が線型独立な固有ベクトルであるとき、それらを並べた行列 $\begin{pmatrix} \boldsymbol{p}_1 \ \boldsymbol{p}_2 \ \dots \ \boldsymbol{p}_n \end{pmatrix}$ を $P$ とすれば、 $P^{-1}AP$ は対角行列である。
証明：(1) $\mathbb{C}^n$ の基底 $\boldsymbol{f}_1,\boldsymbol{f}_2,\dots,\boldsymbol{f}_n$ に関する $T_A$ の行列表示 $B$ が対角行列であるとする。 $P$ を $\boldsymbol{f}_1,\boldsymbol{f}_2,\dots,\boldsymbol{f}_n$ から $\mathbb{C}^n$ の単位ベクトルからなる基底への変換行列とすると、

$(T_A)_B=T_P\circ T_A\circ T_P^{-1}$

より、

$\begin{split} T_P(T_A\boldsymbol{f}_i)&=(T_A)_B(T_P\boldsymbol{f}_i) \\ &= \begin{pmatrix} \alpha_1 & & & \Huge{0} \\ & \alpha_2 & & \\ &&\ddots& \\ \Huge{0} & & & \alpha_n \end{pmatrix} \begin{pmatrix} 0 \\ \vdots \\ 1 \\ \vdots \\ 0 \end{pmatrix} =\alpha_i\boldsymbol{e}_i=P\alpha_i\boldsymbol{f}_i \end{split}$

である。従って

$A\boldsymbol{f}_i=\alpha_i\boldsymbol{f}_i$

で $\boldsymbol{f}_1,\boldsymbol{f}_2,\dots,\boldsymbol{f}_n$ は $n$ 個の線型独立な固有ベクトルである。逆に $\boldsymbol{f}_1,\boldsymbol{f}_2,\dots,\boldsymbol{f}_n$ がすべて $A$ の固有ベクトルのとき、

$T_A\boldsymbol{f}_i=\alpha_i\boldsymbol{f}_i$

とし、基底 $\boldsymbol{f}_1,\boldsymbol{f}_2,\dots,\boldsymbol{f}_n$ から単位ベクトルからなる基底 $\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_n$ への変換行列を $P$ とすると $P^{-1}AP$ は対角行列

\begin{pmatrix} \alpha_1 & & & \Huge{0} \\ & \alpha_2 & & \\ &&\ddots& \\ \Huge{0} & & & \alpha_n \end{pmatrix}

となる。
(2) $\boldsymbol{p}_j$ を $A$ の固有値 $\alpha_j$ に対する固有ベクトルとする。 $P^{-1}AP$ の第 $j$ 列のベクトルを $\boldsymbol{b}_j$ とすると、

$\boldsymbol{b}_j=P^{-1}A\boldsymbol{p}_j=P^{-1}\alpha_j\boldsymbol{p}_j=\alpha_j\boldsymbol{e}_j$

となる。但し、 $\boldsymbol{e}_j$ は $n$ 項単位ベクトルである。よって

$P^{-1}AP= \begin{pmatrix} \alpha_1 & & & \Huge{0} \\ & \alpha_2 & & \\ &&\ddots& \\ \Huge{0} & & & \alpha_n \end{pmatrix}$

となる。

3. 固有値と固有ベクトルの計算方法
固有値・固有ベクトルの計算の仕方を具体例から始める。
例3.1

$\begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}$

とする。 $A$ の固有値と固有ベクトルを求める。

$\boldsymbol{x}= \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \in \mathbb{C}^n$

として、数 $\alpha$ が $A$ の固有値であるためには、斉次一次方程式

$A\boldsymbol{x}=\alpha\boldsymbol{x}$

が自明でない解を持つことが必要かつ十分な条件である。

このとき

$\begin{split} A\boldsymbol{x}&= \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix}= \begin{pmatrix} 2x_1+x_2 \\ x_1+2x_2 \end{pmatrix} \\ \alpha\boldsymbol{x}&= \begin{pmatrix} \alpha x_1 \\ \alpha x_2 \end{pmatrix} \end{split}$

より

$\begin{split} (\alpha -2)x_1-x_2=0 \\ -x_1+(\alpha -2)x_2=0 \end{split} \tag{4}$

である。即ち

$\begin{pmatrix} \alpha -2 & -1 \\ -1 & \alpha -2 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} =0$

で、 $\boldsymbol{x}$ が自明でない解をもつには、行列

$\begin{pmatrix} \alpha -2 & -1 \\ -1 & \alpha -2 \end{pmatrix}$

が正則行列でないことが必要十分条件である。このとき下記の記事定理7.2より

$\begin{vmatrix} \alpha -2 & -1 \\ -1 & \alpha -2 \end{vmatrix} =0$

であることが必要十分条件である。

camelsan.hatenablog.com

よって

$\begin{split} 0&=(\alpha -2)^2 -1 \\ &=\alpha-2 -4\alpha +4 -1 \\ &=\alpha^2 -4\alpha +3 &=(\alpha -3)(\alpha -1) \end{split}$

より、 $\alpha = 3, \ \ 1$ である。 $\alpha =1$ のとき、

$A\boldsymbol{x}=\boldsymbol{x}$

を解く。式(4)から、

$-x_1-x_2=0$

より、解の一つとして

$\boldsymbol{p}_1= \begin{pmatrix} 1 \\ -1 \end{pmatrix}$

が得られる。また、 $\alpha =3$ のとき

$A\boldsymbol{x}=3\boldsymbol{x}$

を解く。式(4)から、

$x_1-x_2=0$

より、解の一つとして

$\boldsymbol{p}_2= \begin{pmatrix} 1 \\ 1 \end{pmatrix}$

が得られる。従って、 $\boldsymbol{p}_1,\boldsymbol{p}_2$ はそれぞれ固有値 $1,3$ の固有ベクトルである。

例3.1から示されるように、 $n$ 次正方行列 $A$ の固有値を求めるためには、次の方程式を解けばよい。

${\rm{det}}(xE-A)=0$

この式の左辺を $\Phi_A(x)$ とおき、 $\Phi_A(x)$ を行列 $A$ の固有方程式という。また、 $\Phi_A(x)=0$ を固有方程式といい、固有方程式の根を、 $A$ の特性婚という。

$V$ を $\mathbb{R}$ または $\mathbb{C}$ 上のベクトル空間とし、 $T$ を $V$ の線型変換とする。 $T$ の行列表示 $A$ の固有多項式、固有方程式、特性根を、それぞれ線型変換 $T$ の固有多項式、固有方程式、特性根という。

$T$ の固有多項式は、行列で表示した際、基底の取り方には依存しない。実際、 $T$ の行列表示 $A$ 以外に、行列表示 $B$ があったとすると、 $B=P^{-1}AP$ となる正方行列 $P$ が存在する。このとき、

$\begin{split} \Phi_B(x)&={\rm{det}}(xE-P^{-1}AP) \\ &={\rm{det}}(xP^{-1}P-P^{-1}AP) \\ &={\rm{det}}(P^{-1}(xE-A)P) \\ &=({\rm{det}}P)^{-1}{\rm{det}}(xE-A){\rm{det}}P \\ &={\rm{det}}(xE-A) = \Phi_A(x) \end{split}$

より、基底の変換前後で、固有多項式は変わらない。

特性根が実際に、こゆうちであることは次の定理から保証される。
定理3.2
(1) 行列 $A$ (または複素線形空間の線型変換 $T$ )の固有値は、 $A$ (または $T$ )の特性根と一致する。
(2) $\mathbb{R}$ 上の線形空間の線型変換の固有値は $T$ の実数の特性根と一致する。
証明：(1) 複素数 $\alpha$ が行列 $A$ の固有値であるということは、 $A\boldsymbol{x}=\alpha\boldsymbol{x}$ をみたす $\boldsymbol{0}$ でないベクトル $\boldsymbol{x}$ が存在するということであり、それは斉次一次方程式

$(\alpha E-A)\boldsymbol{x}=\boldsymbol{0}$

が自明でない解を持つということである。これは、下記の記事の定理7.2より、 $\Phi_A(\alpha)=0$ が成り立つことである。

camelsan.hatenablog.com

(2) $\mathbb{R}$ 上の線形空間の線型変換を $T$ とすると、任意の基底に関する $T$ の行列を $A$ とすれば、 $A$ は実数値を成分とする行列であり、実数 $\alpha$ が $T$ の固有値であるということは、実係数の斉次一次方程式 $(\alpha E-A)\boldsymbol{x}=\boldsymbol{0}$ が自明でない実数解を持つということである。　よって、 ${\rm{det}}(\alpha E-A)=0$ であり、 $\alpha$ は実特性根である。逆に、 $\alpha$ が実特性根であるとする。このとき、 ${\rm{det}}(\alpha E-A)=0$ で、 $(\alpha E-A)\boldsymbol{x}=\boldsymbol{0}$ が自明な解を持つことと同値である。ここで、下記の記事の証明から、一次方程式系の係数がすべて実数ならば、解の状態は、複素ベクトルで考えても、実ベクトルだけで考えても変わらない。

camelsan.hatenablog.com

即ち、実ベクトルの範囲で解がなければ、複素ベクトルまで考えても解はない。また、解を持つ場合の任意定数の個数も複素ベクトルで考えても実数ベクトルで考えても変わらない。従って、任意定数を時数だけに限れば、すべての実数解が得られる。従って、 $(\alpha E-A)\boldsymbol{x}=\boldsymbol{0}$ の自明でない解は、すべての自明でない実数解である。

よって、 $(\alpha E-A)\boldsymbol{x}=\boldsymbol{0}$ が自明でない実数解をもつことと、 $\alpha$ が実特性根であることは同値である。従って、 $\mathbb{R}$ 上のベクトル空間の線型変換の固有値は、 $T$ の実特性根と一致する。

4. 対角化可能性
行列の対角化が可能な条件を述べた次の定理が得られる。
定理4.1
行列 $A$ が対角行列に掃除である( $P^{-1}AP$ が対角行列になるような正則行列 $P$ が存在する)ためには、 $A$ の各特性根 $\alpha$ に対する固有空間の次元が $\alpha$ の重複度(固有多項式で、 $\alpha$ が何重解であるか)に一致することが必要かつ十分な条件である。
証明： $A$ が対角行列に相似であると仮定する。即ち $\Lambda=P^{-1}AP$ となる正則行列 $P$ と対角行列 $\Lambda$ が存在する。 $A$ の固有値 $\alpha$ に対する固有空間を $W_\alpha$ とすると、

$\begin{split} W_\alpha&=\{\boldsymbol{x}\in V:A\boldsymbol{x}=\alpha\boldsymbol{x} \} \\ &=\{\boldsymbol{x}\in V:(\alpha E-A)\boldsymbol{x}=\boldsymbol{0}\} \\ &={\rm{Ker}}(\alpha E-A) \end{split}$

より、

$\begin{split} {\rm{dim}}W_\alpha &={\rm{divKer}}(\alpha E-A) \\ &=n-{\rm{rank}}(\alpha E-A) \\ &=n-{\rm{rank}}(\alpha E-P^{-1}AP) \\ &=n-{\rm{rank}}(\alpha E-\Lambda) \end{split}$

である、。ここで、2行目の等式に関して下記の記事の定理2.1を使った。

camelsan.hatenablog.com

$\Lambda$ の対角成分は $A$ の固有値に等しく、 $\alpha$ が $m$ 個あったとすると( $\alpha$ の重複度が $m$ )、

${\rm{rank}}(\alpha E-\Lambda)=n-m$

このとき

${\rm{dim}}W_\alpha = n-n+m=m$

逆に、固有値 $\alpha$ の固有空間の次元が、固有値 $\alpha$ の重複度に等しいとする。まず次の主張を証明する。
「固有値の異なる固有空間の次元の総和が、ベクトル空間 $V$ の次元 $n$ に等しい」
固有方程式

${\rm{det}}(\alpha E-A)=0$

は、代数学の基本定理により、必ず $n$ 個の複素数解

$\lambda_1,\lambda_2,\dots,\lambda_n$

を持つ。この中に値の異なる解が $r$ 種類だけあるとし、それらを

$\alpha_1,\alpha_2,\dots,\alpha_r$

と表す。 $\lambda_1,\lambda_2,\dots,\lambda_n$ の中に $\alpha_j$ が $m_j$ 個( $j=1,\dots,r$ )含まれていたとする。このとき

$\displaystyle\sum_{j=1}^r m_j = n$

である。 $m_j$ は解 $\alpha_j$ の重複度であるから、仮定より

${\rm{dim}}W_{\alpha_j}=m_j$

である。従って、

$\displaystyle\sum_{j=1}^n {\rm{dim}}W_{\alpha_j}=\displaystyle\sum_{j=1}^r m_j = n$

となる。従って、固有値の異なる固有空間の次元の総和がベクトル空間 $V$ の次元 $n$ に等しい。

次に $A$ が対角行列に相似であることを証明する。異なる固有値の各固有空間から、基底に対応するベクトル

$p_1^j,p_2^j,\dots,p_{m_j}^j$

をとる。このとき、上で証明したことから、集合

$\displaystyle\cup_{j=1}^r \{ p_1^j,p_2^j,\dots,p_{m_j}^j \} \tag{5}$

の元の個数は $n$ である。定理2.1より、異なる固有値に対応する固有ベクトルは線型独立なので、式(5)の中のすべてのベクトルは線型独立である。式(5)の集合の元を並び替えることで、

$\displaystyle\cup_{j=1}^r \{ p_1^j,p_2^j,\dots,p_{m_j}^j \}=\{\boldsymbol{p}_1,\boldsymbol{p}_2,\dots,\boldsymbol{p}_n\}$

と表すことにする。[\boldsymbol{p}_j]は線型独立であり、 $A$ の固有ベクトルであるから、

$A\boldsymbol{p}_i=\mu_i\boldsymbol{p}_i \ \ (i=1,\dots,n)$

である。ここで、 $\mu_i$ は $A$ の固有値 $\lambda_1,\lambda_2,\dots.\lambda_n$ のいずれかである。

$P= \begin{pmatrix} \boldsymbol{p_1} & \boldsymbol{p_2} & \dots & \boldsymbol{p_n} \end{pmatrix}$

と定義すると、

$\begin{split} AP&= \begin{pmatrix} A\boldsymbol{p_1} & A\boldsymbol{p_2} & \dots & A\boldsymbol{p_n} \end{pmatrix} \\ &= \begin{pmatrix} \mu_1\boldsymbol{p_1} & \mu_2\boldsymbol{p_2} & \dots & \mu_n\boldsymbol{p_n} \end{pmatrix} \\ &= \begin{pmatrix} \boldsymbol{p_1} & \boldsymbol{p_2} & \dots & \boldsymbol{p_n} \end{pmatrix} \begin{pmatrix} \mu_1 & & & \Huge{0} \\ & \mu_2 & & \\ &&\ddots& \\ \Huge{0} & & & \mu_n \end{pmatrix} \\ &=P\Lambda \end{split}$