ベイジアン研究所

技術(人工知能、数学等)と心理の話をしています。

【線形代数学入門】基底と行列

1. 記事の目的
以下の記事で、基底の定義と基底を使った次元の定義について述べた。本記事では、基底の変換行列およびベクトル空間の間の線形写像の、行列による表現について述べる。

camelsan.hatenablog.com

camelsan.hatenablog.com

本記事では、常にK=\mathbb{R}または\mathbb{C}を表すものとする。

2. 基底の変換行列
VK上のベクトル空間とする。\boldsymbol{e}_1,\dots,\boldsymbol{e}_n\boldsymbol{f}_1,\dots,\boldsymbol{f}_nVの2つの基底とする。これら2つの基底が定めるVからK^nへの同型写像\varphi, \psiとする。即ち任意のVの元を、\boldsymbol{x}=x_1\boldsymbol{e}_1+\dots+x_n\boldsymbol{e}_n=y_1\boldsymbol{f}_1+\dots+y_n\boldsymbol{f}_nと表したとき、


\begin{split}
    &\varphi : V \rightarrow K^n ; \boldsymbol{x} \mapsto \begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix} \\
    &\psi : V \rightarrow K^n ; \boldsymbol{x} \mapsto \begin{pmatrix} y_1 \\ \vdots \\ y_n \end{pmatrix} \\
\end{split}

である。

このとき、\varphi\circ\psi^{-1}は、K^nからK^nへの同型写像であるから、以下の記事の4節の定理から、n次正方行列P=(p_{ij})によって定まるK^nの線型変換T_Pに等しい。

camelsan.hatenablog.com

このとき、K^nの元(y_1\dots,y_n)^Tに対し、


\varphi\circ\psi^{-1}\left(\begin{pmatrix} y_1 \\ \vdots \\ y_n\end{pmatrix}\right)=T_P\left(\begin{pmatrix} y_1 \\ \vdots \\ y_n\end{pmatrix}\right)=P\left(\begin{pmatrix} y_1 \\ \vdots \\ y_n\end{pmatrix}\right)

である。


\begin{split}
    左辺&=\varphi (y_1\boldsymbol{f}_1+\dots+y_n\boldsymbol{f}_n) \\
    &=\varphi (x_1\boldsymbol{e}_1+\dots+x_n\boldsymbol{e}_n) \\
    &=\begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix} \\
    右辺&=
        \begin{pmatrix}
            p_{11} & \dots & p_{1n} \\
            \vdots & & \vdots \\
            p_{n1} & \dots & p_{nn} 
        \end{pmatrix}\begin{pmatrix} y_1 \\ \vdots \\ y_n\end{pmatrix}
\end{split}

である。即ち、


\begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix} = 
\begin{pmatrix}
            p_{11} & \dots & p_{1n} \\
            \vdots & & \vdots \\
            p_{n1} & \dots & p_{nn} 
\end{pmatrix}\begin{pmatrix} y_1 \\ \vdots \\ y_n\end{pmatrix}
\tag{1}

が成り立つ。このとき行列Pを基底の取り替え行列という。

\boldsymbol{f}_1,\dots,\boldsymbol{f}_nを、\boldsymbol{e}_1,\dots,\boldsymbol{e}_nの線型結合として表して、その線形結合の係数を求めてみる。

\boldsymbol{f}_i=c_{i1}\boldsymbol{e}_1+\dots+c_{in}\boldsymbol{e}_n \ \ (i=1,\dots,n)

と表す。このとき、c_{ij}は、式(1)に


\begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix} = \begin{pmatrix} c_{i1} \\ \vdots \\ c_{in} \end{pmatrix}, \ \begin{pmatrix} y_1 \\ \vdots \\ y_i \\ \vdots \\ y_n \end{pmatrix} = \begin{pmatrix} 0 \\ \vdots \\ 1 \\ \vdots \\ 0 \end{pmatrix}

を代入することで求めることができる。よって、c_{ij}=p_{ji}である。よって

\boldsymbol{f}_i = \displaystyle\sum_{j=1}^np_{ji}\boldsymbol{e}_j \ \ (i=1,2,\dots,n)

となる。

3. 線形写像の行列による表現
ベクトル空間において、基底を選んで、線形写像を行列で表現することを考える。

ベクトル空間Vの一つの基底\boldsymbol{e}_1,\dots,\boldsymbol{e}_nを選べば、VからK^nへの同型写像\varphiが決まるので、基底とその同型写像を合わせて、基底(\boldsymbol{e}_1,\dots,\boldsymbol{e}_n;\varphi)と言うことにする。

V, V^{\prime}をそれぞれK上のn次元とm次元の線形空間TVからV^{\prime}への線形写像とする。Vの基底(\boldsymbol{e}_1,\dots,\boldsymbol{e}_n;\varphi)V^{\prime}の基底(\boldsymbol{e}^{\prime}_1,\dots,\boldsymbol{e}^{\prime}_n;\varphi^{\prime})をとる。このとき\varphi^{\prime}\circ T\circ \varphi^{-1}K^nからK^mへの線形写像なので、ある(m,n)型行列Aによって、

\varphi^{\prime}\circ T\circ \varphi^{-1}=T_A \tag{2}

と書ける。行列Aを基底(\boldsymbol{e}_1,\dots,\boldsymbol{e}_n;\varphi)(\boldsymbol{e}^{\prime}_1,\dots,\boldsymbol{e}^{\prime}_n;\varphi^{\prime})に関するTの行列という。

基底に関する線形写像の行列を具体的に求める方法を述べる。上記で用いた記号の下で述べる。Vの基底をTによって写して、写されたベクトル空間の基底を使って線型結合で表した係数を見ることで求めることができる。

A=(a_{ij})とおく。式(2)より\varphi^{\prime}\circ T=T_A\circ\varphiで、T\boldsymbol{e}_j=x_{j1}\boldsymbol{e}_1^{\prime}+x_{j2}\boldsymbol{e}_2^{\prime}+\dots+x_{jm}\boldsymbol{e}_m^{\prime}とおくと、


\begin{pmatrix} x_{i1} \\ \vdots \\ x_{in} \end{pmatrix} = \varphi^{\prime} (T\boldsymbol{e}_j) = T_A\varphi (\boldsymbol{e}_j)=
\begin{pmatrix}
            a_{11} & \dots & a_{1n} \\
            \vdots & & \vdots \\
            a_{m1} & \dots & a_{mn} 
\end{pmatrix}\begin{pmatrix} 0 \\ \vdots \\1 \\ \vdots \\ 0 \end{pmatrix}
=\begin{pmatrix} a_{1j} \\ \vdots \\a_{ij} \\ \vdots \\ a_{mj} \end{pmatrix}

従って

T\boldsymbol{e}_j=a_{1j}\boldsymbol{e}_1^{\prime}+a_{2j}\boldsymbol{e}_2^{\prime}+\dots+a_{mj}\boldsymbol{e}_m^{\prime} \ \ (j=1,\dots,m)

この式により、Tの行列の成分を求めることができる(基底を実際に線形写像で写して、値域のベクトル空間の基底で具体的に線型結合で表して、その係数を行列の成分として並べればよい)。

4. 線形写像の行列による表現と基底の変換
3節において、ベクトル空間の線形写像を行列で表現することを考えた。本節では、ベクトル空間の基底を変えた場合に、その線形写像の行列による表現はどう変わるかを見る。

V, V^{\prime}をそれぞれn次元、m次元のベクトル空間とする。TVからV^{\prime}への線形写像とする。(\boldsymbol{e}_1,\dots,\boldsymbol{e}_n;\varphi)(\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_n^{\prime};\varphi^{\prime})をそれぞれVV^{\prime}の基底とする。(\boldsymbol{f}_1,\dots,\boldsymbol{f}_n;\varphi)(\boldsymbol{f}_1^{\prime},\dots,\boldsymbol{f}_n^{\prime};\varphi^{\prime})をそれぞれVV^{\prime}のもう一つの基底とする。
基底(\boldsymbol{e}_1,\dots,\boldsymbol{e}_n;\varphi)(\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_n^{\prime};\varphi^{\prime})に関するTの行列をA、基底(\boldsymbol{f}_1,\dots,\boldsymbol{f}_n;\varphi)(\boldsymbol{f}_1^{\prime},\dots,\boldsymbol{f}_n^{\prime};\varphi^{\prime})に関するTの行列をBとする。即ち


\begin{split}
    \varphi^{\prime}\circ T\circ \varphi^{-1}=T_A \\
    \psi^{\prime}\circ T\circ \psi^{-1}=T_B
\end{split}

である。Vの基底(\boldsymbol{e}_1,\dots,\boldsymbol{e}_n;\varphi)(\boldsymbol{f}_1,\dots,\boldsymbol{f}_n;\varphi)に関する取り替え行列をPV^{\prime}の基底(\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_n^{\prime};\varphi^{\prime})(\boldsymbol{f}_1^{\prime},\dots,\boldsymbol{f}_n^{\prime};\varphi^{\prime})に関する取り替え行列をQとすると、

\varphi\circ\psi^{-1}=T_P, \ \ \varphi^{\prime}\circ{\psi^{\prime}}^{-1}=T_Q

である。このとき、


\begin{split}
     T_B = \psi^{\prime}\circ T\circ \psi^{-1} &= \psi^{\prime}\circ ({\varphi^{\prime}}^{-1}\circ \varphi^{\prime})\circ T\circ (\varphi^{-1}\circ \varphi)\circ \psi^{-1} \\
    &= (\psi^{\prime}\circ {\varphi^{\prime}}^{-1})\circ (\varphi^{\prime}\circ T\circ \varphi^{-1})\circ (\varphi \circ \psi^{-1}) \\
    &= T_{Q^{-1}}\circ T_A \circ T_P \\
    &= T_{Q^{-1}AP}
\end{split}

従って、

B=Q^{-1}AP\tag{3}

が得られる。

5. 線形写像と階数
3節の結果から、線形写像を行列によって表現することができた。このことから、線形写像の階数を定義することができる。線形写像の階数の概念は、その表現された行列の階数であることを後々見ていく。行列の階数に関しては、以下の記事を参照。

camelsan.hatenablog.com

V, V^{\prime}をベクトル空間とし、TVからV^{\prime}への線形写像とする、T(V)の基底を、\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_r^{\prime}とする。これを拡大したV^{\prime}の基底を\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_m^{\prime}とする。\boldsymbol{e}_i^{\prime}\in T(V) \ \ (i=1,\dots,r)より、T\boldsymbol{e}_i=\boldsymbol{e}_i^{\prime} \ \ (i=1,\dots,r)となるVの元\boldsymbol{e}_iがある。このとき、\boldsymbol{e}_i^{\prime}が線型独立なので、次の記事の定理3.1から、\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_r^{\prime}も線型独立である。

camelsan.hatenablog.com

また、次の記事の定理2.1により、T^{-1}(\boldsymbol{0}^{\prime})の次元はn-rである。

camelsan.hatenablog.com

よってその基底を\boldsymbol{e}_{r+1},\dots,\boldsymbol{e}_nとする。このとき\boldsymbol{e}_1,\dots,\boldsymbol{e}_r,\boldsymbol{e}_{r+1},\dots,\boldsymbol{e}_nVの基底となる。実際、Vの任意の元を、\boldsymbol{x}とする。T(\boldsymbol{x})\in T(V)より、T(V)の基底は\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_r^{\prime}なので、

T(\boldsymbol{x})=c_1\boldsymbol{e}_1^{\prime}+\dots+c_r\boldsymbol{e}_r^{\prime}

と表すことができる。また、T\boldsymbol{e}_i=\boldsymbol{e}_i^{\prime} \ \ (i=1,\dots,r)となるようにとっていたので、


\begin{split}
T(\boldsymbol{x})&=c_1T(\boldsymbol{e}_1)+\dots+c_rT(\boldsymbol{e}_r) \\
&=T(c_1\boldsymbol{e}_1+\dots+c_r\boldsymbol{e}_r)
\end{split}

従って、

T(\boldsymbol{x}-c_1\boldsymbol{e}_1-\dots-c_r\boldsymbol{e}_r)=\boldsymbol{0}^{\prime}

より、

\boldsymbol{x}-c_1\boldsymbol{e}_1-\dots-c_r\boldsymbol{e}_r\in T^{-1}(\boldsymbol{0}^{\prime})

で、\boldsymbol{e}_{r+1},\dots,\boldsymbol{e}_nT^{-1}(\boldsymbol{0}^{\prime})の基底としてとっていたので、

\boldsymbol{x}-c_1\boldsymbol{e}_1-\dots-c_r\boldsymbol{e}_r=c_{r+1}\boldsymbol{e}_{r+1}+\dots+c_n\boldsymbol{e}_n

とかける。よって、

\boldsymbol{x}=c_1\boldsymbol{e}_1+\dots+c_r\boldsymbol{e}_r+c_{r+1}\boldsymbol{e}_{r+1}+\dots+c_n\boldsymbol{e}_n

よりVの任意の元は、\boldsymbol{e}_1,\boldsymbol{e}_2,\dots,\boldsymbol{e}_nの線型結合で書くことができる。つぎに線型独立性を示す。線形関係

c_1\boldsymbol{e}_1+c_2\boldsymbol{e}_2+\dots+c_n\boldsymbol{e}_n=\boldsymbol{0}\tag{3}

があったとすると、両辺をTで写すことにより(T\boldsymbol{e}_i=\boldsymbol{e}_i^{\prime} \ \ (i=1,\dots,r)\boldsymbol{e}_j\in T^{-1}(\boldsymbol{0}^{\prime}) \ \ (j=r+1,\dots,n)を使う)

c_1\boldsymbol{e}_1^{\prime}+c_2\boldsymbol{e}_2^{\prime}+\dots+c_n\boldsymbol{e}_n^{\prime}=\boldsymbol{0}^{\prime}

\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_r^{\prime}は線型独立なので、c_1=\dots=c_r=0である。式(3)に代入して、

c_{r+1}\boldsymbol{e}_{r+1}+\dots+c_n\boldsymbol{e}_n=\boldsymbol{0}

となる。\boldsymbol{e}_{r+1},\dots,\boldsymbol{e}_nも線型独立であることから、c_{r+1}=\dots=c_n=0である。よって、\boldsymbol{e}_1,\dots,\boldsymbol{e}_nは線型独立である。以上より、\boldsymbol{e}_1,\dots,\boldsymbol{e}_nVの基底となる。

線形写像Tの、基底\boldsymbol{e}_1,\dots,\boldsymbol{e}_n\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_m^{\prime}に関する行列Aは、


\begin{split}
T\boldsymbol{e}_j&=\boldsymbol{e}_j^{\prime} \ \ (j=1,\dots,r) \\
T\boldsymbol{e}_i&=\boldsymbol{0}^{\prime} \ \ (i=r+1,\dots,n)
\end{split}

であるから、

A=
\begin{pmatrix}
E_r & 0 \\
0 & 0
\end{pmatrix}
=F_r (m,n)

である。以上の議論から次の定理が証明された。

定理5.1
ベクトル空間VからV^{\prime}への任意の線形写像Tに対して、V, V^{\prime}の基底\boldsymbol{e}_1,\dots,\boldsymbol{e}_n\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_m^{\prime}を適切に選べば、\boldsymbol{e}_1,\dots,\boldsymbol{e}_n\boldsymbol{e}_1^{\prime},\dots,\boldsymbol{e}_m^{\prime}に関するTの行列は、標準形

F_r (m,n)=
\begin{pmatrix}
E_r & 0 \\
0 & 0
\end{pmatrix}

となる。

定理5.1は、線形写像の階数と行列の階数の関係を述べるためにカギとなる。

ここで、線形写像の階数を次のように定義する。

定義5.2
Tがベクトル空間VからV^{\prime}への線形写像であるとき、像空間T(V)の次元をTの階数という。

次の定理が成り立つ。

定理5.3
Tがベクトル空間VからV^{\prime}への線形写像であるとき、Tの階数は、VV^{\prime}の任意の基底に関してTを行列で表現したときの、行列の階数に等しい。
証明:定理5.1からTの行列による表現が標準形になる基底が存在する。このとき、定理5.1の中の議論から、像空間の次元と行列の階数は等しい。また、その他の基底の取り方に関しては、4節の式(3)による関係があり、その行列による表現は互いに基本行列で写り合うことができるので、階数は変わらない。従って、任意の基底の取り方についてTの像空間の次元と、Tを表現した行列の階数は等しい。

6. 参考文献
[1] 線型代数入門

線型代数入門 (基礎数学) [ 斎藤正彦 ]

価格:2,090円
(2021/12/6 21:07時点)
感想(2件)