ベイジアン研究所

技術(人工知能、数学等)と心理の話をしています。

【線形代数学入門】二次形式

1. 記事の目的
本記事では、二次形式について述べる。二次形式の零点全体は、放物線などの図形である。二次形式を用いることで、放物線などの二次曲線の分類を代数的(文字式の変形によって)に行うことができる。二次形式には標準形と呼ばれる形がある。この際に対称変換の理論が必要になる。対象変換については下記の記事を参照。

camelsan.hatenablog.com

2. 多項式
まず、1変数の多項式を定義する。
一つの文字xと、\mathbb{R}の元a_0, a_1, \dots, a_nから作られる式


\displaystyle\sum_{i=0}^n a_ix^i = a_0+a_1x+\dots+a_nx^n
\tag{1}

を文字x\mathbb{R}-係数多項式という。n多項式(1)の次数という。

次に多変数の多項式を定義する。最初に単項式を定義する。
n個の文字x_1,x_2,\dots,x_n\mathbb{R}の元aから作られる式


ax_1^{p_1}x_2^{p_2}\dots x_n^{p_n} \ \ (p_i\ge 0)
\tag{2}

n変数x_1,x_2,\dots,x_nの単項式という。p=p_1+p_2+\dots+p_nを単項式(2)の総次数という。個々のp_iは単項式(2)のx_iに関する次数と呼ばれる。

いくつかの単項式を記号+で結んだ式


\displaystyle\sum_{(p_1,p_2,\dots,p_n)} a_{p_1,p_2,\dots,p_n} x_1^{p_1}x_2^{p_2}\dots x_n^{p_n}
\tag{3}

n変数x_1,x_2,\dots,x_n多項式という。多項式(3)に含まれる0でない係数を持つ単項式の総次数の最大のものを、多項式(3)の総次数という。

多項式の核単項式の総次数がすべて等しいとき、その多項式を、斉次多項式という。このとき各探鉱しの総次数がnのとき、n次の斉次多項式と呼ぶこととする。

3. 二次形式
n個の変数x_1,x_2,\dots,x_nに関する実変数の2次の斉次多項式を、二次形式という。即ち


F(x_1,x_2,\dots,x_n)=\displaystyle\sum_{i,j=1}^n a_{ij} x_ix_j

である。ここで、a_{ii}は[tex:x_i2]の係数であるから一意的に決まる。しかし、x_ix_j=x_jx_iより、a_{ij} \ \ (i\neq j)は一意に定まらない( x_ix_jの係数は(a_{ij}+a_{ji})となり、和の分け方の不確定性によりa_{ij}は一意に決定できない )。今後、

a_{ij}=a_{ji}

という条件をつける(これによりx_ix_jの係数は2a_{ij}となり、a_{ij}が一意に定まる)。

3.1
n=3のとき


\begin{split}
F(x_1,x_2,x_3)&=\displaystyle\sum_{i,j=1}^3 a_{ij}x_ix_j \\
&=a_{11}x_1^2+a_{22}x_2^2+a_{33}x_3^2+2a_{12}x_1x_2+2a_{13}x_1x_3+2a_{23}x_2x_3
\end{split}

二次形式の係数から作られる行列A=(a_{ij})を二次形式Fの行列という。a_{ij}=a_{ji}よりA^t=AなのでAは実対称行列である。


\boldsymbol{x}=
\begin{pmatrix}
x_1 \\ x_2 \\ \vdots \\ x_n
\end{pmatrix}

とすれば


F(x_1,x_2,\dots,x_n)=F(\boldsymbol{x})=^t\boldsymbol{x}A\boldsymbol{x}

と表される。これを、対称行列Aによって定まる二次形式という意味で、


A[\boldsymbol{x}]=^t\boldsymbol{x}A\boldsymbol{x}

と表す。

3.2
n=3のとき、


A=
\begin{pmatrix}
a_{11} & a_{12} & a_{13} \\
a_{12} & a_{22} & a_{23} \\
a_{13} & a_{23} & a_{33}
\end{pmatrix}, \ \ 
\boldsymbol{x}=
\begin{pmatrix}
x_1 \\ x_2 \\ x_3
\end{pmatrix}

とすると


\begin{split}
A[\boldsymbol{x}]&=
\begin{pmatrix}
x_1 & x_2 & x_3
\end{pmatrix}
\begin{pmatrix}
a_{11} & a_{12} & a_{13} \\
a_{12} & a_{22} & a_{23} \\
a_{13} & a_{23} & a_{33}
\end{pmatrix}
\begin{pmatrix}
x_1 \\ x_2 \\ x_3
\end{pmatrix} \\
&=\begin{pmatrix}
x_1 & x_2 & x_3
\end{pmatrix}
\begin{pmatrix}
a_{11}x_1+a_{12}x_2+a_{13}x_3 \\ a_{12}x_1+a_{22}x_2+a_{23}x_3 \\ a_{13}x_1+a_{23}x_2+a_{33}x_3
\end{pmatrix} \\
&=a_{11}x_1^2+a_{12}x_1x_2+a_{13}x_1x_3 \\
&+a_{12}x_1x_2+a_{22}x_1^2+a_{23}x_2x_3 \\
&+a_{13}x_1x_3+a_{23}x_1x_3+a_{33}x_3^2 \\
&=a_{11}x_1^2+a_{22}x_2^2+a_{33}x_3^2+2a_{12}x_1x_2+2a_{13}x_1x_3+2a_{23}x_2x_3
\end{split}

これは、例3.1のF(x_1,x_2,x_3)と一致する。

4. 二次形式の標準形
二つの変数ベクトル


\boldsymbol{x}=
\begin{pmatrix}
x_1 \\ x_2 \\ \vdots \\ x_n 
\end{pmatrix}, \ \ 
\boldsymbol{y}=
\begin{pmatrix}
y_1 \\ y_2 \\ \vdots \\ y_n 
\end{pmatrix}

正則行列Pによって、

\boldsymbol{x}=P\boldsymbol{y}

なる関係で呼ばれているとする。

G(\boldsymbol{y})=F[\boldsymbol{x}]

とおくとG(\boldsymbol{y})\boldsymbol{y}の二次形式である。実際、


\begin{split}
G(\boldsymbol{y})&=F[\boldsymbol{x}] \\
&=^t\boldsymbol{x}A\boldsymbol{x} \\
&=^t(P\boldsymbol{y})A(P\boldsymbol{y}) \\
&=^t\boldsymbol{y}(^tPAP)\boldsymbol{y} \\
&=^tPAP[\boldsymbol{y}]
\end{split}

即ち、G(\boldsymbol{y})は対称行列^tPAPによって定まる二次形式である。

二次形式F(\boldsymbol{x})が与えられたとき、適当な変数ベクトル\boldsymbol{y}=P\boldsymbol{x} ( P正則行列 )を見つけて、G(\boldsymbol{y})をなるべく簡単な二次形式にすることを考える。

特に、Pが直交行列ならば、^tP=P^{-1}なので、次の定理が成り立つ。
定理4.1
二次形式F(\boldsymbol{x})=A[\boldsymbol{x}]に対し、適当な直交行列Pをとって、\boldsymbol{x}=P\boldsymbol{y}とすれば、

F(\boldsymbol{x})=G(\boldsymbol{y})=\alpha_1y_1^2+\alpha_2y_2^2+\dots+\alpha_ny_n^2\tag{5}

となる。但し、\alpha_1,\alpha_2,\dots,\alpha_nは、Aの(重複をこめた)固有値である。
証明:下記の記事の定理2.3より、Aは対称行列なので、P^{-1}APが対角行列で、しかもその対角成分がA固有値\alpha_1,\alpha_2,\dots,\alpha_nであるものが存在する。

camelsan.hatenablog.com

よって、


\begin{split}
F(\boldsymbol{x})&=G(\boldsymbol{x})=^t\boldsymbol{y}(P^{-1}AP)\boldsymbol{y} \\
&=\alpha_1y_1^2+\alpha_2y_2^2+\dots+\alpha_ny_n^2
\end{split}

である。

定理4.1で、


\begin{split}
\alpha_1,\alpha_2,\dots,\alpha_p > 0, \alpha_{p+1}, \alpha_{p+2},\dots, \alpha_{p+q} < 0 \\
\alpha_{p+q+1}=\alpha_{p+q+2}=\dots=\alpha_n=0
\end{split}

となるように調整し、


y_i=\frac{1}{\sqrt{\alpha_i}}z_i \ \ (1\le i\le p), \ \ y_j=\frac{1}{\sqrt{\alpha_j}}z_j \ \ (p+1\le j\le p+q)

により変数変換を行うと、


\begin{split}
F(\boldsymbol{x})&=G(\boldsymbol{y})=H(\boldsymbol{z}) \\
&=z_1^2+z_2^2+\dots+z_p^2-z_{p+1}^2-\dots-z_{p+q}^2
\end{split}

となる。これを二次形式F(\boldsymbol{x})の標準形という。

このとき次の標準形の一意性が成り立つ。
定理4.2 (シルヴェスタの慣性法則)
二次形式の標準形は一意に定まる。即ち、変数にどんな正則線型変換を施して標準形に写しても、正負の数p,qは一定である。
証明:2通りの変数変換

\boldsymbol{x}=P\boldsymbol{y}, \ \ \boldsymbol{x}=Q\boldsymbol{z}

によって、2通りの標準形


\begin{split}
F(\boldsymbol{x})&=G(\boldsymbol{y})=y_1^2+y_2^2+\dots+y_p^2-y_{p+1}^2-\dots-y_{p+q}^2 \\
&=H(\boldsymbol{z})=z_1^2+z_2^2+\dots+z_s^2-z_{s+1}^2-\dots-z_{s+t}^2
\end{split}

を得たとする。このとき、p+q=s+t=r(A) ( A の階数) である。
p > sと仮定する。x_1,x_2,\dots,x_nに関する連立方程式


\begin{split}
y_i &= 0 \ \ (i=p+1,p+2,\dots, n) \\
z_j&=0 \ \ (j=1,2,\dots,s)
\end{split}

は自明でない解a_1,a_2,\dots,a_nを持つ。実際、方程式の個数はn-P+sであり、p-s>0より、変数の数nより小さいため、下記の記事の定理7.1より成り立つ。

camelsan.hatenablog.com


P^{-1}=
\begin{pmatrix}a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix}=\begin{pmatrix}b_1 \\ b_2 \\ \vdots \\ b_p \\ 0 \\ \vdots \\ 0 \end{pmatrix}, \ \ 
Q^{-1}
\begin{pmatrix}a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix}=\begin{pmatrix}0  \\ \vdots \\ 0 \\ c_{s+1} \\ \vdots \\ c_n \end{pmatrix}

の形なので、

F(\boldsymbol{a})=b_1^2+b_2^2+\dots+b_p^2=-c_{s+1}^2-c_{s+2}^2-\dots-c_n^2

である。左辺は\geで、右辺は\leなので、両辺は0でなければならない。よって、

b_1=b_2=\dots=b_p=0

となり、a_1,a_2\dots,a_nが自明でない解であることに反する。従ってp\le sである。psを入れ替えて、p\ge sも言えるので、p=sである。

一意に決まるp,qの組(p,q)を二次形式F(\boldsymbol{x})=A[\boldsymbol{x}]の符号という。pは実対称行列Aの正の固有値の数、qは負の固有値の数である。

二次形式が正値(半正値)であることを定義する。
定義
\boldsymbol{x}でない任意のベクトル\boldsymbol{x}に対して、F(\boldsymbol{x})>0 (またはF(\boldsymbol{x})\ge0 )が成立するとき、二次形式F(\boldsymbol{x})は正値(または半正値)であるという。

F(\boldsymbol{x})=^t\boldsymbol{x}A\boldsymbol{x}=(A\boldsymbol{x},\boldsymbol{x})であるから、下記の記事の定理4.1より、二次形式が正値(または半正値)であることと、実対称行列Aが正値(または半正値)であることは同値である。さらに、p=n \ \ (q=0)が成り立つことと同値である。

camelsan.hatenablog.com

二次形式の正値性を小行列式によって判定することができる。


A=
\begin{pmatrix}
a_{11} & a_{12} & \dots & a_{1n} \\
a_{21} & a_{22} & \dots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \dots & a_{nn} 
\end{pmatrix}

に対し、


A=
\begin{pmatrix}
a_{11} & a_{12} & \dots & a_{1k} \\
a_{21} & a_{22} & \dots & a_{2k} \\
\vdots & \vdots & & \vdots \\
a_{k1} & a_{k2} & \dots & a_{kk} 
\end{pmatrix}

とおく( k=1,2,\dots,n )。

定理4.3
二次形式A[\boldsymbol{x}]が正値であるためには、|A_k| > 0 \ \ (k=1,2,\dots,n)が成り立つことが必要かつ十分な条件である。
証明:A[\boldsymbol{x}]が正値ならば、


\begin{split}
&\begin{pmatrix}
^t\boldsymbol{x}_k & ^t\boldsymbol{x}_{n-k}
\end{pmatrix}
\begin{pmatrix}
A_k & B \\
\boldsymbol{c} & A_{n-k}
\end{pmatrix}
\begin{pmatrix}
\boldsymbol{x}_k \\ \boldsymbol{x}_{n-k}
\end{pmatrix} \\
&=
\begin{pmatrix}
^t\boldsymbol{x}_kA_k+^t\boldsymbol{x}_{n-k}\boldsymbol{c} & ^t\boldsymbol{x}_kB+^t\boldsymbol{x}_{n-k}A_{n-k}
\end{pmatrix}
\begin{pmatrix}
\boldsymbol{x}_k \\ \boldsymbol{x}_{n-k}
\end{pmatrix} \\
&=^t\boldsymbol{x}_kA_k\boldsymbol{x}_k+^t\boldsymbol{x}_{n-k}\boldsymbol{c}\boldsymbol{x}_k+^t\boldsymbol{x}_kB\boldsymbol{x}_{n-k}+^t\boldsymbol{x}_{n-k}A_{n-k}\boldsymbol{x}_{n-k}
\end{split}

より、


\boldsymbol{x}=
\begin{pmatrix}
x_1 \\ \vdots \\ x_k \\ 0 \\ \vdots \\ 0
\end{pmatrix}, \ \ 
\boldsymbol{x}_k=
\begin{pmatrix}
x_1 \\ \vdots \\ x_k
\end{pmatrix}
\neq 0

として、0 \lt ^t\boldsymbol{x}A\boldsymbol{x}=^t\boldsymbol{x}_kA_k\boldsymbol{x}_kとなるので、A_kも正値である。
よって、ある直交行列P_kがあって、

P_k^{-1}A_kP_k=
\begin{pmatrix}
\alpha_1 & & \\
& \ddots & \\
& & \alpha_k
\end{pmatrix} \ \ (\alpha_1,\dots,\alpha_k > 0)

となる。よって、

|A_k|=|P_k^{-1}A_kP|=\alpha_1\dots\alpha_k > 0 \ \ (k=1,\dots,n)

である。
逆をnに関する数学的帰納法によって証明する。n=1のとき、x\neq 0に対し、

F(x)=ax^2

より、F(x) > 0であるためにはa>0であることが必要十分条件なので、0\lt |A_1|=aより成り立つ。n=1のとき成り立つと仮定すれば、A_{n-1}[\boldsymbol{x}]は正値である。


A=
\begin{pmatrix}
A_{n-1} & \boldsymbol{b} \\
^t\boldsymbol{b} & c
\end{pmatrix}

と区分けしておく(行列の区分けは下記の記事を参照)。

camelsan.hatenablog.com


P=
\begin{pmatrix}
E_{n-1} & A_{n-1}^{-1}\boldsymbol{b} \\
^t\boldsymbol{0} & 1
\end{pmatrix}

とおくと、[tex:^tA{n-1}=A{n-1}]を用いて、


\begin{split}
^tP
\begin{pmatrix}
A_{n-1} & \boldsymbol{0} \\
^t\boldsymbol{0} & c-A_{n-1}^{-1}[\boldsymbol{b}]
\end{pmatrix}
P&=
\begin{pmatrix}
E_{n-1} & \boldsymbol{0} \\
^t\boldsymbol{b}A_{n-1}^{-1} & 1
\end{pmatrix}
\begin{pmatrix}
E_{n-1} & \boldsymbol{0} \\
^t\boldsymbol{0} & c-A_{n-1}^{-1}[\boldsymbol{b}]
\end{pmatrix}
\begin{pmatrix}
E_{n-1} & A_{n-1}^{-1}\boldsymbol{b} \\
^t\boldsymbol{0} & 1
\end{pmatrix} \\
&=
\begin{pmatrix}
A_{n-1} & \boldsymbol{0} \\
^t\boldsymbol{b} & c-^t\boldsymbol{b}A_{n-1}^{-1}\boldsymbol{b}
\end{pmatrix}
\begin{pmatrix}
E_{n-1} & A_{n-1}^{-1}\boldsymbol{b} \\
^t\boldsymbol{0} & 1
\end{pmatrix} \\
&=
\begin{pmatrix}
A_{n-1} & \boldsymbol{b} \\
^t\boldsymbol{b} & c
\end{pmatrix}
\end{split}
\tag{6}

となる。定理4.1から、Pによる変数変換の前後で、二次形式の正値性は変化しないので、


B=
\begin{pmatrix}
A_{n-1} & \boldsymbol{0} \\
^t\boldsymbol{0} & c-A_{n-1}^{-1}[\boldsymbol{b}]
\end{pmatrix}

が正値であることを言えばよい。式(6)の両辺の行列式をとると、区分けと行列式の定理と、直交行列の行列式は常に1、即ち|^tP|=|P|=1より、

|A|=|A_{n-1}|\cdot (c-A_{n-1}^{-1}[\boldsymbol{b}])

仮定より、|A|>0, \ \ |A_{n-1}|>0であるから、d=c-A_{n-1}^{-1}[\boldsymbol{b}] > 0 である。\boldsymbol{0}でないn項列ベクトル\boldsymbol{x}

\boldsymbol{x}=
\begin{pmatrix}
\boldsymbol{x}^{\prime} \\ x_n
\end{pmatrix}

と区分けすれば


\begin{split}
B[\boldsymbol{x}]
&=
\begin{pmatrix}
^t\boldsymbol{x}^{\prime} & x_n
\end{pmatrix}
\begin{pmatrix}
A_{n-1} & \boldsymbol{0} \\
^t\boldsymbol{0} & d
\end{pmatrix}
\begin{pmatrix}
\boldsymbol{x}^{\prime} \\ x_n
\end{pmatrix} \\ 
&=
\begin{pmatrix}
^t\boldsymbol{x}^{\prime}A_{n-1} & dx_n
\end{pmatrix}
\begin{pmatrix}
\boldsymbol{x}^{\prime} \\ x_n
\end{pmatrix} \\
&=^t\boldsymbol{x}^{\prime}A_{n-1}\boldsymbol{x}^{\prime}+dx_n^2 > 0
\end{split}

即ちBは正値である。

\boldsymbol{0}でない任意のベクトル\boldsymbol{x}に対して、F(\boldsymbol{x})\lt 0 (または  F ( \boldsymbol{x} ) \ge 0 )となるような二次形式は負値(または半負値)であると言われる。A[\boldsymbol{x}]が負値であるのは、丁度(-A)[\boldsymbol{x}]が正値のときなので、定理4.3から、から次の定理が得られる。

定理4.4
二次形式A[\boldsymbol{x}]が負値であるためには、(-1)^k|A|_k>0 \ \ (k=1,2,\dots,n)が成り立つことが必要かつ十分な条件である。

5. 参考文献
[1] 線型代数入門

線型代数入門 (基礎数学) [ 斎藤正彦 ]

価格:2,090円
(2021/12/6 21:07時点)
感想(2件)