\chapter{検定}

\section{検定の基礎事項}
\subsection{検定とは}
 部分的な情報から、正確には知られていない母集団に関して
2つのうちどちらの行動を選ぶか、という決定理論の1つの応用として
仮説の検定というものがある。
いま母数(パラメータ)空間を$\Phi$ 、その部分集合を$\phi$ とし、
未知の母数を$\theta$ とする。母数に関する{\bf 統計的仮説}$H$ は
母数$\theta$ が母数空間の特定の部分集合$\phi$ に含まれていること、
即ち$\theta \in \phi$ で表現される。

\begin{description}
 \item{{\bf 検定に関する定義 1}~~}
  統計的仮説 $H:~\theta \in \phi$ において、集合$\Phi$ がただ一つの
 要素から成るときこの仮説を{\bf 単純仮説}、また$\Phi$ が二つまたは
 それ以上の要素を持つときこの仮説を{\bf 複合仮説}という。
\end{description}

検定において、母数空間$\Phi$ は二つの部分集合$\phi_0,\phi_1$ に分割され
る。この部分集合に対応し仮説検定では、
命題$\theta \in \phi_0$ を{\bf 検定仮説}、$\theta \in \phi_1$ を
{\bf 対立仮説}という。前者を$H_0$、後者を$H_1$ で示す。
一般に$H_0:\theta \in \phi_0$ は現状の不変あるいは無差別を意味する命題の
場合が多い。
%$\theta$ が部分集合$\phi_0$ に属すると決定することを意味し、
%$a_1$ は$\theta$ が$\phi_1$ に属すると判断することを意味する。
なお、検定仮説$H_0$ を選ぶことを検定仮説を{\bf 採択}する
といい、対立仮説を取ることを検定仮説を{\bf 棄却}するという。
仮説検定では、検定仮説$H_0$ と対立仮説$H_1$ のいずれかを正しいと決定
しなければならない。なお、対立仮説を想定しない検定仮説は存在しない。

\vspace{5mm}
さて、仮説の採否を決定するためには、母集団に関する情報収集(データの観察)を
行わなければならない。この観察データは確率標本を構成する。いま母集団
$f(x;\theta)$ より求められた大きさ$n$ の確率標本を
$\{X_1,X_2,\cdots,X_n\}$ とし、行動(仮説の採否)を決める決定関数を   \\
\begin{equation}
   a=d(X_1,X_2,\cdots,X_n)
\end{equation}
とする。
行動$a=\{a: a=a_0,a_1\}$ に対応して標本空間$S$ も同様に
二つの部分集合$S_0,S_1(=S-S_0)$ に分割される。標本点$s=(x_1,x_2,
\cdots,x_n)$ が集合$S_0$ に属するとき、
\[ d(x_1,x_2,\cdots,x_n)=a_0    \]とし、
検定仮説$H_0$ を採択する。また標本点$s$ が集合$S_1$ に属するとき
\[  d(x_1,x_2,\cdots,x_n)=a_1    \]とし、
仮説$H_0$ を棄却する。部分集合$S_0$ を仮説の{\bf 採択域}、
$S_1$ をその{\bf 棄却域}という。

\vspace{5mm}
行動の決定は標本観察値、すなわち標本点によって直接
行うのではなく、その標本点が定める特定の統計量$T$ によることが多い。
例えば母平均$\mu$ に関する検定を標本平均値$\bar{X}$ によって
行うなどである。このとき決定関数は
\begin{equation}
 a=d(T)~~~~T=T(X_1,X_2,\cdots,X_n)
\end{equation}
で与えられる。このときの統計量$T$ を{\bf 検定統計量}という。
各標本点$s$ はそれぞれ対応する$T$ の値を有するから、標本空間内の
採択域と棄却域に対応して検定統計量も仮説$H_0$ を採択する領域と
棄却する領域とに分かれる。これらの領域に対しても同様に採択域、
棄却域の名称が用いられる。 

\subsection{検定で注意すべき点}
以上の行動は未知の母数に関する不完全な情報に基づいているのであるから、
これらの行動には常に損失の危険が伴っている。真の状態、即ち母数が
$\theta$ のとき、行動$a$ を取ることによって生ずる損失は、損失関数
$l(a;\theta) \geq 0$ で与えられる。そして
\begin{eqnarray}
  H_0 が真ならば(即ち\theta \in \omega_0 ならば)~~~l(a_0;\theta)&=&0 \nonumber \\
  H_1 が真ならば(即ち\theta \in \omega_1 ならば)~~~l(a_1;\theta)&=&0 \label{71.3} 
\end{eqnarray}
である。これらのとき行動$a_0,a_1$ はいずれも正しかったことになる。決定
$d$ に伴う危険は危険(関数)の定義により次式で定められる。
\begin{equation}
  R(d;\theta)=l(a_0;\theta)P(s \in S_0 | \theta)
         +l(a_1;\theta)P(s \in S_1 | \theta)  \label{71.4}
\end{equation}
ただし$P(s \in S_0|\theta)$ は母数が$\theta$ のとき標本点$s$ が標本空間
の採択域$S_0$ に属する確率である。このとき行動$a_0$ (仮説$H_0$ の採択)
が取られるから、$P(s \in S_0|\theta)$ を$a_0$ の{\bf 行動確率}($H_0$ の
採択確率)という。同様にして$P(s \in S_1|\theta)$ は$a_1$ の行動確率
($H_0$ の棄却確率)である。

\vspace{5mm}
いま母数$\theta$ が集合$\phi_i$ に属するとき、行動$a_j$ に伴う損失を
$l(a_j;\theta \in \phi_i)$ で示すことにすれば、$\theta$ が$\phi_0$ 
に属するときの危険は(\ref{71.4})式により
\[ R(d;\theta \in \phi_0)=l(a_0;\theta \in \phi_0)P(s \in S_0|\theta 
\in \phi_0)+l(a_1;\theta \in \phi_0)P(s \in S_1|\theta \in \phi_0) 
\]
である。(\ref{71.3})式より$l(a_0;\theta \in \phi_0)=0$ であるから
\begin{equation}
  R(d;\theta \in \phi_0)=l(a_1;\theta \in \phi_0)
         P(s \in S_1|\theta \in \phi_0)  \label{71.5}
\end{equation}
であり、同様にして
\begin{equation}
 R(d;\theta \in \phi_1)=l(a_0;\theta \in \phi_1)
         P(s \in S_0|\theta \in \phi_1)  \label{71.6}
\end{equation}
である。(\ref{71.5})式右辺の$P(s \in S_1|\theta \in \phi_0)$ は
母数$\theta$ が集合$\phi_0$ に属し、従って行動$a_0$ を取るべきであるに
も関わらず、標本点$s$ が棄却域$S_1$ に属していたため、誤った行動を取る
確率であって、つまり検定仮説$H_0:\theta \in \phi_0$ が正しいに関わらず
、これを採択しないで棄却する誤りをおかす確率である。この誤りを検定仮説の
＜{\bf 第一種の誤り}＞という。これに対して(\ref{71.6})式の$P(s \in
S_0|\theta \in \phi_1)$ は$\theta$ が$\phi_1$ に属し、従って行動
$a_1$ を取るべきに関わらず$a_0$ を取る誤り、即ち仮説$H_0$ が誤っているの
に関わらずこれを採択する誤りをおかす確率であって、この誤りを＜{\bf 第二
種の誤り}＞という。(\ref{71.5})式、(\ref{71.6})式はそれぞれ第一種、第二
種の誤りをおかす危険の大きさを示すことになる。

\vspace{5mm}
(\ref{71.4})式と(\ref{71.5})(\ref{71.6})式とで明らかなように、
(\ref{71.4})式の中の損失関数$l(a_0;\theta),l(a_1;\theta)$ のいずれか
一つは$0$ であるから、(\ref{71.4})式は次の形で表すことができる。
\begin{equation}
 R(d;\theta)=l(\theta)\epsilon(d;\theta)  \label{71.7} 
\end{equation}
ただし$l(\theta)$ は損失関数、$\epsilon(d;\theta)$ は誤った行動をとる
確率(誤りの確率)で、(\ref{71.5})(\ref{71.6})式で明らかなように次の通り
定められる。
\begin{eqnarray}
 \theta \in \phi_0 ならば
     ~~~~l(\theta)&=&l(a_1;\theta) \nonumber \\
         \epsilon_I&=&P(s \in S_1|\theta \in \phi_0)  \nonumber \\
 \theta \in \phi_1 ならば
     ~~~~l(\theta)&=&l(a_0;\theta)  \nonumber \\
         \epsilon_{II}&=&P(s \in S_0|\theta \in \phi_1) \nonumber
\end{eqnarray}
$\epsilon_I$ は第一種の誤りの確率、$\epsilon_{II}$ は第二種の誤りの確率
である。検定理論は母数空間$\Phi$ に属するすべての値に対してこの危険
関数が最小になるような検定方式、即ち決定関数を見出すことである。しかし
一般にこの危険を最小にするような決定関数(検定方式)は母数$\theta$ の値に
よって一様ではない。そして検定仮説の場合母数$\theta$ は未知であるから、
与えられた問題の場合にこのような条件を満たす決定方式を発見することは
容易な事柄ではない。

\vspace{5mm}
もう一つ、仮説検定の困難な問題は、危険関数を定める損失関数$l$ の形が
一般に不明であるか、あるいは少なくとも正確に知られていないということ
である。もし損失関数の形が分からないとしたら、危険関数を小さくするために
(\ref{71.7}) 式のもう一つの因子である誤りの確率$\epsilon$ を小さくする
こと、従ってそのような条件を満たす決定関数を求めることは合理的である。
しかし母数$\theta$ が$\phi_0$ に属するか不明であるから、誤りの確率と
して$\epsilon_I$ と$\epsilon_{II}$ のいずれかを考えるべきかも不明である。
そしてこの二つ、即ち第一種の誤りの確率と第二種の誤りの確率とは、一方を
小さくすれば他方が大きくなるという背反的な性質を持っているから、二つの
$\epsilon$ を同時に小さくすることは不可能である。そこで伝統的な仮説
検定方式では、比較的小さな確率$\alpha$ (例えば0.01,0.05,0.10等) を第
一種の誤りの確率$\epsilon_I$ の許容限度として定め、このような条件、即ち
\begin{equation}
 \epsilon_I=P(s \in S_1|\theta \in \phi_0) \leq \alpha  \label{71.8}
\end{equation}
を満たす検定方式、即ち棄却域$S_1$ の集合を考え、このような集合の中で
第二種の誤りの確率、即ち
\begin{equation}
 \epsilon_{II}=P(s \in S_0|\theta \in \phi_1)  \label{71.9}
\end{equation}
を最小にするような検定方式、あるいはその余事象の確率
\begin{equation}
  1-\epsilon_{II}=P(s \in S_1|\theta \in \phi_1) \label{71.10}
\end{equation}
を最大にするような検定方式を求める。

\begin{description}
 \item{{\bf 検定に関する定義 2}~~}
 定められた一定の確率$\alpha$ に対して検定方式が次の条件
\begin{eqnarray}
 \phi_0 に属するすべての\theta に対して &\epsilon_I \leq \alpha& \nonumber \\
 \phi_1 に属するすべての\theta に対して &1-\epsilon_{II}& が最大 \nonumber 
\end{eqnarray}
を満たすとき、この検定方式を{\bf 最良}あるいは{\bf 最強力}であるという。
\end{description}

\vspace{5mm}
この検定方式では損失関数$l(\theta)$ は明示的には考慮されていないが、
事実は条件式(\ref{71.8}) の$\alpha$ の値の決定のときにそれが考えられてい
る。もし第一種の誤りをしたときの損失$l(a_1;\theta \in \phi_0)$ が第二
種の誤りをしたときの損失$l(a_0;\theta \in \phi_1)$ に比べて非常に重大
であれば、検定方式の危険を小さくするためにそのような誤りをおかす確率の
限度$\alpha$ をなるべく小さな値に定めておかねばならない。故にこの検定方
式は第一種の誤りが第二種の誤りに比べて特に重要であるという考え方に基づい
ているといえる。なぜならばこの場合は第一種の誤りをする確率を許容できる
最小限度に抑えておくことが第一の条件だからである。 

\begin{description}
\item{{\bf 検定に関する定義 3}~~}
条件(\ref{71.8} )式の$\alpha$ 、即ち第一種の誤りの確率の許容される限度を
{\bf 検定の水準、有意水準}あるいは{\bf 棄却域の大きさ}という。 
\end{description}

\subsection{検出力関数} \label{kenshutsu} 
 以下、統計的仮説の検定方式、即ち検定のための決定関数の求め方について
説明する。ここでは検定仮説、対立仮説がともに単純仮説の場合について
考える。この場合、検定に関する定義 2 の意味での最強力検定方式を
求めることは容易である。いま、検定仮説を$H_0:\theta=\theta_0$、
対立仮説を$H_1:\theta=\theta_1(\neq \theta_0)$ とする。
$\theta_0$、$\theta_1$ はいずれも一定値である。また第一種の誤りの確率を
$\epsilon_{I}$、第二種の誤りの確率を$\epsilon_{II}$ とする。
この場合、$\epsilon_{II}$ の大きさは$\theta_1$ 次第で変わってくるから、
$\epsilon_{II}$ は$\theta_1$ の関数である。一般にある検定について
\begin{equation}
 \pi(\theta_1)=1-\epsilon_{II}(\theta_1)
\end{equation}
を、その検定の{\bf 検出力}という。また$\pi(\theta_1)$ を$\theta_1$ の関
数とみて{\bf 検出力関数}という。

%ここで、簡単のために検定仮説$H_0$ が真の場合の標本
%$\{X_1,X_2,\cdots,X_n\}$ の確率密度($X_i$ が連続変数の場合を考える)を
%\begin{equation} 
%  L_0(x)=f(x_1,x_2,\cdots,x_n;\theta_0),
%\end{equation}
%対立仮説$H_1$ が真の場合の標本の確率密度を
%\begin{equation} 
%  L_1(x)=f(x_1,x_2,\cdots,x_n;\theta_1)
%\end{equation}
%で示すこととする。検定の水準を$\epsilon_{I}=\alpha$ に定めて、この
%有意水準に対する検定の棄却域を$A$ で示すとき、
%\begin{equation}
%  \alpha=\int \cdots \int_A f(x_1,x_2,\cdots,x_n;\theta_0)
%       dx_1 \cdots dx_n \equiv \int_A L_0(x) dx 
%\end{equation}
%である。これに対して検定の検出力は
\vspace{5mm} 
一般によい検定とは仮説$H_0:\theta=\theta_0$、$H_1:\theta=\theta_1$ に
対し、$\alpha$ が小さく、かつ$\pi(\theta_1)$ が全ての$\theta_1$ について
なるべく大きいような検定をいう。指定された$\alpha$ を有する検定方式のう
ち、全ての$\theta_1$ について他のものよりも検出力の大きいものがあるなら
ば、それは{\bf 一様最強力な検定}と呼ばれる。また$\theta=\theta_0$ に
おいて$\pi(\theta_1)$ が最小になる検定を{\bf 不偏な検定}という。

\vspace{5mm} 
ここで、最強力検定に関連して有名な{\bf ネイマン-ピアソンの定理}を挙げて
おく。
\begin{description}
 \item{{\bf ネイマン-ピアソンの定理}~~}  \label{neyman}
仮説$H_0:\theta=\theta_0$、対立仮説
$H_1:\theta=\theta_1$ が与えられたとき、$H_0$ を検定する最強力な棄却域は、
不等式
\begin{equation}
  \frac{\prod_{i=1}^n f(x_i|\theta_1)}{\prod_{i=1}^n f(x_i|\theta_0)}
   \geq c
\end{equation}
を満たす点 $x_1,x_2,\cdots,x_n$ の集合で与えられる(証明は省略)\footnote{
この定理の意味、使い方がよく分からない。分布の形を変えるのだろうか?}。
\end{description}

\vspace{5mm} 
検定仮説が複合仮説の形で与えられているとき、一様に最強力な検定方式を
見出すことは困難であるから、この場合には母数$\theta$ の全ての領域に
対して最強力な検定方式を求めるという考え方をあきらめて、別の標準で
検出力の比較的大きい検定方式を求めることを工夫しなければならない。
次に述べる尤度比検定はその一つの方法である。

\subsection{尤度比検定}  \label{yuidohi-kentei}
以下の尤度比検定の方法は、必ずしも常によい検定方式を与えるという訳では
ないが、多くの場合、特に大標本の場合はよい結果を導く方法である。
いま母集団分布を簡単のために一母数関数の密度関数$f(x;\theta)$ で定め
られるものとし、検定仮説を$H_0:\theta \in \phi_0$とする。ただし$\phi$
 は母数空間$\Phi$ の中の特定の部分集合とする。対立仮説は$H_1:\theta
 \in \phi_1$、ただし$\phi_1=\Phi-\phi_0$ である。標本の
大きさを$n$ とし、確率標本$\{X_1,X_2,\cdots,X_n\}$ によって$H_1$ に
対する$H_0$ の検定を考える\footnote{こういう言い方をするのだろうか?}。

\vspace{5mm}
まず確率標本の尤度関数は$L=\prod_{i=1}^n f(X_i;\theta)$ で与えられる。
いま母数$\theta$ の関数としての尤度関数$L$ が母数空間$\Phi$ 全体の
上でとりうる最大値を
\begin{equation}
 L(\hat{\Phi})=\prod f(X_i;\hat{\theta})
\end{equation}
と定める。このとき$\hat{\theta}$ は明らかに母数$\theta$ の最尤推定値で
ある。これに対して仮説$H_0:\theta \in \phi_0$ が真のとき、即ち部分集合
$\phi$ の範囲内で尤度関数$L$ がとりうる最大値を
\begin{equation}
 L(\hat{\phi})=\prod f(X_i;\hat{\theta}')
\end{equation}
と定める。このとき$\phi$ は$\Phi$ の部分集合であって、部分集合では
母数空間全体におけるよりも母数の範囲が制限されているから、尤度関数$L$ が
大となる機会も制限される。従っていま{\bf 尤度比}を
\begin{equation}
 \lambda=\frac{L(\hat{\phi})}{L(\hat{\Phi})}
\end{equation}
と定義すれば明らかに$\lambda \leq 1$ である。この尤度比$\lambda$ は
標本観察値のみの関数であって母数を含まないから統計量である。

\vspace{5mm}
さて尤度関数$L$ は確率標本$\{X_1,X_2,\cdots,X_n\}$ の確率密度である。
従って  \\
$\lambda=L(\hat{\phi})/L(\hat{\Phi})$ が$1$ に近いほど、
%母数$\theta$ に検定仮説$H_0:\theta \in \phi_0$ の範囲外の値を与えても、
%標本点$\{x_i\}$ の確率密度が増加する余地は少ない。いいかえると
仮説$H_0:\theta \in \phi_0$ の真実性は大で
あるといえる。逆に$\lambda$ が$0$ に近いほど仮説$H_0:\theta \in \phi_0$ 
の真実性は乏しい。従って尤度比$\lambda$ は仮説$H_0$ の検定のための
検定統計量として利用することができる。

\vspace{5mm}
いま仮説$H_0$ が真であって、そのときの尤度比$\lambda$ の確率密度
$g(\lambda | H_0)$ が知られているとする。$g(\lambda | H_0)$ は
母集団分布$f(x;\theta)$ が与えられていればそれから導くことができる
訳である。もし$g(\lambda | H_0)$ が未知の母数を含まないならば、
与えられた有意水準$\alpha$ に対して次式の定める$c$ の値を計算する
ことができる。
\begin{equation}
 \alpha=\int_0^c g(\lambda|H_0) d\lambda
\end{equation}
このとき仮説$H_0:\theta \in \phi_0$ の棄却域は$0 < \lambda < c$ で
与えられる。

\subsubsection{尤度比検定に関する定理 1}\footnote{証明はしない。意味につ
いては前の段落を参照のこと。} 
検定の有意水準を$\alpha$ とするとき、尤度比$\lambda$ による仮説$H_0$ 
の棄却域は$0 < \lambda < c$ で定められる。ただし$c$ は次式で定められる。
\[ \alpha=\int_0^c g(\lambda|H_0) d\lambda  \]
ここで$g(\lambda|H_0)$ は仮説$H_0$ を条件とする尤度比$\lambda$ の確率密度
である。

\vspace{5mm}
この定理に基づく仮説検定の方法を一般に{\bf 尤度比検定}という。
時として統計量$\lambda$ の分布よりもその関数$u(\lambda)$ の分布の方が
計算しやすい場合がある。このときは次の定理によって$U=u(\lambda)$ を
検定統計量として使用することができる。

\subsubsection{尤度比検定に関する定理 2}
$U=u(\lambda)$ が尤度比$\lambda$ の単調関数のとき、統計量$U$ に基づく
仮説検定は$\lambda$ による仮説検定と同値である。このとき$0 < \lambda <
c$ に対応する棄却域は$u(0) < U < u(c)$ で与えられる。ただし$U$ が
$\lambda$ の単調減少関数のときは$u(c) < U < u(0)$ で与えられる(証明は省
略)。
 
\vspace{5mm}
以上では簡単のために母集団分布の母数を一個と仮定したが、母集団分布が
二個以上の母数を有するときも、尤度比検定の方法は全く同一である。この
とき尤度関数は$L=\prod_{i=1}^n f(X_i;\theta_1,\theta_2,\cdots)$ で
与えられ、検定仮説は$H_0:(\theta_1,\theta_2,\cdots) \in \phi_0$ である。

\begin{description}
 \item{例 1} \label{yuidokentei-rei1}
正規母集団の分散$\sigma^2=1$ が与えられているとき、
$H_0:\mu=\mu_0$、$H_1:\mu \neq \mu_0$ の検定方式を尤度比検定の方法に
よって求めよ。 \\
$\sigma^2=1$ であるから尤度関数は
\[  L(\mu)=(\frac{1}{\sqrt{2\pi}})^n e^{-\frac{1}{2} \sum (X-\mu)^2}     \]
である。$\mu$ の最尤推定量は$\hat{\mu}=\bar{X}$ であるから母数空間
$\Phi$ での$L$ の最大値は
\[  L(\hat{\Phi})=L(\hat{\mu})
     =(\frac{1}{\sqrt{2\pi}})^n e^{-\frac{1}{2} \sum (X-\bar{X})^2}  \] 
である\footnote{$L(\hat{\Phi})$ は必ず$\phi_0$ の方にあるのだろうか?}。
次に仮説$H_0$ のもとでは$\mu=\mu_0$ は一定であって他に推定すべき
母数はこの場合存在しないから、尤度関数$L$ の値はこの$\mu=\mu_0$ を代入した
\[  L(\hat{\phi})=L(\mu_0)
     =(\frac{1}{\sqrt{2\pi}})^n e^{-\frac{1}{2} \sum (X-\mu_0)^2}         \]
以外にはない。よって尤度比は
\begin{eqnarray}
  \lambda=\frac{L(\hat{\phi})}{L(\hat{\Phi})}
        &=&\exp\left[-\frac{1}{2}
              \{\sum (X-\mu_0)^2- \sum (X-\bar{X})^2 \} \right] \nonumber \\
        &=&\exp\left[-\frac{n}{2} (\bar{X}-\mu_0)^2 \right] \nonumber
\end{eqnarray}
となる。ここで$n$、$\mu_0$ は与えられており、$\bar{X}$ の分布は正規であるから、
上の式から$g(\lambda|H_0)$ を求めることは容易ではない。ただしこの場合
$\lambda$ の対数を考えた方が処理がいっそう容易である。即ち上式から
\[  \log \lambda=-n(\bar{X}-\mu_0)^2/2        \]
を得る。$\mu=\mu_0$ のとき$\bar{X}$ は平均値$\mu_0$、分散$1/n$ の正規
分布変数であるから
\[  -2 \log \lambda=n(\bar{X}-\mu_0)^2        \]
は自由度$1$ のカイ二乗変数である。いま
\[  Y=-2 \log \lambda    \]
とおけば、$Y$ は$\lambda$ の単調減少関数で、$\lambda=0$ のとき$Y=\infty$
であるから、有意水準を$\alpha$ とすれば
\[  \alpha=\int_0^c g(\lambda|H_0) d\lambda
          =\int_{-2 \log c}^\infty h(y) dy            \]
ただし$h(y)$ は自由度$1$ のカイ二乗分布の密度関数である。$\alpha=0.05$
 とすればカイ二乗分布の数値表より
\[ -2 \log c=3.84    \]
を得るから検定の棄却域は
\[ n(\bar{X}-\mu_0)^2>3.84     \]
あるいは
\[  \bar{X}<\mu_0-\frac{1.96}{\sqrt{n}},
               ~~~~\bar{X}>\mu_0+\frac{1.96}{\sqrt{n}}    \]
で与えられる。このように棄却域が検定統計量$\bar{X}$ の分布の両側に
できるから、この検定方式は両側検定である。

 \item{例 2}  \label{yuidokentei-rei2} 例 1 では母分散$\sigma^2=1$ が
与えられていたが、同じく
 正規母集団で母分散が未知の場合について$H_0:\mu=\mu_0$、$H_1:\mu \neq \mu_0$ 
 の検定方式を求めよ。 \\
$\mu$、$\sigma^2$ の最尤推定量は
\[  \hat{\mu}=\bar{X}~~~~~\hat{\sigma}^2=\sum (X-\bar{X})^2/n  \]
で与えられる\footnote{p.\pageref{seiki-saiyui} の例「正規分布の母数
$\mu$,$\sigma^2$ の推定」を参照のこと。}。よって
\[  L(\hat{\Phi})=L(\hat{\mu},\hat{\sigma}^2)
     =\left[\frac{1}{(2\pi /n) \sum (X-\bar{X})^2}
            \right]^{\frac{n}{2}} e^{-\frac{n}{2}}   \]
である。次に仮説$H_0:\mu=\mu_0$ のもとで尤度関数を最大にするための条件を
求める。$\mu$ は仮説で定めたので、もう一つの未知の母数$\sigma^2$ を$L$ 
を最大にするように決定すればよい。$\sigma^2$ も仮説によって規定され、
\[ \hat{\sigma}_0^2=\sum (X-\mu_0)^2/n   \]
である。よって
\[ L(\hat{\phi})=L(\mu_0,\hat{\sigma}_0^2)
   =\left[\frac{1}{(2\pi/n) \sum (X-\mu_0)^2}
       \right]^{\frac{n}{2}} e^{-\frac{n}{2}}    \]
である。従って尤度比は
\[ \lambda=\left[ \frac{\sum (X-\bar{X})^2}{\sum (X-\mu_0)^2}
            \right]^{\frac{n}{2}} \]
となる。次の問題はこの$\lambda$ の分布を求めることである。$X,\bar{X}$
 の分布はともに正規であるからこのことは可能であるが、前の例ほど簡単では
ない。まず$\lambda$ の分母は
\[ \sum (X-\mu_0)^2=\sum (X-\bar{X})^2 +n(\bar{X}-\mu_0)^2    \]
とかけるから、$\lambda$ は次のような形で示すことができる。
\[   \lambda=\left[\frac{1}{1+n(\bar{X}-\mu_0)^2} \cdot
              \frac{1}{\sum (X-\bar{X})^2} \right]^{\frac{n}{2}}
 \] 
ところで$\mu=\mu_0$ のときは
\[  t=\frac{\bar{X}-\mu_0}{s/ \sqrt{n-1}}
     =\frac{\bar{X}-\mu_0}{\sqrt{\sum (X-\bar{X})^2/n(n-1)}}       \]
は自由度$n-1$ の$t$ 分布変数であるから
\[    \lambda=\left[\frac{1}{1+t^2/(n-1)}\right]    \]
となる。$\lambda$ の分布は$t$ 分布をこの式によって変数変換して求めること
ができる。ただしこの場合、実際に分布$g(\lambda)$ の形を計算する必要は
ない。$\lambda$ は$t^2$ の単調減少関数になっているから、$\lambda$ の
棄却域に対応する$t^2$ の棄却域を定め、$t$ を検定統計量として使用すれば
問題は解決される。$\lambda=1$ のとき、$t^2=0$ で、$\lambda$ が$0$ に
近づくに従って$t^2$ は大となるから、$\lambda$ の棄却域$0 < \lambda < c$ 
に対応する$t^2$ の棄却域の形は$t^2 > A$ となる。よって任意の有意水準
$\alpha$ に対する$t$ の棄却域の限界を$\pm t_{\frac{\alpha}{2}}$ とすれば
\footnote{$t_\alpha$ を $t_n(\alpha),t_{n-1}(\frac{\alpha}{2})$ などと書く
場合もある。このとき、$t_n,t_{n-1}$ は自由度が$n$ もしくは$n-1$ の$t$ 分布であ
	    ることを示している。}、仮説
$\mu=\mu_0$ の棄却域は$t=0$ の両側で
\[   t<-t_{\frac{\alpha}{2}} ~~~~~t>t_{\frac{\alpha}{2}}       \] 
で与えられ、$t_{\frac{\alpha}{2}}$ の値は
\[  \int_{t_{\frac{\alpha}{2}}}^\infty f(t;n-1) dt=\frac{\alpha}{2}     \]
から計算される。ただし$f(t;n-1)$ は自由度$n-1$ の$t$ 分布を示す。
従って検定方式はこの場合、次のようにまとめることができる。
\[ 統計量 t=\frac{\bar{X}-\mu_0}{s/ \sqrt{n-1}} 
  (ただし s^2=\frac{\sum (X-\bar{X})^2}{n}) を計算し、-t_{\frac{\alpha}{2}}<t<t_{\frac{\alpha}{2}}  ならば   \]
  仮説$\mu=\mu_0$ を採択、その他の場合は仮説を棄却する。
\end{description}

\vspace{5mm}
この例で仮説$\mu=\mu_0$ の採択域は次の不等式で与えられている。
\[  -t_{\frac{\alpha}{2}} < \frac{\bar{X}-\mu_0}{s/ \sqrt{n-1}} < t_{\frac{\alpha}{2}}   \]
この不等式は次の形で示すことができる。
\[ \bar{X}-t_{\frac{\alpha}{2}} \frac{s}{\sqrt{n-1}} 
     < \mu_0 < \bar{X}+t_{\frac{\alpha}{2}} \frac{s}{\sqrt{n-1}}    \]
この式は信頼係数$\gamma=1-\alpha$ に対する母平均$\mu$ 
の信頼限界である。
故に尤度比検定による仮説$H_0$ の検定は結局次の方法と同値である。即ち 
母平均の信頼係数$\gamma=1-\alpha$ の信頼区間を計算し、もし仮説
$\mu=\mu_0$ がこの区間内にあれば仮説を採択し、区間内になければ仮説を
棄却する。

\vspace{5mm}
多くの場合、母数に関する仮説の採択域はこのようにその母数の信頼区間の
形で表すことができる。一般に仮説$\theta=\theta_0$ に対する有意水準
$\alpha$ の検定(採択域)は、母数$\theta$ に対する信頼係数$1-\alpha$
 の信頼区間で与えられる。

\vspace{5mm}
以上の2例では$\lambda$ の関数を媒介として$\lambda$ の分布に代わる既知の
分布が容易に見出されたが、このようなことが可能でないとき、一般には
$\lambda$ の分布は複雑で、従って$\lambda$ を検定量とするときの棄却域
$\lambda > c$ の計算は必ずしも容易ではない。このような場合、次の定理は
特に有用である。
\subsubsection{尤度比検定についての定理 3}
極めて一般的な条件のもとで統計量$-2 \log \lambda$ の分布は、検定仮説
$H_0$ が真であれば、標本の大きさ$n$ が大であるとき、カイ二乗分布で
近似され、その自由度は仮説$H_0$ に含まれる未知の母数の数に等しい。

\vspace{5mm}
例2 では$-2 \log \lambda=n(\bar{X}-\mu_0)^2$ はまさしく自由度$1$ の
カイ二乗変数であるから、この例は$-2 \log \lambda$ が正確にカイ二乗
変数で与えられている特別の例である。この例の場合と同様に$Y=-2 \log
\lambda$ は$\lambda$ の減少関数であるから、$Y$ の棄却域はカイ二乗
分布の右側で定められる。従って大標本の場合に有意水準$\alpha$ で尤度
比検定を行うためには$Y=-2 \log \lambda$ の棄却域$Y>A$ をカイ二乗分布の
右側で$\alpha=P(Y>A)$ となるように定めればよい。
 
\begin{description}
\item{例3} \label{yuidokentei-rei3} 平均値の差の検定 \\
二つの正規母集団$X,Y$ で分散は未知であるが同一であることが
知られている。仮説 $H_0:\mu_x-\mu_y=0$、$H_1:\mu_x-\mu_y \neq 0$
の検定方式を求めよ。 

今、母集団$X$ からの標本の大きさを$m$ 、その標本平均値を
$\bar{X}$ 、$Y$ からの標本の大きさを$n$ 、標本平均値を$\bar{Y}$ とし、
両母集団に共通の母分散を$\sigma^2$ とする。母集団$X$ からの標本を
$\{X_1,X_2,\cdots,X_m\}$ 、母集団$Y$ からの標本を
$\{Y_1,Y_2,\cdots,Y_n\}$ とすれば、このとき標本の尤度関数は
\begin{equation}  L=\left(\frac{1}{2 \pi \sigma^2}\right)^{\frac{m+n}{2}} 
      e^{-\frac{1}{2\sigma^2}\left[\sum^m (X-\mu_x)^2+\sum^n 
        (Y-\mu_y)^2\right]}   \label{sa-yuido}
\end{equation}
である。これはp.\pageref{eq-yuido-seiki} の(\ref{eq-yuido-seiki})式から
$x$ についての式と$y$ についての式をかけ合わせることで得られる。
次に平均値$\mu_x、\mu_y$ および分散$\sigma^2$ の最尤推定値についても
p.\pageref{eq-yuido-seiki} の例のように
ログをとって、
\[  \frac{\partial}{\partial \mu_x} \log L=0,~~
    \frac{\partial}{\partial \mu_y} \log L=0,~~
    \frac{\partial}{\partial \sigma^2} \log L=0  \]
を解くことで以下のように得られる。
\[  \hat{\mu_x}=\bar{X},~~~~\hat{\mu_y}=\bar{Y}   \]
\[  \hat{\sigma}^2=\frac{1}{m+n} \left[\sum^m (X-\bar{X})^2
    +\sum^n (Y-\bar{Y})^2  \right]   \]
従って
\[  L(\hat{\Phi})=\left[ \frac{m+n}{2\pi \left[ \sum(X-\bar{X})^2
   + \sum(Y-\bar{Y})^2 \right]} \right]^{\frac{m+n}{2}} e^{-\frac{m+n}{2}}
\]
である。次に仮説$H_0:\mu_x=\mu_y=\mu$ が真のとき、平均値、分散の
最尤推定値は(\ref{sa-yuido})式において$\mu_x=\mu_y=\mu$ とし、 
\[  \frac{\partial}{\partial \mu} \log L=0,~~
    \frac{\partial}{\partial \sigma^2} \log L=0  \]
を解いて次のようになる。
\begin{eqnarray}
 \hat{\mu}&=&\frac{1}{m+n}(\sum^m X + \sum^n Y)
             =\frac{m\bar{X}+n\bar{Y}}{m+n}  \nonumber  \\
 \hat{\sigma}^2&=&\frac{1}{m+n}\left[\sum^m (X-\hat{\mu})^2
       + \sum^n (Y-\hat{\mu})^2\right]  \nonumber  \\
               &=&\frac{1}{m+n}\left[\sum^m (X-\bar{X})^2
                  + \sum^n (Y-\bar{Y})^2 
       + \frac{mn}{m+n}(\bar{X}-\bar{Y})^2 \right] \nonumber  
\end{eqnarray}
となる。従って、
\[  L(\hat{\phi})=\left[\frac{m+n}
   {2\pi \{\sum(X-\bar{X})^2+\sum(Y-\bar{Y})^2+\frac{mn}{m+n}
      (\bar{X}-\bar{Y})^2\}}\right]^{\frac{m+n}{2}} e^{-\frac{m+n}{2}}
\]
である。よって尤度比は次の形で与えられる。
\begin{equation}
  \lambda=\left[1+\frac{\frac{mn}{m+n}(\bar{X}-\bar{Y})^2}
      {\sum (X-\bar{X})^2 + \sum (Y-\bar{Y})^2}
       \right]^{-\frac{m+n}{2}}  \label{sa-1}
\end{equation}
この検定は$t$ 分布を使って表すことができる。その理由は以下の通りである。
まず、標本平均値
$\bar{X}、\bar{Y}$ はそれぞれ平均値$\mu_x、\mu_y$、分散$\sigma^2/m、
\sigma^2/n$ の正規分布変数で\footnote{p.\pageref{seiki-hyouhon-dis}の
「正規分布を母集団とする標本集団の性質」の「定理1」を参照のこと。}、
互いに独立であるから、その差
$\bar{X}-\bar{Y}$ は平均値$\mu_x-\mu_y$、分散
$\sigma^2(\frac{1}{m}+\frac{1}{n})$ の正規分布をする\footnote{分散につい
ては、p.\pageref{nihensu-teiri3}の「二変数分布の定理3」を参照のこと。}。
仮説$H_0$ が真ならば$\mu_x-\mu_y=0$ であるから、$\bar{X}-\bar{Y}$ の
期待値も$0$ である。次に$\sum^m (X-\bar{X})^2/ \sigma^2$、
$\sum^n (Y-\bar{Y})^2/ \sigma^2$ はそれぞれ自由度$m-1$、$n-1$ のカイ二乗
変数であるから\footnote{p.\pageref{teiri-5.11}の「母集団分布が正規分布の時、
その標本分散はカイ二乗分布をすること」の定理を参照のこと。
$\sum^m (X-\bar{X})^2/ \sigma^2$ は定理の$ns^2/\sigma^2$ にあたる。}、その和は
自由度$m+n-2$ のカイ二乗変数である。さらに仮説$H_0$ が真のとき、
\[  Z=\frac{\bar{X}-\bar{Y}}{\sigma \sqrt{\frac{1}{m}+\frac{1}{n}}}  \]
は平均値$0$、分散$1$ の正規分布をするから\footnote{p.\pageref{hyoujunseikihensuu}の(\ref{hyoujunseikihensuu})式で、$X$ を$X-Y$、$\mu$ を$\mu_x-\mu_y$、
$\sigma$ を$\sigma \sqrt{\frac{1}{m}+\frac{1}{n}}$ に置き換えて考えればよい。
}、
\begin{equation}
 t=\frac{\bar{X}-\bar{Y}}{\sigma \sqrt{\frac{1}{m}+\frac{1}{n}}}
   \left/ \sqrt{\frac{\sum (X-\bar{X})^2 + \sum (Y-\bar{Y})^2}
     {\sigma^2(m+n-2)}} \right.     \label{sa-2}
\end{equation}
は自由度$m+n-2$ の$t$分布変数である\footnote{p.\pageref{t-shoumei}の
$t$分布についての＜証明＞を参照のこと。}。(\ref{sa-1})式と(\ref{sa-2})式とから
\[  \lambda=\left[1+\frac{t^2}{m+n-2}\right]^{-\frac{m+n}{2}}  \]
を得る。よって$\lambda$ の代りに統計量$t$ を用いて仮説の検定を行なう
ことができる。即ち対立仮説$H_1:\mu_x \neq \mu_y$ に対して棄却域は
\[ t<-t_{\frac{\alpha}{2}} ~~~~t>t_{\frac{\alpha}{2}}   \]
\[ \int_{t_{\frac{\alpha}{2}}}^\infty f(t ; m+n-2)dt=\frac{\alpha}{2}    \]
で与えられる。またもし対立仮説が例えば$H_1:\mu_x<\mu_y$ (片側検定)のときは
\[ t<-t_\alpha  \]
\[ \int_{t_\alpha}^\infty f(t ; m+n-2) dt=\alpha \]
で与えられる。
\end{description}


%%% 2.2 母平均の検定 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{母平均の検定}
\subsection{正規母集団の母平均の検定の一般的手順}
正規母集団$N(\mu,\sigma^2)$ の母平均$\mu$ を検定するとき、母分散
$\sigma^2$ が既知か未知かで2通りに場合分けされるが、手順としては
共に次のようになる。
\begin{enumerate}
 \item 検定統計量$t$ を計算する。
 \item 有意水準$\alpha$ に対する$t$ の棄却域の限界値$t_\alpha$ を求める。
 \item $t$ が 棄却域に含まれるならば 仮説$\mu=\mu_0$ を採択、
       そうでないときには仮説を棄却する。
\end{enumerate}
ここで、対立仮説$H_1$の取り方により、棄却域の限界値$t_\alpha$ は変わってくる。
即ち、$H_1:\mu \neq \mu_0$({\bf 両側検定})のときには仮説$\mu=\mu_0$ の棄却域が
$t=0$ の両側で
\[  t<-t_{\frac{\alpha}{2}}, ~~~~t>t_{\frac{\alpha}{2}}      \]
で与えられ、$t_{\frac{\alpha}{2}}$ の値は
\[  \int_{t_{\frac{\alpha}{2}}}^\infty f(t;n-1)dt=\frac{\alpha}{2}         \]
から計算される。ただし$f(t;n-1)$ は自由度$n-1$ の$t$分布を示す。
これに対し$H_1:\mu<\mu_0$ もしくは$H_1:\mu>\mu_0$({\bf 片側検定})のとき
には、仮説$\mu=\mu_0$ の棄却域が$t=0$ の片側で
\[  t<-t_\alpha もしくは t>t_\alpha      \]
となり、$t_\alpha$ の値は
\[  \int_{t_\alpha}^\infty f(t;n-1)dt=\alpha         \]
から計算される。

\subsection{母分散$\sigma^2$ が既知の場合} 
このとき大きさ$n$ の標本$\{X_1,X_2,\cdots,X_n\}$ による
母平均$\mu$ の検定統計量$T(\bar{X})$ は
\[  T(\bar{X})=\frac{\bar{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}}   \]
である。この場合の検定統計量が上の様になる理由は
p.\pageref{yuidokentei-rei1}の尤度比検定の例1を参照のこと。
$T(\bar{X})$ の分布は標準正規分布$N(0,1^2)$ に従う。証明は
p.\pageref{seiki-hyouhon-dis}の定理1を参照のこと。

 \subsection{母分散$\sigma^2$ が未知の場合}
普通、母分散$\sigma^2$ は分からないことが多い。この場合、母分散
$\sigma^2$ の代りに標本分散$s^2$ を用いて検定を行う。
このとき大きさ$n$ の標本$\{X_1,X_2,\cdots,X_n\}$ による
母平均$\mu$ の検定統計量$T(\bar{X},s^2)$ は
\[  T(\bar{X},s^2)=\frac{\bar{X}-\mu_0}{\frac{s}{\sqrt{n-1}}},
    ~~ただしs^2=\frac{\sum(X-\bar{X})^2}{n}  \]
 である。この場合の検定統計量が上の様になる理由は
p.\pageref{yuidokentei-rei2}の尤度比検定の例2を参照のこと。
$T(\bar{X},s^2)$ の分布は自由度$n-1$ の$t$分布に従う。
証明は\ref{t-hyouhon}、$t$ 分布の節の「標本平均値の分布」を参照のこと
\footnote{テキストによって、標本分散を$s^2=(\Sigma(X-\bar{X})^2)/n$ 
とするものと$s^2=(\Sigma(X-\bar{X})^2)/(n-1)$ とするものとがある。
標本の数が少ない場合は後者の方が好ましいように思われる。
$s^2=(\Sigma(X-\bar{X})^2)/(n-1)$としたときは、検定統計量は
$T(\bar{X},s^2)=\frac{\bar{X}-\mu_0}{\frac{s}{\sqrt{n}}}$ となる。}。

\subsection{応用例}
ある領域における東西風データのうち、特定の年が以上であることを検定したい。
具体的な問題は以下の通りである。インド付近のある領域における春の東西風の
年々変動を考える。使用するデータは1948年から1999年までの52年間。
領域平均した東西風の時系列データを作ると、1948、54、70、81、85、94年は
特に強いように見える。これらの年は普段の年に比べて異常であることを
検定したい。以上の検定は「母分散が未知の場合の母平均の検定」を
行えばよい。母集団は解析期間(52年間)の東西風とした。\footnote{ただし、
これを母集団とするのが適当かは分からない。}この場合、母平均$\mu_0=26.95$ は
解析期間で平均した東西風となる。標本は循環の強い年($n=6$)の東西風であるとする。
このとき標本平均は$\mu=29.14$ で、標本分散は$s^2=0.3597$ である。また、
仮説を$H_0:\mu=\mu_0$ とする。これに対し、対立仮説は$H_1:\mu<\mu_0$ と
なるので、片側検定を行えばよい。有意水準を$0.05$ とするとき、 
自由度$5$ の$t$分布における棄却域の限界値は、
$t_5(0.025)=2.015$ となる。ここで検定統計量を計算すると
$T(\bar{X},s^2)=8.151$ となる。$T$ の値は棄却域に入るので、
仮説$H_0$ は棄却される。こうして、選び出した6年間の東西風は、普段の年に比べて
異常に(有意に)強いことが分かった。
%%%  2.5 差の検定  %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{2つの正規母集団の母平均の差の検定}
2つの正規母集団 $N(\mu_x,\sigma_x^2)$、$N(\mu_y,\sigma_y^2)$に母平均の差
があることを示したい場合に用いる。差の検定についても2つの母分散
$\sigma_x^2$、$\sigma_y^2$ が既知か未知かによって、3通りの方法が考えられる。

 \subsection{2つの母分散$\sigma_x^2,\sigma_y^2$ が既知の場合} \label{kichi}
このとき、大きさ$m$ と$n$ の二つの標本  
$\{X_1,X_2,\cdots,X_m\}$、$\{Y_1,Y_2,\cdots,Y_n\}$
 による母平均の差$\mu_x-\mu_y$ の検定統計量$T(\bar{x_1},\bar{x_2})$ は
\[ T(\bar{X},\bar{Y})=\frac{\bar{X}-\bar{Y}}
    {\sqrt{\frac{\sigma_x^2}{m}+\frac{\sigma_y^2}{n}}}  \]
	    で、$T(\bar{X},\bar{Y})$ の分布は標準正規分布$N(0,1^2)$ 
	    に従う\footnote{$T(\bar{X},\bar{Y})$ の値は
\[ T(\bar{X},\bar{Y})=\frac{(\bar{X}-\bar{Y})-(\mu_x-\mu_y)}
    {\sqrt{\frac{\sigma_x^2}{m}+\frac{\sigma_y^2}{n}}}
\]
かもしれない。}。

＜証明＞ \\
今、母集団$X$ からの標本の大きさを$m$ 、その標本平均値を
$\bar{X}$ 、$Y$ からの標本の大きさを$n$ 、標本平均値を$\bar{Y}$ とし、
母分散をそれぞれ$\sigma_x^2$、$\sigma_y^2$ とする。母集団$X$ からの標本を
$\{X_1,X_2,\cdots,X_m\}$ 、母集団$Y$ からの標本を
$\{Y_1,Y_2,\cdots,Y_n\}$ とすれば、このとき標本の尤度関数は
\begin{equation}
        L=\left(\frac{1}{2 \pi}\right)^{\frac{m+n}{2}}
       \left(\frac{1}{\sigma_x^2}\right)^{\frac{m}{2}}
       \left(\frac{1}{\sigma_y^2}\right)^{\frac{n}{2}}  
      e^{-\frac{1}{2}\left(\frac{\sum(X-\mu_x)^2}{\sigma_x^2}
      +\frac{\sum(Y-\mu_y)^2}{\sigma_y^2}\right)}  \label{sa-yuido2}  
\end{equation}

である。これはp.\pageref{eq-yuido-seiki} の(\ref{eq-yuido-seiki})式から
$x$ についての式と$y$ についての式をかけ合わせることで得られる。
次に平均値$\mu_x$、$\mu_y$ および分散$\sigma_1^2$、$\sigma_2^2$ の
最尤推定値を求める。まず、p.\pageref{eq-yuido-seiki} の
例のように$L$ のログをとると、
\[  \log L=-\frac{m+n}{2}\log(2\pi)-\frac{m}{2}\log\sigma_x^2
            -\frac{n}{2}\log\sigma_y^2
            -\frac{1}{2}\left(\frac{\sum(X-\mu_x)^2}{\sigma_x^2}
                +\frac{\sum(Y-\mu_y)^2}{\sigma_y^2}\right)  \]
となる。$\mu_x$、$\mu_y$、$\sigma_x^2$、$\sigma_y^2$について微分すると、
\[  \hat{\mu_x}=\bar{X},~~\hat{\mu_y}=\bar{Y},~~
    \frac{\partial}{\partial \sigma^2} \log L=0  \]
を解くことで以下のように得られる。
\[  \hat{\mu_x}=\bar{X},~~~~\hat{\mu_y}=\bar{Y}   \]
\[  \hat{\sigma_x}^2=\frac{1}{m} \sum^m (X-\bar{X})^2,~~
    \hat{\sigma_y}^2=\frac{1}{n} \sum^n (Y-\bar{Y})^2    \]
従って
\[  L(\hat{\Phi})=\left(\frac{1}{2\pi}\right)^{\frac{m+n}{2}}
    \left(\frac{m}{\sum(X-\bar{X})^2}\right)^{\frac{m}{2}} 
     \left(\frac{n}{\sum(Y-\bar{Y})^2}\right)^{\frac{n}{2}}
     \cdot e^{-\frac{m+n}{2}}    \]
である。次に仮説$H_0:\mu_x=\mu_y=\mu$ が真のとき、平均値、分散の
最尤推定値は(\ref{sa-yuido2})式において$\mu_x=\mu_y=\mu$ とし、 
\[  \frac{\partial}{\partial \mu} \log L=0,~~
    \frac{\partial}{\partial \sigma_x^2} \log L=0,~~
    \frac{\partial}{\partial \sigma_y^2} \log L=0    \]
を解いて次のようになる。

\[ \hat{\mu}=\frac{m\bar{X}\sigma_y^2+n\bar{Y}\sigma_x^2}
           {m\sigma_y^2+n\sigma_x^2}.  \]
ここで$\hat{\sigma_x^2}$、$\hat{\sigma_y^2}$ がうまく求められず挫折。 


 \subsection{2つの母分散$\sigma_x^2,\sigma_y^2$ は未知だが、
       $\sigma_1^2=\sigma_2^2$ と仮定できる場合}
このとき、大きさ$m$ と$n$ の二つの標本  \\
$\{X_1,X_2,\cdots,X_m\},\{Y_1,Y_2,\cdots,Y_n\}$
による母平均の差$\mu_1-\mu_2$ の検定統計量
\[ T(\bar{X},\bar{Y})
   =\frac{\bar{X}-\bar{Y}}{\sqrt{(\frac{1}{m}+\frac{1}{n})
     \cdot \frac{\sum(X-\bar{X})^2+\sum(Y-\bar{Y})^2}{m+n-2}}}
 \]
で、$T(\bar{X},\bar{Y})$ の分布は自由度$m+n-2$ の
$t$分布に従う。  

検定統計量が上記のようになることはp.\pageref{yuidokentei-rei3}の
尤度比検定の例3を参照のこと。


\subsubsection{応用例}
この検定が当てはまるのは、例えば、二種の製品の品質の優劣を双方からの
抜取標本の検査成績によって判定する場合、あるいは
新生児の体重が今と10年前とで変化しているか判定する場合などである。

%\newcommand{\APPROX}{\mathrel{\mathpalette\ap@align{\smash.}}}
%\newcommand{\ap@align}[2]{\lower.2ex\vbox{\baselineskip\z@skip\lineskip\z@
%   \def\finsm@sh{\ht\z@.2ex \dp\z@.2ex \box\z@}%
%   \ialign{$\m@th#1\hfil##\hfil$\crcr#2\crcr=\crcr#2\crcr}}}

 \begin{description}
   \item{例~~新生児の体重の変化}
     1978年と1988年の新生児の体重のデータが以下の表のように与えられた。
     10年間で新生児の体重に変化があるかを検定したい。二つの母集団の
     平均を$\mu_x$、$\mu_y$ とする。仮説は$H_0:\mu_x=\mu_y$
     とする。対立仮説は、新生児の体重は年々減少してきているという
     情報より、$\mu_x > \mu_y$ とする。
 \begin{center}
  \begin{tabular}{|l|cccccccccr|}   \hline
   \multicolumn{11}{|c|}{\textbf{新生児の体重(g)}}  \\ \hline
    \multicolumn{1}{|l|}{1978年} & 3840 & 3540 & 3920 & 2920 & 3820 & 3910 
             & 3300 & 2770 & 3000 & 3900  \\ \hline
    \multicolumn{1}{|l|}{1988年} & 3470 & 2550 & 2920 & 2530 & 3280 & 2840 
             & 2520 & 3350 & 3610 & 3430  \\ \hline
  \end{tabular}
 \end{center}
    データより、標本平均は$\bar{X}=3492$ g、$\bar{Y}=3050$ gである。
  このとき検定統計量は

 \begin{eqnarray}
   T(\bar{X},\bar{Y})
   &=&\frac{\bar{X}-\bar{Y}}{\sqrt{(\frac{1}{m}+\frac{1}{n})
     \cdot \frac{\sum(X-\bar{X})^2+\sum(Y-\bar{Y})^2}{m+n-2}}} \nonumber \\
   &=&\frac{3492-3050}{\sqrt{(\frac{1}{10}+\frac{1}{10})
     \cdot
  \frac{1882760+1639600}{10+10-2}}}=\frac{442}{\sqrt{\frac{3522360}{5\times 18}}}=\frac{442}{197.8} \approx 2.235 \nonumber 
 \end{eqnarray}
となる。ここで、自由度$18$の$t$分布における有意水準$0.05$の棄却域は
$t_{18}(0.05)=1.734$ 以上である。検定統計量$T(\bar{X},\bar{Y})$ は棄却域に
含まれるので、有意水準$0.05$で仮説は棄却される。従って、10年間で新生児の
体重は減少していると考えてよさそうである。
       
 \end{description}

%\vspace{5mm}
私が修論ではじめに行ったのはこちらの検定。まず、二つの集団を
「循環の強い年(6年分)」と、「解析期間全体(52年分)」とした\footnote{比べ
るとしたら「循環の強い年」と「循環の強い年を除いた(52-6)年」とすべきかも
しれない。}。この2つの
集団の平均$x_1,x_2$にについての仮説$x_1=x_2$ が棄却されれば、シグナルは
有意と言えるだろうと考えた。
ただ、$\sigma_x^2=\sigma_y^2$ はグラフからも明らかに成り立たないので、
不適切であるということになり、「母分散が未知の場合の母平均の検定」で
やり直した。下のウェルチの検定を用いれば問題ないのかも知れない。
結論として、どの検定をどのように用いればよいのか、まだよく分からない。

\subsection{母分散$\sigma_x^2,\sigma_y^2$ が共に未知の場合}
このとき、大きさ$m$ と$n$ の二つの標本  \\
$\{X_1,X_2,\cdots,X_n\},\{Y_1,Y_2,\cdots,Y_n\}$
による母平均の差$\mu_1-\mu_2$ の検定統計量
$T(\bar{X},\bar{Y},s_1^2,s_2^2)$ は、
\[  T(\bar{X},\bar{Y},s_x^2,s_y^2)=\frac{\bar{X}-\bar{Y}}
    {\sqrt{\frac{s_1^2}{m}+\frac{s_2^2}{n}}}   \]
ただし
\[  s_1^2=\frac{\sum(X_i-\bar{X})^2}{m-1},~~
    s_2^2=\frac{\sum(Y_i-\bar{Y})^2}{n-1}      \]
で、$T(\bar{X},\bar{Y},s_1^2,s_2^2)$ の分布は自由度$k$ の$t$ 分布に
従う。この自由度$k$ は
\[ k=\frac{(\frac{s_1^2}{m}+\frac{s_2^2}{n})^2}
  {\frac{s_1^4}{m^2(m-1)}+\frac{s_2^4}{n^2(n-1)}}  \]
で近似する。$k$ が整数値でないときは、その最も近い整数値を$k$ 
と定める\footnote{証明は省略。}。
これをウェルチの検定という。

%%%  2.6 無相関の検定  %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{無相関の検定}
大きさ$n$ の標本の相関係数が$r$ のとき、無相関検定の検定統計量$T(r,0)$は
\[   T(r,0)=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}}       \]
で、この分布は自由度$n-2$ の$t$ 分布に従う。\footnote{証明は省略。}
このとき仮説および対立仮説は次のようになる。
\begin{eqnarray} 
        H_0&：&無相関である,  \nonumber  \\
        H_1&：&相関がある.  \nonumber
\end{eqnarray}
このとき$T(r,0) \in R$ ならば\footnote{$R$ は棄却域である。}、
有意水準$\alpha$ で仮説$H_0$ を棄却する。
注意すべきは、この検定は両側検定であることである。
$\pm t_{n-2}(\frac{\alpha}{2})$ の値を外れると棄却域になる。






























































