\chapter{検定の前提となる事柄}    % 章 

%\section{検定に関する用語、概念}  % 節
                    
\section{確率変数}
%\subsection{確率変数、分布関数、確率密度関数}
\subsection{標本点、標本空間}
同一条件下で繰り返される実験あるいは観察を{\bf 試行}といい、試行の結果と
して起こる事柄を{\bf 事象}という。また、
ある試行について、考え得る限りの可能な個々の結果を{\bf 標本点(素事象、
根源事象)}\footnote{根源事象：それ以上細かく分解して考えられない事象。
例えば、サイコロを投げたとき、1の目が出ること。}といい、このような結果の
全体(集合\footnote{ある明確に定まった条件に適するものの集まり。})を
{\bf 標本空間}といい、$\Omega$で表す。例を挙げると、1つのサイコロを1回
投げるとき、偶数の目がでるという事象$A$ は、$A=\{2,4,6\}$、標本空間は、
$\Omega=\{1,2,3,4,5,6\}$ と表される。

\vspace{5mm}
いま、ある事象に対応する部分集合\footnote{部分集合：2つの集合A、Bにおい
て、Bの要素がすべてAの要素であるとき、BはAの部分集合、あるいはBはAに
含まれるといい$B \in A$ と書く。}を$A$ とし、試行の結果$\omega$ が$A$ に
属する1点を表すとき、すなわち
\[  \omega \in A\]
であるとき、この試行で事象$A$ が起こったということにすれば、普通用いられ
る集合演算に次のような具体的な事象的な意味が対応つけられる。\\
$~~~~~~A \cup B\cdots\cdots$事象$A,B$ のうち少なくとも1つが起こるという
事象、 \\
$~~~~~~A \cap B\cdots\cdots$事象$A$ および$B$ がともに起こる
という事象、 \\
$~~~~~~A - B\cdots\cdots$事象$A$ が起こり、$B$ が起こらない
という事象、\\
$~~~~~~A^c~~~\cdots\cdots$事象$A$ が起こらないという事象。 \\

%変数\footnote{変数：数を代表する文字が、一つの問題を考察している間、
%種々の値を取る得るとみなす時、これを変数という。また、数以外の事項にも
%拡張して用いる。$\leftrightarrow$ 定数}$X$ のとり得る値
%$x_1,x_2,\cdots,x_n$ 及び$X$ がこれらの値をとる確率
%$p_1,p_2,\cdots,p_n$ が定まっているとき、変数$X$ を{\bf 確率変数}といい、 
%$x_1,x_2,\cdots,x_n$ と$p_1,p_2,\cdots,p_n$ の対応関係を確率変数$X$ の
%{\bf 確率分布}という。ここで、$p_1+p_2+\cdots+p_n=1.$

\subsection{$\sigma-$集合体}
%確率変数を数学的にきちんと定義するには、確率の定義から始める必要がある。

次にこの事象$A$ に確率という数値を対応させることを考える。
確率はある事象が起こる「確からしさ」を表す実数値である。
確率を定義するとき、その定義域にあたる集合族をきちんと決める必要がある。
この集合族としては、次のような$\mathcal{U}$ (これを{\bf 
$\sigma-$集合体}ということにする)を考える。
$\mathcal{U}$ は次の性質をもっている。 $\Omega$ の部分集合(Aなど。ここで$A \in \Omega$)からなる、
空でない集合族である。
\begin{description}
 \item[$\mathcal{U}$の条件1]
        $\Omega$ の部分集合(集合Aなど。ここで$A \in \Omega$)からなる、
       空でない集合族である。
 \item[$\mathcal{U}$の条件2] 
           集合$A$ が$\mathcal{U}$ に属するとき、補集合$A^c$ もまた
            $\mathcal{U}$ に属する。 
 \item[$\mathcal{U}$の条件3] 
        集合$A_i(i=1,2,\cdots)$ が$\mathcal{U}$ に属するとき、\\
             和集合$\cup_{i=1}^{\infty} A_i = A_1 \cup A_2 \cup A_3
	     \cdots$ もまた$\mathcal{U}$ に属する。
\end{description}
これらの条件を満たすから、任意の$\sigma-$集合体$\mathcal{U}$ は次のよう
な性質をもつ。
\begin{description}
 \item[$\mathcal{U}$の性質1]
        常に元の空間$\Omega$ (確実に起こる事象の意味にとれる)を含む。 \\
       なぜなら、$\mathcal{U}$ に属している一つの集合を$A$ とおくと、
        $\mathcal{U}$の条件2より$A^c \in \mathcal{U}.$
 \item[$\mathcal{U}$の性質2]
       常に空集合\footnote{要素(集合を構成する個々のもの、元ともいう)
       を全く含まない集合のこと。}$\phi$(起こり得ない事象の意味)を
       含む。\\
       なぜなら、上と同様に$\mathcal{U}$ に属している一つの集合を
       $A$ とおくと、$\mathcal{U}$の条件2より$A^c \in \mathcal{U}.$
       また$\mathcal{U}$の条件3より
     \[ \Omega = A \cup A^c \in \mathcal{U},
        ~~~~\phi=\Omega^c \in \mathcal{U}. \] 
 \item[$\mathcal{U}$の性質3] 
       $A_1,A_2$ が$\mathcal{U}$ に属するときは
%$A_1 \cup A_2 \in \mathcal{U}$ であるが、
          $A_1 \cap A_2$ もまた$\mathcal{U}$ に属す。
       \[ なぜならA_1 \cap A_2 = (A_1^c \cup A_2^c)^c \in \mathcal{U}. \] 
        
 \item[$\mathcal{U}$の性質4]
       $A_1,A_2$ が$\mathcal{U}$ に属するとき、$A_1-A_2$もまた
       $\mathcal{U}$ に属す。
      \[  なぜならA_1-A_2=(A_1^c \cup A_2)^c \in \mathcal{U}. \]  
    
 \item[$\mathcal{U}$の性質5]
       一般的に、$\mathcal{U}$ に属する集合の間に$\cup,\cap,-,c$ の
       集合演算を可付番無限回ほどこして得られる集合もまた$\mathcal{U}$ 
       に属する。
 \end{description}
ここで、$\Omega$と$\mathcal{U}$の例を挙げておく。1つのサイコロを1回投げ
る場合を考えると、
$\Omega=\{1,2,3,4,5,6\}$ に対し、 \\ 
~~~~~~$\mathcal{U}=\{1\},\{2,4\},\{1,2,3,4,5,6\},\{\phi\},\cdots$  \\
となる。

\subsection{確率、確率空間}
$\sigma-$集合体$\mathcal{U}$ のすべての集合$A$ に対し、一意的に定められ
た関数$P(A)$ が次の条件を満たすとき、$P(A)$ を{\bf 事象$A$ が起こる}
(または{\bf 事象$A$ の}){\bf 確率}という。 
\begin{description}
 \item[確率の条件1] $P(A)\geq 0,~~~~(A \in \mathcal{U}),$ 
 \item[確率の条件2] $P(\Omega)=1,$   
 \item[確率の条件3] $A_i \in \mathcal{U},A_i \cap A_j = \phi, (i\neq j)$
              であるとき、  \\
   \begin{equation}
     P(\cup_{i=1}^{\infty}A_i)=\sum_{i=1}^{\infty}P(A_i)  
   \end{equation} 
\end{description}


 注意 \\
\begin{enumerate}
  \item 確率の条件1の中に$P(A)\leq 1$ が欠けているようにみえるが、これは
   他の2条件が満たされれば成り立つ。 \\
    証明  \\
    \begin{equation}
     \Omega=A \cup A^c ,A \cap A^c=\phi  \nonumber \\ 
    \end{equation}
   よって確率の条件3および確率の条件2より
    \[ P(A)+P(A^c)=P(A \cup A^c)=P(\Omega)=1.   \]
    \[ P(A) \geq 0,~~~~P(A^c) \geq 0   \]
   なので、   
    \[   0 \leq P(A) \leq 1,~~~~0 \leq P(A^c) \leq 1.~~~~~(証明終わり)    \]
  \item 確率の条件3は確率事象$A_1,A_2,\cdots$ のどの2つをとっても
        {\bf 排反事象}(同時に起こることがあり得ない事象)であるとき、
     $A_1,A_2,\cdots$ のうち少なくとも1つの事象が起こる確率は、各事象の
     起こる確率の和で表されるという意味である。これは $A_1,A_2,\cdots$ が
      有限個の場合も含んでいる。すなわち$n<i$ に対し$A_i=\phi$ とおけば
       確率の条件3より
      \[ P(\cup_{i=1}^n A_i)=\sum_{i=1}^n P(A_i).  \]
  \item 上の結果は通常{\bf 確率の加法定理}と呼ばれるもので、
    ここでは証明なしに公理的に与えられた性質であるが、
    確率の条件1〜3があればいろいろな確率の結果を導くことができる。
    例えば次の一般化された加法定理も示される
    \[ P(A \cup B)=P(A)+P(B)-P(A \cap B).  \]
   確率の加法定理の証明 \\
    集合$A \cup B$ は次のように独立な3つの集合に分けられる。
   \[ A \cup B = (A-B) \cup (B-A) \cup (A \cap B).  \]
   よって
   \[ P(A \cup B) = P(A-B) + P(B-A) + P(A \cap B). \]
   ここで
  \[ P(A)=P(A-B)+P(A \cap B),~~~~P(B)=P(B-A)+P(A \cap B). \]
   変形して上式に代入し、整理すると
  \[ P(A \cup B)=P(A)+P(B)-P(A \cap B). ~~~~~~~(証明終わり) \]
\end{enumerate}

\vspace{5mm}
以上により今後、確率について考えるときには、理論的にはまずそれに対し
空間$\Omega$ を定め、その部分集合よりなる$\sigma-$集合体$\mathcal{U}$
を決め、その集合体に属する任意の集合に対し上のような確率$P$ が定義されな
ければならないことになる。この$\Omega,\mathcal{U},P$ をまとめて
$(\Omega,\mathcal{U},P)$ と書き、これを{\bf 確率空間}という\footnote
{標本空間$\Omega$ の元$\omega$ は標本点である。Pは$\mathcal{U}$ 上で
定義される集合関数である。}。 

\vspace{5mm}
例として、ある試行の起こり得る結果の数が有限個または可付番無限個の場合
\footnote{連続だと可付番にはならない。ex.実数値には番号が付けられない。}
の確率空間は次のように定められる。
$\Omega=\{\omega_1,\omega_2,\cdots,\omega_n,\cdots\}$ とおく。$\sigma-$
集合体$\mathcal{U}$ としては$\Omega$ のすべての部分集合(空集合$\phi$ を
含む)よりなる集合属を考える\footnote{$\mathcal{U}$ を定義するのは、
空集合$\phi$ を含むため、より厳密に確率を定義できるからと考えられる。
$P(A)=0$があり得るのは$\mathcal{U}$ があるため。確率$P(\mathcal{U})$ は
定義できないことに注意!}。
次に確率$P$ は次のような数列$\{p_i\}$で定義する。
\[ P(\omega_i)=p_i,~~~p_i \geq 0,~~~\sum_{i=1}^{\infty} p_i=1.   \]
$\mathcal{U}$ に属する任意の集合 
\[ A_i=\{\omega_{i1}, \omega_{i2}, \cdots, \omega_{ik}\}   \]
に対しては$P(A_i)=\sum_{l=1}^k p_{il}$ とし、特に$P(\phi)=0$ とする。
このように定義された$P(A_i)$ は、確率の条件$1.\sim 3.$ を明らかに満たす
\footnote{$A_1=\{\omega_{11},\omega_{12}\},A_2=\{\omega_{21},\omega_{22}\},
B=\{\omega_{11},\omega_{12},\omega_{21},\omega_{22}\},
C=\{\omega_{11},\omega_{22}\}$ とする。このとき$P(B)=P(A_1)+P(A_2),
P(C)=P(A_1)+P(C)-p_{11}.$つまり、独立な事象の確率のみ足されていく
ことになるので、条件3を満たしていると言える。}。

\subsection{確率変数}
標本空間を構成する標本点(試行の結果)に対応して定められる
実数値を{\bf 確率変数}という\footnote{例1)サイコロ投げの場合。
~~~~標本点：1から6までの目が出るという結果の各々。確率変数：1,2,3,4,5,6。 \\
例2)1枚のコインを2回投げたときの表の数。~~~~標本点：$s_1=$\{表、表\},
$s_2=$\{表、裏\},$s_3=$\{裏、表\},$s_4=$\{裏、裏\}の各々。
確率変数(表の数)：$x_1=2,x_2=1,x_3=1,x_4=0$。}。
確率変数自身は確率を表すものではなく、サイコロ投げの例では「1〜6までの
いずれかの目が出る」という可能性を表すものに過ぎない。
以下では確率変数$X$ の数学的な定義を示す。

\vspace{5mm}
まず確率空間を$(\Omega,\mathcal{U},P)$ とおく。$\Omega$ の上で定義された
実数値関数\footnote{☆確率変数$X$ が$\mathcal{U}$ に属することで、
各々の$X$ についてではなく、まとめて議論することができる。}
$X(\omega),(\omega \in \Omega)$ が次の条件、
「任意の実数$x$ に対し、$X(\omega) \leq x$ を満たす$\omega$ の集合が
常に$\sigma-$ 集合体 $\mathcal{U}$ に属する」、即ち
\[~~~~ \{\omega; X(\omega) \leq x\} \in \mathcal{U}  \]
を満たすとき、この$X(\omega)$ を{\bf 確率変数}という。  

\subsection{確率分布}
集合~~$\{\omega; X(\omega)\leq x\}$ は$\mathcal{U}$ に属しているから、
この集合の$\mathcal{U}$ に対する確率が与えられ、次のように
表される。
\[ P(X\leq x)=P\{\omega; X(\omega) \leq x\} = F(x).   \]
これを確率変数$X$ の{\bf 分布関数}という。 

\vspace{5mm}
確率変数$X$ がとる値を支配している偶然性は、ある確率法則により規定される。
その確率法則を{\bf 確率分布}ということにする。この確率分布は上の分布関数
で表されていることになる。
%すなわち分布関数$F(x)$ が与えられていれば、
%確率変数 $X$ が例えば区間$(a,b]$($a<x\leq b$ を満たす$x$ の集合) 内の
%どれかの$x$ をとる確率が、分布関数で次のように表される。
%\[ P(a<X\leq b)=F(b)-F(a).   \]
分布関数$F(x)$ には次の性質がある。

\begin{description}
 \item[分布関数の性質1] $0 \leq F(x) \leq 1.$
 \item[分布関数の性質2] $\lim_{x\to -\infty} F(x) = F(-\infty)= 0,~~~
                   \lim_{x\to \infty} F(x) = F(+\infty)= 1.$
 \item[分布関数の性質3] $x < y$ ならば$F(x)\leq F(y).$\footnote{$x<y$ ならば
                          $(-\infty,x)\subset (-\infty,y)$ である。} 
\end{description}
分布関数の性質3から明らかなように、分布関数$F(x)$ は$x$ の単調増加関数である。

\vspace{5mm}
$P(a<X\leq b)$ と$F(a),F(b)$ の関係は以下のようになる。
ここで$a,b(a<b)$ は$X$ の変域内の二つの値とする。 
\[ P(X\leq b)=P(X\leq a)+P(a<X\leq b)          \]
であるから、$X$ が$a$ より大で$b$ を超えない確率$P(a<X\leq b)$は
明らかに
\begin{equation}
 P(a<X\leq b)=P(X\leq b)-P(X\leq a)=F(b)-F(a)
\end{equation}
である。

\subsection{度数関数と密度関数}
この節では、確率変数の分布関数上のある点またはある微小部分における
確率を定義することを考える。
確率変数が離散的な場合と連続的な場合について分けて考える方が
分かりやすい。

\subsubsection{離散的確率変数の場合}
確率変数$X$ が離散量$x_1<x_2<x_3<\cdots$ をとるとき、個々の離散量に
対応する確率が定まる。離散的確率変数$X$ が特定の値$x_i$ をとる
確率を
\[ f(x_i)=P(X=x_i)  \]
で示し、これを離散的確率変数の{\bf 度数関数}という。$f(x)$ を$X$ の
変域内のすべての値に対して考えるとき、この$f(x)$ を変数$X$ の離散的
確率分布あるいは簡単に{\bf 確率分布}という。度数関数は明らかに次の
性質を持つ。
\begin{enumerate}
 \item $0 \leq f(x_i) \leq 1.$
 \item $\sum_i f(x_i)=1.$
\end{enumerate}
逆に任意の関数$f(x)$ が$x$ のある変域に対してこの二つの条件をみたすとき、
その関数は度数関数と考えることができる。

\vspace{5mm}
度数関数$f(x)$ と分布関数$F(x)$ との関係は次式で示される。 
確率変数$X$ が離散量$x_1<x_2<x_3<\cdots$ をとるとき、その分布関数
$F(x)$ は離散量$x_1,x_2,x_3,\cdots$ ごとに上昇するが、$x_i$ と$x_{i+1}$ 
の中間においては不変である。故に離散的確率変数の分布は個々の離散量に
対応する確率によって定まる。  \\
\begin{equation}
    F(x)=P(X\leq x)=\sum_{i;x_i \leq x} f(x_i).
\end{equation}
この 式の右辺は$x$ を超えない$x_i$ のすべての値に対する$f(x_i)$ の値の
総和を意味する。この関係式により分布関数$F(x)$ を度数関数$f(x_i)$ から
計算することができ、逆に$f(x_i)$ を$F(x)$ から計算することもできる。

%＜離散型確率変数の確率の定義＞
% \[ P(X=x_i)=p_i,(i=1,2,\cdots)  \]
%ここで
%\[ p_i\geq 0,\sum_{i=1}^{\infty} p_i = 1. \]
%このとき 
% \[  P(a \leq X \leq b)=\sum_{\{i;(a \leq X \leq b)\}} p_i,
%     (\sum は a \leq X \leq b を満たすi についてのみのp_i の和を
%        表す). \]

\subsubsection{連続的確率変数の場合}

確率変数が連続量の場合、変数の特定の値に対して non ゼロ の確率を定める
ことはできない。しかし分布関数が変域内で微分可能な場合(以下このような
分布関数のみを考える)、連続的確率変数に対する確率を次のような形で
定めることができる。次の式で定義される
$f(x)$ を確率変数$X$ の{\bf 確率密度}あるいは{\bf 密度関数}という。
\[  f(x)=\lim_{h \to 0} \frac{P(X \leq x+h)-P(X \leq x)}{h}  \]
密度関数$f(x)$ の定義式から直ちに密度関数と分布関数$F(x)$ との関係を
示す次の式が得られる。 \\
\begin{equation}
   f(x)=\frac{dF(x)}{dx}   \label{kakuritsusobun}
\end{equation}
$f(x)dx=dF(x)$ をしばしば{\bf 確率素分}という。確率素分$f(x)dx$ は
点$x$ の付近における確率である。厳密にいえば連続変数の場合$x$ の
特定値に対して確率はゼロである。確率素分は変数$X$ のきわめて小さい
区間に対する確率(次式で表される)と考えればよい。
\[ \int_x^{x+\mathit{\Delta}x}f(x)dx \cong f(x)\mathit{\Delta}x    \]
(\ref{kakuritsusobun})式から直ちに明らかなように \\
\begin{equation}
  F(x)=\int_{-\infty}^x f(t)dt
\end{equation}
である。したがって$a<b$ のとき、$X$ が区間$(a,b)$ の値をとる確率は \\
\begin{eqnarray}
    P(a < X \leq b)&=&\int_a^b f(x)dx  \nonumber \\
                   &=&F(b)-F(a)
\end{eqnarray}
である\footnote{点$a,b$ において確率はゼロであるから、区間$(a,b) [a,b)
 (a,b] [a,b]$ の確率はいずれも同じ。(記号( )は開区間(端の値を含む)、
[ ]は閉区間を示す。)}。 

\vspace{5mm}
連続関数の場合、確率密度関数が次の性質をもつことは明らかである。 
\begin{enumerate}
 \item $f(x) \geq 0.$
 \item $\int_{-\infty}^\infty f(x)dx=1.$
\end{enumerate}
1 は分布関数$F(x)$ が非減少であることの当然の結果であり、2 は分布関数の
性質$F(\infty)=1$ と同値である。密度関数$f(x)$ はこの二つの条件を
みたさなければならないし、反対に任意の関数$f(x)$ が一定の区間でこの
二条件をみたすとき、それは密度関数と考えることができる。

%＜連続型確率変数の確率の定義など＞
%任意の$a,b(a<b)$ に対し 
% \[P(a\leq X\leq b)=\int_a^b f(x)dx,
%    (f(x)\geq 0,\int_{-\infty}^{\infty} f(x)dx=1)  \]
%である$f(x)$ が存在するとき、この確率分布を{\bf 連続型確率分布}という。
%またこの$f(x)$ を{\bf 確率密度関数}という\footnote{連続型確率分布をもつ
%確率変数$X$ については、$X$ がただ1つの値をとる確率は0 と規定する(どうい
%う意味?)。すなわち任意の実数に対し$P(X=a)=0.$
%このことから$P(a\leq X\leq b)$の値は符号をはずしても確率の値は変わらない}。 


%\subsection{信頼度、信頼区間}

\subsection{積率、平均および分散}
  ここでは確率変数$X$ が連続変数である場合について書くが、離散変数の
  場合も同様である。 \\
  $X$ が確率変数で
  $f(x)$ がその密度関数のとき、
  任意の実数値$a$ を原点とする($k$ 次の){\bf 積率}を次の式で定義する。
  \[ E\left[(X-a)^k\right]=\int (x-a)^k f(x) dx/ \int f(x) dx  \]
 ここで、$a=0$ とおいた場合を原点に対する$X$ の $k$ 次積率、あるいは
 {\bf 原点積率}といい、これを記号$\mu_k'$ で示す。また、$a=\mu$ とおくと、
  平均に対する積率 $\mu_k$ が定義され、これを{\bf 中心積率}という。 
\vspace{5mm}

  一次の原点積率を期待値もしくは{\bf 平均値}という。すなわち、
   \begin{equation}
     \mu_1'=E\left[(X^1)\right]=\int_{-\infty}^{\infty} 
              x f(x)dx/\int_{-\infty}^{\infty} f(x) dx.  \label{eq:e(x)}
   \end{equation}

  $E(X)$ が発散するときは
  期待値は存在しない\footnote{というらしい。もしくは「考えない」のだと
  思われる}。以下、平均値$\mu_1'$ を記号 $\mu$ で示すことにする。
  平均値$\mu$ は分布の中心(正確には重心)を示す。
\vspace{5mm}

  二次の中心積率を{\bf 分布の分散}(あるいは単に{\bf 分散})という。
 記号$\sigma^2$ または$\sigma^2(X)$、$\sigma_X^2,$ あるいは
 $var(X)$ で示す。すなわち\footnote{離散変数の場合は
    $\sigma^2=\sum_i \left(x_i-\mu\right)^2 f(x_i)/\sum_i f(x_i)$}
  \begin{eqnarray}
     \sigma^2&=&\mu_2=E\left[(X-E(X))^2\right]
                       =E\left[(X-\mu)^2\right]   \nonumber \\
             &=&\int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx
                   /\int_{-\infty}^{\infty} f(x) dx.  \label{eq:var(x)} 
 \end{eqnarray}
 分散の正の平方根を{\bf 標準偏差}という。記号$\sigma$ で示す。すなわち
 \[ +\sqrt{\sigma^2}=\sigma=+\sqrt{\mu_2}.\]

 分散$\sigma^2=\mu_2$ は分布の{\bf ばらつき}の大小を示す。
 ただし変数$X$ と同次の量でばらつきの
 大小を示すためには分散の平方根である標準偏差$\sigma$ が便利である。

\vspace{7mm}
 
 任意の$a$ を原点とする二次積率と二次の中心積率との間には次の関係が成り
 立つ\footnote{3行目から4行目で、密度関数の性質より$\int f(x)dx=1$である。}。
 \begin{eqnarray}
 E\left[(X-a)^2\right]&=&E\left[\{(X-\mu)+(\mu-a)\}^2\right] \nonumber \\
                      &=&E\left[(X-\mu)^2+2(X-\mu)(\mu-a)
                                       +(\mu-a)^2 \right] \nonumber  \\
                      &=&\int\{(x-\mu)^2+2(x-\mu)(\mu-a)+(\mu-a)^2\}f(x) dx
                                 / \int f(x)dx   \nonumber \\
                      &=&\int(x-\mu)^2f(x) dx+2(\mu-a)\int (x-\mu)f(x)dx
                                            +(\mu-a)^2  \nonumber  \\
                      &=&E\left[(X-\mu)^2\right]+2(\mu-a)E(X-\mu)
                                         +(\mu-a)^2 \nonumber \\
                      &=&\mu_2+(\mu-a)^2  \label{eq:nijinosekiritu}
 \end{eqnarray}
   ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(なぜな
   らば ~~~~~$E(X-\mu)=0$ )
 \footnote{   \begin{eqnarray}
              E(X-\mu)&=&\int (x-\mu)f(x) dx/\int f(x) dx \nonumber \\
                      &=&(\int xf(x) dx-\mu \int f(x) dx)/ \int f(x)dx 
                               \nonumber  \\
                      &=&(\mu-\mu\cdot 1)/1=0 \nonumber
              \end{eqnarray}  }

  $(\mu-a)^2\geq0$ であるから次の関係が成り立つ。
 \[ E(X-a)^2\geq\mu_2   \]
 故に二次積率の中で最も小さいものが分散である。
\vspace{5mm}
 
次に変数$X$ の一次変換$Y=aX+b$($a$ は目盛の変更、$b$ は座標原点の変更を
 示す)を考える。$E(Y)=aE(X)+b$ であるから\footnote{\begin{eqnarray}
                 \sigma^2(Y)&=&\int\{y-E(Y)\}^2f(x)dx
                                =\int\{ax+b-E(aX+b)\}^2f(x)dx \nonumber \\
                            &=&\int\{ax+b-aE(X)-b\}^2f(x)dx
                                =a^2\int\{x-E(X)\}^2f(x)dx
                                =a^2\sigma^2(X) \nonumber 
                \end{eqnarray} }、
 \begin{eqnarray}
     \sigma^2(Y)&=&E\left[Y-E(Y)\right]^2  \nonumber \\
                &=&E\left[(aX+b)-\{aE(X)+b\}\right]^2 \nonumber \\
                &=&E\left[a\{X-E(X)\}\right]^2=a^2E[X-E(X)]^2 \nonumber \\
                &=&a^2\sigma^2(X) \label{eq:hensuuhenkan} 
 \end{eqnarray}
故に目盛の変更は分散の大きさに関係するが、座標の原点の変更は分散に無関係
である\footnote{例えば$y=100x$のとき$\int f(y)dy=1$ は成り立たない。即ち
変換後は確率密度関数とは言えない。$\int f'(y)/ dy/100$ を考える。}。

\vspace{5mm}

分散(二次の積率)について知られる性質をまとめる。
\begin{description}
 \item[分散の性質1] $c$ を定数とすれば\\
    \begin{equation} 
        \sigma^2(c)=0.\footnote{\[ \sigma^2[g(x)]=\int_{-\infty}^{\infty} 
              \{g(x)-E[g(x)]\}^2 f(x) dx\]
であるから、\\
   \[ \sigma^2(c)=\int_{-\infty}^{\infty} \{c-c\}^2 f(x) dx = 0.\]} 
    \end{equation} 
  \item[分散の性質2]
    \begin{equation}
      \sigma^2(X+c)=\sigma^2(X).\footnote{$X+c$の平均は$\mu+c$ であるから、
      \[ \sigma^2(X+c)=\int_\infty^\infty \{(x+c)-(\mu+c)\}^2 f(x)dx 
         = \sigma^2(X). \]}
    \end{equation}   
  \item[分散の性質3]
    \begin{equation}
     \sigma^2(cX)=c^2\sigma^2(X). 
    \end{equation} 
分散の性質2と3は(\ref{eq:hensuuhenkan})の直接の結果である。
  \item[分散の性質4] 二次の原点積率と中心積率との間には
       次の関係が成り立つ\footnote{同様に三次の中心積率も
       次のように原点積率の項で示すことができる。
         \begin{equation}
           \mu_3=\mu_3'-3\mu\mu_2'+2\mu^3
         \end{equation}
      一般に次式が成り立つ。
          \begin{equation}
            \mu_k=\mu_k'-\pmatrix{ k \cr 1 \cr}\mu'_{k-1}\mu+\cdots+(-1)^i
             \pmatrix{ k \cr i \cr}\mu'_{k-i}\mu^i+\cdots+(-1)^{k-1}(k-1)\mu^k
          \end{equation}
      ただし、$\pmatrix{ k \cr i \cr}=~_kC_i
                   =\frac{k\cdot(k-1)\cdot\cdots\cdot(k-i+1)}{i !}.$
     これらの関係式を使って中心積率を原点積率から計算することができる。
             逆に原点積率を中心積率から計算する式を作ることもできる。}
        \footnote{(\ref{eq:nijinosekiritu})式で$a=0$ とおくと、
                 $\mu_2'=\mu_2+\mu^2=\sigma^2+\mu^2.$}。\\
                   \begin{equation}
                     \sigma^2(X)=\sigma_X^2=\mu_2=\mu_2'-\mu^2 
                   \end{equation}
 \end{description}

以上では中心積率、すなわち平均値に対する積率$E(X-\mu)^k$ や、任意の原点
$a$ に対する積率$E(X-a)^k$ を考えた。もっと一般的には、
$X$ の任意の関数$g(X)$ についての積率を次のように定義できる。
確率変数$X$ の任意の関数を$g(X)$ とするとき、$g(X)$ の$k$ 次の積率は
\footnote{離散関数の場合は$\sum_i [\{g(x_i)\}^k] f(x_i).$}
\begin{equation}
 E[\{g(X)\}^k]=\int_{-\infty}^{\infty} [g(x)]^k f(x) dx ~~~~~~(連続関数). 
\end{equation}

なお参考までに、3次の中心積率$\mu_3$ は分布のゆがみの大小を示し、4次の
 中心積率$\mu_4$ は同じく尖り方の大小を示すことを加えておく。

\vspace{5mm}
$X$ が離散変数の場合について付け加えておく。
\begin{equation}
  E\left[(X-a)^k\right]
     =\sum_i (x_i-a)^k f(x_i) / \sum_i f(x_i).\label{risan-sekiritu} 
\end{equation}
\begin{equation} 
      E(X)=\sum x_i p_i=\mu,~~Var(X)=\sum (x_i-\mu)^2 p_i.
\end{equation}

\subsection{積率母関数}
 確率変数の積率は統計の理論および実際で重要な役割をもっている。前節の
 ように積率は確率変数の分布の種々の性質を定めることができ、普通の場合
 すべての積率が与えられればそれで確率分布の形が決定する
 \footnote{級数の考え方と似ているのだろうが、実際にグラフが描けるかは
 よく分からない。}。従ってすべての
 積率を包括的に代表するような関数を見出すことができれば大変好都合である。
 その一つが{\bf 積率母関数}である。確率分布の形によっては、積率の定義式
 に基づいて積率を計算するときに、特別の工夫をしなければならない場合や、
 計算の面倒な場合があるが、積率母関数を使うと積率を一定の方法でたいてい
 簡単に計算することができる。
$X$ を確率変数、$t$ を実変数とするとき、次式で定義される関数
$M_x(t)$ を$X$ の{\bf 積率母関数}という。
 \[ M_x(t)=E(e^{tX}). \]
 $X$ が離散変数ならば
 \begin{equation}
    M_X(t)=\sum_x e^{tx}f(x),
 \end{equation}
 $X$ が連続変数ならば
 \begin{equation}
    M_X(t)=\int_{-\infty}^{\infty} e^{tx}f(x) dx. \label{bokansu}
 \end{equation}
\vspace{2mm}

 指数関数$e^{tX}$ をベキ級数に展開\footnote{一般的なベキ級数展開は
\begin{equation} f(x)=f(0) + \frac{f'(0)}{1!}x + \frac{f''(0)}{2!}x^2 + \cdots
       + \frac{f^{(n)}(0)}{n!}x^n + \cdots.  \label{beki-kyusu}
 \end{equation} 
 この公式の$x$ に対応するのが$tX$ である。}
 すると、積率母関数を次のような級数の形で示すことができる。
 \begin{eqnarray}
  M_X(t)=E(e^{tX})&=&E(1+tX+\frac{1}{2!}t^2X^2+\cdots+
                          \frac{1}{k!}t^kX^k+\cdots) \nonumber  \\
                  &=&1+tE(X)+\frac{t^2}{2!}E(X^2)+\cdots+
                          \frac{t^k}{k!}E(X^k)+\cdots \nonumber  \\
                  &=&1+\mu_1't+\mu_2'\frac{t^2}{2!}+\cdots+
                          \mu_k'\frac{t^k}{k!}+\cdots \label{bokansuu-kyusu}   
 \end{eqnarray}
 故に積率母関数をこのようにベキ級数の形に展開することができれば、その展
 開式の$t^k/k!$ の項の係数は$k$ 次の原点積率$\mu_k'$ を与える。これが
 $M_X(t)$ を積率母関数(積率を生み出す関数)と呼ぶ理由である。  \\
\vspace{5mm}

 積率母関数から積率を計算するためには次の方法を用いることもできる。
 積率母関数を$t$ について$k$ 回微分すると
  \begin{eqnarray}
    \frac{d^k}{dt^k}M_X(t)&=&E\left[
                                     \frac{d^k}{dt^k}e^{tX}\right] \nonumber \\
                          &=&E(X^ke^{tX})   \nonumber
  \end{eqnarray}
 となり\footnote{$\frac{d^k}{dt^k}M_X(t)=\int(\frac{d^k}{dt^k}e^{tx})
 f(x)dx.$これは( )内についての平均、即ち
 $E\left[\frac{d^k}{dt^k}e^{tx}\right]$である。また$e^{tX}$ を
 $t$ について$k$ 回微分すれば$X^ke^{tX}$となる。}、$t=0$ とおけば
   \begin{equation}
      M_X^{(k)}(0)=E(X^k)=\mu_k'
   \end{equation}
 となる。故に母関数を$k$ 回微分して$t=0$ とおくことにより$k$ 次の原点積
 率が得られる(この結果は\ref{bokansuu-kyusu}式を項ごとに微分して$t=0$ と
 おいても得られる\footnote{$t$ について$k$ 回微分したときの$k-n$ 番目の
 項は$\frac{1}{(k-n)!}t^{k-n}\cdot\mu_{k-n}'$.$k$ 番目より前では定数の微
 分になるため$0$、$k$ 番目より後では$t=0$ を入れたときに$0$となり、
 結局$\mu_k'$しか残らない。})。 \\
 $X$ を確率変数、$g(X)$ をその関数とするとき、$g(X)$ の積率母関数を
 次の式で定義する。
  \begin{equation}
    M_{g(X)}(t)=E(e^{tg(X)})  \label{g(x)-bokansuu}
  \end{equation}
 $X$ の積率母関数$M_X(t)$ をベキ級数に展開した(\ref{bokansuu-kyusu})式で、
 $e^{tx}$ を$e^{tg(X)}$ に置き換えると次の式が得られる。
\[ E(e^{tg(X)})=1+tE\left[g(X)\right]+\frac{t^2}{2!}E\left[g(X)\right]^2
                 +\cdots+\frac{t^k}{k!}E\left[g(X)\right]^k+\cdots  \]
\vspace{2mm}

積率母関数についての定理を示す。 
\begin{description}
 \item[積率母関数の定理1] \label{bokansu-teiri}
       $X$ を確率変数、$g(X)$ を任意の関数、
                            $c$ を任意の定数とすれば

  \begin{equation}
    M_{cg(X)}(t)=M_{g(X)}(ct).  \label{bokansuu-cg(x)}
  \end{equation}

＜証明＞ (\ref{g(x)-bokansuu})式で$g(X)=cg(X)$ として、
 \[ M_{cg(X)}(t)=\int_{-\infty}^{\infty} e^{tcg(X)} f(x)dx. \]
  ~~~~~~~(\ref{g(x)-bokansuu})式で$t$ を$ct$ で置き換えると、
\[  M_{cg(X)}(t)= M_{g(X)}(ct).\]~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)   \\
 (\ref{bokansuu-cg(x)})式で$g(X)=X$ のときは
  \begin{equation}
    M_{cX}(t)=M_X(ct)
  \end{equation}
 
 \item[積率母関数の定理2] $X$ を確率変数、$g(X)$ をその関数、
                        $c$ を任意の定数とすれば 

 \begin{equation}
   M_{g(X)+c}=e^{ct}M_{g(X)}(t).  \label{bokansuu-g(x)+c}
 \end{equation}
＜証明＞ 
 \begin{eqnarray}
   M_{g(X)+c}(t)&=&\int_{-\infty}^{\infty}e^{t(g(x)+c)} f(x)dx  \nonumber  \\
                &=&\int_{-\infty}^{\infty}e^{tg(x)} \cdot 
                      e^{ct} f(x)dx  \nonumber  \\
                &=&e^{ct} \cdot M_{g(X)}(t).  \nonumber
 \end{eqnarray}
       ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)  
\end{description}

式(\ref{bokansuu-g(x)+c})で $g(X)=X$ のとき
  \begin{equation}
     M_{X+c}(t)=e^{ct}M_{X}(t)
  \end{equation}

 式(\ref{bokansuu-g(x)+c})で $g(X)=X,c=-\mu$ のとき
  \begin{equation}
    M_{X-\mu}(t)=e^{-\mu t}M_X(t)  \label{chushinbokansuu}
  \end{equation}

$M_{X-\mu}(t)$は{\bf 中心積率母関数}と呼ばれ、確率変数の平均値に対する
偏差の積率母関数となっている。この中心積率母関数は原点積率母関数に
$e^{-\mu t}$ をかけたものに等しい。$M_{X-\mu}(t)$ を
ベキ級数に展開するか\footnote{(\ref{chushinbokansuu})式に
(\ref{bokansuu-kyusu})式を代入すると大変。つまり、
\begin{equation}
 M_{X-\mu}(t)=e^{-\mu t} \cdot E(e^{tX})
             =e^{-\mu t} \cdot E(1+tX+\frac{1}{2!}t^2X^2+\cdots) \nonumber 
\end{equation}
とすると、とっても面倒になる。下のようにすればいい。
\begin{eqnarray}
M_{X-\mu}(t)=E(e^{t(X-\mu)})
         &=&E\{1+t(X-\mu)+\frac{1}{2!}t^2(X-\mu)^2
                   +\cdots+\frac{1}{k!}t^k(X-\mu)^k+\cdots\}  \nonumber  \\
         &=&1+tE(X-\mu)+\frac{1}{2!}t^2E\{(X-\mu)^2\}+\cdots        
\end{eqnarray}
}、
または$M_{X-\mu}(t)$ を$k$ 回微分して$t=0$ と
おけば$k$ 次の中心積率が得られる。
 \begin{equation}
\frac{d^k}{dt^k}M_{X-\mu}(t)|_{t=0}= \mu_k.
\footnote{\begin{eqnarray}
 M_{X-\mu}(t)&=&\int_{-\infty}^{\infty} e^{t(x-\mu)} f(x)dx \cdot    
                       \frac{d^k}{dt^k}M_{X-\mu}(t) \nonumber  \\
             &=&\int_{-\infty}^{\infty} e^{t(x-\mu)}(x-\mu)^k 
                  f(x)dx \cdot \frac{d^k}{dt^k}M_{X-\mu}(t)|_{t=0}     
   =\int_{-\infty}^{\infty} (x-\mu)^k f(x)dx = \mu_k. \nonumber
%    \label{chushinbokansuu}
   \end{eqnarray}}  
\end{equation}

\section{多変数分布}\footnote{カイ二乗分布、$t$ 分布を議論する際、
本当は多変数(三変数以上)についての、確率変数の和の分布を知る必要がある。
このノートでは、積率母関数を除き、二変数について扱うものとする。}
二つまたは二つ以上の確率変数を同時に考える必要がしばしば起こる。
これは標本空間の各標本点に二つまたは二つ以上の実数値が相伴って対応してい
る場合といえる。例えば標本点$\omega$ を任意に抽出された世帯
とし、これに三つの確率変数$X(\omega),Y(\omega),Z(\omega)$ を対応させる。
$X$ は収入、$Y$ は家族の人数、$Z$ は食費と考えてよい。
この三変数は相互に関連しながら確率的に変化する。ある場合には標本空間その
ものが$n$ 次元空間であって、標本点は$n$ 個の座標によって決定されるその
空間内の一点を定めることも考えられる。例えば$2$ 枚のコインを投げる場合、
表を$1$、裏を$0$ とすると、標本点は$(1,1),(1,0),(0,1),(0,0)$ であり、
標本空間は$2$ 次元となる。

\vspace{5mm}
このような$n$ 個の座標によって決定される標本点についても確率が定まる。
この章では二つ(以上)の確率変数の同時分布について考える。

\subsection{離散的二変数分布}
%\subsubsection{離散的二変数分布の場合}
確率変数の定義された標本空間を$S$ とし、$X,Y$ を$\Omega$ の上で
定義された二つの離散的確率変数とする。任意の標本点が$X=x_i,~Y=y_j$ とい
う実現値をとる確率は、このような値をとる標本点の確率の和に等しい。この
確率を  \\
\begin{equation}
  f(x_i,y_j)\equiv P(X=x_i,Y=y_j)
\end{equation}
で示す。
上の式を$i=1,2,\cdots,m,~j=1,2,\cdots,n$ の全てについて考えるとき、
これを二変数$X,Y$ の{\bf 同時度数関数}という。明らかに
\[  f(x_i,y_j)\geq 0,  \]  
\[   \sum_i \sum_j f(x_i,y_j)=1 \]
である。$X,Y$ の{\bf 同時分布関数}は次の式で定義される。 \\
\begin{equation}
  F(x_i,y_j)=P(X\leq x_i,Y\leq y_j)=\sum_{x\leq x_i} \sum_{y\leq y_j}
                f(x,y).
\end{equation}
 
\vspace{5mm}
いま$Y$ の値は何でもいいからとにかく$x_i$ がでる確率
$P(X=x_i)(これをg(x_i)$ とおく)は
\[ g(x_i)=\sum_j f(x_i,y_j)   \]
である。この計算は$x_i$ のすべての値に対してすることができるから、 \\
\begin{equation}
  g(x)=\sum_y f(x,y)
\end{equation}
は$X$ の確率分布を示す。$g(x)$ を$X$ の{\bf 周辺度数(関数)}という。同様
にして  \\
\begin{equation}
  h(y)=\sum_x f(x,y)
\end{equation}
は$Y$ の周辺度数(関数)を与える。$X,Y$ の同時密度関数が与えられるとき、
その周辺度数は一意的に定まる。

\vspace{5mm}
$Y$ の値が一定値(例えば$y$)に定められたときの$X$ の条件付き確率を 
$f(x|y)$ とすれば\footnote{確率の教科書では、条件つき確率は以下の様に
求められている。事象$A$ が起こったときに事象$B$ が起こるという
条件つき確率を$P_A(B)$ で表す。事象$A,B$ を表す集合をそれぞれ${\bf A,B}$ とし、
事象$A$ の起こる場合の数を$n({\bf A})$ で表す。ただし$n({\bf A}) \neq 0$ 
とする。また標本空間を${\bf U}$ とする。
事象$A$ も$B$ も起こる場合は${\bf A} \cap {\bf B}$ で表される。この
${\bf A} \cap {\bf B}$ は集合${\bf A}$ の部分集合である。従って、
条件つき確率は\\
\begin{equation}
P_A(B)=\frac{n({\bf A} \cap {\bf B})}{n({\bf A})} \label{jokentuki}
\end{equation}
となる。条件つき確率の場合、分母が$n({\bf A})$ となることに注意しなけれ
ばならない。単に事象$A$ も$B$ も起こるという確率は 
\[P({\bf A} \cap {\bf B})=\frac{n({\bf A} \cap {\bf B})}{n({\bf U})} \]
である。
(\ref{jokentuki})式の右辺の分母、分子を
$n({\bf U})$ で割ると、条件つき確率は次の式で表される。 \\
\begin{equation}
P_A(B)=\frac{P({\bf A} \cap {\bf B})}{P({\bf A})}.
\end{equation}}  \\
\begin{equation}
  f(x|y)=\frac{f(x,y)}{h(y)}~~~h(y)\neq 0  \label{jokentuki-kakuritu}
\end{equation}
である。いまもし$X$ と$Y$ が互いに独立ならば  
\[ f(x|y)=g(x),~~~f(y|x)=h(y)   \]
であるから  \\
\begin{equation}
  f(x,y)=g(x)h(y)
\end{equation}
である。

\subsection{連続的二変数分布}
 $X,Y$ を標本空間$\Omega$ の上で定義された二つの連続的確率変数とし、
$A$ を$xy$ 平面上の点$(x,y)$ の任意の部分集合とする。このとき
点$(x,y)$ がこの部分集合に属することに対して一定の確率が定まるならば、
二変数$X,Y$ の同時分布を定めることができる。いま変域$-\infty <x< \infty,
-\infty <y< \infty$ のすべての$x,y$ に対して非負の関数$f(x,y)$ が存在し、
$xy$ 平面上の任意の領域$A$ に対して次の関係が成り立つとき、$f(x,y)$
 を二変数$X,Y$ の{\bf 同時密度関数}という。 \\
\begin{equation}
  P\left[(X=x,Y=y) \in A \right]=\int \int_A f(x,y)dxdy.\footnote{分布関数なので、右辺の値は0から1である。}
\end{equation}
明らかに 
\[ \int_{-\infty}^\infty \int_{-\infty}^\infty f(x,y)dxdy=1  \]
である。
{\bf 同時分布関数}は次の式で定義される。
\begin{eqnarray}
    F(x,y)&=&P(X\leq x,Y\leq y)     \nonumber \\
          &=&\int_{-\infty}^x \int_{-\infty}^y f(x,y)dydx.
\end{eqnarray}
故に一変数の場合と同様にこの場合も密度関数は分布関数を微分して求める
ことができる。  \\
\begin{equation}
  f(x,y)=\frac{\partial^2}{\partial x \partial y}F(x,y).
\end{equation}
離散変数の場合と同様に、変数$X,Y$ の単独の密度関数(周辺分布という)は
次の式によって与えられる\footnote{$g(x)$ は、まず$x=x$ と
$x$ の値を固定し、$y$ の値について足し合わせていく。その後、$x$ の値は
動いても構わない。}。  
\begin{eqnarray}
  g(x)&=&\int_{-\infty}^\infty f(x,y)dy,  \nonumber \\
  h(y)&=&\int_{-\infty}^\infty f(x,y)dx.
\end{eqnarray}
即ち一変数の分布は二変数の同時分布をもう一方の変数
に関して積分することによって導かれる。

\vspace{5mm}
%次に変数$Y$ が区間$(y,y+dy)$ にあるとき、$X$ が区間$(x,x+dx)$ におちる
%確率は、条件付き確率の定義により\footnote{1行目の右辺が特に分からない。}  
%\begin{eqnarray}
%  f(x|y)dx&=&\frac{f(x,y)dxdy}{h(y)dy}  \nonumber \\
%          &=&\frac{f(x,y)dx}{h(y)}.  \nonumber
%\end{eqnarray}
条件付き確率の場合と同様、周辺分布についても
\begin{equation}
 f(x|y)=\frac{f(x,y)}{h(y)},~~f(y|x)=\frac{f(x,y)}{g(x)}
\end{equation}
が成り立つ。これらの式で定められる分布を$Y$(または$X$) に対する、あるいは
$Y$(または$X$) を条件とする$X$(または$Y$) の{\bf 条件付き分布}という。
上式の$f(x|y),f(y|x)$ がそれぞれ密度関数を定めることは次の通り明らかであ
る。即ち$f(x|y),f(y|x)$ はいずれも二つの確率密度の比であるから非負である。
また明らかに  \\
\begin{eqnarray}
  \int_{-\infty}^\infty f(x|y)dx 
       &=&\int_{-\infty}^\infty \frac{f(x,y)}{h(y)}dx
        =\frac{1}{h(y)}\int_{-\infty}^\infty f(x,y)dx \nonumber \\
       &=&\frac{1}{h(y)}h(y)=1   \nonumber
\end{eqnarray}
である。

\vspace{5mm}
いまもし$f(x|y)=f(x,y)/h(y)$ が$Y$ に無関係ならば、即ちこの式の右辺を整
理して$y$ を含まない式になるときは、$f(x|y)=g(x)$ であり、従って  \\
\begin{equation}
  f(x,y)=g(x)h(y)
\end{equation}
となる。$f(y|x)=h(y)$ のときも同様である。このことは次のことを意味する。

\begin{description}
 \item[二変数分布の定理1]  $P(X\in A,Y\in B)=P(X\in A)P(Y\in B)$、即ち$X,Y$ が互いに
独立ならば、$X,Y$ の同時分布はそれぞれ$X,Y$ のみを含む二関数の積の形で
表される。逆に同時分布がそれぞれ$X$ または$Y$ だけの関数の積として示す
ことができ、かつそれぞれの変数の変域が互いに無関係のときは、二変数$X,Y$ 
は互いに独立である。
\end{description}
$X,Y$ が互いに独立ならば、その分布関数についても明らかに次の関係が成り立
つ。  \\
\begin{equation}
   F(x,y)=F(x)F(y).
\end{equation}

\subsection{二変数分布の積率}
一変数分布の場合と同様にして二変数分布に対しても変数の期待値が定義される。 
$X,Y$ を二つの連続確率変数、その同時密度関数を$f(x,y)$ とし、$X,Y$ の
任意の関数を$\phi(X,Y)$ とすれば、関数$\phi(X,Y)$ の{\bf 期待値}は次式で
定義される。  \\
\begin{equation}
 E\left[\phi(X,Y)\right]=\int_{-\infty}^\infty \int_{-\infty}^\infty
                         \phi(x,y)f(x,y)dxdy
\end{equation}
$X,Y$ が離散変数の場合も期待値をこれに準じて定義することができる。

\vspace{5mm}
二つの確率変数が互いに独立のとき、その積の期待値について次の定理が成り
立つ。
\begin{description}
 \item[二変数分布の定理2] 二つの確率変数が互いに独立のとき、その積の期待値は
  各変数の期待値の積に等しい。
\end{description}
＜証明＞ \\
いま$\phi(X,Y)=XY$ とすれば、二変数の積$XY$ の期待値は
\[ E(XY)=\int_{-\infty}^\infty \int_{-\infty}^\infty
                   xyf(x,y)dxdy   \] 
で定められる。もし$X,Y$ が互いに独立ならば、$f(x,y)=g(x)h(y)$ であるから 
\begin{eqnarray}
  E(XY)&=&\int_{-\infty}^\infty xg(x)dx 
                  \int_{-\infty}^\infty yh(y)dy \nonumber \\ 
       &=&E(X)E(Y)
\end{eqnarray}
である。~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
(証明終わり)  \\
この定理は三変数以上の場合に拡張される。

\vspace{5mm}
二変数分布の場合も$X,Y$ のそれぞれの周辺分布に対してそれぞれの積率が定ま
るが、この他に$X,Y$ の同時分布に対しても次のような{\bf 同時積率}が定義さ
れる。$X,Y$ が確率変数のとき次の式で定まる値
\[ E\left[(X-a)^r (Y-b)^s\right]  \]
を$X,Y$ の$X=a,~Y=b$ に対する$r,s$ 次の積率という。いま$a=b=0$ とおけば
$X,Y$ の原点積率 
\begin{equation}
 \mu_{rs}'=E(X^r Y^s)=\int_{-\infty}^\infty \int_{-\infty}^\infty
                       x^r y^s f(x,y) dxdy
\end{equation}
が定義され、$a=E(X)=\mu_X,~b=E(Y)=\mu_Y$ とおけば中心積率 
\begin{eqnarray}
  \mu_{rs}&=&E\left[(X-\mu_X)^r (Y-\mu_Y)^s \right] \nonumber \\
           &=&\int_{-\infty}^\infty \int_{-\infty}^\infty
              (x-\mu_X)^r (y-\mu_Y)^s f(x,y)dxdy           
\end{eqnarray}
が定義される。特に  
\begin{equation}
 \mu_{11}=\int_{-\infty}^\infty \int_{-\infty}^\infty
               (x-\mu_X)(y-\mu_Y)f(x,y)dxdy
\end{equation}
を$X,Y$ の{\bf 共分散}と称し、記号$cov(X,Y)$ あるいは$\sigma_{XY}$ で示
す。次の関係式は重要である。  
\begin{eqnarray}
  cov(X,Y)&=&\mu_{11}=E\left[(X-\mu_X)(Y-\mu_Y)\right] \nonumber \\
          &=&E\left[XY-\mu_X Y-\mu_Y X+\mu_X \mu_Y \right]  \nonumber  \\
          &=&E(XY)-\mu_X E(Y)-\mu_Y E(X)+\mu_X \mu_Y  \nonumber  \\
          &=&\mu_{11}'-\mu_X \mu_Y  \label{jo-sekiritu}
\end{eqnarray}
$E(XY)=\mu_{11}'$ を(原点に対する)$X,Y$ の{\bf 乗積率}という。$X,Y$ が互
いに独立なときは二変数分布の定理2により$E(XY)=E(X)E(Y)$、即ち
$\mu_{11}'=\mu_X \mu_Y$ であるから、(\ref{jo-sekiritu})式は$0$ となる。
即ち二変数が互いに独立のとき、その共分散は$0$ である。ただしこの逆は
必ずしも真ではない。

\vspace{5mm}
なお、同時積率の記号を用いて$X,Y$ の平均値や分散を次のように表記すること
ができる。(以下、確率変数表示の添字には便宜上小文字を用いる。)
\begin{eqnarray}
 E(X)&=&\mu_x=E(X^1 Y^0)=\mu_{10}' \nonumber  \\
 E(Y)&=&\mu_y=\mu_{01}' \nonumber  \\ 
 var(X)&=&\sigma_x^2=E\left[(X-\mu_x)^2\right]=\mu_{20}  \nonumber \\
 var(Y)&=&\sigma_y^2=\mu_{02}  \nonumber   \\
 cov(X,Y)&=&\sigma_{xy}=\mu_{11}  \nonumber
\end{eqnarray}

\vspace{5mm}
例として二変数$X,Y$ の和および差の分散を求めると次のようになる。
\begin{eqnarray}
 var(X \pm Y)&=&E\left[X\pm Y-E(X\pm Y)\right]^2 \nonumber  \\
             &=&E\left[(X-\mu_x)\pm (Y-\mu_y)\right]^2 \nonumber \\
             &=&E\left[(X-\mu_x)^2\right]+E\left[(Y-\mu_y)^2\right]
                 \pm 2E\left[(X-\mu_x)(Y-\mu_y)\right] \nonumber \\
             &=&\sigma_x^2+\sigma_y^2\pm 2\sigma_{xy} \label{2hensuu-bunsan}
\end{eqnarray}
いまもし$X,Y$ が互いに独立ならば共分散は$\sigma_{xy}=0$ である。
よってこのときは  \\
\begin{equation}
 var(X\pm Y)=\sigma_x^2+\sigma_y^2
\end{equation}
となる。すなわち次の定理が成り立つ。
\begin{description}
 \item[二変数分布の定理3] 二変数$X,Y$ が互いに独立ならば、その和(または
差)の分散は各変数の分散の和に等しい。 \label{nihensu-teiri3}
\end{description}
この定理は三変数以上の場合にも拡張される。

\subsection{多変数分布の積率母関数}
ここではまず、二変数分布について述べる。
二変数$X,Y$ の同時分布の{\bf 積率母関数}は次式によって定義される。
\begin{equation}
 M_{X,Y}(t_x,t_y)=E(e^{t_x X+t_y Y})
\end{equation}
いま$X,Y$ を共に連続変数とすれば、積率母関数は次式で計算される。
\begin{equation}
  M(t_x,t_y)=\int_{-\infty}^\infty \int_{-\infty}^\infty
            e^{t_x x+t_y y} f(x,y)dxdy
\end{equation}
一変数の場合と同様に、この母関数は次のような形にベキ級数展開される。 \\
\begin{equation}
  M(t_x,t_y)=\sum_{r,s=0}^\infty \mu_{rs}' \frac{t_x^r t_y^s}{r!s!}.\footnote{
\[ M(t_x,t_y)=E(e^{t_x X \cdot e^{t_y Y}})
    =(\sum(t_x x)^r \cdot \frac{1}{r!})(\sum(t_y y)^s \cdot \frac{1}{s!})
    =\sum((t_x x)^r \cdot \frac{1}{r!})((t_y y)^s \cdot \frac{1}{s!}). \]
 $E(1+t_x X+t_y Y+\frac{1}{2!}(t_x X+ t_y Y)^2 \cdots )$
として計算してもいいが、大変。また、
 \[  \mu_{rs}'=E(X^r Y^s)=\int \int x^r y^s f(x,y) dxdy.\]  }
\end{equation}
従って任意の次数の同時積率が次の計算によって得られる。 \\
\begin{equation}
 \mu_{rs}'=\frac{\partial^{r+s}}{\partial t_x^r \partial t_y^s}
           M(t_x,t_y) |_{t_x=0 \atop t_y=0}.\footnote{$r-1,s-1$ までの項は
   微分されて落ち、$r+1,s+1$ 以上の項は$t_x=0,t_y=0$ で消える。}
\end{equation}
同様にして平均値に対する{\bf 中心積率母関数}が次のように定義される。\\
\begin{equation}
  M_{X-\mu_x,Y-\mu_y}(t_x,t_y)=\left[e^{t_x(X-\mu_x)+t_y(Y-\mu_y)}\right]
\end{equation}
$X,Y$ が互いに独立のときは$f(x,y)=g(x)h(y)$ であるから
\begin{eqnarray}
 M_{X,Y}(t_x,t_y)&=&\int_{-\infty}^\infty e^{t_x x}g(x)dx
                     \int_{-\infty}^\infty e^{t_y y}h(y)dy \nonumber \\
                 &=&M_X(t_x)\cdot M_Y(t_y)  \label{nihensu-bokansu}
\end{eqnarray}
となる。よって次の定理が得られる。
\begin{description}
 \item[二変数分布の定理4] 二変数$X,Y$ が互いに独立のときは、その同時分布の
  積率母関数は各変数の積率母関数の積に等しい。
\end{description}

\vspace{5mm}
二変数分布の定理4は、多変数分布について次のように拡張できる。
 \begin{description}
  \item[独立変数の和の積率母関数の定理] 
    確率変数$X_1,X_2,\cdots$ が互いに独立でかつ積率母関数$M_{X_1}(t),
    M_{X_2}(t),\cdots$ を有するとき、$Y=X_1+X_2+\cdots$ の積率母関数は \\
   \begin{equation}
    M_Y(t)=M_{X_1}(t) \cdot M_{X_2}(t) \cdots  \label{sekiritubokansu-x1x2x3}
   \end{equation}
   で与えられる。 \\
   ＜証明＞ 連続変数のばあいについて考える。定義により 
    \begin{eqnarray}
      M_Y(t)&=&E(e^{tY})=E\left[e^{t(X_1+X_2+\cdots)}\right] \nonumber \\
            &=&\int_{-\infty}^\infty \cdots \int_{-\infty}^\infty
               e^{t(x_1+x_2+\cdots)} f(x_1,x_2,\cdots)
                          dx_1 dx_2 \cdots \nonumber  \\
            &=&\int_{-\infty}^\infty e^{tx_1}f_{X_1}(x_1)dx_1 
                \int_{-\infty}^\infty e^{tx_2}f_{X_2}(x_2)dx_2
                \cdots   \nonumber \\
            &=&M_{X_1}(t) M_{X_2}(t) \cdots \nonumber
    \end{eqnarray}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり) 
\end{description}


\subsection{二変数分布の変数変換}\footnote{一変数の場合の変数変換は
\ref{sec-t-bunpu}の$t$ 分布の節で用いる。二変数分布の変数変換は、
直接使う訳ではなかった。$X,Y$の同時分布が与えられており、$U=X+Y$などの分布を
求める場合、変数変換によって解くこともできる。}
% X+Y について
この節では連続変数について考える。またこの節においては、確率変数$X$ の
密度関数を$f_X$ と表記する。確率変数$X$ の密度関数$f_X(x)$ 
 が与えられたとき、$X$ を$X$ の関数${\bf Y}={\bf g}({\bf X})$ で変数
変換することを考える。このとき$Y$ の密度関数は次式で定められる。
\begin{equation}
  f_Y(y)=f_X\{g^{-1}(y)\}\left|\frac{dx}{dy}\right|  \label{hensuuhennkan1}
\end{equation}
ただし$g^{-1}(Y)$ は$g(X)$ の逆関数$(X=g^{-1}(Y))$であり、$g(X)$ の逆関
数が存在するとき(一変数分布の場合は$g(X)$ が単調増加もしくは単調減少の時)
のみを考える。すなわち$Y$ の密度関数は
$f_X(x)$ の$x$ を$x=g^{-1}(y)$ で$y$ におきかえてそれに$dx/dy$ (の絶対値)を
かければよいのであって、このとき$dx/dy$ は$X$ の確率素分$f(x)dx$ を$Y$ 
 の確率素分$f(y)dy$ に変換するための換算因子の働きをしている。 \\
＜(\ref{hensuuhennkan1})式の証明＞ \\
まず$Y=g(X)$ が増加関数の場合について考える。$g(X)$ は単調増加であるから
逆関数$X=g^{-1}(Y)$ も単調増加である。いま$X$ の分布関数を$F_X(x),a$ を
$X$ の任意の値とすれば
\[  F_X(a)=P(X \le a)=\int_{-\infty}^a f_X(x) dx.   \]
$Y$ の分布関数を$F_Y(y)$ とすれば
\[  F_Y\{g(a)\}=P[Y \le g(a)]=P(X \le a)=F_X(a)  \]
である。よって
\[  \int_{-\infty}^{g(a)} f_Y(y) dy=\int_{-\infty}^a f_X(x) dx  \]
右辺を$x=g^{-1}(y),~f_X(x)=f_X\{g^{-1}(y)\},~dx=\frac{d}{dy}g^{-1}(y)
dy$ で置き換えると
\[ \int_{-\infty}^{g(a)} f_Y(y) dy
   =\int_{-\infty}^{g(a)} f_X\{g^{-1}(y)\} \frac{d}{dy}g^{-1}(y) dy  \]
となり、従って
\[  f_Y(y)=f_X\{g^{-1}(y)\} \frac{d}{dy}g^{-1}(y)     \]
となる。  \\
$Y=g(X)$ が$X$ の減少関数であるときは、
\[  F_Y\{g(a)\}=P[Y \le g(a)]=P(X > a)    \]
であるから
\begin{eqnarray}
 \int_{-\infty}^{g(a)} f_Y(y) dy&=&\int_a^\infty f_X(x) dx
         =\int_\infty^a -f_X(x) dx  \nonumber  \\
        &=&\int_{-\infty}^{g(a)} -f_X\{g^{-1}(y)\} 
            \frac{d}{dy}g^{-1}(y) dy \nonumber
\end{eqnarray}
となる。従って
\[  f_Y(y)=-f_X\{g^{-1}(y)\} \frac{d}{dy}g^{-1}(y).    \]
このとき減少関数$g^{-1}(y)$ の導関数は負であるから、$f_Y(y)$ は正である。
以上の結果を合わせると、(\ref{hensuuhennkan1})式となる。~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)


\vspace{5mm}
次にこの考え方を拡張して二変数分布の場合の変数変換の方法を考える。問題は
確率変数$X,Y$ の同時分布$f_{X,Y}(x,y)$ が与えられているとき、$X,Y$ の
与えられた関数$U=g(X,Y),~V=h(X,Y)$ の同時分布$f_{U,V}(u,v)$ を求めること
である。ただし関数$g,h$ は$X,Y$ の変域内で連続かつ微分可能とする。このと
き$X,Y$ の同時分布の確率素分$f(u,v)dudv$ に変換するための換算因子(一変数
のときの$dx/dy$ に相当するもの)は次式で与えられる。
\begin{equation}
 J=\frac{\partial (x,y)}{\partial (u,v)}
  =\left| \pmatrix{ 
      \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \cr
      \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \cr  }
      \right|   \label{yakobian}
\end{equation}
この換算因子を($U,V$ に関する$X,Y$ の){\bf ヤコービアン}という。\\
＜ヤコービアンに関する説明＞ 

 一組の変数$U,V$ が他の一組の変数$X,Y$ の関数として次の式
\begin{equation}
  U=g(X,Y),~~~V=h(X,Y) \label{u-v}
\end{equation}
で表されていて、$g$ および$h$ は連続でかつ微分できるものとする。もし
$X$ に一定の値を与えれば、これら二つの式から$Y$ を消去して$U$ および
$V$ を結び付けることができる。幾何学的には、$X=$const は$UV$ 平面上の
一つの曲線を表す。同様に$Y=$const もまた一つの曲線を表す。即ち
$X=c_1,X=c_2,\cdots$ 等は一群の曲線を、$Y=k_1,Y=k_2,\cdots$ 等は他の
一群の曲線を表す。もし式(\ref{u-v})の逆関数があるときはこれを
\begin{equation}
 X=G(U,V),~~~Y=H(U,V)  \label{x-y}
\end{equation}
とし、$G$ および$H$ は連続でかつ微分できるものとする。ある平面上に
おいて$X$ を横軸、$Y$ を縦軸にとれば、$U=a_1,U=a_2,\cdots$ および
$V=l_1,V=l_2,\cdots$ 等はそれぞれ曲線群を表すことになる。
(\ref{u-v})を(\ref{x-y})に代入すれば
\[  X=G(g(X,Y),h(X,Y)),~~~Y=H(g(X,Y),h(X,Y))     \]
が得られる。これらをそれぞれ$X$ および$Y$ に関して微分すれば、
\begin{eqnarray}
     1&=&\left.\frac{\partial G}{\partial U}\right|_V 
        \left.\frac{\partial g}{\partial X}\right|_Y 
       +\left.\frac{\partial G}{\partial V}\right|_U 
        \left.\frac{\partial h}{\partial X}\right|_Y,
   ~~~0=\left.\frac{\partial G}{\partial U}\right|_V
        \left.\frac{\partial g}{\partial Y}\right|_X
       +\left.\frac{\partial G}{\partial V}\right|_U
        \left.\frac{\partial h}{\partial Y}\right|_X, \nonumber \\
    0&=&\left.\frac{\partial H}{\partial U}\right|_V
        \left.\frac{\partial g}{\partial X}\right|_Y
       +\left.\frac{\partial H}{\partial V}\right|_U
        \left.\frac{\partial h}{\partial X}\right|_Y,
   ~~~1=\left.\frac{\partial H}{\partial U}\right|_V
        \left.\frac{\partial g}{\partial Y}\right|_X
       +\left.\frac{\partial H}{\partial V}\right|_U
        \left.\frac{\partial h}{\partial Y}\right|_X. \nonumber
\end{eqnarray}
ゆえに
\begin{equation}
 J=\frac{\partial G}{\partial U} \frac{\partial H}{\partial V}
   -\frac{\partial G}{\partial V} \frac{\partial H}{\partial U} 
  =\frac{\partial x}{\partial u} \frac{\partial y}{\partial v}
   - \frac{\partial x}{\partial v} \frac{\partial y}{\partial u}
\end{equation}
が$0$ でなければ\footnote{
\begin{equation}
 \pmatrix{x \cr y \cr}=\pmatrix{a & b \cr c & d \cr}
    \pmatrix{u \cr v \cr}    \nonumber
\end{equation}
であるとすると、
\begin{equation}
 \pmatrix{u \cr v \cr}=\frac{1}{ad-bc}\pmatrix{ d & -b \cr -c &  a \cr}
      \pmatrix{x \cr y \cr}.    \nonumber
\end{equation}
結局、$J=ad-bc \ne 0$ は逆行列が存在するための条件。
}、
\[ \frac{\partial g}{\partial X}=\frac{1}{J}\frac{\partial H}{\partial V},
~~\frac{\partial g}{\partial Y}=-\frac{1}{J}\frac{\partial G}{\partial V},
~~\frac{\partial h}{\partial X}=-\frac{1}{J}\frac{\partial H}{\partial U},
~~\frac{\partial h}{\partial Y}=\frac{1}{J}\frac{\partial G}{\partial U}   \]
が得られる。以上より、
\[J=\left| \pmatrix{ 
      \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \cr
      \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \cr  }
      \right|
   =\frac{\partial (x,y)}{\partial (u,v)}.  \]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(説明終わり)    

\vspace{5mm}
(\ref{hensuuhennkan1})式に対応し、
二変数分布の変数変換については次の定理が成り立つ。
\begin{description}
 \item[二変数分布の定理5] $X,Y$ の同時密度関数が$f_{X,Y}(x,y)$ で与えら
	 れ、関数$U=g(X,Y),~V=h(X,Y)$ が$X,Y$ の変域内で連続かつ微分可能
	 なとき、$U,V$ の同時密度関数は次式で与えられる。 
   \begin{equation}
     f_{U,V}(u,v)=f_{X,Y}\{G(u,v)H(u,v)\}
         \left|\frac{\partial(x,y)}{\partial(u,v)}\right|  \label{2hensuu-5}
  \end{equation}
	    ただし$G(u,v),H(u,v)$ は$g(x,y),h(x,y)$ の逆関数である。
\end{description}
＜証明＞  \\
ヤコービアンが$X,Y$ の変域内で$0$ でなければ$X,Y$ の逆関数
\[   X=G(U,V),~~~~Y=H(U,V)  \]
が一価的に定まる。よって$xy$ 平面上の任意の領域$R$ に含まれる点$(x,y)$ 
は$uv$ 平面上のこれに対応する領域$S$ 内の一点$(u,v)$ と一対一で対応する。
このとき点$(x,y)$ が集合$R$ に属する確率は点$(u,v)$ が集合$S$ に属する
確率に等しい。即ち
\[ P[(u,v) \in S]=P[(x,y) \in R]   \]
である。この関係から
\[ \int \int_S f_{U,V}(u,v)dudv 
         =\int \int_R f_{X,Y}(x,y)dxdy  \]
が成り立つ。ここで
\[   X=G(U,V),~~~~Y=H(U,V)  \]
による変数変換を考える。$XY$座標系において、ベクトル$(dx,0),(0,dy)$
間の面積は
\[  \left|(dX,0) \times (0,dY)\right|
    = \left|
      \begin{array}{@{\,}cc@{\,}}
       dX & 0  \\
       0  & dY 
       \end{array}
       \right|= dXdY        \]
となる。ところで、
\begin{eqnarray}
  dX&=&\frac{\partial G}{\partial U}dU
            + \frac{\partial G}{\partial V}dV, \nonumber \\
  dY&=&\frac{\partial H}{\partial U}dU
            + \frac{\partial H}{\partial V}dV \nonumber
\end{eqnarray}
であるから、次に$UV$座標系におけるベクトル、
$(\frac{\partial G}{\partial U}dU,\frac{\partial G}{\partial V}dV),
(\frac{\partial H}{\partial U}dU,\frac{\partial H}{\partial V}dV)$
間の面積は次のようになる。
\[ \left|(\frac{\partial G}{\partial U}dU,\frac{\partial G}{\partial
V}dV) \times (\frac{\partial H}{\partial U}dU,\frac{\partial H}
 {\partial V}dV) \right|=   
  \left|
  \begin{array}{@{\,}cc@{\,}} 
 \frac{\partial G}{\partial U}dU & \frac{\partial H}{\partial U}dU  \\ 
 \frac{\partial G}{\partial V}dV  & \frac{\partial H}{\partial V}dV  
  \end{array}
  \right|
    =  J dUdV.                \]
よって
\begin{eqnarray}         
  \int \int_S f_{U,V}(u,v)dudv 
  &=&\int \int_R f_{X,Y}(x,y)dxdy \nonumber     \\
  &=&\int \int_S f_{X,Y}\{G(u,v)H(u,v)\}
           \left|\frac{\partial(x,y)}{\partial(u,v)}\right| dudv \nonumber
\end{eqnarray}
という関係が導かれる。この関係は$uv$ 平面上のどのような集合$S$ について
も成り立つから、二変数分布の定理5が成り立つ。~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)

\vspace{5mm}
即ち$U,V$ の同時密度関数を求めるためには$X,Y$ の変換式$U=g(X,Y),~V=h(X,Y)$
 を$X,Y$ について解いてこれを$X,Y$ の同時密度関数$f_{X,Y}(x,y)$ に代入し、
$U,V$ に関する$X,Y$ のヤコービアンの絶対値を確率素分の変換因子としてかけ
ればいい。新しい変数$U,V$ の変換は$X,Y$ の変域と$U=g(X,Y),~V=h(X,Y)$ の
関係からそれぞれの場合につき決定される。なおヤコービアンの式(\ref{yakobian})
の計算については
\[ \frac{\partial(x,y)}{\partial(u,v)}
     =\left[ \frac{\partial(u,v)}{\partial(x,y)}\right]^{-1}
     = \left| \pmatrix{ 
      \frac{\partial u}{\partial x} & \frac{\partial u}{\partial y} \cr
      \frac{\partial v}{\partial x} & \frac{\partial v}{\partial y} \cr  }
      \right|^{-1}         \]
であるから、左辺よりも右辺の方が計算しやすいときにはこの方法で計算すれば
よい。

\begin{description}
 \item[問題例1] $X,Y$ の同時分布が$f(x,y)=e^{-(x+y)},~x>0,~y>0$ で与えら
	れ、$U=X+Y,~V=X/Y$ と定めたとき、$f(u,v)$ を求めよ。 \\
      $U,V$ の逆関数は
     \[ X=\frac{UV}{1+V},~~~Y=\frac{U}{1+V}   \] 
   であるから変数変換のヤコービアンは
  \[ J=\left| \pmatrix{ 
      \frac{v}{1+v} & \frac{u}{(1+v)^2} \cr
      \frac{1}{1+v} & \frac{-u}{(1+v)^2} \cr  }
      \right| = \left|\frac{-u}{(1+v)^2}\right|  \]  
   となる。(ただしこの場合は変換式をそのまま使ってヤコービアンの逆数を
   求める方が計算は簡単である。即ち
  \[ J^{-1}=\left| \pmatrix{ 
                  1 & 1 \cr
      \frac{1}{y} & -\frac{x}{y^2} \cr  }
      \right|=\left|\frac{-(x+y)}{y^2}\right|
          =\left|\frac{-(1+v)^2}{u}\right|  \]
    となる。)よって$U,V$ の同時分布は
  \[  f_{U,V}(u,v)=e^{-u}\left|\frac{-u}{(1+v)^2}\right|  \]
                  
     で定められる。$u,v$ の変域は$x>0,~y>0$ であるから$u=x+y>0,~v=x/y>0$
    である。よって
\[      f_{U,V}(u,v)=\frac{ue^{-u}}{(1+v)^2} \] 
\end{description}
  
\vspace{5mm}
$X,Y$ の同時分布$f(x,y)$ が与えられていてこの二変数の与えられた一関数
$g(X,Y)$ の分布を求めるときも以上の方法を応用して計算することができる。
即ち$U=g(X,Y),~V=X$ または$V=Y$ とおいて$f_{X,Y}(x,y) \to f_{U,V}(u,v)$    
 の変換を行ない、$f_U(u)=\int f_{U,V}(u,v)dv$ であるから$f_{U,V}$ を
$V=X$ または$V=Y$ の変域について積分すればよい。具体例は次の通りである。

\begin{description}
 \item[問題例2]  $f(x,y)=e^{-(x+y)},~x>0,~y>0$ のとき$U=X+Y$ の分布を
  求めよ。
 \[ U=X+Y,~~~~V=Y  \]
 とおけば、逆関数は
 \[ X=U-V,~~~~Y=V        \]
 である。よって
\[  J=\left| \pmatrix{ 1 & -1 \cr 0 & 1 \cr }\right|=1,  \]
\[  f_{U,V}(u,v)=e^{-u} \cdot 1=e^{-u}  \]
である。$y>0$ であるから$v>0$ であるが、$x=u-v>0$ であるから$u>v$ である。
よって$V$ の変域は$0<v<u$ となる。従って$U=X+Y$ の分布は
\begin{eqnarray}
 f_U(u)&=&\int_0^u f_{U,V}(u,v)dv=\int_0^u e^{-u} dv \nonumber \\
       &=&ue^{-u}~~~~u>0.  \nonumber
\end{eqnarray}
\end{description}
 
\subsubsection{積率母関数による変数変換}\footnote{後で直接使うわけではな
       い。}
一変数分布の場合と同様に、二変数分布の場合にも積率母関数を使って
変数変換のできる場合がある。いま$X,Y$ の同時分布を$f(x,y)$ とし、
$U=g(X,Y)$ を$X,Y$ の任意の関数とする。このとき$U$ の積率母関数が存在
するならば、それは  
\[ M_U(t)=E(e^{tU})=\int \int e^{tg(x,y)}f(x,y)dxdy    \]
で与えられる\footnote{
\[ M_U(t)=E(e^{tU})=\int e^{tU}f(u)Jdu
      =\int \int e^{tg(x,y)}f(x,y)dxdy  \]
ということ。}。もしこの関数が既知の確率変数の積率母関数と同形になるならば、
$U$ はそれと同じ形の分布をもつことになる。この方法は$X,Y$ の異なった
二つの関数$g(X,Y),~h(X,Y)$ の同時分布を求める場合(一般に$X,Y$ の関数の
いくつかの同時分布を求める場合)にも拡張することができる。



\section{標本分布}
%統計調査を行なう際、調査対象としている大きな集まりを {\bf 母集団}と呼ぶ。
%母集団をすべて調査できないときに、母集団の一部を取り出した統計調査が
%行なわれる。この一部の測定データを{\bf 標本}と呼ぶ。
%母集団の平均値や分散(標準偏差)値は分かっていないのが普通であるから、
%標本の性質から母集団の性質を推定することが試みられるのである。

\subsection{標本、確率標本}
われわれが経験世界で現実に当面する確率変数が本来どのような分布を有するかは
通常明らかではない。このようなときわれわれはその分布についての情報を得る
ために、その確率変数についての試験的観察を何回か試みる。このように確率変
数について実際に観察を行なうことを{\bf 標本観察}といい、この標本観察の
対象として選ばれる個体の集合を{\bf 標本}という。これに対して標本観察
によって情報を得ようとする確率変数が定義されている標本空間を、その標本の
{\bf 母集団}という。統計解析の中心問題の一つは、標本観察の結果によって
母集団に関する情報をさぐることである。ここで母集団に関する情報とは、
母集団が確率変数に関してどのような分布を有し、その分布がどのような値の
母数によって定められているかということである。われわれはこのような母数の
推定値を標本観察の結果から計算しようとする。

\vspace{5mm}
母集団から確率的に選ばれた個々の観察対象を$\omega$ とし、$i$ 番目に
選ばれた$\omega_i$ について観察された結果を$X_i=X(\omega_i)$ とする。
$X_i$ は確率変数である。$n$ 回の観察結果は$n$ 個の確率変数の集合
\[ \{X_1,X_2,\cdots,X_n\} \]
を作る。これを母集団$X$ からの{\bf 大きさ}$n$ 個の標本と呼ぶことにする。
ここで$\{X_1,X_2,\cdots,X_n\}$ は確率変数(個々の試行の結果にある実数値を
与えるルール、あるいはどのような値が考えられるかを集めた
可能性一覧のようなもの。
直接、確率を表す訳ではなく、確率が定義されるという前提がある場合に
用いられる、一種の変数。)の集合としての標本を意味し、
実際に標本観察の結果として得られた数値の集まり$\{x_1,x_2,\cdots,x_n\}$
とは区別されている。

\vspace{5mm}
標本観察は対象の持つ量的属性または質的属性について行なわれる。量的属性の
観察結果は直ちに確率変数として取り扱われる。質的属性の場合も特定の性質を
持つか否かによって$(0,1)$ 変数で表現することができる。例えば製品の合格
不合格の観察で、合格を1、不合格を0とすれば、$n$ 個の標本観察の結果は
例えば
\[ \{1,1,0,1,0,1,\cdots\}  \]
で示される。この場合、確率標本$X$ の具体的な数値が
$x_1=1,x_2=1,x_3=0,\cdots$ となる。

\vspace{5mm}
母集団$X$ の分布が$f(x)$ で与えられ、$n$ 個の対象が同一かつ不変のこの
母集団から互いに独立に抜き取られるとき、一組の標本観測値
$\{x_1,x_2,\cdots,x_n\}$ が得られる確率あるいは確率密度は
\[  f(x_1,x_2,\cdots,x_n)=f(x_1)f(x_2)\cdots f(x_n)  \]
である。 

\vspace{5mm}
標本$\{X_1,X_2,\cdots,X_n\}$ の確率または確率密度が  \\
\begin{equation}
   f(x_1,x_2,\cdots,x_n)=f(x_1)f(x_2)\cdots f(x_n)   \label{kakuriruhyohon}
\end{equation}
で与えられるとき、$\{X_1,X_2,\cdots,X_n\}$ を度数関数あるいは密度関数
$f(x)$ を有する母集団$X$ からの大きさ$n$ 個の{\bf 確率標本(無作為標本、
標本)}という。条件(\ref{kakuriruhyohon})が成り立つためには
$X_1,X_2,\cdots$ は互いに独立でなければならない。

\vspace{5mm}
確率標本についての注意を挙げておく。
確率標本$\{X_1,X_2,\cdots,X_n\}$ は、一定の分布$F$ をもつ
互いに独立な確率変数の組であり、結局、確率標本とは母集団から互いに
独立に抜き取られた(無作為抽出された)標本であるといえる。さらに加えると、
確率標本$X$は集合ではない。また$f(x_1)$ は確率もしくは確率密度なので、
$X_1\neq f(x_1).$ 

% コイン投げを考えると、母集団はうら、おもて。標本集団はうら、おもて…
%母集団が正規分布をするなら、母集団は無限。

%+++++++以下、辞書から+++++++ \\
%一般に、ある統計量の確率分布を{\bf 標本分布}という。一定の分布$F$ をもつ
%互いに独立な確率変数の組$X_1,X_2,\cdots,X_n$ を分布$F$ からの{\bf 無作為
%標本}({\bf 確率標本、標本})という。本項目では主として正規分布からの
%無作為標本にもとづく統計量$Y=f(X_1,X_2,\cdots,X_n)$ の標本分布について
%述べる。\\
%{\bf 1次元正規分布からの標本} \\
%確率変数$X_1,X_2,\cdots,X_n$ が互いに独立にそれぞれ正規分布
%$N(\mu_1,\sigma_1^2),\cdots,N(\mu_n,\sigma_n^2)$ に従って分布
%するとき、それらの1次式$\sum a_iX_i$ は$N(\sum a_i\mu_i,\sum
%a_i^2\sigma_i^2)$ に従う。  \\
%$X_1,X_2,\cdots,X_n$ が正規分布$N(0,1)$ からの無作為標本であるとき、
%統計量$Y=\sum X_i^2$ の分布を{\bf 自由度}$n$ の{\bf $\chi^2$(カイ2乗)分布}
%という。その密度関数は、$0<y<\infty$ において
%\[ f_n(y)=2^{-n/2}(\Gamma(n/2))^{-1} y^{n/2-1} e^{-y/2}  \]
%である($\Gamma$ は$\Gamma$ 関数)。この分布を $\chi^2(n)$ と書くことにす
%る。

%確率変数$X,Y$ が互いに独立にそれぞれ$N(\delta,1),\chi^2(n)$ に従うとき、
%$T=X/\sqrt{Y/n}$ の分布を自由度$n$ 、非心母数 $\delta$ の非心$t$ 分布
%という。密度関数は、$-\infty<t<\infty$ において
%\[ f_{n,\delta}(t)=\sum_{k=0}^\infty e^{-\delta^2/2}\delta^k
%   \frac{2^{k/2}}{k!}\frac{\Gamma((n+k+1)/2)}{\sqrt{\pi n}\Gamma(n/2)}
%   \cdot \frac{(t/\sqrt{n})^k}{(1+t^2/n)^{(n+k+1)/2}}   \] 
%である。この分布を$t(n,\delta)$ と書く。特に$\delta=0$ のときは、
%自由度$n$ の$t$ 分布といい、その密度関数は
%\[f_n(t)=\frac{\Gamma((n+1)/2)}{\sqrt{\pi n}\Gamma(n/2)}
%      (1+\frac{t^2}{n})^{-(n+1)/2}   \] 
%となる。この分布を$t(n)$ と書く。

%$X_1,\cdots,X_n$ を正規分布$N(\mu,\sigma^2)$ からの無作為標本とする。
%標本分散$S^2=\sum(X_i-\bar{X})^2/(n-1)$ と$\mu=\mu_0$ が与えられたときの
%$t$ 統計量$T=\sqrt{n}(\bar{X}-\mu_0)/\sqrt{S^2}$ の正確な分布はStudent
%によって正確に与えられた。すなわち、$(n-1)S^2/\sigma^2$ が$\chi^2(n-1)$
%に、また$T$ は$t(n-1)$ にそれぞれ従う。


\subsection{標本分布}
 母集団$f(x)$ から\footnote{確率標本の各々が、同一の分布に従う(あるいは
ある一つの母集団から$n$ 個の確率標本が順番に抜き取られる)というのが
ポイントのようである。}抜き取られた大きさ$n$ の確率標本を$\{X_1,X_2,\cdots,
X_n\}$ とすれば  \\
\begin{equation}
   f(x_1,x_2,\cdots,x_n)=f(x_1)f(x_2)\cdots f(x_n)   
\end{equation}
はこのような標本の得られる確率あるいは密度関数である。このような度数
関数あるいは密度関数の定める分布を{\bf 標本分布}という\footnote
{ただし$f(x_1,x_2,\cdots,x_n)$ は大きさ$n$ の標本がこの順序で得られる
確率あるいは確率密度である。一般に標本は観察単位の順序づけられた
集合である\footnote{意味不明。ある順番で観察された集合ということだと
考えられる}。}。

\subsection{統計量、統計量の分布}
$\{X_1,X_2,\cdots,X_n\}$ が確率変数を示すとき、そのおのおのの観察値を
独立変数とする関数
\[ Y=g(X_1,X_2,\cdots,X_n)   \]
を{\bf 統計量}という。統計量は明らかに確率変数である。

\vspace{5mm}
統計量の定義式には母集団のパラメーター(母数)は含まれていない。故にそれは
母集団の知識なしに標本観察値のみから計算できる。例えば標本について
観察された平均値や分散、
\[ \bar{X}=\frac{1}{n}(X_1+X_2+\cdots+X_n), \] 
\[ s^2=\frac{1}{n}[(X_1-\bar{X})^2+(X_2-\bar{X})^2+\cdots+(X_n-\bar{X})^2] \]
はいずれも統計量である。 

\vspace{5mm}
確率標本$\{X_1,X_2,\cdots,X_n\}$ はその母集団分布によって定まる一定の
標本分布  \\
$f(x_1,x_2,\cdots,x_n)$ を持つ。そして統計量
$Y=g(X_1,X_2,\cdots,X_n)$ が一価関数であれば、$Y$ の分布はこの定義式を
変換式として、与えられた標本分布$f(x_1,x_2,\cdots,x_n)$ から導くことが
できる。統計量$Y$ の分布を{\bf 標本分布}ということもある。 


\vspace{5mm}
統計量の中には、{\bf 順序統計量}というものがあり、以下のようなものである。
標本観察値を観察された順序ではなく大きさの順に配列し直し、
\[ X_{(1)},X_{(2)},\cdots,X_{(n)} \]
(ただし$X_{(1)}<X_{(2)}<\cdots<X_{(n)}$)とする。このように
並べられたベクトル、あるいはこのベクトルに基づいて定義された量が
順序統計量である。例えばメジアン(中央値)、レンジ(範囲)
$R=X_{(n)}-X_{(1)}$ などは順序統計量である。これらの標本統計量に
対しても同様に標本分布が考えられる。 

\vspace{5mm}
統計量の分布(標本分布)は母集団分布を推定するために重要である。
母集団分布の形$f(x;\theta)$(ただし$x$ は確率変数、
$\theta$ は母数(母集団分布の形を決めるパラメータ)を示す)が与えられているが、母数$\theta$ の値が
未知のとき、この母集団から選ばれた標本$\{X_1,X_2,\cdots,X_n\}$ 
に基づいて$\theta$ の値を推定することである。
標本$\{X_1,X_2,\cdots,X_n\}$ は母集団分布$f(x;\theta)$ の母数
$\theta$ に関する情報を含んでいるはずであるから、統計量
$Y=g(X_1,X_2,\cdots,X_n)$ も同様に$\theta$ に関する情報を含んでおり、
その形を適当に選べば母数$\theta$ の値をこの統計量によって推定する
ことができるであろう。このとき統計量$Y$ の標本分布が母数$\theta$ と
どのような関係にあるかを知ることができれば、$Y$ を推定量として用いる
ときの推定の正確さについて明確な判断を下すことができる。故に、母数
推定の問題は、推定量として用いられる統計量の標本分布の問題に帰着する。

%\vspace{5mm}
%++++以下、辞書より++++++++ \\
%{\bf 統計量}とは、統計的推定の過程で観測値(すなわち標本値)の
%関数として表される量をいう。その目的には、$1^\circ$標本観測値の
%分布の特徴づけ、$2^\circ$標本から得られる母集団母数についての
%情報の要約、の2面がある。

%標本的推定を行なうときに基礎となる概念は母集団と標本とである。これらは
%確率論の基礎の上に次のように形式化される。
%$({\bf \Omega},\mathcal{U},P)$ を確率空間、$P$ を$\mathcal{U}$ 
%上の確率測度とする。確率変数$X$ は、1次元確率分布
%${\bf \Phi}(A)=P\{\omega|X(\omega)\in A\}$ (ただし$A$ はBorel 集合)
%を定め、1次元確率空間$({\bf R},\mathcal{U}^1,{\bf \Phi})$を誘導する。
%ただし、${\bf R}$ は実数の全体、$\mathcal{U}^1$ は1次元Borel 集合の全体
%とする。いま、$X_1,\cdots.X_n$ を同一の1次元確率分布${\bf \Phi}$ をもつ
%互いに独立な確率変数とする。そのとき、$n$ 次元確率変数
%$X=(X_1,\cdots,X_n)$ を、母集団$({\bf \Omega},\mathcal{U},P)$ からの
%{\bf 大きさ}$n$ の{\bf 無作為標本}({\bf 確率標本、標本})(random sample)
%という。一般に$X$ の定める$n$ 次元確率分布を${\bf \Phi}_n$ とし、
%$n$ 次元確率空間$({\bf R}^n,\mathcal{U}^n,{\bf \Phi}_n)$($\mathcal{U}^n$
% は$n$ 次元Borel 集合の全体)を{\bf $n$ 次元標本空間} という。この場合、
%${\bf \Phi}_n$ は$n$ 個の1次元確率分布 ${\bf \Phi}$ の直積測度である。
%標本$X$ という場合には、$X$ は確率変数であるが、実際に観測した値を考える
%場合もある。後者を示すときには{\bf 標本値} と呼び、小文字$x$ で表す。
%すなわち、標本値は$x=X(\omega)(\omega \in {\bf \Omega})$ と表すこともで
%きるし、または標本空間の点({\bf 標本点})とみなすこともできる。

%母集団は集合${\bf \Omega}$ によって表現されているが、それは観測値を
%生み出す物理的構造に対応するものと考えられる。しかし統計的処理は
%すべて標本を通じて行なわれるので、ふつう${\bf \Omega}$ 自身は直接に
%取り扱われない。標本$X$ の定める1次元確率分布${\bf \Phi}$ 、または
%$n$ 次元確率分布${\bf \Phi}_n$ は、母集団における確率測度から誘導されて
%いるので、それぞれ1次元および$n$ 次元標本空間における{\bf 母集団分布}
%という。

%統計量$Y$ とは、標本空間$({\bf R}^n,\mathcal{U}^n,{\bf \Phi}_n)$ から
%可測空間$({\bf R},\mathcal{U}^1)$ への可測関数$f$ によって$Y=f(X)$ と
%表される確率変数をいう。標本$X$ の標本値$x$ に対応する統計量$Y$ の
%値は$y=f(x)$ で表される。(とりあえず、以下省略)

%☆★☆  標本積率  ★☆★☆★☆★☆★☆
\subsection{標本積率}
 
 ${X_1,X_2,\cdots,X_n}$ を大きさ$n$ の確率標本とするとき、$k$ 次
 の{\bf 原点標本積率}は次の式で定義される。 \\
 \begin{equation}
   m_k'=\frac{1}{n}\sum^n_{i=1} X_i^k 
 \end{equation} 
標本平均値、標本分散はこの積率記号でそれぞれ次のとおりに示される。
 \begin{equation}
    \bar{X}=m_1',   \\
    ~~~~~s^2=m_2'-m_1'^2.  \\
 \end{equation}
原点標本積率と同様に{\bf 中心標本積率}も次のとおり定義される。 \\
  \begin{equation}
     m_k=\frac{1}{n}\sum^{n}_{i=1} (X_i-\bar{X})^k  
  \end{equation}
\vspace{2mm}
 
標本積率は標本観察値で定められるから統計量であって、母集団に関する情報を
含む。この点に関して次の諸定理は重要である\footnote{
%期待値：離散的確率変
%数のとる値に、対応する確率をそれぞれかけて加えた値、即ち$\sum x_i p_i.$
期待値という用語の意味は、
「最も期待されそうな値」であり、以下の定理では記号$E(~ )$ と共に使われる。
平均値と同義で使うこともあるが、注意が必要である。
標本については、平均値と期待値は等しく、$(x_1+x_2+\cdots+x_n)/n$である。 
これに対し、母集団については確率が分かっていなければならない。
即ち、母集団分布が離散的な場合、
母平均の期待値は $E(X)=\sum^n x_i p_i$であり、母平均の分散は $var(X)=\sum^n
(x_i-\mu)^2 p_i$ である。 母平均値は分からない場合が普通であるので、
標本平均値の$n$ が大きくなると母平均の期待値に近付くといった性質を
利用して、母集団について期待値を求めるのである。}。

\begin{description}
 \item[定理1] $k$次の原点標本積率の期待値は母集団の原点積率に等しい。 \\
  ＜証明＞ 
    \begin{eqnarray}
       E(m_k')=E(\frac{1}{n}\sum^n_{i=1} X_i^k)
                         &=&\frac{1}{n}E(\sum X^k) \nonumber \\
                         &=&\frac{1}{n}\sum\left[E(X^k)\right] \nonumber  
    \end{eqnarray}
     然るに積率の一般定義(母集団の積率の定義)により、$E(X^k)=\mu_k'$
     であるから\footnote{確率変数$X_1,X_2,\cdots,X_n$ はそれぞれ独立に
     同じ分布をしている母集団から取り出すので、期待値などは等しくなる。}、
       \begin{equation}
             E(m_k')=\frac{1}{n}\sum^n \mu_k'=\frac{1}{n}n\mu_k'=\mu_k'
        \end{equation}
  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)  \\
ただし、中心積率$m_k$ については必ずしもこれと同じ関係は成り立たない。

標本平均値の期待値は母集団平均値に等しい。すなわち
 \begin{equation}
   E(\bar{X})=\mu_1'=\mu
 \end{equation}
ただし分散についてはこの関係は成り立たない。

 \item[定理2] 標本平均値の積率母関数は母集団分布の積率母関数で次のとおり
       示される。  
      \begin{equation}
         M_{\bar{X}}(t)=\left[M_X(\frac{t}{n})\right]^n
       \end{equation}
    ＜証明＞ $X_1,X_2,\cdots$ は互いに独立であるから
       \begin{eqnarray}
        M_{\bar{X}}(t)&=&E(e^{t\bar{X}})
                        =E\left[e^{t(X_1+X_2+\cdots+X_n)/n}\right] \nonumber \\
                      &=&E(e^{\frac{t}{n}X_1})E(e^{\frac{t}{n}X_2}) 
                       \cdots E(e^{\frac{t}{n}X_n})  \nonumber  \\
                 &=&\left[M_X(\frac{t}{n})\right]^n
         \end{eqnarray}
  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)

 \item[定理3] 母集団分散(母分散)$\sigma^2$ が有限値のとき、標本平均値の分散は
   \begin{equation}
     var(\bar{X})=\sigma_{\bar{X}}^2=\frac{\sigma^2}{n}
   \end{equation}
   で与えられる。  \\
  ＜証明＞ 
 \begin{eqnarray}
var(\bar{X})&=&E\left[\bar{X}-E(\bar{X})\right]^2
             =E\left[(\bar{X}-\mu)^2\right]
             =E\left[(\frac{1}{n}\sum X_i-\mu)^2\right] \nonumber \\
            &=&E\left[(\frac{1}{n}\sum X_i-\frac{1}{n}\sum \mu)^2\right]
           =E\left[\left(\frac{1}{n}\sum(X_i-\mu)\right)^2\right] \nonumber  \\
            &=&\frac{1}{n^2}E\left[\left(\sum (X_i-\mu)\right)^2
                                                  \right]  \nonumber  \\
            &=&\frac{1}{n^2}E\left[ \{(X_1-\mu)+\cdots+(X_n-\mu)\} 
                     \{(X_1-\mu)+\cdots+(X_n-\mu)\}\right] \nonumber\\ 
            &=&\frac{1}{n^2}E\left[\sum_i (X_i-\mu)^2
                   +\sum_{i\neq j}(X_i-\mu)(X_j-\mu)\right] \nonumber  \\
            &=&\frac{1}{n^2}\left(E\left[\sum_i (X_i-\mu)^2\right]
                   +E\left[\sum_{i\neq j} (X_i-\mu)(X_j-\mu)\right]\right)
                         \nonumber  
  \end{eqnarray}
然るに
      \[ E \left[ \sum (X_i-\mu)^2\right]=\sum^n \left[ E(X_i-\mu)^2 \right]
                                   =n\sigma^2.\footnote{$X_i$ の$i$ は何番目の試行かということ。各確率変数は同じ母集団分布から独立に抜き出したものなので、どの$i$ についても$\left[ E(X_i-\mu)^2 \right]=\sigma^2$ となる。}   \]
  \begin{eqnarray}
      E \left[ \sum_{i\neq j} (X_i-\mu)(X_j-\mu) \right]&=&
            \sum \left[ E(X_i-\mu)(X_j-\mu) \right]  \nonumber \\
            &=&\sum \left[ E(X_i-\mu)E(X_j-\mu) \right] \nonumber
     \end{eqnarray}
	    ($X_i,X_j$ は互いに独立であり、二変数分布の定理4
      (\ref{nihensu-bokansu}式を参照)
     「二つの確率変数が互いに独立のとき、
    その積の期待値は各変数の期待値の積に等しい」が成り立つので。) \\
ここで、  
  \[  E(X_i-\mu)=\sum(x_i-\mu)p_i=\sum x_i p_i-\mu \sum p_i
         =\mu -\mu \cdot 1=0.  \] 
よって、 
\[ E \left[ \sum_{i\neq j} (X_i-\mu)(X_j-\mu) \right]
       =\sum \left[ E(X_i-\mu)E(X_j-\mu) \right]
       =\sum (0 \cdot 0)=0  \]
故に
  \begin{equation}
    var(\bar{X})=\frac{1}{n^2}n\sigma^2=\frac{\sigma^2}{n} \nonumber
  \end{equation}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)
 \item[定理4] 標本分散$s^2=\frac{\sum(X-\bar{X})^2}{n}$ の期待値は
           $\frac{n-1}{n}\sigma^2$ である
	    \footnote{$s^2=\frac{\sum(X-\bar{X})^2}{n-1}$?}。 
            \label{hyouhonsekirituteiri4} \\
   ＜証明＞ 
   \begin{eqnarray}
 E(s^2)&=&E\left[\frac{1}{n}\sum (X_i-\bar{X})^2\right]
        =E\left[\frac{1}{n}\sum (X_i-\mu-(\bar{X}-\mu))^2\right] \nonumber  \\
       &=&E\left[\frac{1}{n}\{\sum(X_i-\mu)^2-2\sum(X_i-\mu)(\bar{X}-\mu)
                   +\sum(\bar{X}-\mu)^2)\}\right] \nonumber  \\ 
       &=&E\left[\frac{1}{n}\{\sum(X_i-\mu)^2-2(n\bar{X}-n\mu)(\bar{X}-\mu)
                   +n(\bar{X}-\mu)^2)\}\right] \nonumber  \\
       &=&E\left[\frac{1}{n}\{\sum(X_i-\mu)^2-2n(\bar{X}-\mu)^2
                   +n(\bar{X}-\mu)^2)\}\right] \nonumber  \\ 
       &=&E\left[\frac{1}{n}\sum (X_i-\mu)^2
                   -(\bar{X}-\mu)^2\right] \nonumber  \\
          &=&\frac{1}{n}\sum^n\left[E(X_i-\mu)^2\right]
                    -E(\bar{X}-\mu)^2  \nonumber  \\
          &=&\frac{1}{n}n\sigma^2-\sigma_{\bar{X}}^2
                =\sigma^2-\frac{\sigma^2}{n}  \nonumber  \\
          &=&\frac{n-1}{n}\sigma^2.
      \end{eqnarray}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)
\end{description}

故に標本分散は平均すると一般に母平均よりも小さい。分散は二次の中心
積率であるが、このように中心積率の場合、標本積率の期待値は必ずしも
母集団積率に等しくならない。

% ☆★☆★☆ 正規分布     ★☆★☆★☆★☆★☆★☆ 
\section{正規分布}
\subsection{正規分布} 
  確率密度関数が 
    \[ f(x)=\frac{1}{\sigma\sqrt{2\pi}}~ e^{-\frac{(x-\mu)^2}{2\sigma^2}}
    ~~~~~~~~-\infty< x < +\infty,~~\sigma>0 \] 
    
 となる分布を{\bf 正規分布}と呼ぶ。以下に示すように正規分布の平均値は$\mu$、
 分散は$\sigma^2$ となる。
 平均値が$\mu$ 、 分散が$\sigma^2$ の正規分布を
 N$\left( \mu , \sigma^2 \right)$ と表すことがある。
 特に、N$(0,1^2)$ の場合を{\bf 標準正規分布}と呼ぶ。 

\begin{figure}
     \begin{center}
       \resizebox{120mm}{!}{\includegraphics{seiki-bunpu.eps}}
       \caption{標準正規分布のグラフ}
       \label{seiki-bunpu-zu}
     \end{center}
   \end{figure}

 正規分布する母集団では、$\mu \pm \sigma$ の範囲に$68\%$、
 $\mu \pm 1.65\sigma$ の範囲に$90\%$、$\mu \pm 1.96\sigma$ の範囲に
 $95\%$ の構成要素が含まれている。

 
\subsubsection{$E(X)=\int_{-\infty}^{\infty} xf(x)dx=\mu$ の証明} 
     正規分布の確率密度関数は 
   \[ f(x)=\frac{1}{\sigma\sqrt{2\pi}}~ e^{-\frac{(x-\mu)^2}{2\sigma^2}}
    ~~~~~~~~-\infty< x < +\infty \]
  である。確率変数$X$の平均は(\ref{eq:e(x)})式で表されるから、
 \begin{eqnarray} 
  E(X)&=&\int_{-\infty}^{\infty} xf(x)dx \nonumber  \\ 
      &=&\int_{-\infty}^{\infty} x \frac{1}{\sigma\sqrt{2\pi}}~
                              e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx. 
 \end{eqnarray}

  ここで$y=x-\mu$とおくと、
   \begin{eqnarray} 
   E(X)&=&\int_{-\infty}^{\infty}~(y+\mu)
          \frac{1}{\sigma\sqrt{2\pi}}~
                   e^{-\frac{y^2}{2\sigma^2}} dy \nonumber \\
       &=&\int_{-\infty}^{\infty}~y
         \frac{1}{\sigma\sqrt{2\pi}}~e^{-\frac{y^2}{2\sigma^2}} dy + 
               \int_{-\infty}^{\infty}~\mu
               \frac{1}{\sigma\sqrt{2\pi}}~e^{-\frac{y^2}
               {2\sigma^2}} dy. \label{eq:seikibunpu}
  \end{eqnarray} 
  ここで第1項は、$z=\frac{y}{\sqrt{2}\sigma}$ とおいて、  \\
  \begin{eqnarray} 
  (\ref{eq:seikibunpu})の第1項&=&\int_{-\infty}^{\infty}~\sqrt{2}\sigma z 
            \frac{1}{\sigma\sqrt{2\pi}}~e^{-z^2}~\sqrt{2}\sigma dz   
        =\frac{\sqrt{2}\sigma}{\sqrt{\pi}}
               \int_{-\infty}^{\infty}~z e^{-z^2} dz  \nonumber \\
    &=&\frac{\sqrt{2}\sigma}{\sqrt{\pi}}\int_{-\infty}^{0}~ 
   z e^{-z^2} dz + \frac{\sqrt{2}\sigma}{\sqrt{\pi}}\int_{0}^{\infty}~
   z e^{-z^2} dz.  \nonumber 
  \end{eqnarray}
 
  さらに$z^2=a$とおくと$2zdz=da$であるから、
  \begin{eqnarray}
 (\ref{eq:seikibunpu})の第1項&=&\frac{\sqrt{2}\sigma}{\sqrt{\pi}}
                                      \int_{\infty}^{0}~\frac{1}{2}
                                    e^{-a} da + \frac{\sqrt{2}\sigma}
                                 {\sqrt{\pi}}\int_{0}^{\infty}~
                                   \frac{1}{2} e^{-a^2} da  \nonumber \\
                            &=&\frac{1}{2} \frac{\sqrt{2}\sigma}{\sqrt{\pi}}
                                 \left[-e^{-a}\right]_\infty^0 
                               + \frac{1}{2} \frac{\sqrt{2}\sigma}{\sqrt{\pi}}
                                 \left[-e^{-a}\right]_0^\infty  \nonumber \\  
                            &=&\frac{1}{2} \frac{\sqrt{2}\sigma}{\sqrt{\pi}}
                               (-1+0+0+1) = 0. \nonumber
  \end{eqnarray}

  第2項については、係数の$\mu$はとりあえず別にして
   (\ref{eq:seikibunpu})式の第2項=$\mu \cdot A$とおく。ただし
  \[A = \int_{-\infty}^{\infty}~
  \frac{1}{\sigma\sqrt{2\pi}}~e^{-\frac{y^2}{2\sigma^2}} dy.\]
  $z=y/\sigma$で変数変換すると
  \[A = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}~
  e^{-\frac{1}{2}z^2} dz  \]
  となる。積分変数の選択は任意であるから、
  \[A^2 = A \cdot A = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}~
  e^{-\frac{1}{2}z^2} dz \cdot \frac{1}{\sqrt{2\pi}}
  \int_{-\infty}^{\infty}~e^{-\frac{1}{2}a^2} da  \]
  \[= \frac{1}{2\pi}\int_{-\infty}^{\infty}~\int_{-\infty}^{\infty}~
   e^{-\frac{1}{2}(z^2+a^2)} dzda   \]
  $z=r \sin \theta ,a=r \cos \theta$ で極座標に変換すれば、
   \begin{eqnarray}
   A^2&=& \frac{1}{2\pi}\int_{0}^{2\pi}~\int_{0}^{\infty}~
                e^{-\frac{1}{2}r^2}~rdrd\theta  \nonumber \\
      &=&\frac{1}{2\pi}\int_{0}^{2\pi}~d\theta~\int_{0}^{\infty}~
           re^{-\frac{1}{2}r^2}~dr  \nonumber  \\
      &=&\frac{1}{2\pi}\left[\theta \right]_0^{2\pi} \cdot 
           \left[-e^{-\frac{1}{2}r^2}\right]_0^\infty \nonumber \nonumber  \\
      &=&\frac{1}{2\pi}2\pi(-0+1)=1  \nonumber  
  \end{eqnarray}
   ここで$A^{2}$について計算したので、$A$の符号を考える。
   $\sigma>0$のとき明らかに$A>0$であるから、$A=1$である。
   以上をまとめれば、\\
   ~~~~~~~~~~~~~~~~~~~~~~~~~~~$E(X) = 0 + \mu \cdot 1 = \mu$ 
   ~~~~~~~~~~~~~~~~~~~~~(証明終わり)

 \subsubsection{$var(X)=\int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx=\sigma^2$の証明}
  
  正規分布をする確率変数$X$の分散は(\ref{eq:var(x)})式で表されるから、
 \[ var(X)
%=\int_{-\infty}^{\infty}~(x-\mu)^2 f(x)dx 
   = \int_{-\infty}^{\infty}~(x-\mu)^2 
       \frac{1}{\sigma\sqrt{2\pi}}~ e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx \]

 ここで$y=\frac{x-\mu}{\sigma}$とおくと、
\[var(X)=\int_{-\infty}^{\infty}~\sigma^2 y^2 
    \frac{1}{\sigma\sqrt{2\pi}}~ e^{-\frac{1}{2}y^2}\cdot \sigma dy 
  =\int_{-\infty}^{\infty}~\sigma^2 
    \frac{1}{\sqrt{2\pi}}~ e^{-\frac{1}{2}y^2} y^2 dy.\]
 積分する関数は偶関数なので、
\[var(X)=2 \int_{0}^{\infty}~\sigma^2\frac{1}{\sqrt{2\pi}} 
    ~ e^{-\frac{1}{2}y^2}y^2 dy.\]  
 ここで、定積分の公式
\[\int_{0}^{\infty}~e^{-ax^2} x^{2n} dx =
\frac{(2n-1)(2n-3)\cdots3\cdot1}{2^{n+1}}\sqrt{\frac{\pi}{a^{2n+1}}} \]
 を用いて、$a=1/2~,~n=1$の時を考えると、  
\[var(X)=2\cdot \sigma^2 \cdot \frac{1}{\sqrt{2\pi}}\cdot\frac{1}{4} \cdot
    \sqrt{8\pi}=\sigma^2.  \]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~(証明終わり)


\subsection{正規分布を母集団とする標本集団の性質} \label{seiki-hyouhon-dis}
 平均値 $\mu$ 、分散 $\sigma^2$ の正規分布をしている母集団から大きさ $n$ の
 サンプルをランダムに抜き取った場合、標本集団の性質は以下のようになる。
\begin{description}
 \item[定理1] 母集団が平均値$\mu$ 、分散$\sigma^2$ の正規分布をするとき、
大きさ$n$ の確率標本を$\{X_1,X_2,\cdots,X_n\}$ とすれば、
標本平均値 $\bar{X}$ は平均値$\mu$ 、分散$\sigma^2/n$ で正規分布する。\\
＜証明＞ $X_i$ は正規分布変数であるから、その積率母関数は以下のようにな
	    る。 \\
 \begin{eqnarray}
   M_X(t)&=&\int_{-\infty}^\infty e^{tx} \cdot 
             \frac{1}{\sigma \sqrt{2\pi}} 
                   e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx  
         = \frac{1}{\sigma \sqrt{2\pi}} \int_{-\infty}^\infty 
            e^{tx-\frac{(x-\mu)^2}{2\sigma^2}} dx \nonumber \\
        &=&\frac{1}{\sigma \sqrt{2\pi}} \int_{-\infty}^\infty 
            e^{-\frac{(x^2-2(\sigma^2t+\mu)x+\mu^2}{2\sigma^2}} dx \nonumber \\
        &=&\frac{1}{\sigma \sqrt{2\pi}} \int_{-\infty}^\infty 
            e^{-\frac{\{x-(\sigma^2 t+\mu)\}^2-(\sigma^4 t^2+2\sigma^2 t \mu)}
                  {2\sigma^2}} dx \nonumber \\
        &=&\frac{e^{\frac{1}{2}\sigma^2 t^2 + t \mu}}
            {\sigma \sqrt{2\pi}} \int_{-\infty}^\infty 
          e^{-\frac{\{x-(\sigma^2 t +\mu)\}^2}{2\sigma^2}} dx.  \nonumber 
  \end{eqnarray}
  ここで$y=x-(\sigma^2 t+\mu)$ とおくと、
 \[ M_X(t)=\frac{e^{\frac{1}{2}\sigma^2 t^2 + t \mu}}
            {\sigma \sqrt{2\pi}} \int_{-\infty}^\infty  
             e^{-\frac{y^2}{2\sigma^2}} dy. \] 
 また、$A=\int_{-\infty}^\infty e^{-\frac{y^2}{2\sigma^2}} dy$ とおく。
 $z=y/ \sigma$ で変数変換すると、
\[  A=\sigma \int_{-\infty}^\infty e^{-\frac{z^2}{2}} dz. \]
積分変数の選択は任意であるから、 \\
\begin{eqnarray}
 A^2=A \cdot A&=&\sigma^2 \int_{-\infty}^\infty e^{-\frac{z^2}{2}} dz 
         \cdot \int_{-\infty}^\infty e^{-\frac{a^2}{2}} da  \nonumber \\
              &=&\sigma^2 \int_{-\infty}^\infty \int_{-\infty}^\infty
                 e^{-\frac{1}{2}(z^2+a^2)} dz da. \nonumber
\end{eqnarray}
$z=r\sin \theta,a=r\cos \theta$ で極座標変換すると、 \\
\begin{eqnarray}
  A^2&=&\sigma^2 \int_{0}^{2\pi} \int_0^\infty e^{-\frac{1}{2} r^2}
             r dr d\theta \nonumber \\ 
     &=&\sigma^2 \left[ \theta \right]_0^{2\pi} \cdot 
               \left[ -e^{-\frac{1}{2}r^2} \right]_0^\infty
          =\sigma^2 \cdot 2\pi(-0+1)=\sigma^2 2\pi  \nonumber    
\end{eqnarray}
 ここで$A^2$ について計算したので$A$ の符号を考える。$f(x)>0$ となるため
	    に$\sigma>0$ なので、$A>0.$ よって、$A=\sigma \sqrt{2\pi}$ 
  である。以上より、 
 \[ M_X(t)=\frac{e^{\mu t+\frac{1}{2}\sigma^2 t^2}}{\sigma \sqrt{2\pi}}
     \cdot \sigma \sqrt{2\pi} =e^{\mu t+\frac{1}{2}\sigma^2 t^2}. \]
標本平均値は \\
\[  \bar{X}=\frac{1}{n}\sum^n_{i=1} X_i
         =\frac{X_1}{n}+\frac{X_2}{n}+\cdots +\frac{X_n}{n}  \]
であるから、まず$X/n$ の積率母関数を求めると(\ref{bokansuu-cg(x)})式より
\[ M_{X/n}(t)=M_X(\frac{t}{n})=e^{\mu\frac{t}{n}
                        +\frac{1}{2}\frac{\sigma^2 t^2}{n^2}}  \]
となる。$X_i$ は互いに独立であるから(\ref{sekiritubokansu-x1x2x3})より、
 \begin{eqnarray}
 M_{\bar{X}}(t)&=&M_{X_1/n}(t) \cdot M_{X_2/n}(t) 
                               \cdots M_{X_n/n}(t)  \nonumber \\    
%&=&M_{\sum X/n}(t)=M_{X_1/n+X_2/n+\cdots+X_n/n} \nonumber  \\
%       =e^{\sum^n(\mu \frac{t}{n}+\frac{1}{2} \frac{\sigma^2 t^2}{n^2})}
      &=&\left[M_X(\frac{t}{n})\right]^n   
               =e^{\mu t+\frac{1}{2}(\frac{\sigma^2}{n})t^2}  \nonumber \\
 \end{eqnarray}
となる。これは平均値$\mu$ 、分散 $\sigma^2/n$ の正規分布の積率母関数であ
る。(証明終わり)

 \item[定理2] 範囲 R\footnote{範囲Rは標本値の最大値と最小値との差、すなわち
   \[ R=x_n-x_1.\]} は、平均値がもとの母集団の標準偏差の定数倍、つまり
     $d_{2\sigma}$ で、標準偏差がもとの母集団の標準偏差の定数倍、
     つまり $d_{3\sigma}$ の正規分布をする。定数 $d_2$ と $d_3$ は
     サンプルの大きさ $n$ によって決まった値をとる(数値表にのっている)。
     (証明は省略)
 \item[定理3] 偏差平方和 S の平均値は、もとの母集団の分散$\sigma^2$ の 
      $(n-1)$倍となる。(証明は省略) 
\end{description}

%☆★☆★ ガンマ二乗分布 ★☆★☆
\section{ガンマ分布}
確率変数$X$ の確率密度が次の式で定められるとき、$X$ をガンマ変数、その
分布を{\bf ガンマ分布}という。  \\
\begin{equation}
 f(x)=\frac{\lambda^n}{\Gamma(n)}e^{-\lambda x}x^{n-1}~~~~x>0 \label{gamma}
\end{equation}
ただし、$\lambda,n$ は分布の母数であって、$\lambda>0,~n>0$ である。
$\Gamma(n)$ はガンマ関数。詳しくはAppendix A を参照。
\begin{figure}
     \begin{center}
       \resizebox{120mm}{!}{\includegraphics{gamma-bunpu.eps}}
       \caption{ガンマ分布のグラフ}
       \label{gamma-bunpu-zu}
     \end{center}
   \end{figure}

\vspace{5mm}
$n=1$ のとき、この分布は指数分布とよばれる。$n \leq 1$ ならばガンマ分布の
形は逆$J$ 字型になる(図1.2参照)\footnote{$n>1$ のときは$X=(n-1)/
\lambda$ がモードである。モードとは度数分布において、度数の最大値に対応
する値、つまり最頻値である。この場合では分布関数の極大値に対応する(即ち
$f'(x)=0$ のときの)$X$ の値である。}。

\vspace{5mm}
(\ref{gamma})式が密度関数の条件$\int_{-\infty}^\infty f(x)dx=1$ をみたす
ことは次の通り証明される。
\[ \int_0^\infty f(x)dx=\frac{\lambda}{\Gamma(n)}\int_0^\infty
          e^{-\lambda x}(\lambda x)^{n-1} dx.   \]
$y=\lambda x$ とおいて変換すれば、
\[ \frac{\lambda}{\Gamma(n)} \cdot \frac{1}{\lambda}
   \int_0^\infty e^{-y}y^{n-1}dy
      =\frac{\lambda}{\Gamma(n)}\frac{1}{\lambda} \Gamma(n)=1. \]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)

\vspace{5mm}
ガンマ分布の分布関数は次式で与えられる。  \\
\begin{equation}
  F(x)=\frac{\lambda^n}{\Gamma(n)} \int_0^x 
         e^{-\lambda x}x^{n-1} dx.   
\end{equation}

\vspace{5mm}
ガンマ関数の積率母関数は次のように計算される。  \\
\begin{eqnarray}
  M(t)&=&\int_0^\infty e^{tx} \frac{\lambda^n}{\Gamma(n)}
        e^{-\lambda x} x^{n-1} dx  \nonumber  \\
      &=&\frac{\lambda^n}{(\lambda-t)^n}\int_0^\infty
         \frac{(\lambda-t)^n}{\Gamma(n)}e^{-(\lambda-t)x}
                   x^{n-1} dx, \nonumber \\
積分をy=(\lambda-t)x で変換して  \nonumber  \\
      &=&\frac{\lambda^n}{(\lambda-t)^n} \frac{1}{\Gamma(n)}\int_0^\infty
         e^{-y}y^{n-1}dy=(\frac{\lambda}{\lambda-t})^n. \nonumber
\end{eqnarray}
よってガンマ分布の積率母関数は  \\
\begin{equation}
  M(t)=(1-\frac{t}{\lambda})^{-n}  \label{gamma-sekiritubokansu}
\end{equation}
で与えられる。この母関数は次のように級数展開される
\footnote{(\ref{beki-kyusu})式の$x$ に$t$ を対応させればよい。}。
\[ M(t)=1+\frac{n}{\lambda}t+\frac{n(n+1)}{\lambda^2}\frac{t^2}{2!}+
         \frac{n(n+1)(n+2)}{\lambda^3}\frac{t^3}{3!}+ \cdots   \]
この展開式からガンマ分布の平均値、分散は直ちに次の通り定まる。 
\begin{equation}
  E(X)=\frac{n}{\lambda}  
\end{equation}
\[  E(X^2)=\frac{n^2+n}{\lambda^2} \]
\begin{equation}
  var(X)=E(X^2)-\left[E(X)\right]^2=\frac{n}{\lambda^2}
\end{equation}


%☆★☆★ カイ二乗分布 ★☆★☆
\section{カイ二乗分布}   \label{sub-chi}
  自由度が$k$の{\bf カイ二乗分布}の確率密度関数は \\
\begin{equation}
    f(x)= \left\{
              \begin{array}{@{\,}ll}
                 \frac{1}{2^{\frac{k}{2}} \Gamma(\frac{k}{2})} 
                  x^{\frac{k}{2}-1} e^{-\frac{x}{2}}  & \mbox{($x > 0$)}  \\
                             0  & \mbox{($x \leq 0$)}
              \end{array}
            \right.    \label{chi-nijo-bunpu} 
\end{equation}
   と表される。カイ二乗分布は標本分布の理論で重要な役割をもつ分布の一つ
   である。以下に示すように、カイ二乗分布の平均は $k$ 、分散は $2k$ となる。
   またカイ二乗分布はガンマ分布の特殊な場合である。(\ref{gamma})
   式に$n=k/2,\lambda=1/2$ を代入すればよい。
\begin{figure}
     \begin{center}
       \resizebox{120mm}{!}{\includegraphics{chi-nijo-bunpu.eps}}
       \caption{カイ二乗分布のグラフ}
       \label{chi-nijo-bunpu-zu}
     \end{center}
   \end{figure}

よって積率母関数は
\begin{equation}
  M(t)=(1-2t)^{-\frac{k}{2}} 
\end{equation}
となる(\ref{gamma-sekiritubokansu}式を参照)。
この積率母関数は次のように級数展開することができる。
\[ M(t)=1+kt+k(k+2)\frac{t^2}{2!}+k(k+2)(k+4)\frac{t^3}{3!}+\cdots  \]
よって  
\begin{eqnarray}
  \mu_1'&=& k.  \nonumber  \\
  \mu_2'&=& k(k+2).  \nonumber  \\
  \mu_3'&=& k(k+2)(k+4). \nonumber   
\end{eqnarray}
一般に  
\begin{equation}
  \mu_i'=k(k+2)(k+4)\cdots (k+2i-2)
\end{equation}
である。この結果からカイ二乗分布の平均値と分散は次のように定められる。
\begin{equation}
  E(\chi^2)=\mu_1'=k.   
\end{equation}
\begin{equation}
  var(\chi^2)=\mu_2'-\mu_1'^2=2k.
\end{equation}

\subsubsection{正規変数の二乗の和の分布がカイ二乗分布になること}
いま$X_i(i=1,2,\cdots)$ が平均値$\mu_i$、
分散$\sigma_i^2$ の正規変数であって、互いに独立のとき、  \\
\begin{equation}
   Z_i=\frac{X_i-\mu_i}{\sigma_i}  \label{hyoujunseikihensuu}
\end{equation}
は標準正規分布変数である。ここで  \\
\begin{equation}
  \chi^2=Z_1^2+Z_2^2+\cdots+Z_k^2
\end{equation}
と定める。明らかに$\chi^2$ は$X_i$ の関数である。この$\chi^2$ の
分布は積率母関数によって次の通り導かれる。$Z_1,Z_2,\cdots,Z_k$ の
同時密度関数は\footnote{$\prod$ は$n$ 個の数についての相乗積
(2個以上の数を掛け合わせて得た積)。}  \\
\begin{eqnarray}
  f(z_1,z_2,\cdots,z_k)&=&\prod_{i=1}^{k}
                 \left[\frac{1}{\sqrt{2\pi}} e^{-z_i^2/2}\right]  \nonumber \\
              &=&(\frac{1}{2\pi})^{\frac{k}{2}}e^{-\sum z_i^2/2} \nonumber
\end{eqnarray}
である。従って$\chi^2=Z_1^2+Z_2^2+\cdots+Z_k^2$ の積率母関数は次の
通りになる。   \\
\begin{eqnarray}
  M_{\chi^2}(t)=E(e^{t\chi^2})&=&\int \cdots \int e^{t \chi^2}
           f(z_1,z_2,\cdots,z_k)dz_1 dz_2 \cdots dz_k \nonumber   \\
   &=&(\frac{1}{2\pi})^{\frac{k}{2}} \int_{-\infty}^\infty \cdots
        \int_{-\infty}^\infty  e^{t \sum z^2} e^{-\sum z^2/2}
        dz_1 \cdots dz_k   \nonumber  \\
   &=&\prod_{i=1}^k \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty}
       e^{-\frac{1}{2}(1-2t)z_i^2} dz_i  \nonumber
\end{eqnarray}
ところで$\frac{\sqrt{1-2t}}{\sqrt{2\pi}} e^{-\frac{1}{2}(1-2t)z^2}$
は分散$\frac{1}{1-2t}$ の正規分布の密度関数であるから
\[ \int_{-\infty}^\infty \frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}(1-2t)z^2} dz
         = \frac{1}{\sqrt{1-2t}}   \]
である。よって
\[ M_{\chi^2}(t)=(\frac{1}{1-2t})^{\frac{k}{2}}~~~~t<\frac{1}{2}  \]
である\footnote{$\chi^2$ はこれで1つの文字と同じ扱いをする。}。
従って、$k$ 個の正規変数の二乗和の分布は自由度$k$ のカイ二乗分布となる。

\vspace{5mm}
以上の結果を使って$k \to \infty$ のときカイ二乗分布が正規分布に近付く
ことを次のように証明することができる。 
\subsubsection{$k \to \infty$ のときカイ二乗分布が正規分布に近付くことの証明}
上記のようにカイ二乗変数の平均値は$k$ 、分散は$2k$ であるから、
$K=(\chi^2-k)/ \sqrt{2k}$ は標準正規変数$Z=(X-\mu)/ \sigma$ に見合う
値である。$\chi^2$ の積率母関数は$M_{\chi^2}(t)=(1-2t)^{-k/2}$ である
から、上の変換式で$K$ の積率母関数を求めると次の結果が得られる
\footnote{p.\pageref{bokansu-teiri}の積率母関数についての
定理1、2を用いる。}。 \\
\begin{eqnarray}
 M_K(t)&=&E(e^{\frac{\chi^2-k}{\sqrt{2k}}t})
        =e^{-\frac{kt}{\sqrt{2k}}}
             (1-\frac{2t}{\sqrt{2k}})^{-\frac{k}{2}}  \nonumber \\
      &=&\left[e^{t\sqrt{2/k}}
            (1-\sqrt{\frac{2}{k}}t)\right]^{-\frac{k}{2}} \nonumber \\
      &=&\left[(1+\sqrt{\frac{2}{k}}t+\frac{1}{2!}
           \left(\sqrt{\frac{2}{k}}t\right)^2+\cdots)
           (1-\sqrt{\frac{2}{k}}t)\right]^{-\frac{k}{2}}  \nonumber \\
      &=&\left[1-\frac{t^2}{k}
           -\left(\frac{2}{k}\right)^{\frac{3}{2}}\frac{t^3}{3}
           +\cdots \right]^{-\frac{k}{2}}  \nonumber
\end{eqnarray}
$k \to \infty$ のとき、括弧内の第3項は第2項よりも高次の無限小となるから、
この式は近似的に次の形で示される。
\[ M_K(t) \cong \left[1-\frac{t^2}{k}\right]^{-\frac{k}{2}}.   \]
$k \to \infty$ のとき、右辺は$e^{\frac{t^2}{2}}$ に収束する\footnote{
\[ \lim_{n \to \infty} (1+\frac{a}{n})^n = e^a \]
であるから、
\[ \lim_{k \to \infty} \left\{(1+\frac{-t^2}{k})^k \right\}^{-\frac{1}{2}}
   =(e^{-t^2})^{-\frac{1}{2}}=e^{\frac{t^2}{2}}. \]}。
これは標準正規分布の積率母関数である。
よってカイ二乗分布は$k \to \infty$ のとき正規分布に近付く。~~~(証明終わり)

\vspace{5mm}
次で標本分散の場合について考える。基本的に似た話である。
            
\subsubsection{母集団分布が正規分布の時、その標本分散は
カイ二乗分布をすること}  \label{hyohonbunsan-chi}

母集団分布を平均値$\mu$、分散$\sigma^2$ の正規分布とし、
大きさ$n$ の確率標本から計算した標本平均値、標本分散\footnote{
普通は$s^2=(\sum_{i=1}^n (X_i-\bar{X})^2)/(n-1)$ の場合が多いと思う。
確認して、必要だったら直すこと。}をそれぞれ
$\bar{X},s^2$ とする。
\[ s^2=\frac{\sum_{i=1}^n (X_i-\bar{X})^2}{n}.    \]
$s^2$ の式を次のように変形する。
\[ s^2=\frac{1}{n}\sum (X-\mu)^2-(\bar{X}-\mu)^2.  \]
両辺に$n/ \sigma^2$ をかけて移項すれば  \\
\begin{equation}
  \sum(\frac{X-\mu}{\sigma})^2=\frac{ns^2}{\sigma^2}
       +\frac{(\bar{X}-\mu)^2}{\sigma^2 /n}. \label{sum-x-mu-sigma}
\end{equation}
即ち、$\sum (\frac{X-\mu}{\sigma})^2$ が$s^2$ の項と$\bar{X}$ の項に
分解されたことになる。$X$ が正規分布変数のとき、この$\bar{X}$ と$s^2$ は
互いに独立であることが証明される\footnote{『統計数理入門』では証明が省略
されている。}。今、(\ref{sum-x-mu-sigma})
式を次の記号で示すことにする。
\[ R=P+Q  \]
両辺の積率母関数を考えると
\[ M_R(t)=M_P(t)\cdot M_Q(t)  \]
となる。ところで$R=\sum^n (\frac{X-\mu}{\sigma})^2$ は自由度$n$ の
カイ二乗変数である。従って
\[ M_R(t)=(1-2t)^{-\frac{n}{2}} \]
である。また$\sqrt{Q}=\frac{\bar{X}-\mu}{\sigma / \sqrt{n}}$ は標準正規
変数であるから、「$X$ が平均値0、分散1 の標準正規変数のとき、$X^2$ 
は自由度1のカイ二乗分布をする」という定理より、$Q$ は自由度1のカイ二乗変
数である。よって
\[ M_Q(t)=(1-2t)^{-\frac{1}{2}}   \]
となる。従って$P=ns^2/ \sigma^2$ の積率母関数は次の通りになる。
\[ M_P(t)=(1-2t)^{-\frac{n-1}{2}}    \]
これは自由度$n-1$ のカイ二乗分布の積率母関数である。よって次の定理が
成立する。 \\
\begin{description}
 \item[定理]   母集団が分散$\sigma^2$ の正規分布を
するとき、$s^2$ を大きさ
$n$ の確率標本の標本分散とすれば、$ns^2/ \sigma^2$ は自由度
$n-1$ のカイ二乗分布をする。  \label{teiri-5.11}
\end{description}
$s^2=\sum_{i=1}^n (X_i-\bar{X})^2/n$ であるから
\[ \frac{ns^2}{\sigma^2}=\sum_{i=1}^n 
     \left(\frac{X_i-\bar{X}}{\sigma}\right)^2 \]
である。この式は$R=\sum_{i=1}^n (\frac{X_i-\mu}{\sigma})^2$ の
母平均$\mu$ の代りに標本平均$\bar{X}$ を使ったものである。いずれもカイ
二乗変数であるが、後者の自由度は$n$ であるのに対し、前者の自由度は$n-1$ 
である。このとき$\sum (\frac{X-\bar{X}}{\sigma})^2$ は、平均値からの偏差
の二乗和の計算に、母平均の代りに標本平均を使用したことによって自由度を
一つ失った、あるいは平均値の推定のために自由度を1つ使用したという。

\vspace{5mm}
今、$ns^2/ \sigma^2$ の自由度が$n-1$ であることに注意して、カイ二乗分布
の密度関数 (\ref{chi-nijo-bunpu})式を$x=ns^2/ \sigma^2$ で変数変換
すれば、標本分散$s^2$ の分布が次の式で定められる。  \\
\begin{equation}
  f(s^2)=\left(\frac{n}{2\sigma^2}\right)^{\frac{n-1}{2}} (s^2)^{\frac{n-3}{2}}
          e^{-\frac{ns^2}{2\sigma^2}}/ \Gamma\left(\frac{n-1}{2}\right).
\end{equation}

%%☆★☆ t 分布 ☆★☆★☆★☆★☆★
\section{$t$ 分布}  \label{sec-t-bunpu}
  自由度が$n$の{\bf $t$ 分布}の確率密度関数は \\
    \begin{equation}
      f(t)=\frac{\Gamma (\frac{n+1}{2})}
      {\sqrt{n\pi} \Gamma (\frac{n}{2})(1+\frac{t^2}{n})^{\frac{n+1}{2}}}
      ~~~~,-\infty<t<\infty  \label{t-distribution}
    \end{equation}
  と表される。$t$ 分布の平均は$0$、分散は $n/(n-2)$ (ただし$n \ge 2$
  \footnote{$n=1$ のときは
\[ 平均~~\int_{-\infty}^\infty tf(t)dt
    =\int_{-\infty}^\infty \frac{t}{\pi(1+t^2)}dt.  \]
 奇関数なので平均$=0$。
\begin{eqnarray} 
    分散~~\int_{-\infty}^\infty t^2f(t)dt
    &=&\int_{-\infty}^\infty \frac{t^2}{\pi(1+t^2)}dt 
     =[t-1 \times \arctan t ]_{-\infty}^\infty  \nonumber  \\
    &=& \infty-\arctan \infty -((-\infty)-\arctan(-\infty))  \nonumber  \\
    &=& \infty -(n\pi+\frac{\pi}{2})+(n\pi-\frac{\pi}{2})=\infty \nonumber
\end{eqnarray}  
})
  である。

\begin{figure}
     \begin{center}
       \resizebox{120mm}{!}{\includegraphics{t-bunpu.eps}}
       \caption{$t$ 分布のグラフ}
       \label{t-bunpu-zu}
     \end{center}
   \end{figure}

\vspace{5mm}
  \ref{seiki-hyouhon-dis}節の定理1によれば、正規母集団の確率標本から計算
  された$Z=(\bar{X}-\mu)/(\sigma / \sqrt{n})$ は平均値0、分散1の標準正規
分布をする。このことは標本平均値$\bar{X}$ の誤差を考えるときの基本原理と
して重要な意味を持つが、この式に含まれる母数$\sigma$ は一般に未知である。
よって$\sigma$ の値を何らかの方法で推定して使うしかない。しかし$\sigma$ 
をその推定値、例えば標本標準偏差$s$ で置き換えると、$n$ が極めて大でない
限り$Z$ はもはや正規変数ではなくなる。そこで$\sigma$ の推定値として何が
適当であるか、そのときその推定値を使った新しい統計量がどのような分布を
するかが問題となる。ここで登場するのが$t$ 分布である。

\vspace{5mm}
$t$分布は次のような分布である。$X$ を標準正規分布する確率変数、$Y$ を
自由度$n$ のカイ二乗分布をするそれぞれ独立な確率変数とする。このとき、
$t=X / \sqrt{Y/n}$ は自由度$n$ の$t$分布をする。

＜証明＞  \label{t-shoumei}   \\
$X$、$Y$ の密度関数は分かっているので、$t$ の密度関数は次のように
導かれる。$X$、$Y$ は独立であるから、その同時密度関数は
\[ f(x,y)=f_X(x) \cdot f_Y(y)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}x^2} 
           \cdot y^{\frac{n}{2}-1} e^{-\frac{1}{2}y} 
           / 2^{\frac{n}{2}}\Gamma \left( \frac{n}{2} \right)        \]
である。この式の変数$X$ を$t=X/ \sqrt{Y/n}$ で$t$ に変換すると \\
\begin{eqnarray}
f(t,y)&=&f\{x(t),y\}\bigl| \frac{dx}{dt} \bigr|  \nonumber \\
      &=&\frac{\frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}(t^2)\frac{y}{n}}
            y^{\frac{n}{2}-1} e^{-\frac{1}{2}y}} 
       {2^{\frac{n}{2}}\Gamma(\frac{n}{2})}
      \left(\frac{y}{n}\right)^{\frac{1}{2}} \nonumber \\
      &=&\frac{y^{\frac{1}{2}(n-1)} e^{-\frac{1}{2}y(1+\frac{t^2}{n})}}
             {(2\pi n)^{\frac{1}{2}}2^{\frac{n}{2}}
          \Gamma \left(\frac{n}{2}\right)}        \nonumber 
\end{eqnarray}
となる。さらに変数$Y$ を$Z=\frac{Y}{2}(1+\frac{t^2}{n})$ で$Z$ に
変換すると  \\
\begin{eqnarray}
f(t,z)&=&f\{t,y(z)\}\bigl| \frac{dy}{dz} \bigr|  \nonumber \\
      &=&\frac{2^{\frac{1}{2}(n-1)} e^{-z} z^{\frac{1}{2}(n-1)}}
           {(1+\frac{t^2}{n})^{\frac{1}{2}(n-1)}(2\pi n)^{\frac{1}{2}}
           2^{\frac{n}{2}}\Gamma(\frac{n}{2})} \cdot 
                 2\left(1+\frac{t^2}{n}\right)^{-1} \nonumber \\
      &=&\frac{z^{\frac{1}{2}(n-1)}e^{-z}}{\sqrt{\pi n}(1+\frac{t^2}{n})
            ^{\frac{1}{2}(n+1)}\Gamma(\frac{n}{2})} \nonumber 
\end{eqnarray}
となり、これを$Z$ の区間$(0,\infty)$ について積分すれば、$t$ の分布が
次の通り計算される。
\begin{eqnarray}
f(t)&=&\int_0^\infty f(t,z) dz  \nonumber \\
    &=&\frac{1}{\sqrt{\pi n}(1+\frac{t^2}{n})^{\frac{1}{2}(n+1)}
         \Gamma(\frac{n}{2})}\int_0^\infty z^{\frac{n+1}{2}-1} e^{-z} dz
          \nonumber \\
    &=&\frac{\Gamma(\frac{n+1}{2})}{\sqrt{\pi n}
        (1+\frac{t^2}{n})^{\frac{1}{2}(n+1)}\Gamma(\frac{n}{2})}. \nonumber   
\end{eqnarray}

 \subsubsection{$t$ 分布の平均と分散の証明}

$t$ 分布は$t=0$ に対して対称であるから、奇数次の積率はすべて$0$ である。
よって平均値は$0$ である。以下、分散について証明する。\\
$t$ 分布は$t=0$ について対称であるから、
 \[  var(t)=2\int_0^\infty t^2f(t)dt
    =\frac{2\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}
      \int_0^\infty t^2 \left(1+\frac{t^2}{n}\right)^{-\frac{n+1}{2}}dt  \]
$u=\frac{t^2}{n+t^2}$ とおけば、
$dt=\frac{n^{\frac{1}{2}}u^{-\frac{1}{2}}}
 {2(1-u)^{\frac{3}{2}}}du$ であるから、 \\
\begin{eqnarray}
 var(t)&=&\frac{2\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}
    \int_0^1\frac{nu}{(1-u)^{\frac{1-n}{2}}}
   \frac{n^{\frac{1}{2}}u^{-\frac{1}{2}}}{2(1-u)^{\frac{3}{2}}}du \nonumber \\
       &=&\frac{n\Gamma(\frac{n+1}{2})}{\sqrt{\pi}\Gamma(\frac{n}{2})}
           \int_0^1 u^{\frac{1}{2}}(1-u)^{\frac{n-2}{2}-1}du  \nonumber  \\
       &=&\frac{n\Gamma(\frac{n+1}{2})}{\sqrt{\pi}\Gamma(\frac{n}{2})}
           B\left( \frac{3}{2},\frac{n-2}{2} \right)   \nonumber  \\
       &=&\frac{n\Gamma(\frac{n+1}{2})}{\sqrt{\pi}\Gamma(\frac{n}{2})}
           \frac{\Gamma(\frac{3}{2})\Gamma(\frac{n-2}{2})}
               {\Gamma(\frac{n+1}{2})}
          =\frac{\frac{1}{2}n\sqrt{\pi}}{\frac{n-2}{2}\sqrt{\pi}}
          =\frac{n}{n-2} \nonumber \\
\end{eqnarray}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証
明終わり)\footnote{$B(m,n)$ はベータ関数である。ベータ関数には次の性質が
ある。ただし、$m>0,n>0$ である。 
\begin{enumerate}
 \item $B(m,n)=\int_0^1 x^{m-1}(1-x)^{n-1}dx
        =\int_0^1 z^{n-1}(1-z)^{m-1}dz=B(n,m)$ 
 \item $B(m,n)=(\Gamma(m)\Gamma(n))/ \Gamma(m+n)$
\end{enumerate}
ベータ関数の性質の証明は、Appendix B を参照のこと。}


\subsubsection{$n \to \infty$ の時、$t$分布が正規分布に近付くことの証明} 
今、(\ref{t-distribution})式を  \\
\begin{equation}
           f(t)=C\left(1+\frac{t^2}{n}\right)^{-\frac{1}{2}(n+1)}  \nonumber \\
ただし~~~~~C=\Gamma\left(\frac{n+1}{2}\right) / \sqrt{\pi n} 
             \Gamma\left(\frac{n}{2}\right) 
                          \nonumber  \\
\end{equation}
とおく。階乗計算のスターリングの公式は一般にガンマ関数$\Gamma(n+1)$ に
対して($n$ が整数であるとないとに関わらず)$n$ が大きいときに成り立つ
近似式
\footnote{\[  \Gamma(n+1) \cong \sqrt{2\pi}n^{n+\frac{1}{2}}e^{-n}. \]
 ~~~~~ $n$ が正の整数ならば$\Gamma(n+1)=n!$}である。
よって$C$ をこの近似式で計算すると
\begin{eqnarray}
 C&=&\frac{\sqrt{2\pi}\left(\frac{n-1}{2}\right)^{\frac{n}{2}} 
         e^{-\frac{1}{2}(n-1)}}
     {\sqrt{2\pi}\left(\frac{n}{2}-1\right)^{\frac{1}{2}(n-1)} 
           e^{-(\frac{n}{2}-1)}\sqrt{\pi n}} 
       = \frac{(n-1)^{\frac{n}{2}} (n-2)^{-\frac{1}{2}(n-1)}}
                 {2^{\frac{1}{2}} e^{\frac{1}{2}}\sqrt{\pi n}} \nonumber \\    
  &=&e^{-\frac{1}{2}}(\pi n)^{-\frac{1}{2}}
           \left(\frac{n-1}{n-2}\right)^{\frac{1}{2}(n-2)}
       \left(\frac{n-1}{n-2}\right)^{\frac{1}{2}}  
       \left(\frac{n-1}{2}\right)^{\frac{1}{2}}\nonumber \\ 
\end{eqnarray}
となる。$n \to \infty$ のとき\footnote{
\[  \lim_{n \to \infty} \left(1+\frac{a}{n}\right)^n=e^a   \]}
\[  \left(\frac{n-1}{n-2}\right)^{\frac{1}{2}(n-2)}
     =\left(1+\frac{1}{n-2}\right)^{(n-2) \cdot \frac{1}{2}} 
              \to e^{\frac{1}{2}}  \]
\[  \left(\frac{n-1}{n-2}\right)^{\frac{1}{2}} \to 1 ,
    ~~~~~~\left(\frac{n-1}{n}\right)^{\frac{1}{2}} \to 1 \]
であるから、
\[  C \to (2\pi)^{-\frac{1}{2}}      \]
となる。また$f(t)$ の残りの部分は
\[ \left(1+\frac{t^2}{n}\right)^{-\frac{1}{2}(n+1)}
  =\left(1+\frac{t^2}{n}\right)^{-\frac{n}{2}}
    \left(1+\frac{t^2}{n}\right)^{-\frac{1}{2}}  \]
で、$n \to \infty$ のとき\footnote{$h=n/t^2$ とおけば、$n \to \infty$ のとき
$h \to \infty$ であるから、
\[ \lim_{n \to \infty}(1+\frac{t^2}{n})^n
       =\lim_{h \to \infty}(1+\frac{1}{h})^{ht^2}
       =e^{t^2}        \]}
\[  \left(1+\frac{t^2}{n}\right)^n \to e^{t^2},
        \left(1+\frac{t^2}{n}\right) \to 1 \]
であるから
\[ \left(1+\frac{t^2}{n}\right)^{-\frac{1}{2}(n+1)} \to e^{-\frac{1}{2}t^2}  \]
となる。よって$n \to \infty$ のとき
\[ f(t) \to \frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}t^2}     \]
となる。右辺は標準正規分布の密度関数である。(証明終わり)

\subsubsection{標本平均値の分布}  \label{t-hyouhon}
   \ref{seiki-hyouhon-dis}節で見たように、正規分布を
   母集団とする標本についての統計量
\[ Z=(\bar{X}-\mu)/(\sigma / \sqrt{n})  \] 
   の分布は標準正規分布となる\footnote{ただし$\bar{X}$ は正規母集団から
  取り出した大きさ$n$ の確率標本の平均値、$\mu$ は
  母集団平均値である。}。しかし母分散 $\sigma^2$ は未知な場合が多いので、
   $\sigma^2$ の代りに
   標本分散 $s^2=\sum_{i=1}^n(X_i-\bar{X})^2/n$ 
   を用いた\footnote{$\sigma^2=(n/n-1)s^2$ という関係を用いる。}
\begin{equation}
     t=  \frac{\bar{X}-\mu}{\frac{s}{\sqrt{n-1}}} \label{t-s} 
\end{equation}
     がどのような分布に従うか調べておくと、 $\mu$ の区間推定に都合がよい。
     (\ref{t-s})式は次のように書き改めることができる。
 \[  t=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}/
 \sqrt{\frac{\frac{ns^2}{\sigma^2}}{(n-1)}} \]
  この式の分子は標準正規分布変数であり、分母の$\frac{ns^2}{\sigma^2}$ は
  自由度$(n-1)$ のカイ二乗変数である
 \footnote{p.\pageref{hyohonbunsan-chi} の 母集団分布が正規分布の時、
    $\cdots$を参照のこと}。
  よって(\ref{t-s})式の$t$ は自由度$(n-1)$ の$t$ 分布をする\footnote
  {p.\pageref{t-shoumei} の$t$ 分布についての証明を参照のこと。}。
  この分布は$\sigma$ の代りに$s$ を用い、
  平均値を0、標準偏差を1に調節したものとも言える。

