%表題   検定に関するノート
%
%履歴   2001/03/21 Kuniko Egawa
%
% ------- ドキュメントスタイル ---------

%\documentclass[12pt,a4j,dennou]{jreport}
\documentclass[12pt,a4j]{jreport}
\setlength{\parindent}{0pt}
  
% -------- ヘッダ・フッタの設定 --------

\Dauthor[江川 晋子]{}           % ノート作成者(ノートの右下に表示される)

\textheight=23.5cm
\pagestyle{DAheadings}
%\pagestyle{myheadings}
% \newcommand{\Entry}[1]{%
%  \section*{#1}
%  \markboth{#1}{#1}%
  
% ------------- 文書入力 --------------

\begin{document}
 
\clearpage

\pagenumbering{roman}
\setcounter{page}{1}

\Ztitle{検定に関するノート}   % ノートタイトル(ノートの左上に表示される)
\tableofcontents              % 目次の表示

\clearpage
\pagenumbering{arabic}
\setcounter{page}{1}

\chapter{検定の前提となる事柄}    % 章 

%\section{検定に関する用語、概念}  % 節
\section{確率}
\Entry{確率}
\subsection{事象と確率}
\subsubsection{試行と事象}
1個のサイコロを投げるとき、例えば、1の目が出るか出ないか、あるいは
奇数の目がでるか偶数の目が出るか、などは偶然に支配され、それをあらかじめ
知ることはできない。しかし、1の目が出ることよりは、奇数の目がでることの
方がより期待できる。
この例のように、同じ状態のもとに繰り返し行うことができて、その結果が
偶然に支配される実験や観察を、一般に{\bf 試行}という。
また、試行の結果として起こる事柄を{\bf 事象}といい、A、B、Cなどの
文字を用いて表す。
1つの試行において、ある事象Aの起こることが期待される割合を、事象Aの
起こる{\bf 確率}という。

\vspace{5mm}
1個のサイコロを投げる試行においては  \\
A~~1の目が出る、~~~~B~~奇数の目が出る、~~~~C~~5の目が出ない  \\
などの事象が考えられる。このうち、事象Bは \\
1の目が出る、~~~~3の目が出る、~~~~5の目が出る  \\
という3個の事象に分解できるが、これに対して事象Aは、どの目がでるかという
ことに着目する限り、これ以上細かい事象に分解することはできない。
このように、それ以上細かく分解して考えられない事象を、一般に{\bf 根元事
象}という。

\vspace{5mm}
1個のサイコロを投げる試行において、出る目について考えると、起こり得る
場合の全体を次の集合で表すことができる。
\[  {\bf U}=\{1,2,3,4,5,6\}   \]
このとき、上であげた事象A、B、Cは、それぞれ
\[ {\bf A}=\{1\},~~~~{\bf B}=\{1,3,5\},~~~~{\bf C}=\{1,2,3,4,6\}       \]
のように、集合{\bf U} の部分集合で表される。
また根元事象は、集合$\{1\}$、$\{2\}$ などのように、1個の要素だけから
なる部分集合で表される。

\vspace{5mm}
一般に、ある試行において、起こり得る場合全体の集合を{\bf 標本空間}
\footnote{白玉3個、黒玉2個が入っている袋から、玉を1個ずつ取り出す
試行においては、3個の白玉を$a_1,a_2,a_3$ で表し、2個の黒玉を$b_1,b_2$
で表すとき、この試行の標本空間は、集合$\{a_1,a_2,a_3,b_1,b_2\}$ で
表される。}という。
標本空間を{\bf U} とすると、その試行における事象は、いずれも、{\bf U} の
部分集合で表すことができる。また、一般に、標本空間{\bf U} 全体で表される
事象を{\bf 全事象}といい、空集合$\phi$ で表される事象を{\bf 空事象}と
いう。全事象は必ず起こる事象であり、空集合は決して起こらない事象である。

\subsubsection{確率とその基本性質}
一般に、試行において、いくつかの事象のどれが起こることも同じ程度に
期待できるとき、これらの事象は{\bf 同様に確からしい}という。


\section{確率変数}
%\subsection{確率変数、分布関数、確率密度関数}

{\bf 標本空間}とは、実験または観察のあらゆる可能な結果、つまり標本点の
集合である。
このとき標本点、すなわち個々の結果は種々の形で観察される。
例えばサイコロを投げると、結果は6つの面のどれかである。
実験や観察の結果、即ち標本空間を構成する標本点に対応して定められる
実数値を{\bf 確率変数}という。数学的に定義すれば、$S$ を確率関数の定義さ
れた標本空間とし、$X$ を$S$ の上に定義された実変数関数とする。このとき
$X$ を{\bf 確率変数}という。この定義で明らかなように、確率変数は
標本点$s(s \in S)$ の関数である。よって本来$X(s)$ のように関数記号で
表現されるべきものであるが、習慣上簡単に$X$ だけで表される。そして
標本空間が定められ、その上で定義されると、確率変数は一定の変域内で任意の 
値をとる普通の変数と同様に取り扱われる。ただし確率変数$X$ が変域内のある
値をとることに対しては一定の確率が対応するから、確率変数は普通の変数に
比べて変化がより限定されていることになる。\\
\vspace{5mm}
変数\footnote{変数：数を代表する文字が、一つの問題を考察している間、
種々の値を取る得るとみなす時、これを変数という。また、数以外の事項にも
拡張して用いる。$\leftrightarrow$ 定数}$X$ のとり得る値
$x_1,x_2,\cdots,x_n$ 及び$X$ がこれらの値をとる確率
$p_1,p_2,\cdots,p_n$ が定まっているとき、変数$X$ を{\bf 確率変数}といい、 
$x_1,x_2,\cdots,x_n$ と$p_1,p_2,\cdots,p_n$ の対応関係を確率変数$X$ の
{\bf 確率分布}という。ここで、$p_1+p_2+\cdots+p_n=1.$


\subsection{確率変数、確率分布}
確率変数$X$ は偶然性に支配されていろいろな実数値をとる変数ともいえるが、
数学的には普通、次のように定義されている。\\
まず確率空間を$(\Omega,\mathcal{U},P)$ とおく。$\Omega$ の上で定義された
実数値関数 $X(\omega),(\omega \in \Omega)$ が次の条件 \\
  任意の実数$x$ に対し、$X(\omega) \leq x$ を満たす$\omega$ の集合が
常に$\sigma-$ 集合体 $\mathcal{U}$ に属する。すなわち\\
\[~~~~\{\omega; X(\omega) \leq x\} \in \mathcal{U}  \]
を満たすとき、この$X(\omega)$ を{\bf 確率変数}という。特に普通の変数
$x$ と区別して大文字$X$ を使うことが多い。\\
集合~~$\{\omega; X(\omega)\leq x\}$ は$\mathcal{U}$ に属しているから、
それに対する確率が与えられる。それを
\[ P(X\leq x)=P\{\omega; X(\omega) \leq x\} = F(x)   \]
と書き、これを確率変数$X$ の{\bf 分布関数}という。 \\
\vspace{5mm}
確率変数$X$ がとる値を支配する偶然性はある確率法則により規定される。
その確率法則を{\bf 確率分布}ということにする。この確率分布は上の分布関数
で表されていることになる。すなわち分布関数$F(x)$ が与えられていれば、
確率変数 $X$ が例えば区間$(a,b]$($a<x\leq b$ を満たす$x$ の集合) 内の
どれかの$x$ をとる確率が、分布関数で次のように表される。
\[ P(a<X\leq b)=F(b)-F(a).   \]
分布関数$F(x)$ には次の性質がある。  \\
$1^\circ$~~~~$F(x)$ は非減少関数である。\\
$2^\circ$~~~~$\lim_{x\to -\infty} F(x) = F(-\infty)= 0,~~~
                   \lim_{x\to \infty} F(x) = F(+\infty)= 1.$  \\  
$3^\circ$~~~~右連続である。 \\
\vspace{5mm}
確率変数$X$ の確率分布は上のように分布関数$F(x)$ で一般には表されるが、
その確率変数$X$ のとり得る値が離散的(多くとも可付番無限個のとき)か、
そうでないかにより区別して表すことが多い。\\
{\bf (a)~~~~離散型確率分布}  \\
 $P(X=x_i)=p_i,(i=1,2,\cdots),$ \\
ここで
\[ p_i\geq 0,\sum_{i=1}^{\infty} p_i = 1. \]
このとき \\
 $P(a \leq X \leq b)=\sum_{\{i;(a \leq X \leq b)\}} p_i,$
     ($\sum$ は$a \leq X \leq b$ を満たす$i$ についてのみの$p_i$ の和を
        表す). \\
{\bf (b)~~~~連続型確率分布}  \\
任意の$a,b(a<b)$ に対し \\
 \[P(a\leq X\leq b)=\int_a^b f(x)dx,
    (f(x)\geq 0,\int_{-\infty}^{\infty} f(x)dx=1)  \]
である$f(x)$ が存在するとき、この確率分布を{\bf 連続型確率分布}という。
またこの$f(x)$ を{\bf 確率密度関数}という\footnote{連続型確率分布をもつ
確率変数$X$ については、$X$ がただ1つの値をとる確率は0 と規定する。
すなわち任意の実数に対し$P(X=a)=0.$このことから$P(a\leq X\leq b)$の値は
符号をはずしても確率の値は変わらない}。  \\
\vspace{5mm}
{\bf 確率密度関数}とは

  確率変数 $X$ が {\bf 連続変数}の場合、確率密度関数は次の性質を持つ。 \\

 (1) $f(x)\geq 0$ ~~~分布関数 $F(x)$ が非減少であることの当然の結果。\\
 (2) $\int_{-\infty}^{\infty} f(x)dx=1$ ~~~$F(\infty)=1$ と同値。


%\subsection{信頼度、信頼区間}

\subsection{積率、平均および分散}
  ここでは確率変数$X$ が連続変数である場合について書くが、離散変数の
  場合も同様である。 \\
  $X$ が確率変数で\footnote{$X$ が離散変数の場合は\begin{equation}
  E\left[(X-a)^k\right]=\sum_i (x_i-a)^k f(x_i) / \sum_i f(x_i).
  \label{risan-sekiritu}\end{equation}}、
  $f(x)$ がその密度関数のとき、
  任意の実数値$a$ を原点とする($k$ 次の){\bf 積率}を次の式で定義する。
  \[ E\left[(X-a)^k\right]=\int (x-a)^k f(x) dx/ \int f(x) dx  \]
 ここで、$a=0$ とおいた場合を原点に対する$X$ の $k$ 次積率、あるいは
 {\bf 原点積率}といい、これを記号$\mu_k'$ で示す。また、$a=\mu$ とおくと、
  平均に対する積率 $\mu_k$ が定義され、これを{\bf 中心積率}という。 
\vspace{5mm}

  一次の原点積率を期待値もしくは{\bf 平均値}という。すなわち、
   \begin{equation}
     \mu_1'=E\left[(X^1)\right]=\int_{-\infty}^{\infty} 
              x f(x)dx/\int_{-\infty}^{\infty} f(x) dx.  \label{eq:e(x)}
   \end{equation}

  $E(X)$ が発散するときは
  期待値は存在しない\footnote{というらしい。もしくは「考えない」のだと
  思われる}。以下、平均値$\mu_1'$ を記号 $\mu$ で示すことにする。
  平均値$\mu$ は分布の中心(正確には重心)を示す。
\vspace{5mm}

  二次の中心積率を{\bf 分布の分散}(あるいは単に{\bf 分散})という。
 記号$\sigma^2$ または$\sigma^2(X)$、$\sigma_X^2,$ あるいは
 $var(X)$ で示す。すなわち\footnote{離散変数の場合は
    $\sigma^2=\sum_i \left(x_i-\mu\right)^2 f(x_i)/\sum_i f(x_i)$}
  \begin{eqnarray}
     \sigma^2&=&\mu_2=E\left[(X-\mu)^2\right]   \nonumber \\
             &=&\int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx
                   /\int_{-\infty}^{\infty} f(x) dx.  \label{eq:var(x)} 
 \end{eqnarray}
 分散の正の平方根を{\bf 標準偏差}という。記号$\sigma$ で示す。すなわち
 \[ +\sqrt{\sigma^2}=\sigma=+\sqrt{\mu_2}.\]

 分散$\sigma^2=\mu_2$ は分布の{\bf ばらつき}の大小を示す。
 ただし変数$X$ と同次の量でばらつきの
 大小を示すためには分散の平方根である標準偏差$\sigma$ が便利である。

\vspace{7mm}
 
 任意の$a$ を原点とする二次積率と二次の中心積率との間には次の関係が成り
 立つ\footnote{3行目から4行目で、密度関数の性質より$\int f(x)dx=1$である。}。
 \begin{eqnarray}
 E\left[(X-a)^2\right]&=&E\left[\{(X-\mu)+(\mu-a)\}^2\right] \nonumber \\
                      &=&E\left[(X-\mu)^2+2(X-\mu)(\mu-a)
                                       +(\mu-a)^2 \right] \nonumber  \\
                      &=&\int\{(x-\mu)^2+2(x-\mu)(\mu-a)+(\mu-a)^2\}f(x) dx
                                 / \int f(x)dx   \nonumber \\
                      &=&\int(x-\mu)^2f(x) dx+2(\mu-a)\int (x-\mu)f(x)dx
                                            +(\mu-a)^2  \nonumber  \\
                      &=&E\left[(X-\mu)^2\right]+2(\mu-a)E(X-\mu)
                                         +(\mu-a)^2 \nonumber \\
                      &=&\mu_2+(\mu-a)^2  \label{eq:nijinosekiritu}
 \end{eqnarray}
   ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(なぜな
   らば ~~~~~$E(X-\mu)=0$ )
 \footnote{   \begin{eqnarray}
              E(X-\mu)&=&\int (x-\mu)f(x) dx/\int f(x) dx \nonumber \\
                      &=&(\int xf(x) dx-\mu \int f(x) dx)/ \int f(x)dx 
                               \nonumber  \\
                      &=&(\mu-\mu\cdot 1)/1=0 \nonumber
              \end{eqnarray}  }

  $(\mu-a)^2\geq0$ であるから次の関係が成り立つ。
 \[ E(X-a)^2\geq\mu_2   \]
 故に二次積率の中で最も小さいものが分散である。
\vspace{5mm}
 
次に変数$X$ の一次変換$Y=aX+b$($a$ は目盛の変更、$b$ は座標原点の変更を
 示す)を考える。$E(Y)=aE(X)+b$ であるから\footnote{\begin{eqnarray}
                 \sigma^2(Y)&=&\int\{y-E(Y)\}^2f(x)dx
                                =\int\{ax+b-E(aX+b)\}^2f(x)dx \nonumber \\
                            &=&\int\{ax+b-aE(X)-b\}^2f(x)dx
                                =a^2\int\{x-E(X)\}^2f(x)dx
                                =a^2\sigma^2(X) \nonumber 
                \end{eqnarray} }、
 \begin{eqnarray}
     \sigma^2(Y)&=&E\left[Y-E(Y)\right]^2  \nonumber \\
                &=&E\left[(aX+b)-\{aE(X)+b\}\right]^2 \nonumber \\
                &=&E\left[a\{X-E(X)\}\right]^2=a^2E[X-E(X)]^2 \nonumber \\
                &=&a^2\sigma^2(X) \label{eq:hensuuhenkan} 
 \end{eqnarray}
故に目盛の変更は分散の大きさに関係するが、座標の原点の変更は分散に無関係
である\footnote{例えば$y=100x$のとき$\int f(y)dy=1$ は成り立たない。即ち
変換後は確率密度関数とは言えない。$\int f'(y)/ dy/100$ を考える。}。

\vspace{5mm}

分散(二次の積率)について知られる性質をまとめる。\\
$1^{\circ}$ ~~~~$c$ を定数とすれば
    \begin{equation} 
        \sigma^2(c)=0.\footnote{\[ \sigma^2[g(x)]=\int_{-\infty}^{\infty} 
              \{g(x)-E[g(x)]\}^2 f(x) dx\]
であるから、\\
   \[ \sigma^2(c)=\int_{-\infty}^{\infty} \{c-c\}^2 f(x) dx = 0.\]} 
    \end{equation} 
$2^{\circ}$ ~~~~
  \begin{equation}
      \sigma^2(X+c)=\sigma^2(X).\footnote{$X+c$の平均は$\mu+c$ であるから、
      \[ \sigma^2(X+c)=\int_\infty^\infty \{(x+c)-(\mu+c)\}^2 f(x)dx 
         = \sigma^2(X). \]}
    \end{equation}   \\
$3^{\circ}$ ~~~~
   \begin{equation}
     \sigma^2(cX)=c^2\sigma^2(X). 
   \end{equation}  \\
$2^{\circ}$ と$3^{\circ}$ は\ref{eq:hensuuhenkan}の直接の結果である。\\
$4^{\circ}$ 二次の原点積率と中心積率との間には次の関係が成り立つ
\footnote{同様に三次の中心積率も次のように原点積率の項で示すことができる。
\begin{equation}
 \mu_3=\mu_3'-3\mu\mu_2'+2\mu^3
\end{equation}
一般に次式が成り立つ。
\begin{equation}
  \mu_k=\mu_k'-\pmatrix{ k \cr 1 \cr}\mu'_{k-1}\mu+\cdots+(-1)^i
        \pmatrix{ k \cr i \cr}\mu'_{k-i}\mu^i+\cdots+(-1)^{k-1}(k-1)\mu^k
\end{equation}
ただし、$\pmatrix{ k \cr i \cr}=~_kC_i
    =\frac{k\cdot(k-1)\cdot\cdots\cdot(k-i+1)}{i !}.$
これらの関係式を使って中心積率を原点積率から計算することができる。
逆に原点積率を中心積率から計算する式を作ることもできる。}
\footnote{(\ref{eq:nijinosekiritu})式で$a=0$ とおくと、
   $\mu_2'=\mu_2+\mu^2=\sigma^2+\mu^2.$}。\\
   \begin{equation}
     \sigma^2(X)=\sigma_X^2=\mu_2=\mu_2'-\mu^2 
   \end{equation}  \\

以上では中心積率、すなわち平均値に対する積率$E(X-\mu)^k$ や、任意の原点
$a$ に対する積率$E(X-a)^k$ を考えた。もっと一般的には、
$X$ の任意の関数$g(X)$ についての積率を次のように定義できる。
確率変数$X$ の任意の関数を$g(X)$ とするとき、$g(X)$ の$k$ 次の積率は
\footnote{離散関数の場合は$\sum_i [\{g(x_i)\}^k] f(x_i).$}
\begin{equation}
 E[\{g(X)\}^k]=\int_{-\infty}^{\infty} [g(x)]^k f(x) dx ~~~~~~(連続関数). 
\end{equation}

なお参考までに、3次の中心積率$\mu_3$ は分布のゆがみの大小を示し、4次の
 中心積率$\mu_4$ は同じく尖り方の大小を示すことを加えておく。

\subsection{積率母関数}
 確率変数の積率は統計の理論および実際で重要な役割をもっている。前節の
 ように積率は確率変数の分布の種々の性質を定めることができ、普通の場合
 すべての積率が与えられればそれで確率分布の形が決定する
 \footnote{級数の考え方と似ているのだろうが、実際にグラフが描けるかは
 よく分からない。}。従ってすべての
 積率を包括的に代表するような関数を見出すことができれば大変好都合である。
 その一つが{\bf 積率母関数}である。確率分布の形によっては、積率の定義式
 に基づいて積率を計算するときに、特別の工夫をしなければならない場合や、
 計算の面倒な場合があるが、積率母関数を使うと積率を一定の方法でたいてい
 簡単に計算することができる。

 $X$ を確率変数、$t$ を実変数とするとき、次式で定義される関数
$M_x(t)$ を$X$ の{\bf 積率母関数}という。
 \[ M_x(t)=E(e^{tX}). \]
 $X$ が離散変数ならば
 \begin{equation}
    M_X(t)=\sum_x e^{tx}f(x),
 \end{equation}
 $X$ が連続変数ならば
 \begin{equation}
    M_X(t)=\int_{-\infty}^{\infty} e^{tx}f(x) dx. \label{bokansu}
 \end{equation}
\vspace{2mm}

 指数関数$e^{tX}$ をベキ級数に展開\footnote{一般的なベキ級数展開は
\[ f(x)=f(0) + \frac{f'(0)}{1!}x + \frac{f''(0)}{2!}x^2 + \cdots
       + \frac{f^{(n)}(0)}{n!}x^n + \cdots\].この公式の$x$ に対応するのが
 $tX$ である。}
 すると、積率母関数を次のような級数の形で示すことができる。
 \begin{eqnarray}
  M_X(t)=E(e^{tX})&=&E(1+tX+\frac{1}{2!}t^2X^2+\cdots+
                          \frac{1}{k!}t^kX^k+\cdots) \nonumber  \\
                  &=&1+tE(X)+\frac{t^2}{2!}E(X^2)+\cdots+
                          \frac{t^k}{k!}E(X^k)+\cdots \nonumber  \\
                  &=&1+\mu_1't+\mu_2'\frac{t^2}{2!}+\cdots+
                          \mu_k'\frac{t^k}{k!}+\cdots \label{bokansuu-kyusu}   
 \end{eqnarray}
 故に積率母関数をこのようにベキ級数の形に展開することができれば、その展
 開式の$t^k/k!$ の項の係数は$k$ 次の原点積率$\mu_k'$ を与える。これが
 $M_X(t)$ を積率母関数(積率を生み出す関数)と呼ぶ理由である。  \\
\vspace{5mm}

 積率母関数から積率を計算するためには次の方法を用いることもできる。
 積率母関数を$t$ について$k$ 回微分すると
  \begin{eqnarray}
    \frac{d^k}{dt^k}M_X(t)&=&E\left[
                                     \frac{d^k}{dt^k}e^{tX}\right] \nonumber \\
                          &=&E(X^ke^{tX})   \nonumber
  \end{eqnarray}
 となり\footnote{$\frac{d^k}{dt^k}M_X(t)=\int(\frac{d^k}{dt^k}e^{tx})
 f(x)dx.$これは( )内についての平均、即ち
 $E\left[\frac{d^k}{dt^k}e^{tx}\right]$である。また$e^{tX}$ を
 $t$ について$k$ 回微分すれば$X^ke^{tX}$となる。}、$t=0$ とおけば
   \begin{equation}
      M_X^{(k)}(0)=E(X^k)=\mu_k'
   \end{equation}
 となる。故に母関数を$k$ 回微分して$t=0$ とおくことにより$k$ 次の原点積
 率が得られる(この結果は\ref{bokansuu-kyusu}式を項ごとに微分して$t=0$ と
 おいても得られる\footnote{$t$ について$k$ 回微分したときの$k-n$ 番目の
 項は$\frac{1}{(k-n)!}t^{k-n}\cdot\mu_{k-n}'$.$k$ 番目より前では定数の微
 分になるため$0$、$k$ 番目より後では$t=0$ を入れたときに$0$となり、
 結局$\mu_k'$しか残らない。})。 \\
 $X$ を確率変数、$g(X)$ をその関数とするとき、$g(X)$ の積率母関数を
 次の式で定義する。
  \begin{equation}
    M_{g(X)}(t)=E(e^{tg(X)})  \label{g(x)-bokansuu}
  \end{equation}
 $X$ の積率母関数$M_X(t)$ をベキ級数に展開した(\ref{bokansuu-kyusu})式で、
 $e^{tx}$ を$e^{tg(X)}$ に置き換えると次の式が得られる。
\[ E(e^{tg(X)})=1+tE\left[g(X)\right]+\frac{t^2}{2!}E\left[g(X)\right]^2
                 +\cdots+\frac{t^k}{k!}E\left[g(X)\right]^k+\cdots  \]
\vspace{2mm}

積率母関数についての定理を示す。 \\
$1^{\circ}$ ~~~~$X$ を確率変数、$g(X)$ を任意の関数、
                            $c$ を任意の定数とすれば

  \begin{equation}
    M_{cg(X)}(t)=M_{g(X)}(ct).  \label{bokansuu-cg(x)}
  \end{equation}

＜証明＞ (\ref{g(x)-bokansuu})式で$g(X)=cg(X)$ として、
 \[ M_{cg(X)}(t)=\int_{-\infty}^{\infty} e^{tcg(X)} f(x)dx. \]
  ~~~~~~~(\ref{g(x)-bokansuu})式で$t$ を$ct$ で置き換えると、
\[  M_{cg(X)}(t)= M_{g(X)}(ct).\]~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)   \\
 (\ref{bokansuu-cg(x)})式で$g(X)=X$ のときは
  \begin{equation}
    M_{cX}(t)=M_X(ct)
  \end{equation}
 
 $2^{\circ}$ ~~~~$X$ を確率変数、$g(X)$ をその関数、
                        $c$ を任意の定数とすれば 

 \begin{equation}
   M_{g(X)+c}=e^{ct}M_{g(X)}(t).  \label{bokansuu-g(x)+c}
 \end{equation}
＜証明＞ 
 \begin{eqnarray}
   M_{g(X)+c}(t)&=&\int_{-\infty}^{\infty}e^{t(g(x)+c)} f(x)dx  \nonumber  \\
                &=&\int_{-\infty}^{\infty}e^{tg(x)} \cdot 
                      e^{ct} f(x)dx  \nonumber  \\
                &=&e^{ct} \cdot M_{g(X)}(t).  \nonumber
 \end{eqnarray}  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)   \\  
式(\ref{bokansuu-g(x)+c})で $g(X)=X$ のとき
  \begin{equation}
     M_{X+c}(t)=e^{ct}M_{X}(t)
  \end{equation}

 式(\ref{bokansuu-g(x)+c})で $g(X)=X,c=-\mu$ のとき
  \begin{equation}
    M_{X-\mu}(t)=e^{-\mu t}M_X(t)
  \end{equation}

$M_{X-\mu}(t)$は{\bf 中心積率母関数}と呼ばれ、確率変数の平均値に対する
偏差の積率母関数となっている。この中心積率母関数は原点積率母関数に
$e^{-\mu t}$ をかけたものに等しい。$M_{X-\mu}(t)$ を
ベキ級数に展開するか\footnote{(\ref{chushinbokansuu})式をまともに受けて
(\ref{bokansuu-kyusu})式をそっくりまねると、とんでもないことになる。
\begin{eqnarray}
M_{X-\mu}(t)=E(e^{t(X-\mu)})
         &=&E\{1+t(X-\mu)+\frac{1}{2!}t^2(X-\mu)^2
                   +\cdots+\frac{1}{k!}t^k(X-\mu)^k+\cdots\}  \nonumber  \\
         &=&1+tE(X-\mu)+\frac{1}{2!}t^2E\{(X-\mu)^2\}        
\end{eqnarray} }、
または$M_{X-\mu}(t)$ を$k$ 回微分して$t=0$ と
おけば$k$ 次の中心積率が得られる。
 \begin{equation}
\frac{d^k}{dt^k}M_{X-\mu}(t)|_{t=0}= \mu_k.\footnote{\begin{equation}
  M_{X-\mu}(t)=\int_{-\infty}^{\infty} e^{t(x-\mu)} f(x)dx.\nonumber \\   
   \frac{d^k}{dt^k}M_{X-\mu}(t)=\int_{-\infty}^{\infty}
                               e^{t(x-\mu)}(x-\mu)^k f(x)dx. \nonumber \\  
   \frac{d^k}{dt^k}M_{X-\mu}(t)|_{t=0}=
           \int_{-\infty}{\infty} (x-\mu)^k f(x)dx = \mu_k. \nonumber
    \end{equation}}   \label{chushinbokansuu}
\end{equation}


\section{標本分布}
\subsection{母集団と標本}

統計的な調査には、国勢調査のように、対象とする集団の要素全体について
もれなく調べる{\bf 全数調査}と、工場の製品の抜き取り検査のように、
集団から一部分だけを抜き出して調べ、その結果から全体の状況を推測しよう
とする{\bf 標本調査}とがある。

\vspace{5mm}
標本調査では、本来調べたいもの全体の集まりを{\bf 母集団}、調査の
ために母集団から抜き取られた要素の集合を{\bf 標本}といい、母集団から
標本を抜き出すことを標本の{\bf 抽出}という。また、母集団、標本の
要素の個数を、それぞれ母集団、標本の{\bf 大きさ}という。

\vspace{5mm}
標本を抽出する場合、標本が母集団の中の特別なものにかたよらず、全体の
状況をよく反映するような方法をとらなければならない。それには、くじ
引きのような公平な方法で、母集団のどの要素も同じ確率で抜き出されるように
するとよい。このような方法を{\bf 無作為抽出法}といい、無作為抽出法で
抜き出された標本を{\bf 無作為標本}({\bf 確率標本、標本})という。

\vspace{5mm}
一般に、母集団における変量$x$ の分布、平均値、標準偏差をそれぞれ
{\bf 母集団分布}、{\bf 母平均}、{\bf 母標準偏差}という。これらは、
大きさ1の無作為標本を確率変数とみなしたときの確率分布、期待値、
標準偏差と一致する\footnote{言っている内容がちょっと分からない}。

\vspace{5mm}
母集団から大きさ$n$ の標本を抽出する場合、毎回もとに戻しながら1個ずつ
$n$ 回取り出す方法を{\bf 復元抽出}という。これに対し、もとに戻さないで
$n$ 個取り出す方法を{\bf 非復元抽出}という。

\vspace{5mm}
変量$x$ に関する母集団から、大きさ$n$ の無作為標本$X_1,X_2,\cdots,X_n$
 \footnote{ここで$\{X_1,X_2,\cdots,X_n\}$ は確率変数の集合としての標本
を意味し、実際に標本観察の結果として得られた数値の集まり
$\{x_1,x_2,\cdots,x_n\}$とは区別されている。}を抽出するとき、これを1組の
資料とみなしたときの平均値
\[  \bar{X}=\frac{1}{n}(X_1+X_2+\cdots +Z_n) \]
を{\bf 標本平均}という。同様に、標本を1組の資料とみなしたときの分散、
標準偏差を、それぞれ{\bf 標本分散}、{\bf 標本標準偏差}という。これらは、
標本抽出という試行により値が定まるから確率変数である。


\vspace{5mm}
標本$\{X_1,X_2,\cdots,X_n\}$ の確率または確率密度が  \\
\begin{equation}
   f(x_1,x_2,\cdots,x_n)=f(x_1)f(x_2)\cdots f(x_n)   \label{kakuriruhyohon}
\end{equation}
で与えられるとき、$\{X_1,X_2,\cdots,X_n\}$ を度数関数あるいは密度関数
$f(x)$ を有する母集団$X$ からの大きさ$n$ 個の{\bf 確率標本}という。
条件(\ref{kakuriruhyohon})が成り立つためには$X_1,X_2,\cdots$ は互いに
独立でなければならない。

+++++++以下、疑問点+++++++ \\
{\bf 確率標本}
xとXの関係($\omega$ はいらなそう)。\\
$X=\{x_1,x_2,\cdots,x_n\}$? 
 *$X_1$は集合ではなさそう。なぜなら後で$k$ 乗するから。\\
 *$X_1\neq f(x_1)$ ではないか。なぜなら$X_1=f(x_1)$だとすると、母集団の分
 布関数$f(x)$ が決まらないと、$X_1$ が決まらなそうだから。\\
% コイン投げを考えると、母集団はうら、おもて。標本集団はうら、おもて…
%母集団が正規分布をするなら、母集団は無限。


\subsection{標本分布}
 母集団$f(x)$ から抜き取られた大きさ$n$ の確率標本を$\{X_1,X_2,\cdots,
X_n\}$ とすれば \\
\begin{equation}
   f(x_1,x_2,\cdots,x_n)=f(x_1)f(x_2)\cdots f(x_n)   
\end{equation}
はこのような標本の得られる確率あるいは密度関数である。このような度数
関数あるいは密度関数の定める分布を{\bf 標本分布}という\footnote
{ただし$f(x_1,x_2,\cdots,x_n)$ は大きさ$n$ の標本がこの順序で得られる
確率あるいは確率密度である。一般に標本は観察単位の順序づけられた
集合である。}。

\subsection{統計量、統計量の分布}
$\{X_1,X_2,\cdots,X_n\}$ が確率変数を示すとき、そのおのおのの観察値を
独立変数とする関数
\[ Y=g(X_1,X_2,\cdots,X_n)   \]
を{\bf 統計量}という。統計量は明らかに確率変数である。

\vspace{5mm}
統計量の定義式には母集団のパラメーター(母数)は含まれていない。故にそれは
母集団の知識なしに標本観察値のみから計算できる。例えば標本について
観察された平均値や分散  \\
\begin{equation}
 \bar{X}=\frac{1}{n}(X_1+X_2+\cdots+X_n)   \\
 s^2=\frac{1}{n}[(X_1-\bar{X})^2+(X_2-\bar{X})^2+\cdots+(X_n-\bar{X})^2] \\
\end{equation}
はいずれも統計量である。 

\vspace{5mm}
確率標本$\{X_1,X_2,\cdots,X_n\}$ はその母集団分布によって定まる一定の標
本分布$f(x_1,x_2,\cdots,x_n)$ を持つ。そして統計量
$Y=g(X_1,X_2,\cdots,X_n)$ が一価関数であれば、$Y$ の分布はこの定義式を
変換式として、与えられた標本分布$f(x_1,x_2,\cdots,x_n)$ から導くことが
できる。統計量$Y$ の分布を{\bf 標本分布}ということもある。 

\vspace{5mm}
統計量の計算にはしばしば標本データの整理を必要とするが、このとき標本
観測値を大きさの順に配列し直すことがある。大きさの順に配列された
標本観測値を
\[ X_{(1)},X_{(2)},\cdots,X_{(n)} \]
(ただし$X_{(1)}<X_{(2)}<\cdots<X_{(n)}$)とするとき、このように
並べられたベクトル、あるいはこのベクトルに基づいて定義された量を
{\bf 順序統計量}という。例えばメジアン(中央値)、レンジ(範囲)
$R=X_{(n)}-X_{(1)}$ などは順序統計量である。これらの標本統計量に
対しても同様に標本分布が考えられる。 

\vspace{5mm}
統計量の分布(標本分布)は統計理論で重要な役割を持っている。推測統計の
重要な問題の一つは、母集団分布の形$f(x;\theta)$(ただし$x$ は確率変数、
$\theta$ は母数を示す)が与えられているが、母数$\theta$ の値が
未知のとき、この母集団から選ばれた標本$\{X_1,X_2,\cdots,X_n\}$ 
に基づいて$\theta$ の値を推定することがである。
標本$\{X_1,X_2,\cdots,X_n\}$ は母集団分布$f(x;\theta)$ の母数
$\theta$ に関する情報を含んでいるはずであるから、統計量
$Y=g(X_1,X_2,\cdots,X_n)$ も同様に$\theta$ に関する情報を含んでおり、
その形を適当に選べば母数$\theta$ の値をこの統計量によって推定する
ことができるであろう。このとき統計量$Y$ の標本分布が母数$\theta$ と
どのような関係にあるかを知ることができれば、$Y$ を推定量として用いる
ときの推定の正確さについて明確な判断を下すことができる。故に、母数
推定の問題は、推定量として用いられる統計量の標本分布の問題に帰着する。

\vspace{5mm}
++++以下、辞書より++++++++ \\
{\bf 統計量}とは、統計的推定の過程で観測値(すなわち標本値)の
関数として表される量をいう。その目的には、$1^\circ$標本観測値の
分布の特徴づけ、$2^\circ$標本から得られる母集団母数についての
情報の要約、の2面がある。

標本的推定を行なうときに基礎となる概念は母集団と標本とである。これらは
確率論の基礎の上に次のように形式化される。
$({\bf \Omega},\mathcal{U},P)$ を確率空間、$P$ を$\mathcal{U}$ 
上の確率測度とする。確率変数$X$ は、1次元確率分布
${\bf \Phi}(A)=P\{\omega|X(\omega)\in A\}$ (ただし$A$ はBorel 集合)
を定め、1次元確率空間$({\bf R},\mathcal{U}^1,{\bf \Phi})$を誘導する。
ただし、${\bf R}$ は実数の全体、$\mathcal{U}^1$ は1次元Borel 集合の全体
とする。いま、$X_1,\cdots.X_n$ を同一の1次元確率分布${\bf \Phi}$ をもつ
互いに独立な確率変数とする。そのとき、$n$ 次元確率変数
$X=(X_1,\cdots,X_n)$ を、母集団$({\bf \Omega},\mathcal{U},P)$ からの
{\bf 大きさ}$n$ の{\bf 無作為標本}({\bf 確率標本、標本})(random sample)
という。一般に$X$ の定める$n$ 次元確率分布を${\bf \Phi}_n$ とし、
$n$ 次元確率空間$({\bf R}^n,\mathcal{U}^n,{\bf \Phi}_n)$($\mathcal{U}^n$
 は$n$ 次元Borel 集合の全体)を{\bf $n$ 次元標本空間} という。この場合、
${\bf \Phi}_n$ は$n$ 個の1次元確率分布 ${\bf \Phi}$ の直積測度である。
標本$X$ という場合には、$X$ は確率変数であるが、実際に観測した値を考える
場合もある。後者を示すときには{\bf 標本値} と呼び、小文字$x$ で表す。
すなわち、標本値は$x=X(\omega)(\omega \in {\bf \Omega})$ と表すこともで
きるし、または標本空間の点({\bf 標本点})とみなすこともできる。

母集団は集合${\bf \Omega}$ によって表現されているが、それは観測値を
生み出す物理的構造に対応するものと考えられる。しかし統計的処理は
すべて標本を通じて行なわれるので、ふつう${\bf \Omega}$ 自身は直接に
取り扱われない。標本$X$ の定める1次元確率分布${\bf \Phi}$ 、または
$n$ 次元確率分布${\bf \Phi}_n$ は、母集団における確率測度から誘導されて
いるので、それぞれ1次元および$n$ 次元標本空間における{\bf 母集団分布}
という。

統計量$Y$ とは、標本空間$({\bf R}^n,\mathcal{U}^n,{\bf \Phi}_n)$ から
可測空間$({\bf R},\mathcal{U}^1)$ への可測関数$f$ によって$Y=f(X)$ と
表される確率変数をいう。標本$X$ の標本値$x$ に対応する統計量$Y$ の
値は$y=f(x)$ で表される。(とりあえず、以下省略)


\subsection{標本積率}
 
 ${X_1,X_2,\cdots,X_n}$ を大きさ$n$ の確率標本とするとき、$k$ 次
 の{\bf 原点標本積率}は次の式で定義される。 \\
 \begin{equation}
   m_k'=\frac{1}{n}\sum^n_{i=1} X_i^k 
 \end{equation} 
標本平均値、標本分散はこの積率記号でそれぞれ次のとおりに示される。
 \begin{equation}
    \bar{X}=m_1',   \\
    ~~~~~s^2=m_2'-m_1'^2.  \\
 \end{equation}
原点標本積率と同様に{\bf 中心標本積率}も次のとおり定義される。 \\
  \begin{equation}
     m_k=\frac{1}{n}\sum^{n}_{i=1} (X_i-\bar{X})^k  
  \end{equation}
\vspace{2mm}
 
標本積率は標本観察値で定められるから統計量であって、母集団に関する情報を
含む。この点に関して次の諸定理は重要である。

$1^{\circ}$~~~~ 標本の原点積率の期待値は母集団の原点積率に等しい。 \\
＜証明＞ 標本積率は統計量であり、確率変数の関数であるから、同じく確率関
数である。したがって
\begin{eqnarray}
 E(m_k')=E(\frac{1}{n}\sum^n_{i=1} X_i^k)
                         &=&\frac{1}{n}E(\sum X^k) \nonumber \\
                         &=&\frac{1}{n}\sum\left[E(X^k)\right] \nonumber  
\end{eqnarray}
然るに積率の一般定義(母集団の積率の定義)により、$E(X^k)=\mu_k'$
であるから、
\begin{equation}
  E(m_k')=\frac{1}{n}\sum^n \mu_k'=\frac{1}{n}n\mu_k'=\mu_k'
\end{equation}
  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)  \\
ただし、中心積率$m_k$ については必ずしもこれと同じ関係は成り立たない。

標本平均値の期待値は母集団平均値に等しい。すなわち
 \begin{equation}
   E(\bar{X})=\mu_1'=\mu
 \end{equation}
ただし分散についてはこの関係は成り立たない。

$2^{\circ}$~~~~標本平均値の積率母関数は母集団分布の積率母関数で次のとおり
示される。
 \begin{equation}
   M_{\bar{X}}(t)=\left[M_X(\frac{t}{n})\right]^n
 \end{equation}
＜証明＞ $X_1,X_2,\cdots$ は互いに独立であるから
 \begin{eqnarray}
   M_{\bar{X}}(t)&=&E(e^{t\bar{X}})
                      =E\left[e^{t(X_1+X_2+\cdots+X_n)/n}\right] \nonumber \\
                 &=&E(e^{\frac{t}{n}X_1})E(e^{\frac{t}{n}X_2}) 
                       \cdots E(e^{\frac{t}{n}X_n})  \nonumber  \\
                 &=&\left[M_X(\frac{t}{n})\right]^n
 \end{eqnarray}
  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)

$3^{\circ}$~~~~母集団分散(母分散)$\sigma^2$ が有限値のとき、標本平均値の分散は
 \begin{equation}
  var(\bar{X})=\sigma_{\bar{X}}^2=\frac{\sigma^2}{n}
 \end{equation}
で与えられる。  \\
＜証明＞ 
 \begin{eqnarray}
  var(\bar{X})&=&E\left[\bar{X}-E(X)\right]^2=E(\bar{X}-\mu)^2 \nonumber \\
              &=&E(\frac{1}{n}\sigma X_i-\mu)^2
                  =E\left[\frac{1}{n}\sum(X_i-\mu)\right]^2 \nonumber  \\
              &=&\frac{1}{n^2}E\left[\sum (X_i-\mu)\right]^2 \nonumber \\
              &=&\frac{1}{n^2}E\left[\sum_i (X_i-mu)^2
                   +\sum_{i\neq j}(X_i-\mu)(X_j-\mu)\right] \nonumber  \\
              &=&\frac{1}{n^2}\left[E\{\sum_i (X_i-\mu)^2\}
                   +E\{\sum_{i\neq j} (X_i-\mu)(X_j-\mu)\}\right]
                         \nonumber  
 \end{eqnarray}
然るに
 \begin{eqnarray}
       E\left[\sum (X_i-\mu)^2\right]&=&\sum^n\left[E(X_i-\mu)^2\right]
                                   =n\sigma^2  \nonumber \\
      E\left[\sum_{i\neq j} (X_i-\mu)(X_j-\mu)\right]&=&
            \sum\left[E(X_i-\mu)(X_j-\mu)\right]=0  \nonumber 
 \end{eqnarray}
(何故ならば$X_i,X_j$ は互いに独立である。) \\
故に
 \begin{equation}
   var(\bar{X})=\frac{1}{n^2}n\sigma^2=\frac{\sigma^2}{n} \nonumber
 \end{equation}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)\\                                       
$4^{\circ}$~~~~標本分散$s^2=\frac{\sum(X-\bar{X})^2}{n}$ の期待値は
           $\frac{n-1}{n}\sigma^2$ である。 \\
＜証明＞ 
 \begin{eqnarray}
  E(s^2)=E\left[\frac{1}{n}\sum (X_i-\bar{X})^2\right]
         &=&E\left[\frac{1}{n}\sigma (X_i-\mu)^2
                   -(\bar{X}-\mu)^2\right] \nonumber  \\
         &=&\frac{1}{n}\sum^n\left[E(X_i-\mu)^2\right]
                   -E(\bar{X}-\mu)^2  \nonumber  \\
         &=&\frac{1}{n}n\sigma^2-\sigma_{\bar{X}}^2
                =\sigma^2-\frac{\sigma^2}{n}  \nonumber  \\
         &=&\frac{n-1}{n}\sigma^2
 \end{eqnarray}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)\\   
故に標本分散は平均すると一般に母平均よりも小さい。分散は二次の中心
積率であるが、このように中心積率の場合、標本積率の期待値は必ずしも
母集団積率に等しくならない。
 
\section{正規分布}
\subsection{正規分布} 
  確率密度関数が 
    \[ f(x)=\frac{1}{\sigma\sqrt{2\pi}}~ e^{-\frac{(x-\mu)^2}{2\sigma^2}}
    ~~~~~~~~-\infty< x < +\infty \] 
    
 となる分布を{\bf 正規分布}と呼ぶ。このとき正規分布の平均値は$\mu$、
 分散は$\sigma^2$ となる。
 平均値が$\mu$ 、 分散が$\sigma^2$ の正規分布を
 N$\left( \mu , \sigma^2 \right)$ と表すことがある。
 特に、N$(0,1^2)$ の場合を{\bf 標準正規分布}と呼ぶ。 

 正規分布する母集団では、$\mu \pm \sigma$ の範囲に$68\%$、
 $\mu \pm 1.65\sigma$ の範囲に$90\%$、$\mu \pm 1.96\sigma$ の範囲に
 $95\%$ の構成要素が含まれている。

＜証明 正規分布の平均値と分散(標準偏差)＞ \\
 (1) $E(X)=\int_{-\infty}^{\infty} xf(x)dx=\mu$ の証明  \\
     正規分布の確率密度関数は \\
   \[ f(x)=\frac{1}{\sigma\sqrt{2\pi}}~ e^{-\frac{(x-\mu)^2}{2\sigma^2}}
    ~~~~~~~~-\infty< x < +\infty \]
  である。確率変数$X$の平均は(\ref{eq:e(x)})式で表されるから、
 \begin{eqnarray} 
  E(X)&=&\int_{-\infty}^{\infty} xf(x)dx \nonumber  \\ 
      &=&\int_{-\infty}^{\infty} x \frac{1}{\sigma\sqrt{2\pi}}~
                              e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx. 
 \end{eqnarray}

  ここで$y=x-\mu$とおくと、
   \begin{eqnarray} 
   E(X)&=&\int_{-\infty}^{\infty}~(y+\mu)
          \frac{1}{\sigma\sqrt{2\pi}}~
                   e^{-\frac{y^2}{2\sigma^2}} dy \nonumber \\
       &=&\int_{-\infty}^{\infty}~y
         \frac{1}{\sigma\sqrt{2\pi}}~e^{-\frac{y^2}{2\sigma^2}} dy + 
               \int_{-\infty}^{\infty}~\mu
               \frac{1}{\sigma\sqrt{2\pi}}~e^{-\frac{y^2}
               {2\sigma^2}} dy. \label{eq:seikibunpu}
  \end{eqnarray} 
  ここで第1項は、$z=\frac{y}{\sqrt{2}\sigma}$ とおいて、  \\
  \begin{eqnarray} 
  (\ref{eq:seikibunpu})の第1項&=&\int_{-\infty}^{\infty}~\sqrt{2}\sigma z 
            \frac{1}{\sigma\sqrt{2\pi}}~e^{-z^2}~\sqrt{2}\sigma dz   
        =\frac{\sqrt{2}\sigma}{\sqrt{\pi}}
               \int_{-\infty}^{\infty}~z e^{-z^2} dz  \nonumber \\
    &=&\frac{\sqrt{2}\sigma}{\sqrt{\pi}}\int_{-\infty}^{0}~ 
   z e^{-z^2} dz + \frac{\sqrt{2}\sigma}{\sqrt{\pi}}\int_{0}^{\infty}~
   z e^{-z^2} dz.  \nonumber 
  \end{eqnarray}
 
  さらに$z^2=a$とおくと$2zdz=da$であるから、
  \begin{eqnarray}
 (\ref{eq:seikibunpu})の第1項&=&\frac{\sqrt{2}\sigma}{\sqrt{\pi}}
                                      \int_{\infty}^{0}~\frac{1}{2}
                                    e^{-a} da + \frac{\sqrt{2}\sigma}
                                 {\sqrt{\pi}}\int_{0}^{\infty}~
                                   \frac{1}{2} e^{-a^2} da  \nonumber \\
                            &=&\frac{1}{2} \frac{\sqrt{2}\sigma}{\sqrt{\pi}}
                                 \left[-e^{-a}\right]_\infty^0 
                               + \frac{1}{2} \frac{\sqrt{2}\sigma}{\sqrt{\pi}}
                                 \left[-e^{-a}\right]_0^\infty  \nonumber \\  
                            &=&\frac{1}{2} \frac{\sqrt{2}\sigma}{\sqrt{\pi}}
                               (-1+0+0+1) = 0. \nonumber
  \end{eqnarray}

  第2項については、係数の$\mu$はとりあえず別にして
   (\ref{eq:seikibunpu})式の第2項=$\mu \cdot A$とおく。ただし
  \[A = \int_{-\infty}^{\infty}~
  \frac{1}{\sigma\sqrt{2\pi}}~e^{-\frac{y^2}{2\sigma^2}} dy.\]
  $z=y/\sigma$で変数変換すると
  \[A = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}~
  e^{-\frac{1}{2}z^2} dz  \]
  となる。積分変数の選択は任意であるから、
  \[A^2 = A \cdot A = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}~
  e^{-\frac{1}{2}z^2} dz \cdot \frac{1}{\sqrt{2\pi}}
  \int_{-\infty}^{\infty}~e^{-\frac{1}{2}a^2} da  \]
  \[= \frac{1}{2\pi}\int_{-\infty}^{\infty}~\int_{-\infty}^{\infty}~
   e^{-\frac{1}{2}(z^2+a^2)} dzda   \]
  $z=r \sin \theta ,a=r \cos \theta$ で極座標に変換すれば、
   \begin{eqnarray}
   A^2&=& \frac{1}{2\pi}\int_{0}^{2\pi}~\int_{0}^{\infty}~
                e^{-\frac{1}{2}r^2}~rdrd\theta  \nonumber \\
      &=&\frac{1}{2\pi}\int_{0}^{2\pi}~d\theta~\int_{0}^{\infty}~
           re^{-\frac{1}{2}r^2}~dr  \nonumber  \\
      &=&\frac{1}{2\pi}\left[\theta \right]_0^{2\pi} \cdot 
           \left[-e^{-\frac{1}{2}r^2}\right]_0^\infty \nonumber \nonumber  \\
      &=&\frac{1}{2\pi}2\pi(-0+1)=1  \nonumber  
  \end{eqnarray}
   ここで$A^{2}$について計算したので、$A$の符号を考える。
   $\sigma>0$のとき明らかに$A>0$であるから、$A=1$である。
   以上をまとめれば、\\
   ~~~~~~~~~~~~~~~~~~~~~~~~~~~$E(X) = 0 + \mu \cdot 1 = \mu$ 
   ~~~~~~~~~~~~~~~~~~~~~(証明終わり)
\clearpage
 (2) $var(X)=\int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx=\sigma^2$の証明  \\
  
  正規分布をする確率変数$X$の分散は(\ref{eq:var(x)})式で表されるから、
 \[ var(X)
%=\int_{-\infty}^{\infty}~(x-\mu)^2 f(x)dx 
   = \int_{-\infty}^{\infty}~(x-\mu)^2 
       \frac{1}{\sigma\sqrt{2\pi}}~ e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx \]

 ここで$y=\frac{x-\mu}{\sigma}$とおくと、
\[var(X)=\int_{-\infty}^{\infty}~\sigma^2 y^2 
    \frac{1}{\sigma\sqrt{2\pi}}~ e^{-\frac{1}{2}y^2}\cdot \sigma dy 
  =\int_{-\infty}^{\infty}~\sigma^2 
    \frac{1}{\sqrt{2\pi}}~ e^{-\frac{1}{2}y^2} y^2 dy.\]
 積分する関数は偶関数なので、
\[var(X)=2 \int_{0}^{\infty}~\sigma^2\frac{1}{\sqrt{2\pi}} 
    ~ e^{-\frac{1}{2}y^2}y^2 dy.\]  
 ここで、定積分の公式
\[\int_{0}^{\infty}~e^{-ax^2} x^{2n} dx =
\frac{(2n-1)(2n-3)\cdots3\cdot1}{2^{n+1}}\sqrt{\frac{\pi}{a^{2n+1}}} \]
 を用いて、$a=1/2~,~n=1$の時を考えると、  
\[var(X)=2\cdot\frac{\sigma^2}{\sqrt{2\pi}}\cdot\frac{1}{2}\sqrt{2\pi}
        =\sigma^2.  \]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~(証明終わり)

\subsection{正規分布を母集団とする標本集団の性質}
 平均値 $\mu$ 、分散 $\sigma^2$ の正規分布をしている母集団から大きさ $n$ の
 サンプルをランダムに抜き取った場合、標本集団の性質は以下のようになる。\\
 (1) 標本集団は、平均値 $\bar{x}=\mu$ 、分散がもとの母集団の
     $\frac{1}{n}$ 倍、つまり $\frac{\sigma^2}{n}$ の
     正規分布をする。\\
{\bf 定理} 母集団が平均値$\mu$ 、分散$\sigma^2$ の正規分布をするとき、
大きさ$n$ の確率標本を$\{X_1,X_2,\cdots,X_n\}$ とすれば、
標本平均値 $\bar{X}$ は平均値$\mu$ 、分散$\sigma^2/n$ で正規分布する。\\
＜証明＞ $X_i$ は正規分布変数であるから、その積率母関数は \\
 \begin{equation}
   M_X(t)=e^{\mu t+\frac{1}{2}\sigma^2 t^2}  \nonumber  \\
 \end{equation}
である。標本平均値は \\
\[  \bar{X}=\frac{1}{n}\sum^n_{i=1} X_i
         =\frac{X_1}{n}+\frac{X_2}{n}+\cdots +\frac{X_n}{n}  \]
であるから、まず$X/n$ の積率母関数を求めると
\[ M_{X/n}(t)=M_X(\frac{t}{n})=e^{\mu\frac{t}{n}
                        +\frac{1}{2}\frac{\sigma^2 t^2}{n^2}}  \]
となる。$X_i$ は互いに独立であるから
 \begin{eqnarray}
  M_X(t)&=&M_{\sum X/n}(t)=\left[M_X(\frac{t}{n})\right]^n  \nonumber \\
        &=&e^{\mu t+\frac{1}{2}(\frac{\sigma^2}{n})t^2}  \nonumber \\
 \end{eqnarray}
となる。これは平均値$\mu$ 、分散 $\sigma^2/n$ の正規分布の積率母関数であ
る。(証明終わり)

 (2) 範囲 R\footnote{範囲Rは標本値の最大値と最小値との差、すなわち
   \[ R=x_n-x_1.\]} は、平均値がもとの母集団の標準偏差の定数倍、つまり
     $d_{2\sigma}$ で、標準偏差がもとの母集団の標準偏差の定数倍、
     つまり $d_{3\sigma}$ の正規分布をする。定数 $d_2$ と $d_3$ は
     サンプルの大きさ $n$ によって決まった値をとる(数値表にのっている)。
     (証明は省略) \\
 (3) 偏差平方和 S の平均値は、もとの母集団の分散$\sigma^2$ の $(n-1)$倍
          となる。(証明は省略)  \\
       
  
 また次のことが成り立つ。      
  $(\bar{x}-\mu) / (\sigma/\sqrt{n} )$ は N$(0,1^2)$ の
   正規分布に従い、これは自由度??のt 分布になる。   \\
[証明1.2.3.4]  
      

\section{カイ二乗分布}
\subsection{ガンマ関数とその性質}
  ガンマ関数は次の式で定義される。ここで$n$ は任意の正の実数である。
\[ \Gamma (n)=\int_{0}^{\infty} e^{-x} x^{n-1}dx.\]
  次にガンマ関数のいくつかの性質について述べる。 \\
 $1^{\circ}$~~~~$\Gamma (n)=(n-1)\Gamma(n-1)$\\
＜証明＞ $\Gamma (n)$を部分積分法によって積分すれば
\begin{eqnarray}
  \int_{0}^{\infty} e^{-x} x^{n-1}dx&=&\left[-e^{-x}x^{n-1}\right]_{0}^{\infty}
                                        +(n-1)\int_{0}^{\infty} 
                                         e^{-x} x^{n-2}dx  \\
                                    &=&(n-1)\int_{0}^{\infty} e^{-x} 
                                          x^{n-2}dx.\\
\end{eqnarray}

ガンマ関数記号を用いれば
\[ \Gamma (n)=(n-1)\Gamma (n-1).\]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり) \\
 $2^{\circ}$~~~~$n>0$ が整数のとき$\Gamma (n)=(n-1)!$  \\
＜証明＞ (1)を繰り返して置き換えれば
\[ \Gamma (n)=(n-1)(n-2)\cdots 2 \cdot 1 \cdot \Gamma (1) \]
となる。そして
\[ \Gamma (1)=\int_{0}^{\infty}e^{-x} dx 
        = \left[-e^{-x}\right]_{0}^{\infty}=1  \]
であるから
\[ \Gamma (n)=(n-1)!.\]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~($n=1$のときも$0!=1$で成り立つ)
   (証明終わり) \\
 $3^{\circ}$~~~~$\Gamma (\frac{1}{2})=\sqrt{\pi}$  \\
＜証明＞ $x=y^{2}$ とおけば
\[ \Gamma (n)=\int_{0}^{\infty}e^{-x} x^{n-1} dx 
        =2 \int_{0}^{\infty}y^{2n-1} e^{-y^2} dy.\]
故に、
\[ \Gamma (\frac{1}{2})=2 \int_{0}^{\infty}e^{-y^2} dy,\]
\[ \left[\Gamma (\frac{1}{2})\right]^2 
   = 4\int_{0}^{\infty} \int_{0}^{\infty} e^{-(y^2+z^2)} dydz.\]
極座標変換して$(0<r<\infty,0<\theta<\frac{\pi}{2})$
\begin{eqnarray}
  \left[\Gamma (\frac{1}{2})\right]^2
  &=&4\int_{0}^{\frac{1}{2}\pi} \int_{0}^{\infty} e^{-r^2} r drd\theta \\
  &=&4\left[\theta\right]_{0}^{\frac{1}{2}\pi} 
     \cdot \left[-\frac{1}{2}e^{-r^2}\right]_{0}^{\infty} \\
  &=&4 \cdot \frac{1}{2}\pi \cdot \frac{1}{2} = \pi. \\
\end{eqnarray}

故に 
\[\Gamma (\frac{1}{2})=\sqrt{\pi}.  \]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり) \\
 $4^{\circ}$~~~~$n$のいくつかの値に対して$\Gamma (n)$を計算すると次のとおりである
\footnote{$n=0$のとき$\Gamma (n)=\infty$であるが、この証明は難しい}。
\begin{center}
 \begin{tabular}{lccccccr} \hline
           $n$    & $\frac{1}{2}$ & 1 & 2 & 3 & 4 & 5  \\
   $\Gamma (n)$   & $\sqrt{\pi}$  & 1 & 1 & 2 & 6 & 24  \\ \hline
 \end{tabular}
\end{center}

\subsection{カイ二乗分布}
  自由度が$n$の{\bf カイ二乗分布}の確率密度関数は \\
    \[f(x)= \left\{
              \begin{array}{@{\,}ll}
                 \frac{1}{2^{\frac{n}{2}} \Gamma(\frac{n}{2})} 
                  x^{\frac{n}{2}-1} e^{-\frac{x}{2}}  & \mbox{($x > 0$)}  \\
                             0  & \mbox{($x \leq 0$)}
              \end{array}
            \right.    \]
   と表される。カイ二乗分布の平均は $n$ 、分散は $2n$ となる。\\
[証明 カイ二乗分布の平均と分散]
%\subsection{ガンマ分布} 
%  {\bf ガンマ分布}の確率密度関数は \\
\section{t 分布}
  自由度が$n$の{\bf t 分布}の確率密度関数は \\
    \[f(x)=\frac{\Gamma (\frac{n+1}{2})}
      {\sqrt{n\pi} \Gamma (\frac{n}{2})(1+\frac{x^2}{n})^{\frac{n+1}{2}}}
      ~~~~~~~~x > 0 \]
  と表される。t 分布の平均は$0$、分散は $n/(n-2)$ (ただし$n＞2$
  \footnote{$n=1$ のときはコーシー分布となり、平均値も分散も存在しない。})
  である。\\
  [証明 t 分布の平均と分散] \\

t 分布は$t=0$ に対して対称であるから、奇数次の積率はすべて$0$ である。
よって平均値は$0$ である。以下、分散について証明する。\\
t 分布は$t=0$ について対称であるから、
\[  var(t)=2\int_0^\infty t^2f(t)dt
    =\frac{2\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}
      \int_0^\infty t^2(1+\frac{t^2}{n})^{-\frac{n+1}{2}}dt  \]
$u=\frac{t^2}{n+t^2}$ とおけば、
$dt=\frac{n^{\frac{1}{2}}u^{-\frac{1}{2}}}
 {2(1-u)^{\frac{3}{2}}}du$ であるから、 \\
\begin{eqnarray}
 var(t)&=&\frac{2\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{1}{2})}
    \int_0^1\frac{nu}{(1-u)^{\frac{1-n}{2}}}
   \frac{n^{\frac{1}{2}}u^{-\frac{1}{2}}}{2(1-u)^{\frac{3}{2}}}du \nonumber \\
       &=&\frac{n\Gamma(\frac{n+1}{2})}{\sqrt{\pi}\Gamma(\frac{n}{2})}
           \int_0^1 u^{\frac{1}{2}}(1-u)^{\frac{n-2}{2}-1}du  \nonumber  \\
       &=&\frac{n\Gamma(\frac{n+1}{2})}{\sqrt{\pi}\Gamma(\frac{n}{2})}
           B(\frac{3}{2},\frac{n-2}{2})   \nonumber  \\
       &=&\frac{n\Gamma(\frac{n+1}{2})}{\sqrt{\pi}\Gamma(\frac{n}{2})}
           \frac{\Gamma(\frac{3}{2})\Gamma(\frac{n-2}{2})}
               {\Gamma(\frac{n+1}{2})}
          =\frac{\frac{1}{2}n\sqrt{\pi}}{\frac{n-2}{2}\sqrt{\pi}}
          =\frac{n}{n-2} \nonumber \\
\end{eqnarray}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(証明終わり)\\ 


母分散 $\sigma$ が分からず、標本分散 $s$ だけが分かっている場合には、
     \[  \frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}} \]
     がどのような分布に従うか
     調べておくと $\mu$ の区間推定ができる。$s$ は $\sigma$ より
     小さい方に偏っているので、
     $\sigma^2=(n/n-1)s^2$ を使って修正すると、\\
     \[ \frac{\bar{x}-\mu}{\sqrt{\frac{n}{n-1}} \frac{s}{\sqrt{n}}} 
      = \frac{\bar{x}-\mu}{\frac{s}{\sqrt{n-1}}} \]

      となる。この分布は正規分布の $\sigma$ のかわりに $s$ を用いて、
      平均値を0、標準偏差を1に調節したものとも言える。

\chapter{検定}
\section{検定の考え方}
\section{母平均の検定}
\section{差の検定}

参考文献  \\
         『統計数理入門』       森田 優三 著          日本評論社 1968年
         『統計解析のはなし』   石村 貞夫 著          東京図書   1989年
         『すぐわかる統計解析』 石村 貞夫 著          東京図書   1993年
         『岩波数学辞典 第3版』 日本数学会 編         岩波書店   1993年
         『統計数学入門』       本間 鶴千代 著        森北出版   1970年
         『高校数学解法事典』   寺田文行、本部均 編   旺文社     1993年


\end{document}







































