    検定に関するノート
§1 検定の前提となる事柄
  1.1 母集団と標本
    「母集団」… 統計調査において標本抽出の母体となる集団。
    「標本」… 母集団をすべて調査できないときに、母集団の
               一部についての統計調査が行なわれる。このとき
               調査される一部の測定値の集まりのこと。
     つまり、調査対象としている大きな集まりを「母集団」、
     測定されるデータを「標本」という。母集団の平均値や標準偏差値は
     分かっていないのが普通であるから、標本を取り出して標本の性質から
     母集団の性質を推定することが試みられる。
  1.2 平均、分散
    「平均」 … データの値をすべて加えてデータの個数で割ったもの。
    「分散」 … データが平均値を中心にどのくらい散らばっているかを示す。
                偏差平方和をデータの個数で割ったもの。
  1.3 信頼度、信頼区間   
  1.4 確率変数、確率密度関数
    ・確率変数とは 

 
    ・確率密度関数とは  
    ・連続変数の場合は、次の性質を持つ。
      (1) f(x)≧0    分布関数 F(x) が非減少であることの当然の結果。
      (2)∫(f)dx＝1 (-∞ 〜 +∞までの積分)   F(∞)＝1 と同値。


       P(a＜X≦b)＝∫ f(x)dx＝F(b)-F(a)

       Pは確率変数Xが a＜X≦b の範囲に入るときの確率を表している。
       分布関数 F(x)もまた、確率を表している。ただし、
       F(∞)＝P(-∞＜X≦∞)＝1 であり、
       F(b)＝P(-∞＜X≦b) である。つまり、
       F(b)-F(a)＝P(-∞＜X≦b)-P(-∞＜X≦a) 。
  1.5 正規分布
                              正規分布の確率密度関数は


     
                                 という式で表される。また正規分布の
                                 平均値はμ、標準偏差はσとなる。
                                  
                                      正規分布する母集団では、
                                      μ±σ の範囲に 68％
                                      μ±1.65σ の範囲に 90％
                                      μ±1.96σ の範囲に 95％
                                     の構成要素が含まれている。
     
    [証明1.5  正規分布の平均値と標準偏差の証明]
  1.6 正規分布を母集団とする標本集団の性質
    平均値がμで、分散がσ**2の正規分布をしている母集団
    (N(μ,σ**2)と表す)
    から大きさn のサンプルをランダムに抜き取って、平均値 x と
    範囲 R と偏差平方和を求めると次のようになる。   
      (1) 平均値 x＝μ、標準偏差はもとの母集団の1/n**(1/2)倍、
          つまり σ/n**(1/2) の正規分布をする。
        [証明]
      (2) 範囲 R は、平均値がもとの母集団の標準偏差の定数倍、つまり
          d2σで、標準偏差がもとの母集団の標準偏差の定数倍、
          つまりd3σの正規分布をする。定数d2とd3はサンプルの大きさn
          によって決まった値をとる(数値表にのっている)。
         (証明は省略する)
      (3) 偏差平方和 S の平均値は、もとの母集団の分散σ**2の(n-1)倍
          となる。
         [証明]
     (x-μ)/(σ/n**(1/2)) は N(0,1) の正規分布に従う
       [証明]
      
     母分散σが分からず、標本分散 s だけが分かっている場合には、
     (x-μ)/(s/n**(1/2)) がどのような分布に従うか調べておくと
     μの区間推定ができる。s はσ より小さい方に偏っているので、
     σ**2＝(n/n-1)s**2 を使って修正すると、



      となる。この分布は正規分布のσのかわりに s を用いて、
      平均値を0、標準偏差を1に調節したものとも言える。
      
  1.7 ガンマ関数とその性質
  1.8 χ2分布
    自由度 n のχ2分布の確率密度関数は次の式で表される。

      f(x)＝                             ,(x＞0)
              0 ,                         (x≦0)

    χ2分布の平均は n 、分散は 2n となる。
   [証明1.8 χ2分布の平均と分散]
    χ2分布はガンマ分布の特別な場合(＊n＝k/2,λ＝1/2)である。
    (＊ただし、上の式のnとは別)
  1.9 ガンマ分布
    ガンマ分布の確率密度関数は次の式で表される。

      f(x)＝                            x＞0
    
     ただしλ、n は分布の母数であって、λ＞0、n＞0である。
     n＝1のとき、この分布は指数分布となる。
     ガンマ分布の平均値は n/λ、分散は n/λ**2 である。


  1.10 t分布
    t分布の確率密度関数は次の式で表される。




   
    Xが標準正規変数、Yが自由度 n のχ2 変数の時、
     t＝X/(Y/n)**(1/2)
    は自由度 n のt分布をする。
(必要があれば、積率母関数などの項目も加える)
    
§2 検定
  2.1 検定の考え方
    母集団に対する仮説を、データの情報からテストする。
  2.2 母平均の検定
    ・どういう時に使うのか
      ある標本集団が、母集団からかけ離れていると言いたいとき。
    ・その方法
      はじめに、仮説と対立仮説をたてる。
        仮説  H0：母集団の母平均μはμ0である。
        対立仮説 H1：母集団の母平均μはμ0ではない。
      この仮説が成り立つ時、母集団は正規分布N(μ0、σ2) に従うので、
      この母集団から取り出した大きさNの標本{x1,x2,…xN}もそれぞれ
      正規分布(μ0、σ2) に従っている。この時、統計検定量
       “T(x,s2)＝ (x-μ0)/(s2/N)**(1/2) は自由度 N-1 の
         
         t分布に従う”
      ことが知られている。ただし、x：標本平均、s2：標本分散。
      ここで統計検定量 T(x,s2)の値が棄却域に入るならば、仮説がおかしいと
      考える。つまり母集団の母平均μはμ0ではないと考える。
  2.3差の検定







