Statistics-kolmogorov-smirnov-test
統計-コルモゴロフスミルノフ検定
このテストは、観測されたサンプルの分布と理論上の分布を比較する必要がある状況で使用されます。
K-S Oneサンプルテスト
このテストは適合度のテストとして使用され、サンプルのサイズが小さい場合に最適です。 変数の累積分布関数を指定された分布と比較します。 帰無仮説は、観測分布と理論分布の間に差がないことを前提とし、検定統計量「D」の値は次のように計算されます。
式
$ D =最大| F_o(X)-F_r(X)| $
どこ-
- $ \ {F_o(X)} $ = n個の観測値のランダムサンプルの観測された累積度数分布。
- および$ \ {F_o(X)= \ frac \ {k} \ {n}} $ =(オブザベーションの数≤X)/(オブザベーションの総数)。
- $ \ {F_r(X)} $ =理論的な頻度分布。
$ \ {D} $のクリティカル値は、1つのサンプルテストのK-Sテーブル値から見つかります。
- 合格基準:*計算値が臨界値未満の場合、帰無仮説を受け入れます。
- 棄却基準:*計算値が表の値より大きい場合、帰無仮説を棄却します。
例
問題文:
大学のさまざまなストリームから行われた研究では、各ストリームから同数の学生が選ばれた60人の学生がインタビューされ、大学のドラマクラブに参加する意向が示されました。
学士号
B.A.
B.Com
M.A.
M.Com
No. 各クラスで
5
9
11
16
19
各クラスの12人の学生がドラマクラブに参加することが期待されていました。 K-Sテストを使用して、ドラマクラブへの参加の意図に関して学生のクラスに違いがあるかどうかを確認します。
溶液:
$ \ {H_o} $:ドラマクラブに参加する意向については、ストリームの異なる生徒の間で違いはありません。
観測分布と理論分布の累積頻度を作成します。
ストリーム
No. 参加に興味のある学生の
$ \ {F_O(X)} $
$ \ {F_T(X)} $
$ \ {| F_O(X)-F_T(X)|} $
観察された(O)
理論上の(T)
学士号
5
12
5/60
12/60
7/60
B.A.
9
12
14/60
24/60
10/60
B.COM。
11
12
25/60
36/60
11/60
M.A.
16
12
41/60
48/60
7/60
M.COM。
19
12
60/40
60/60
60/60
合計
n=60
検定統計$ \ {| D |} $は次のように計算されます:
$ D =最大\ {| F_0(X)-F_T(X)|} \\ [7pt] \、= \ frac \ {11} \ {60} \\ [7pt] \、= 0.183 $
5%の有意水準でのDの表の値は、
$ \ {D_0.05 = \ frac \ {1.36} \ {\ sqrt \ {n}}} \\ [7pt] \、= \ frac \ {1.36} \ {\ sqrt \ {60}} \\ [7pt ] \、= 0.175 $
計算された値は臨界値よりも大きいため、帰無仮説を棄却し、クラブに参加する意図にさまざまなストリームの生徒の違いがあると結論付けます。
K-S 2サンプルテスト
1つではなく2つの独立したサンプルがある場合、K-S 2サンプルテストを使用して、2つの累積分布間の一致をテストできます。 帰無仮説は、2つの分布に差がないことを示しています。 D統計は、K-S One Sample Testと同じ方法で計算されます。
式
$ \ {D =最大| \ {F_n} _1(X)-\ {F_n} _2(X)|} $
どこ-
- $ \ {n_1} $ =最初のサンプルからの観測。
- $ \ {n_2} $ = 2番目のサンプルからの観測。
累積分布が大きな最大偏差$ \ {| D |} $を示す場合、2つのサンプル分布の差に向かっていることがわかりました。
$ \ {n_1 = n_2} $で、≤40のサンプルのDの臨界値は、2つのサンプルケースのK-Sテーブルが使用されます。 $ \ {n_1} $および/または$ \ {n_2} $> 40の場合、2つのサンプルテストの大きなサンプルのK-Sテーブルを使用する必要があります。 計算値がテーブル値よりも小さい場合、またはその逆の場合、帰無仮説が受け入れられます。
したがって、これらのノンパラメトリックテストのいずれかを使用すると、ターゲット母集団の特性が不明であるか、それらについての仮定が行われていない場合に、研究者が結果の重要性をテストするのに役立ちます。