Python-data-science-python-p-value

提供:Dev Guides
移動先:案内検索

Python-P値

p値は仮説の強さに関するものです。 いくつかの統計モデルに基づいて仮説を立て、p値を使用してモデルの有効性を比較します。 p値を取得する1つの方法は、T検定を使用することです。

これは、独立した観測値 'a’のサンプルの期待値(平均)が指定された母集団平均 popmean に等しいという帰無仮説の両側検定です。 次の例を考えてみましょう。

from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)

上記のプログラムは、次の出力を生成します。

Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))

2つのサンプルの比較

次の例では、同じ分布または異なる分布からの2つのサンプルがあり、これらのサンプルが同じ統計特性を持っているかどうかをテストします。

*ttest_ind* -スコアの2つの独立したサンプルの平均のT検定を計算します。 これは、2つの独立したサンプルの平均値(期待値)が同一であるという帰無仮説の両側検定です。 このテストでは、デフォルトで母集団の分散が同一であると想定しています。

同じ母集団または異なる母集団からの2つの独立したサンプルを観察する場合、このテストを使用できます。 次の例を考えてみましょう。

from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)

上記のプログラムは、次の出力を生成します。

Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)

同じ長さの新しい配列を使用して、同じことをテストできますが、平均は異なり​​ます。 loc で別の値を使用し、同じ値をテストします。