Statistics-required-sample-size
統計-必要なサンプルサイズ
テストの重要な部分は、テストの尺度の選択です。 探索を完了するために大衆から選択されるユニットの量。 明確な答えや、最適なサイズを特徴付ける答えはありません。 例が大衆の10%であるべきか、標本サイズが宇宙の範囲に相対的であるように、テストの範囲に関して誤った判断が確かにあります。 しかし、前述のように、これらは見当違いの判断です。 標本がどれほど広範囲にあるべきかは、研究中の人口パラメータの多様性と専門家が必要とする正確さの評価です。
サンプルの最適サイズの決定は、2つの角度からアプローチできます。 主観的および数学的。
- サンプルサイズを決定する主観的アプローチ
- サンプルサイズ決定の数学的アプローチ
サンプルサイズを決定する主観的アプローチ
サンプルのサイズの選択は、以下で説明するさまざまな要因の影響を受けます。
- 人口の性質-均質性または不均質性のレベルは、標本の範囲に影響します。 大衆が興味のある質に関して均質であるという偶然に、標本の少しのサイズでさえ適切です。 ただし、人口が異質な場合は、十分な代表性を保証するために、より大きな例が必要になります。
- 回答者の性質-回答者が楽にアクセスでき、利用できる場合、必要なデータは小さな例から取得できます。 偶然にも関わらず、回答者が非協力的であり、非反応が高いことに依存している場合、より大きな標本が必要になります。
- Nature of Study -実質的な例を使用して、1回限りの調査を行うことができます。 一定の性質を持ち、真剣に完了する試験研究が発生する場合、小さな標本は、長いコンパスにわたって小さな例を監督し、保持するのが難しいので、より適しています。
- 使用されるサンプリングテクニック-テストの範囲に影響を与える重要な変数は、受け取った検査システムです。 まず、非尤度システムでは、尤度戦略よりも大きな標本が必要です。 尤度テストのほかに、簡単な不規則な検査が利用される場合、層別化が利用される場合よりも大きなサンプルが必要です。
- 集計の複雑さ-標本の見積もりに落ち着く間、専門家は同様に、発見が組み立てられて分解される分類とクラスの量を考慮すべきです。 生成される分類の量が多いほど、サンプルサイズが大きくなることがわかっています。 すべてのクラスが十分に話されるべきであるため、最も小さな分類の確実な測定を行うには、より大きな標本が必要です。
- リソースの可用性-専門家がアクセスできる資産と時間は、テスト期間に影響します。 検査は期間と現金でエスカレートされた割り当てであり、機器の準備、フィールドスタッフの契約と準備、輸送コストなどの演習がかなりの資産を占めています。 その後、科学者が十分な時間を持たず、アクセスしやすいようにサポートしている場合、彼は小さな例に落ち着きます。
- 必要な精度と精度-。 以前の談話から、標準的な失態によって測定される精度は、S.Eが小さいか、サンプルのサイズがかなり大きい場合にのみ高くなることが明らかになっています。
また、高精度を得るには、より大きな試料が必要です。 これらの主観的な努力の他に、サンプルサイズも数学的に決定できます。
サンプルサイズ決定の数学的アプローチ
サンプルサイズを決定するための数学的アプローチでは、必要な推定精度が最初に記載され、次にサンプルサイズが算出されます。 精度は、99%の信頼レベルで真の平均の$ \ {\ pm} $ 1として指定できます。 これは、サンプル平均が200の場合、平均の真の値は199〜201であることを意味します。 このレベルの精度は、「c」という用語で示されます
平均のサンプルサイズの決定。
宇宙平均の信頼区間は、
$ \ {\ bar x \ pm Z \ frac \ {\ sigma_p} \ {\ sqrt N} \または\ \ bar x \ pm e} $
どこ-
- $ \ {\ bar x} $ =サンプル平均
- $ \ {e} $ =許容エラー
- $ \ {Z} $ =所定の信頼水準での標準正規変量の値
- $ \ {\ sigma_p} $ =母集団の標準偏差
- $ \ {n} $ =サンプルのサイズ
許容可能なエラー「e」、つまり $ \ {\ mu} $と$ \ {\ bar x} $の違いは、
$ \ {Z. \ frac \ {\ sigma_p} \ {\ sqrt N}} $
したがって、サンプルのサイズは次のとおりです。>
$ \ {n = \ frac \ {Z ^ 2 \ {\ sigma_p} ^ 2} \ {e ^ 2}} $
Or
サンプルサイズが人口サイズに対して有意な場合、上記の式は有限人口乗数によって修正されます。
$ \ {n = \ frac \ {Z ^ 2.N。\ {\ sigma_p} ^ 2} \ {(N-1)e ^ 2 + Z ^ 2。\ {\ sigma_p} ^ 2}} $
どこ-
- $ \ {N} $ =母集団のサイズ
割合のサンプルサイズの決定
割合を推定する際の標本サイズの決定方法は、平均の推定方法と同じです。 宇宙の割合$ \ {\ hat p} $の信頼区間は、
$ \ {p \ pm Z. \ sqrt \ {\ frac \ {p.q} \ {n}}} $
どこ-
- $ \ {p} $ =サンプルの割合
- $ \ {q =(1-p)} $
- $ \ {Z} $ =サンプル比率の標準正規変量の値
- $ \ {n} $ =サンプルのサイズ
$ \ {\ hat p} $は推定されるため、pの値は、許容可能な値であるp = 0.5の値をとることで決定でき、控えめなサンプルサイズが得られます。 もう1つのオプションは、pの値をパイロットスタディまたは個人の判断に基づいて推定することです。 pの値が与えられると、許容誤差「e」は
$ \ {e = Z. \ sqrt \ {\ frac \ {pq} \ {n}} \\ [7pt] e ^ 2 = Z ^ 2 \ frac \ {pq} \ {n} \\ [7pt] n = \ frac \ {Z ^ 2.pq} \ {e ^ 2}} $
母集団が有限の場合、上記の式は有限母集団乗数によって修正されます。
$ \ {n = \ frac \ {Z ^ 2.p.q.N} \ {e ^ 2(N-1)+ Z ^ 2.p.q}} $
例
問題文:
ショッピングストアは、ストアの特権会員カードを所有している世帯の割合を推定することに関心があります。 以前の調査では、世帯の59%が店舗のクレジットカードを持っていることが示されています。 95の信頼レベルで、許容エラーレベル05。
- 調査の実施に必要なサンプルサイズを決定します。
- 対象世帯の数が1000であることがわかっている場合、サンプルサイズはどうなりますか?
溶液:
ストアには次の情報があります
$ \ {p = .59 \\ [7pt] \ Rightarrow q =(1-p)=(1-.59)= .41 \\ [7pt] CL = .95 \\ [7pt] And \ the \ Z \ standard \ variate \ for \ CL \ .95 \ is \ 1.96 \\ [7pt] e = \ pm .05} $
サンプルサイズは、次の式を適用して決定できます。
$ \ {n = \ frac \ {Z ^ 2.p.q} \ {e ^ 2}} $
$ \ {n = \ frac \ {(1.96)^ 2。(。59)。(。41)} \ {(。05)^ 2} \\ [7pt] = \ frac \ {。9226} \ {。0025} \\ [7pt] = 369} $
したがって、調査を実施するには369世帯のサンプルで十分です。
人口以来 対象世帯は1000であることがわかっており、上記のサンプルは総人口のかなりの割合であるため、有限の人口乗数を含む修正された式が使用されます。
$ \ {n = \ frac \ {Z ^ 2.p.q.N} \ {e ^ 2(N-1)+ Z ^ 2.p.q} \\ [7pt] = \ frac \ {(1.96)^ 2。(。59)。(。41)。(1000)} \ {(。05)^ 2 \ times 999 +(1.96)^ 2(.59)(。41)} \\ [7pt] = \ frac \ {922.6} \ {2.497 + .922} \\ [7pt] = 270} $
したがって、人口が1000世帯の有限集団である場合、調査の実施に必要なサンプルサイズは270です。
この図から、母集団のサイズがわかっている場合、決定されたサンプルサイズのサイズが小さくなっていることがわかります。