Statistics-stratified-sampling

提供:Dev Guides
移動先:案内検索

統計-層別サンプリング

調査のためのこの戦略は、集団を特に互いにまったく同じではない集まりまたは層に楽に分割できる状況の一部として利用されますが、集まりの内部のコンポーネントはいくつかの属性に関して同質ですe。 g. 学校の過小評価は、性的指向、提供されるコース、年齢などを前提として階層に分けることができます。 この場合、母集団は最初に階層に分割され、その後、基本的な不規則な標本がすべての階層から取得されます。 層別テストには、比例層別検査と不均衡層別検査の2種類があります。

  • 比例した層別サンプリング-この場合、各階層から選択されるユニットの数は、人口の階層の割合に比例します。 大学には合計2500人の学生がいますが、そのうち1500人が大学院に、1000人が大学院に在籍しています。 比例層別サンプリングを使用して100のサンプルを選択する場合、サンプルに含まれる学部生の数は60であり、40は大学院生です。 したがって、2つの階層は、母集団での表現と同じ割合でサンプルで表現されます。 +この方法は、サンプリングの目的がいくつかの特性の母集団値を推定することであり、層内の差異に差がない場合に最適です。
  • 不均衡な層別サンプリング-調査の目的が階層間の違いを比較することである場合、人口の割合に関係なく、すべての階層から等しい単位を引き出すことが必要になります。 いくつかの階層は、他の階層よりもいくつかの特性に関してより可変である場合があり、そのような場合、より多くのユニットがより可変の階層から引き出される可能性があります。 どちらの状況でも、描かれたサンプルは不均衡な層別サンプルです。 さまざまな階層からサンプルサイズを決定するための次の式を使用して、階層サイズと階層のばらつきの差を最適に割り当てることができます === 式 + $ \ {n_i = \ frac \ {n.n_i \ sigma_i} \ {n_1 \ sigma_1 + n_2 \ sigma_2 + …​ + n_k \ sigma_k} \ for \ i = 1,2 …​ k} $ +ここで-
  • $ \ {n_i} $ = i階層のサンプルサイズ。
  • $ \ {n} $ =階層のサイズ。
  • $ \ {\ sigma_1} $ = i層の標準偏差。 それに加えて、サンプルを収集するコストが、ある層で他の層よりも高くなる場合があります。 + $ \ {\ frac \ {n_1} \ {n_1 \ sigma_1 \ sqrt \ {c_1}} = \ frac \ {n_2} \ {n_2 \ sigma_1 \ sqrt \ {c_2 }} = ... = \ frac \ {n_k} \ {n_k \ sigma_k \ sqrt \ {c_k}}} $ +ここで$ \ {c_1、c_2、... 、c_k} $はk層のサンプリングのコストを示します。 異なる階層からのサンプルサイズは、次の式を使用して決定できます。 $ \ {n_i = \ frac \ {\ frac \ {n.n_i \ sigma_i} \ {\ sqrt \ {c_i}}} \ {\ frac \ { n_1 \ sigma_1} \ {\ sqrt \ {c_i}} + \ frac \ {n_2 \ sigma_2} \ {\ sqrt \ {c_2}} + …​ + \ frac \ {n_k \ sigma_k} \ {\ sqrt \ { c_k}}} \ for \ i = 1,2 …​ k} $

問題文:

組織には、3つのレベルに階層化された5000人の従業員がいます。

  • 階層A:標準偏差= 9のエグゼクティブ50人
  • 階層B:標準偏差= 4の1250人の非手動労働者
  • 階層C:標準偏差= 1の3700人の手動労働者

300人の従業員のサンプルがどのように最適配分で不均衡に引き出されますか

溶液:

最適な配分のために不均衡なサンプリングの公式を使用します。

$ \ {n_i = \ frac \ {n.n_i \ sigma_i} \ {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \、ストリームAの場合、\ {n_1 = \ frac \ {300 (50)(9)} \ {(50)(9)(1250)(4)(3700)(1)}} \\ [7pt] \、= \ {\ frac \ {135000} \ {1950 } = \ {14.75} \または\ say \ \ {15}} \\ [7pt] \、ストリームBの場合、\ {n_1 = \ frac \ {300(1250)(4)} \ {(50)(9 )(1250)(4)(3700)(1)}} \\ [7pt] \、= \ {\ frac \ {150000} \ {1950} = \ {163.93} \または\ say \ \ {167 }} \\ [7pt] \、ストリームCの場合、\ {n_1 = \ frac \ {300(3700)(1)} \ {(50)(9)(1250)(4)(3700)(1 )}} \\ [7pt] \、= \ {\ frac \ {110000} \ {1950} = \ {121.3} \または\ say \ \ {121}} $