Statistics-simple-random-sampling

提供:Dev Guides
移動先:案内検索

統計-単純なランダムサンプリング

単純なランダムサンプルは、母集団の各要素が等しく独立して選択される可能性があるサンプルとして定義されます。 N単位の母集団の場合、N〜C〜n ~~サンプルのすべての可能な組み合わせで、nサンプル単位を選択する確率は、1/N〜C〜n ~~によって与えられます。 5つの要素(A、B、C、D、E)の母集団がある場合、つまり N 5、サイズn = 3のサンプルが必要な場合、5〜C〜3 ~~ = 10のサンプルがあり、1つのユニットがサンプルのメンバーである確率は1/10で与えられます。

単純なランダムサンプリングは、2つの異なる方法で実行できます。 「置換あり」または「置換なし」。 次の描画の前に選択されたユニットを交換した後、ユニットがサンプルに連続して選択されると、それは交換のある単純なランダムサンプルです。 選択されたユニットが次の描画の前に置換されず、連続するユニットの描画が母集団の残りのユニットからのみ行われる場合、置換のない単純なランダムサンプルと呼ばれます。 したがって、前者の方法では、一度選択されたユニットを繰り返すことができますが、後者では、一度選択されたユニットは繰り返されません。 置換のない単純なランダムサンプルに関連する統計的効率が高いため、この方法が推奨されます。

単純なランダムサンプルは、2つの手順のいずれかで描画できます。 宝くじ方法または乱数表を使用します。

  • 宝くじ方法-この方法では、ランダムな抽選に基づいてユニットが選択されます。 まず、人口の各メンバーまたは要素に一意の番号が割り当てられます。 次のステップで、これらの番号は、形状、サイズ、色などが物理的に似ている別のカードに書き込まれます。 次に、バスケットに入れて完全に混ぜます。 最後のステップでは、スリップは見ずにランダムに取り出されます。 描画されるスリップの数は、必要なサンプルサイズと同じです。 +宝くじ法にはいくつかの欠点があります。 N個のスリップを記述するプロセスは面倒であり、人口の規模が非常に大きい多数のスリップをシャッフルすることは困難です。 また、スリップの選択中に人間の偏見が入ることもあります。 したがって、他の選択肢、すなわち 乱数を使用できます。
  • ランダム番号テーブル方式-これらは、ランダムに準備された番号の列で構成されます。 ランダムなテーブルの数が利用可能です。 フィッシャーとイェーツの表、ティペットの乱数など 以下にリストされているのは、Fisher&Yatesテーブルの2桁の乱数のシーケンスです。 + 61、44、65、22、01、67、76、23、57、58、54、11、33、86、07、26、75、76、64、22、19、35、74、49、86 、58、69、52、27、34、91、25、34、67、76、73、27、16、53、18、19、69、32、52、38、72、38、64、81、79および38。 +最初のステップでは、母集団の各メンバーに一意の番号を割り当てます。 人口が20人の場合、すべての個人には01から20までの番号が付けられます。 5つのユニットのサンプルを収集する場合は、乱数表を参照して5つの2桁の数字を選択します。 E.g. 上記の表を使用すると、次の5つの番号を持つユニットがサンプルを形成します:01、11、07、19、および16。 サンプリングが置換なしであり、特定の乱数が繰り返される場合、再度取得されることはなく、基準に適合する次の数値が選択されます。

したがって、2つの手順のいずれかを使用して、単純なランダムサンプルを描画できます。 ただし、実際には、単純なランダムサンプルには多くの時間と労力がかかり、非実用的であることがわかっています。