Statistics-data-patterns

提供:Dev Guides
移動先:案内検索

統計-データパターン

データパターンは、グラフィカルに描画する場合に非常に便利です。 中心、広がり、形状、およびその他の異常な特性などの機能に関して一般的に説明されるデータパターン。 他の特別な記述ラベルは、対称、ベル形、斜めなどです。

センター

分布の中心は、グラフィカルに、分布の中央に位置します。 このようなグラフィックチャートは、観測値のほぼ半分が両側にあることを示しています。 各列の高さは、観測の頻度を示します。

中央データパターン

スプレッド

分布の広がりとは、データの変動を指します。 観測セットが広範囲をカバーする場合、広がりは大きくなります。 観測値が単一の値に集中している場合、広がりは小さくなります。

スプレッドデータパターン

形状

分布の形状は、次の特性を使用して説明できます。

  • 対称性-対称分布では、グラフが中央で分割され、各半分が互いに鏡像になります。 + 対称性
  • ピークの数-1つまたは複数のピークを持つ分布。 1つの明確なピークを持つ分布は単峰性と呼ばれ、2つの明確なピークを持つ分布は双峰性と呼ばれます。 中心の単一ピーク対称分布は、ベル型と呼ばれます。 + ピークの数
  • ゆがみ-一部の分布では、グラフの片側に他の側よりも複数の観測値がある場合があります。 低い値に向かう観測値が少ない分布は、右に歪んでいると言われています。また、より低い値に向かって観測値が少ない分布は左に歪んでいると言われます。 + スキューネス
  • 均一-観測値のセットにピークがなく、データが分布の範囲全体に均等に広がっている場合、その分布は均一分布と呼ばれます。 + 均一

珍しい機能

データパターンの一般的な異常な機能は、ギャップと外れ値です。

  • ギャップ-ギャップは、観測値のない分布の領域を指します。 次の図には、分布の中央に観測値がないため、ギャップがあります。 + ギャップ
  • 外れ値-分布は、他の一連の観測データとは大きく異なる極値によって特徴付けられる場合があります。 これらの極値は、外れ値と呼ばれます。 次の図は、外れ値のある分布を示しています。 + 外れ値