Statistics-outlier-function

提供:Dev Guides
移動先:案内検索

統計-外れ値関数

確率分布関数の外れ値は、下位または上位の四分位数から離れたデータセットの長さの1.5倍を超える数です。 具体的には、数値が$ \ {Q_1-1.5 \ times IQR} $未満または$ \ {Q_3 + 1.5 \ times IQR} $より大きい場合、それは外れ値です。

外れ値は、次の確率関数によって定義および指定されます。

$ \ {Outlier \ datas \ are \、\ lt Q_1-1.5 \ times IQR \(または)\ \ gt Q_3 + 1.5 \ times IQR} $

どこ-

  • $ \ {Q_1} $ =四分位
  • $ \ {Q_2} $ = 3番目の四分位
  • $ \ {IQR} $ =四分位範囲

問題文:

8つの異なる学生の定期的なタスクカウントを表すデータセットを考えます。 タスクカウント情報セットは、11、13、15、3、16、25、12、14です。 学生の定期的なタスクカウントから外れ値データを見つけます。

溶液:

与えられたデータセットは次のとおりです。

11 13 15 3 16 25 12 14

昇順に並べます:

3 11 12 13 14 15 16 25

最初の四分位値()$ \ {Q_1} $

$ \ {Q_1 = \ frac \ {(11 + 12)} \ {2} \\ [7pt] \ = 11.5} $

3番目の四分位値()$ \ {Q_3} $

$ \ {Q_3 = \ frac \ {(15 + 16)} \ {2} \\ [7pt] \ = 15.5} $

低外れ値範囲(L)

$ \ {Q_1-1.5 \ times IQR \\ [7pt] \ = 11.5-(1.5 \ times 4)\\ [7pt] \ = 11.5-6 \\ [7pt] \ = 5.5} $

上限外れ値範囲(L)

$ \ {Q_3 + 1.5 \ times IQR \\ [7pt] \ = 15.5 +(1.5 \ times 4)\\ [7pt] \ = 15.5 + 6 \\ [7pt] \ = 21.5} $

与えられた情報では、5.5と21.5は与えられたデータセットの他の値よりも大きいです。 3は5.5より大きく、25は21.5より小さいため、3と25を除きます。

このようにして、3と25を外れ値として利用します。