Statistics-outlier-function
統計-外れ値関数
確率分布関数の外れ値は、下位または上位の四分位数から離れたデータセットの長さの1.5倍を超える数です。 具体的には、数値が$ \ {Q_1-1.5 \ times IQR} $未満または$ \ {Q_3 + 1.5 \ times IQR} $より大きい場合、それは外れ値です。
外れ値は、次の確率関数によって定義および指定されます。
式
$ \ {Outlier \ datas \ are \、\ lt Q_1-1.5 \ times IQR \(または)\ \ gt Q_3 + 1.5 \ times IQR} $
どこ-
- $ \ {Q_1} $ =四分位
- $ \ {Q_2} $ = 3番目の四分位
- $ \ {IQR} $ =四分位範囲
例
問題文:
8つの異なる学生の定期的なタスクカウントを表すデータセットを考えます。 タスクカウント情報セットは、11、13、15、3、16、25、12、14です。 学生の定期的なタスクカウントから外れ値データを見つけます。
溶液:
与えられたデータセットは次のとおりです。
11 | 13 | 15 | 3 | 16 | 25 | 12 | 14 |
昇順に並べます:
3 | 11 | 12 | 13 | 14 | 15 | 16 | 25 |
最初の四分位値()$ \ {Q_1} $
$ \ {Q_1 = \ frac \ {(11 + 12)} \ {2} \\ [7pt] \ = 11.5} $
3番目の四分位値()$ \ {Q_3} $
$ \ {Q_3 = \ frac \ {(15 + 16)} \ {2} \\ [7pt] \ = 15.5} $
低外れ値範囲(L)
$ \ {Q_1-1.5 \ times IQR \\ [7pt] \ = 11.5-(1.5 \ times 4)\\ [7pt] \ = 11.5-6 \\ [7pt] \ = 5.5} $
上限外れ値範囲(L)
$ \ {Q_3 + 1.5 \ times IQR \\ [7pt] \ = 15.5 +(1.5 \ times 4)\\ [7pt] \ = 15.5 + 6 \\ [7pt] \ = 21.5} $
与えられた情報では、5.5と21.5は与えられたデータセットの他の値よりも大きいです。 3は5.5より大きく、25は21.5より小さいため、3と25を除きます。
このようにして、3と25を外れ値として利用します。