Machine-learning-with-python-box-and-whisker-plots
提供:Dev Guides
機械学習-箱ひげ図
ボックスプロットとウィスカープロット(略してボックスプロットとも呼ばれます)は、各属性の分布の分布を確認するためのもう1つの便利な手法です。 以下は、この技術の特徴です-
- 本質的に単変量であり、各属性の分布を要約します。
- 真ん中の値に線を引きます。 中央値。
- 25%と75%の周りにボックスを描画します。
- また、データの広がりについてのアイデアを提供するひげも描画します。
- ひげの外側のドットは、外れ値を示します。 外れ値は、中間データの広がりのサイズの1.5倍になります。
例
次の例では、PythonスクリプトはPima Indian Diabetesデータセットの属性の分布の密度プロットを生成します。
from matplotlib import pyplot
from pandas import read_csv
path = r"C:\pima-indians-diabetes.csv"
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(path, names = names)
data.plot(kind = 'box', subplots = True, layout = (3,3), sharex = False,sharey = False)
pyplot.show()
出力
上記の属性の分布のプロットから、年齢、テスト、および皮膚が小さな値に向かって歪んでいることがわかります。