Machine-learning-with-python-box-and-whisker-plots

提供:Dev Guides
移動先:案内検索

機械学習-箱ひげ図

ボックスプロットとウィスカープロット(略してボックスプロットとも呼ばれます)は、各属性の分布の分布を確認するためのもう1つの便利な手法です。 以下は、この技術の特徴です-

  • 本質的に単変量であり、各属性の分布を要約します。
  • 真ん中の値に線を引きます。 中央値。
  • 25%と75%の周りにボックスを描画します。
  • また、データの広がりについてのアイデアを提供するひげも描画します。
  • ひげの外側のドットは、外れ値を示します。 外れ値は、中間データの広がりのサイズの1.5倍になります。

次の例では、PythonスクリプトはPima Indian Diabetesデータセットの属性の分布の密度プロットを生成します。

from matplotlib import pyplot
from pandas import read_csv
path = r"C:\pima-indians-diabetes.csv"
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(path, names = names)
data.plot(kind = 'box', subplots = True, layout = (3,3), sharex = False,sharey = False)
pyplot.show()

出力

箱ひげ図

上記の属性の分布のプロットから、年齢、テスト、および皮膚が小さな値に向かって歪んでいることがわかります。