Seaborn-plotting-categorical-data

提供:Dev Guides
移動先:案内検索

Seaborn-カテゴリーデータのプロット

前の章では、調査中の連続変数の分析に使用される散布図、hexbinプロット、kdeプロットについて学びました。 これらのプロットは、調査中の変数がカテゴリカルである場合には適していません。

検討中の変数の一方または両方がカテゴリカルである場合、striplot()、swarmplot()などのプロットを使用します。 Seabornは、そうするためのインターフェイスを提供します。

カテゴリー散布図

このセクションでは、カテゴリー散布図について学習します。

stripplot()

stripplot()は、調査中の変数の1つがカテゴリカルである場合に使用されます。 軸のいずれか1つに沿ってソートされた順序でデータを表します。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = df)
plt.show()

出力

ボックス

上記のプロットでは、各種の petal_length の違いを明確に見ることができます。 ただし、上記の散布図の主な問題は、散布図上の点が重なっていることです。 「ジッタ」パラメータを使用して、この種のシナリオを処理します。

ジッタは、データにランダムノイズを追加します。 このパラメーターは、カテゴリー軸に沿って位置を調整します。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = df, jitter = Ture)
plt.show()

出力

ドット

これで、ポイントの分布を簡単に確認できます。

Swarmplot()

「ジッタ」の代替として使用できる別のオプションは、関数* swarmplot()*です。 この関数は、散布図の各ポイントをカテゴリ軸上に配置し、それによってポイントの重複を回避します-

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.swarmplot(x = "species", y = "petal_length", data = df)
plt.show()

出力

シェード