Seaborn-plotting-categorical-data
提供:Dev Guides
Seaborn-カテゴリーデータのプロット
前の章では、調査中の連続変数の分析に使用される散布図、hexbinプロット、kdeプロットについて学びました。 これらのプロットは、調査中の変数がカテゴリカルである場合には適していません。
検討中の変数の一方または両方がカテゴリカルである場合、striplot()、swarmplot()などのプロットを使用します。 Seabornは、そうするためのインターフェイスを提供します。
カテゴリー散布図
このセクションでは、カテゴリー散布図について学習します。
stripplot()
stripplot()は、調査中の変数の1つがカテゴリカルである場合に使用されます。 軸のいずれか1つに沿ってソートされた順序でデータを表します。
例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = df)
plt.show()
出力
上記のプロットでは、各種の petal_length の違いを明確に見ることができます。 ただし、上記の散布図の主な問題は、散布図上の点が重なっていることです。 「ジッタ」パラメータを使用して、この種のシナリオを処理します。
ジッタは、データにランダムノイズを追加します。 このパラメーターは、カテゴリー軸に沿って位置を調整します。
例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = df, jitter = Ture)
plt.show()
出力
これで、ポイントの分布を簡単に確認できます。
Swarmplot()
「ジッタ」の代替として使用できる別のオプションは、関数* swarmplot()*です。 この関数は、散布図の各ポイントをカテゴリ軸上に配置し、それによってポイントの重複を回避します-
例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.swarmplot(x = "species", y = "petal_length", data = df)
plt.show()