Seaborn-statistical-estimation

提供:Dev Guides
移動先:案内検索

シーボーン-統計的推定

ほとんどの状況では、データの分布全体の推定を扱います。 しかし、中心傾向の推定に関しては、分布を要約する特定の方法が必要です。 平均と中央値は、分布の中心傾向を推定するために非常に頻繁に使用される手法です。

上記のセクションで学んだすべてのプロットで、分布全体の視覚化を行いました。 次に、分布の中心傾向を推定できるプロットについて説明します。

バープロット

  • barplot()*は、カテゴリ変数と連続変数の関係を示します。 データは長方形のバーで表され、バーの長さはそのカテゴリのデータの割合を表します。

棒グラフは、中心傾向の推定値を表します。 「タイタニック」データセットを使用して棒グラフを学習しましょう。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.barplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

出力

barplot

上記の例では、各クラスの男性と女性の平均生存数がわかります。 このプロットから、男性よりも多くの女性が生き残ったことがわかります。 男性と女性の両方で、より多くの生存者がファーストクラスからのものです。

barplotの特殊なケースは、2番目の変数の統計を計算するのではなく、各カテゴリの観測数を表示することです。 このために、* countplot()。*を使用します

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.countplot(x = " class ", data = df, palette = "Blues");
plt.show()

出力

バーグラフ

プロットによると、3番目のクラスの乗客の数は、1番目と2番目のクラスよりも多くなっています。

点プロット

ポイントプロットはバープロットと同じように機能しますが、スタイルが異なります。 バー全体ではなく、推定値は他の軸上の特定の高さのポイントで表されます。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.pointplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

出力

zSymbol