Seaborn-kernel-density-estimates

提供:Dev Guides
移動先:案内検索

Seaborn-カーネル密度の推定

カーネル密度推定(KDE)は、連続確率変数の確率密度関数を推定する方法です。 ノンパラメトリック分析に使用されます。

*distplot* で *hist* フラグをFalseに設定すると、カーネル密度推定プロットが生成されます。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()

出力

グラフ

パラメトリック分布のあてはめ

  • distplot()*は、データセットのパラメトリック分布を視覚化するために使用されます。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()

出力

ヒストグラム

二変量分布のプロット

2変量分布は、2つの変数間の関係を決定するために使用されます。 これは主に2つの変数間の関係と、1つの変数が他の変数に対してどのように動作するかを扱います。

seabornの二変量分布を分析する最良の方法は、* jointplot()*関数を使用することです。

Jointplotは、2つの変数間の2変量関係を予測するマルチパネルの図を作成し、各変数の単変量分布も別々の軸に投影します。

散布図

散布図は、各観測がx軸とy軸を介して2次元プロットで表される分布を視覚化する最も便利な方法です。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()

出力

バーとヒストグラム

上の図は、Irisデータの petal_lengthpetal_width の関係を示しています。 プロットの傾向は、調査中の変数間に正の相関があることを示しています。

六角形プロット

六角形のビニングは、データが密度がまばらな場合、つまり、データが非常に散在しており、散布図で分析するのが難しい場合、二変量データ分析で使用されます。

「kind」と値「hex」と呼ばれる追加パラメーターは、hexbinプロットをプロットします。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

HExagon and bar

カーネル密度推定

カーネル密度の推定は、変数の分布を推定するノンパラメトリックな方法です。 seabornでは、* jointplot()。*を使用してkdeをプロットできます。

カーネルプロットをプロットするには、パラメーターの種類に値「kde」を渡します。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

出力

xray