Seaborn-kernel-density-estimates
提供:Dev Guides
Seaborn-カーネル密度の推定
カーネル密度推定(KDE)は、連続確率変数の確率密度関数を推定する方法です。 ノンパラメトリック分析に使用されます。
*distplot* で *hist* フラグをFalseに設定すると、カーネル密度推定プロットが生成されます。
例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()
出力
パラメトリック分布のあてはめ
- distplot()*は、データセットのパラメトリック分布を視覚化するために使用されます。
例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()
出力
二変量分布のプロット
2変量分布は、2つの変数間の関係を決定するために使用されます。 これは主に2つの変数間の関係と、1つの変数が他の変数に対してどのように動作するかを扱います。
seabornの二変量分布を分析する最良の方法は、* jointplot()*関数を使用することです。
Jointplotは、2つの変数間の2変量関係を予測するマルチパネルの図を作成し、各変数の単変量分布も別々の軸に投影します。
散布図
散布図は、各観測がx軸とy軸を介して2次元プロットで表される分布を視覚化する最も便利な方法です。
例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()
出力
上の図は、Irisデータの petal_length と petal_width の関係を示しています。 プロットの傾向は、調査中の変数間に正の相関があることを示しています。
六角形プロット
六角形のビニングは、データが密度がまばらな場合、つまり、データが非常に散在しており、散布図で分析するのが難しい場合、二変量データ分析で使用されます。
「kind」と値「hex」と呼ばれる追加パラメーターは、hexbinプロットをプロットします。
例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()
カーネル密度推定
カーネル密度の推定は、変数の分布を推定するノンパラメトリックな方法です。 seabornでは、* jointplot()。*を使用してkdeをプロットできます。
カーネルプロットをプロットするには、パラメーターの種類に値「kde」を渡します。
例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()