Machine-learning-with-python-understanding-data-with-visualization

提供:Dev Guides
移動先:案内検索

ML-視覚化によるデータの理解

前書き

前の章では、統計を使用してデータを理解するためのいくつかのPythonレシピとともに、機械学習アルゴリズムのデータの重要性について説明しました。 データを理解するために、視覚化と呼ばれる別の方法があります。

データの視覚化により、データがどのように見え、データの属性によってどのような相関関係が保持されているかを確認できます。 これは、機能が出力に対応しているかどうかを確認する最も速い方法です。 Pythonのレシピに従うことで、統計付きのMLデータを理解できます。

データ視覚化手法

一変量プロット:属性を独立して理解する

最も単純なタイプの視覚化は、単一変数または「単変量」視覚化です。 単変量視覚化の助けを借りて、データセットの各属性を個別に理解できます。 以下は、単変量視覚化を実装するためのPythonのテクニックです-

Sr.No Univariate Plots & Description
1

Histograms

ヒストグラムはビン内のデータをグループ化し、データセット内の各属性の分布について知るための最速の方法です。

2

Density Plots

各属性分布を取得するための別の迅速で簡単な手法は、密度プロットです。

3

Box and Whisker Plots

ボックスプロットとウィスカープロット(略してボックスプロットとも呼ばれます)は、各属性の分布の分布を確認するためのもう1つの便利な手法です。

多変量プロット:複数の変数間の相互作用

別の種類の視覚化は、多変数または「多変量」視覚化です。 多変量視覚化の助けを借りて、データセットの複数の属性間の相互作用を理解できます。 以下は、多変量視覚化を実装するためのPythonのテクニックです-

Sr.No Multivariate Plots & Description
1

Correlation Matrix Plot

相関は、2つの変数間の変化に関する指標です。

2

Scatter Matrix Plot

散布図は、2つの次元のドットを使用して、1つの変数が別の変数によってどの程度影響を受けるか、または変数間の関係を示します。