Machine-learning-with-python-simple-linear-regression
機械学習-単純な線形回帰
単一の機能を使用して応答を予測する線形回帰の最も基本的なバージョンです。 SLRの前提は、2つの変数が線形に関連していることです。
Pythonの実装
SLRをPythonに実装するには、2つの方法があります。1つは独自のデータセットを提供する方法、もう1つはscikit-learn pythonライブラリのデータセットを使用する方法です。
- 例1 *-次のPython実装例では、独自のデータセットを使用しています。
まず、次のように必要なパッケージのインポートから始めます-
次に、SLRの重要な値を計算する関数を定義します-
次のスクリプト行は、観測数nを与えます-
xとyベクトルの平均は次のように計算できます-
次のようにxに関する交差偏差と偏差を見つけることができます-
次に、回帰係数、すなわち bは次のように計算することができます-
次に、回帰直線をプロットし、応答ベクトルを予測する関数を定義する必要があります-
次のスクリプト行は、実際のポイントを散布図としてプロットします-
次のスクリプト行は、応答ベクトルを予測します-
次のスクリプト行は回帰直線をプロットし、それらにラベルを付けます-
最後に、データセットを提供し、上記で定義した関数を呼び出すためのmain()関数を定義する必要があります-
出力
- 例2 *-次のPython実装例では、scikit-learnの糖尿病データセットを使用しています。
まず、次のように必要なパッケージのインポートから始めます-
次に、糖尿病データセットをロードし、そのオブジェクトを作成します-
SLRを実装しているので、次のように1つの機能のみを使用します-
次に、次のようにデータをトレーニングセットとテストセットに分割する必要があります-
次に、次のようにターゲットをトレーニングセットとテストセットに分割する必要があります-
さて、モデルを訓練するには、次のように線形回帰オブジェクトを作成する必要があります-
次に、次のようにトレーニングセットを使用してモデルをトレーニングします-
次に、次のようにテストセットを使用して予測を行います-
次に、MSE、分散スコアなどの係数を出力します。 次のように-
今、次のように出力をプロットします-
出力