Machine-learning-with-python-multiple-linear-regression
ML-多重線形回帰
2つ以上の機能を使用して応答を予測するのは、単純な線形回帰の拡張です。 数学的には、次のように説明できます-
h(x _ \ {i})\:= \:b _ \ {0} \:+ \:b _ \ {1} x _ \ {i1} \:+ b _ \ {2} x _ \ {i2} \: + \ dotsm + b _ \ {p} x _ \ {ip}
ここで、$ h(x _ \ {i})$は予測応答値であり、$ b _ \ {0}、b _ \ {1}、b _ \ {2}、\ dotsm \:b _ \ {p} $は回帰です。係数。
多重線形回帰モデルには、常に計算を次のように変更する残留誤差として知られるデータの誤差が含まれます-
h(x _ \ {i})\:= \:b _ \ {0} + b _ \ {1} x _ \ {i1} + b _ \ {2} x _ \ {i2} + \ dotsm + b _ \ {p } x _ \ {ip} + e _ \ {i}
また、次のように上記の方程式を書くことができます-
$ y _ \ {i} \:= \:h(x _ \ {i})+ e _ \ {i} \:or \:e _ \ {i} \:= \:y _ \ {i} -h(x_ \ {i})$
Pythonの実装
この例では、scikit Learnからボストンの住宅データセットを使用します-
まず、次のように必要なパッケージのインポートから始めます-
次に、次のようにデータセットをロードします-
次のスクリプト行は、特徴行列、Xと応答ベクトル、Yを定義します-
次に、次のようにデータセットをトレーニングセットとテストセットに分割します-
今、線形回帰オブジェクトを作成し、次のようにモデルを訓練します-
出力