時系列-エラーメトリック

モデルのパフォーマンスを定量化してフィードバックおよび比較として使用することが重要です。このチュートリアルでは、最も一般的なエラーメトリックの二乗平均平方根エラーを使用しました。他にもさまざまなエラーメトリックが利用可能です。この章では、それらについて簡単に説明します。

平均二乗誤差

これは、予測値と真の値の差の2乗の平均です。 Sklearnはそれを関数として提供します。これは、真の値と予測値の二乗と同じ単位を持ち、常に正です。

MSE = \ frac \ {1} \ {n} \ displaystyle \ sum \ limits _ \ {t = 1} ^ n \ lgroup y '_ \ {t} \：-y _ \ {t} \ rgroup ^ \ { 2}

$ y '_ \ {t} $が予測値である場合、

$ y _ \ {t} $は実際の値であり、

nは、テストセット内の値の総数です。

式から、MSEがより大きなエラーまたは外れ値に対してよりペナルティを課していることが明らかです。

これは、平均二乗誤差の平方根です。また、常に正であり、データの範囲内にあります。

RMSE = \ sqrt \ {\ frac \ {1} \ {n} \ displaystyle \ sum \ limits _ \ {t = 1} ^ n \ lgroup y '_ \ {t} -y _ \ {t} \ rgroup ^ 2}

ここで、$ y '_ \ {t} $は予測値です

$ y _ \ {t} $は実際の値であり、

nは、テストセット内の値の総数です。

それは団結の力であり、したがってMSEと比較してより解釈可能です。 RMSEは、より大きなエラーに対してもより不利になります。チュートリアルではRMSEメトリックを使用しました。

これは、予測値と真の値の絶対差の平均です。予測値と真値と同じ単位を持ち、常に正です。

MAE = \ frac \ {1} \ {n} \ displaystyle \ sum \ limits _ \ {t = 1} ^ \ {t = n} | y '\ {t} -y _ \ {t} \ lvert

ここで、$ y '_ \ {t} $は予測値です。

$ y _ \ {t} $は実際の値であり、

nは、テストセット内の値の総数です。

これは、予測値と真の値の絶対差の平均の割合を真の値で割ったものです。

MAPE = \ frac \ {1} \ {n} \ displaystyle \ sum \ limits _ \ {t = 1} ^ n \ frac \ {y '_ \ {t} -y _ \ {t}} \ {y_ \ {t}} *100 \：\％

ここで、$ y '_ \ {t} $は予測値です。

$ y _ \ {t} $は実際の値で、nはテストセットの値の総数です。

ただし、このエラーを使用する場合の欠点は、正のエラーと負のエラーが互いに相殺できることです。したがって、平均絶対パーセント誤差が使用されます。

これは、予測値と真の値の絶対差の平均の割合を真の値で割ったものです。

MAPE = \ frac \ {1} \ {n} \ displaystyle \ sum \ limits _ \ {t = 1} ^ n \ frac \ {| y '_ \ {t} -y _ \ {t} \ lvert} \ {y _ \ {t}}* 100 \：\％

$ y '_ \ {t} $は予測値です

$ y _ \ {t} $は実際の値であり、

nは、テストセット内の値の総数です。