Statistics-residual-analysis
提供:Dev Guides
統計-残差分析
残差分析を使用して、残差を定義し、残差プロットグラフを調べることにより、線形回帰モデルの妥当性を評価します。
残差
残差($ e $)は、観測値($ y $)と予測値($ \ hat y $)の差を指します。 すべてのデータポイントには1つの残差があります。
$ \ {残余= observedValue-predictValue \\ [7pt] e = y-\ hat y} $
残差プロット
残差プロットは、残差が縦軸にあり、独立変数が横軸にあるグラフです。 ドットが水平軸の周りにランダムに分散している場合、線形回帰モデルがデータに適しています。それ以外の場合は、非線形モデルを選択します。
残差プロットの種類
次の例は、残差プロットのいくつかのパターンを示しています。
最初の場合、ドットはランダムに分散されます。 したがって、線形回帰モデルが推奨されます。 2番目と3番目の場合、ドットはランダムに分散されておらず、非線形回帰法が好ましいことを示唆しています。
例
問題文:
線形回帰モデルが次のデータに適している場所を確認します。
$ x $ | 60 | 70 | 80 | 85 | 95 |
$ y $ (Actual Value) | 70 | 65 | 70 | 95 | 85 |
$ \hat y $ (Predicted Value) | 65.411 | 71.849 | 78.288 | 81.507 | 87.945 |
溶液:
- ステップ1:*各データポイントの残差を計算します。
$ x $ | 60 | 70 | 80 | 85 | 95 |
$ y $ (Actual Value) | 70 | 65 | 70 | 95 | 85 |
$ \hat y $ (Predicted Value) | 65.411 | 71.849 | 78.288 | 81.507 | 87.945 |
$ e $ (Residual) | 4.589 | -6.849 | -8.288 | 13.493 | -2.945 |
ステップ2:-残差プロットグラフを描画します。
ステップ3:-残差のランダム性を確認します。
ここで、残差プロットはランダムパターンを示します。最初の残差は正、次の2つは負、4番目は正、最後の残差は負です。 パターンは非常にランダムであるため、線形回帰モデルが上記のデータに適していることを示しています。