Time-series-server-auto-regression
提供:Dev Guides
時系列-自動回帰
定常時系列の場合、自動回帰モデルは、時間「t」での変数の値を、その前の「p」時間ステップの値の線形関数として認識します。 数学的には次のように書くことができます-
y _ \ {t} = \:C + \:\ phi _ \ {1} y _ \ {t-1} \:+ \:\ phi _ \ {2} Y _ \ {t-2} + ... + \ phi _ \ {p} y _ \ {tp} + \ epsilon _ \ {t}
ここで、「p」は自己回帰トレンドパラメーターです。
$ \ epsilon _ \ {t} $はホワイトノイズであり、
$ y _ \ {t-1}、y _ \ {t-2} \:\:… y _ \ {t-p} $は、前の期間の変数の値を示します。
pの値は、さまざまな方法を使用して調整できます。 「p」の適切な値を見つける1つの方法は、自己相関プロットをプロットすることです。
注-テストデータはモデルの精度を調べるためのものであり、仮定はそうではないため、データを分析する前に、利用可能な合計データの8:2の比率でデータをトレインとテストに分離する必要があります予測が行われるまで利用できます。 時系列の場合、データポイントのシーケンスは非常に重要であるため、データの分割中に順序を失わないように注意する必要があります。
自己相関プロットまたはコレログラムは、以前のタイムステップでの変数とそれ自体の関係を示します。 ピアソンの相関を利用して、95%信頼区間内の相関を示します。 データの「温度」変数がどのように見えるかを見てみましょう。
ACPを表示
[141]で:
split = len(df) - int(0.2*len(df))
train, test = df['T'][0:split], df['T'][split:]
[142]で:
from statsmodels.graphics.tsaplots import plot_acf
plot_acf(train, lags = 100)
plt.show()
影付きの青い領域の外側にあるすべてのラグ値は、相関があると見なされます。