Python-data-science-python-time-series

提供:Dev Guides
移動先:案内検索

Python-時系列

時系列は、各データポイントがタイムスタンプに関連付けられている一連のデータポイントです。 簡単な例は、特定の日のさまざまな時点での株式市場の株価です。 別の例は、1年の異なる月の地域の降雨量です。

以下の例では、特定の銘柄記号について四半期ごとに毎日株価の値を取得します。 これらの値をcsvファイルとしてキャプチャし、pandasライブラリを使用してデータフレームに整理します。 次に、追加のValuedate列をインデックスとして再作成し、古いvaluedate列を削除することにより、日付フィールドをデータフレームのインデックスとして設定します。

サンプルデータ

以下は、特定の四半期の異なる日の株式の価格のサンプルデータです。 データは、stock.csvという名前のファイルに保存されます

ValueDate   Price
01-01-2018, 1042.05
02-01-2018, 1033.55
03-01-2018, 1029.7
04-01-2018, 1021.3
05-01-2018, 1015.4
...
...
...
...
23-03-2018, 1161.3
26-03-2018, 1167.6
27-03-2018, 1155.25
28-03-2018, 1154

時系列の作成

from datetime import datetime
import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('path_to_file/stock.csv')
df = pd.DataFrame(data, columns = ['ValueDate', 'Price'])

# Set the Date as Index
df['ValueDate'] = pd.to_datetime(df['ValueDate'])
df.index = df['ValueDate']
del df['ValueDate']


df.plot(figsize=(15, 6))
plt.show()

その*出力*は次のとおりです-

timeseries.png