hatunina’s blog

メモと日記です

kaggleの「Bitcoin Historical Data」のカーネルを読むその2

今日はこちら

Bitcoin Price. Prediction by ARIMA | Kaggle

概要

自己回帰和分移動平均モデル(ARIMAモデル)とやら。

うーむ、事前知識なさすぎて、ちょっと専門的になるとわからん
時系列データ分析に関する本も並行して読まねば

statsmodelsというライブラリを用いてトレンド、季節性、ノイズに分けたり自己相関係数とかを出してなんかしてます。
うん、なんかしてる(わからない)

詳しくはこちら
logics-of-blue.com

タメになったやつ

理論部分は全くわからなかったのでpandasのtipsです。

こんな感じのデータフレームがあります。

f:id:hatunina:20180417233144p:plain

このコードを実行すると、、、

df_day = df.resample('D').mean()
df_day.head()


こうなる!

f:id:hatunina:20180417235011p:plain


何が起きたかと言うと1日ごとにデータが調節されました。
resampleという関数を用いることで時系列データの感覚を調節することができます。
引数にDを与えているのでこの場合は1日ごとになっています。
時間の区切りだけでなく月末月初や年末年始も調節できます。
meanmaxとかと繋げられるので便利かも

詳しくはこちら

docs.pyq.jp