読者です 読者をやめる 読者になる 読者になる

Pythonデータサイエンスクックブック

(2順目)

レシピ10.1

気象データはhttps://github.com/ipython-books/cookbook-dataから持ってくる
全ての列名を表示させる
2項

for col in df0:
    print(col)
print(df0.shape)

STATION(気象データサイト?)
DATE(年月日)
PRCP ?
TMAX 日最高気温(華氏表記)
TMIN 日最低気温(華氏表記)
(309747, 5)

STATIONは61箇所あり「GHCND:FG000081405」のような番号で識別されている。
華氏表記だと実感がわかないので摂氏表記に変換

STATION DATE    PRCP    TMAX    TMIN
365 GHCND:FR013055001   1994-01-01  0   41.111111   23.333333
366 GHCND:FR013055001   1994-01-02  4   54.444444   10.555556
367 GHCND:FR013055001   1994-01-03  0   72.222222   31.666667
368 GHCND:FR013055001   1994-01-04  0   48.888889   29.444444
369 GHCND:FR013055001   1994-01-05  34  57.222222   13.888889

1月1日に最高気温が41℃(?)1月3日最高気温72℃(華氏表記ではないのかな?)

4項
dateにDateTimeIndoexを入れておく、具体的には次のようなデーターが入る。

DatetimeIndex(['1994-01-01', '1994-01-02', '1994-01-03', '1994-01-04',
            '1994-01-05', '1994-01-06', '1994-01-07', '1994-01-08',
            '1994-01-09', '1994-01-10',
            ...
            '2013-12-22', '2013-12-24', '2013-12-25', '2013-12-26',
            '2013-12-27', '2013-12-28', '2013-12-29', '2013-12-30',
            '2013-12-31', '2014-01-01'],
            dtype='datetime64[ns]', name='DATE', length=7282, freq=None)

5項
f:id:bitop:20160417113459p:plain

10項
f:id:bitop:20160417113837p:plain

12項
f:id:bitop:20160417113951p:plain