Python実践データ分析100本ノックを読む

ノック16 顧客名の揺れを補正しよう

現状
f:id:bitop:20191022072242p:plain
f:id:bitop:20191022072520p:plain
補正後
f:id:bitop:20191022072832p:plain

ノック17 日付の揺れを補正しよう

f:id:bitop:20191022075930p:plain
本のとおりやってみると2日ほどずれがある
f:id:bitop:20191022085825p:plain
scriptで変換した結果
f:id:bitop:20191022085939p:plain
WindowS Excelのシリアル値について記述されている
http://www.excel.studio-kazu.jp/mwiki/ep_01_serial.pdf
を参考に2日減らして計算したところ合った。 確かにWindowの時計も1900年以降は表示がなかった
f:id:bitop:20191022090400p:plain
日付更新結果
f:id:bitop:20191022093329p:plain
年月ごとの顧客登録数の集計
f:id:bitop:20191022095204p:plain

ノック18 顧客名をキーに2つのデータを結合しよう

f:id:bitop:20191022095909p:plain

ノック19 クレンジングしたデータをダンプしよう

csv形式で保存したファイルを開いたところ
f:id:bitop:20191022103353p:plain

ノック20 データを集計しよう

購入年月ごと商品の集計
f:id:bitop:20191022104055p:plain
購入年月ごと売上金額の集計
f:id:bitop:20191022104516p:plain
購入年月ごと顧客の購入個数の集計
f:id:bitop:20191022104846p:plain
購入年月ごと地域における集計
f:id:bitop:20191022111417p:plain
離脱客(期間中購入していない顧客)
f:id:bitop:20191022113251p:plain