Python実践データ分析100本ノックを読む

ノック11 データを読み込んでみよう

f:id:bitop:20191021073148p:plain
1章と同じように欠損値、統計値を見てみる
◆売上テーブル
- item_priceに387と多い。他はない。
- 全データが2612なので約15%。

◆顧客テーブル
- 全顧客200名
f:id:bitop:20191021080423p:plain
◆統計量
f:id:bitop:20191021080530p:plain

ノック12 データの揺れを見てみよう

f:id:bitop:20191021081242p:plain

f:id:bitop:20191021081401p:plain

ノック13 データに揺れがあるまま集計してみよう

商品が99種類もあることになっている
f:id:bitop:20191021085249p:plain

f:id:bitop:20191021091655p:plain

ノック14 商品の揺れ補正しよう

f:id:bitop:20191021091927p:plain
揺れ補正後、商品個有数はちゃんと26になった
f:id:bitop:20191021092804p:plain

ノック15 金額欠損値の補完をしよう

item_price列に欠損値が含まれているのがわかる
f:id:bitop:20191021094717p:plain
item_priceがFalseとなり欠損値がなくなった
f:id:bitop:20191021095706p:plain
補完値の検証
f:id:bitop:20191021101839p:plain