機械学習のための「前処理」入門

4章 構造化データの前処理(2)

1 顧客の特性を知る

1.3 データの正規化

範囲変換
f:id:bitop:20190614073611p:plain
Z変換
f:id:bitop:20190614073655p:plain
平均 ほぼゼロ
f:id:bitop:20190614073756p:plain
標準偏差 ほぼ1
f:id:bitop:20190614073921p:plain

2 顧客のグループ化

2.1 階層型クラスタリング

f:id:bitop:20190614074121p:plain
グループは15に分類されナンバー15がもっとも多い
f:id:bitop:20190614080701p:plain

2.2 非階層型クラスタリング

f:id:bitop:20190614084446p:plain
かなり団子になっているので別々にしてみた
f:id:bitop:20190614084533p:plain
f:id:bitop:20190614084643p:plain
f:id:bitop:20190614084709p:plain
f:id:bitop:20190614084730p:plain
f:id:bitop:20190614084817p:plain
f:id:bitop:20190614084842p:plain
f:id:bitop:20190614084905p:plain
f:id:bitop:20190614084928p:plain
f:id:bitop:20190614084955p:plain
f:id:bitop:20190614085020p:plain
クラスタ数を2にしてみた。
f:id:bitop:20190614085255p:plain