機械学習のための「前処理」入門

1章 データ分析・活用を始めるために

 省略

2章 データ分析のプロセスと環境

 Google Colaboratoryで作業することにする。
 ワーク用のデータは出版社のサイトからDownLoadしGoogle Driveに保存する。
 f:id:bitop:20190609175259p:plain

3章 構造化データの前処理

1.2 データの読み込みと確認

 最初にGoogle ColaboratoryからGoogle Driveをマウントさせる
 f:id:bitop:20190609175751p:plain
   f:id:bitop:20190609175929p:plain

1.3 欠損値の確認

isnull()は要素が欠損値ならTrueを返す。any()は列または行(axisで指定する)にひとつでもTrueがあればTrueを返す。その反対はall()
f:id:bitop:20190609181745p:plain

欠損値が多いのはpoutcome[前回のキャンペーンの成功の有無],contact[連絡手段]
f:id:bitop:20190609182450p:plain