Pythonではじめる機械学習

7.4 ストップワード

f:id:bitop:20191005065951p:plain
結果
f:id:bitop:20191005070046p:plain

f:id:bitop:20191005071955p:plain
STOP WORDSを入れた結果、特徴量が減っている
f:id:bitop:20191005072144p:plain

STOP WORDSを入れた評価
f:id:bitop:20191005072736p:plain
結果
f:id:bitop:20191005073119p:plain

7.5 tf-idfを用いたデータのスケール変換

f:id:bitop:20191005083352p:plain
結果
f:id:bitop:20191005083423p:plain  

重要な言葉を抽出する
f:id:bitop:20191005090538p:plain
結果、tfidfが低い、高い特徴量(言葉)
f:id:bitop:20191005090834p:plain