機械学習のための「前処理」入門

2.1 全記事の形態素解析

f:id:bitop:20190628120014p:plain

2.2 単語文章行列の作成

f:id:bitop:20190628120137p:plain
f:id:bitop:20190628120219p:plain
高頻度、低頻度単語のカット
f:id:bitop:20190628120338p:plain

2.3 TF-IDFによる重み付け

f:id:bitop:20190628120528p:plain

3.4 単語の数値化

f:id:bitop:20190628123921p:plain

4.2 単語文書行列の作成

f:id:bitop:20190628124638p:plain
f:id:bitop:20190628125228p:plain