2019-10-06 Pythonではじめる機械学習 7.7 1単語より大きい単位のBag-of-Words(n-グラム) 結果 バイグラム 結果 トリグラム 結果 TfidfVectorizerを使ったn-グラム かなり時間がかかった、約30分 結果 7.8 より進んだトークン分割、語幹処理、見出し語化 spacyとnltkのinstallが必要 en_nlp = spacy.load('en')でエラーがでた。 teratail.com を参考にモデルをinstall 結果