2018-03-04から1日間の記事一覧

TfidfVectorizerのよく使いそうなオプションまとめ

TfidfVectorizerとは 文章内に出現する単語の出現頻度と希少性を掛け合わせた値Tfidfを算出するアルゴリズム。文章を特徴づける単語を探したりできる。 例えば、Twitterの投稿テキストを読み込んで、気分が「Happy」か「Unhappy」かを判別する機械学習モデル…