Python-text-processing-python-text-classification
提供:Dev Guides
Python-テキスト分類
多くの場合、利用可能なテキストをいくつかの事前定義された基準によってさまざまなカテゴリに分類する必要があります。 nltkは、さまざまなコーパスの一部としてこのような機能を提供します。 以下の例では、映画レビューコーパスを見て、利用可能な分類を確認します。
上記のプログラムを実行すると、次の出力が得られます-
次に、肯定的なレビューが行われたファイルの1つのコンテンツを見てみましょう。 このファイルの文はトークン化されており、サンプルを見るために最初の4つの文を印刷します。
上記のプログラムを実行すると、次の出力が得られます-
次に、これらの各ファイル内の単語をトークン化し、nltkのFreqDist関数を使用して最も一般的な単語を見つけます。
上記のプログラムを実行すると、次の出力が得られます-