Python-text-processing-python-stemming-algorithms
提供:Dev Guides
Python-ステミングアルゴリズム
自然言語処理の分野では、2つ以上の単語が共通の語根を持つ状況に遭遇します。 たとえば、同意、同意、同意の3つの単語は、同じ語根が一致します。 これらの単語のいずれかを含む検索では、それらをルート単語である同じ単語として扱う必要があります。 そのため、すべての単語をルートワードにリンクすることが不可欠になります。 NLTKライブラリには、このリンクを実行し、ルートワードを示す出力を提供するメソッドがあります。
nltkには、最もよく使用される3つのステミングアルゴリズムがあります。 それらはわずかに異なる結果を与えます。 以下の例は、3つのステミングアルゴリズムすべての使用とその結果を示しています。
上記のプログラムを実行すると、次の出力が得られます-