Natural-language-toolkit-getting-started

提供:Dev Guides
移動先:案内検索

自然言語ツールキット-はじめに

NLTKをインストールするには、コンピューターにPythonをインストールする必要があります。 リンクhttps://www.python.org/downloads/[www.python.org/downloads]に移動して、OSの最新バージョンを選択できます。 Windows、Mac、Linux/Unix。 Pythonの基本的なチュートリアルについては、リンクlink//python3/index [www.finddevguides.com/python3/index]を参照してください。

Install Natural Language Toolkit

コンピューターシステムにPythonをインストールしたら、NLTKをインストールする方法を説明しましょう。

NLTKのインストール

NLTKは次のようにさまざまなOSにインストールできます-

Windowsの場合

Windows OSにNLTKをインストールするには、以下の手順に従ってください-

  • まず、Windowsコマンドプロンプトを開き、 pip フォルダーの場所に移動します。
  • 次に、次のコマンドを入力してNLTKをインストールします-
pip3 install nltk

次に、WindowsのスタートメニューからPythonShellを開き、次のコマンドを入力して、NLTKのインストールを確認します-

Import nltk

エラーが発生しなければ、Python3がインストールされているWindows OSにNLTKが正常にインストールされています。

Mac/Linuxの場合

Mac/Linux OSにNLTKをインストールするには、次のコマンドを記述します-

sudo pip install -U nltk

コンピューターにpipがインストールされていない場合は、以下の指示に従って最初に pip をインストールします-

まず、次のコマンドを使用して、次のようにパッケージインデックスを更新します-

sudo apt update

ここで、次のコマンドを入力して、python 3に pip をインストールします-

sudo apt install python3-pip

アナコンダを通して

Anacondaを介してNLTKをインストールするには、以下の手順に従います-

まず、Anacondaをインストールするには、リンクhttps://www.anaconda.com/distribution/#download-section[www.anaconda.com/distribution/#download-section]にアクセスし、必要なPythonのバージョンを選択しますインストール。

アナコンダ

コンピューターシステムにAnacondaをインストールしたら、コマンドプロンプトに移動して次のコマンドを入力します-

conda install -c anaconda nltk

Anacondaコマンド

出力を確認して「yes」と入力する必要があります。 NLTKがダウンロードされ、Anacondaパッケージにインストールされます。

NLTKのデータセットとパッケージのダウンロード

これでコンピューターにNLTKがインストールされましたが、NLTKを使用するには、そこにあるデータセット(コーパス)をダウンロードする必要があります。 利用可能な重要なデータセットには、 stpwords、guntenberg、framenet_v15 などがあります。

次のコマンドを使用して、すべてのNLTKデータセットをダウンロードできます-

import nltk
nltk.download()

Natural Language Toolkit Datasets

次のNLTKダウンロードウィンドウが表示されます。

Natural Language Toolkit Download

次に、ダウンロードボタンをクリックしてデータセットをダウンロードします。

NLTKスクリプトを実行するには?

以下は、 PorterStemmer nltkクラスを使用してPorter Stemmerアルゴリズムを実装する例です。 この例では、NLTKスクリプトの実行方法を理解できます。

まず、自然言語ツールキット(nltk)をインポートする必要があります。

import nltk

次に、 PorterStemmer クラスをインポートして、Porter Stemmerアルゴリズムを実装します。

from nltk.stem import PorterStemmer

次に、次のようにPorter Stemmerクラスのインスタンスを作成します-

word_stemmer = PorterStemmer()

次に、語幹処理したい単語を入力します。 −

word_stemmer.stem('writing')

出力

'write'
word_stemmer.stem('eating')

出力

'eat'