Apache-pig-installation
Apache Pig-インストール
この章では、システムで Apache Pig をダウンロード、インストール、およびセットアップする方法について説明します。
前提条件
Apache Pigを使用する前に、HadoopとJavaをシステムにインストールしておくことが重要です。 したがって、Apache Pigをインストールする前に、次のリンクに記載されている手順に従ってHadoopとJavaをインストールします-
http://www.finddevguides.com/hadoop/hadoop_enviornment_setup
Apache Pigをダウンロードする
まず、次のWebサイト(https://pig.apache.org/)からApache Pigの最新バージョンをダウンロードします。
ステップ1
Apache Pig Webサイトのホームページを開きます。 次のスナップショットに示すように、[*ニュース] *セクションの下にある[リリースページ]リンクをクリックします。
ステップ2
指定されたリンクをクリックすると、* Apache Pigリリース*ページにリダイレクトされます。 このページの[ダウンロード]セクションには、* Pig 0.8以降*および* Pig 0.7以前*の2つのリンクがあります。 * Pig 0.8以降*のリンクをクリックすると、ミラーのセットがあるページにリダイレクトされます。
ステップ3
以下に示すように、これらのミラーのいずれかを選択してクリックします。
ステップ4
これらのミラーは、 Pig Releases ページに移動します。 このページには、Apache Pigのさまざまなバージョンが含まれています。 それらの中で最新バージョンをクリックします。
ステップ5
これらのフォルダー内には、Apache Pigのソースファイルとバイナリファイルがさまざまなディストリビューションで含まれています。 Apache Pig 0.15、 pig0.15.0-src.tar.gz 、および* pig-0.15.0.tar.gz。*のソースファイルとバイナリファイルのtarファイルをダウンロードします。
Apache Pigをインストールする
Apache Pigソフトウェアをダウンロードしたら、以下の手順に従ってLinux環境にインストールします。
ステップ1
- Hadoop、Java、およびその他のソフトウェアのインストールディレクトリがインストールされたのと同じディレクトリに、Pigという名前のディレクトリを作成します。 (チュートリアルでは、Hadoopという名前のユーザーにPigディレクトリを作成しました)。
ステップ2
以下に示すように、ダウンロードしたtarファイルを解凍します。
ステップ3
以下に示すように、 pig-0.15.0-src.tar.gz ファイルの内容を以前に作成した Pig ディレクトリに移動します。
Apache Pigを構成する
Apache Pigをインストールしたら、構成する必要があります。 設定するには、 bashrcとpig.properties の2つのファイルを編集する必要があります。
.bashrcファイル
- PIG_HOME フォルダーをApache Pigのインストールフォルダーに、
- PATH 環境変数からbinフォルダー、および
- PIG_CLASSPATH 環境変数をHadoopインストールのetc(設定)フォルダー(core-site.xml、hdfs-site.xml、mapred-site.xmlファイルを含むディレクトリ)に。
pig.propertiesファイル
Pigの conf フォルダーには、 pig.properties という名前のファイルがあります。 pig.propertiesファイルでは、以下に示すようにさまざまなパラメーターを設定できます。
次のプロパティがサポートされています-
インストールの検証
versionコマンドを入力して、Apache Pigのインストールを確認します。 インストールが成功すると、以下に示すバージョンのApache Pigが取得されます。