Apache-pig-grunt-shell
Apache Pig-Grunt Shell
Gruntシェルを呼び出した後、シェルでPigスクリプトを実行できます。 それに加えて、Gruntシェルによって提供される特定の有用なシェルおよびユーティリティコマンドがあります。 この章では、Gruntシェルが提供するシェルおよびユーティリティコマンドについて説明します。
注-この章の一部では、 Load や Store などのコマンドが使用されます。 詳細については、それぞれの章を参照してください。
シェルコマンド
Apache PigのGruntシェルは、主にPig Latinスクリプトを作成するために使用されます。 それ以前は、 sh および fs を使用して、任意のシェルコマンドを呼び出すことができます。
shコマンド
構文
以下に、 sh コマンドの構文を示します。
例
以下に示すように、 sh オプションを使用して、GruntシェルからLinuxシェルの ls コマンドを呼び出すことができます。 この例では、 /pig/bin/ ディレクトリ内のファイルをリストします。
fsコマンド
構文
以下に fs コマンドの構文を示します。
例
fsコマンドを使用して、GruntシェルからHDFSのlsコマンドを呼び出すことができます。 次の例では、HDFSルートディレクトリ内のファイルを一覧表示します。
同様に、 fs コマンドを使用して、Gruntシェルから他のすべてのファイルシステムシェルコマンドを呼び出すことができます。
ユーティリティコマンド
Gruntシェルは、一連のユーティリティコマンドを提供します。 これらには、* clear、help、history、quit、、 *set などのユーティリティコマンドが含まれます。そして、GruntシェルからPigを制御するための* exec、kill、、 *run などのコマンド。 以下は、Gruntシェルが提供するユーティリティコマンドの説明です。
クリアコマンド
構文
以下に示すように、 clear コマンドを使用して、Grunt Shellの画面をクリアできます。
helpコマンド
使用法
以下に示すように help コマンドを使用して、Pigコマンドのリストを取得できます。
historyコマンド
このコマンドは、Grunt sellが呼び出されてから現在までに実行/使用されたステートメントのリストを表示します。
使用法
Gruntシェルを開いてから3つのステートメントを実行したと仮定します。
次に、 history コマンドを使用すると、次の出力が生成されます。
setコマンド
使用法
このコマンドを使用すると、次のキーに値を設定できます。
Key | Description and values |
---|---|
default_parallel | You can set the number of reducers for a map job by passing any whole number as a value to this key. |
debug | You can turn off or turn on the debugging freature in Pig by passing on/off to this key. |
job.name | You can set the Job name to the required job by passing a string value to this key. |
job.priority |
You can set the job priority to a job by passing one of the following values to this key −
|
stream.skippath | For streaming, you can set the path from where the data is not to be transferred, by passing the desired path in the form of a string to this key. |
終了コマンド
このコマンドを使用して、Gruntシェルを終了できます。
使用法
以下に示すように、Gruntシェルを終了します。
GruntシェルからApache Pigを制御できるコマンドを見てみましょう。
execコマンド
構文
以下は、ユーティリティコマンド exec の構文です。
例
HDFSの /pig_data/ ディレクトリに student.txt という名前のファイルがあり、次のコンテンツがあると仮定します。
また、HDFSの /pig_data/ ディレクトリに sample_script.pig という名前のスクリプトファイルがあり、次の内容があるとします。
次に、以下に示すように exec コマンドを使用して、Gruntシェルから上記のスクリプトを実行します。
出力
killコマンド
このコマンドを使用して、Gruntシェルからジョブを強制終了できます。
構文
以下は、 kill コマンドの構文です。
例
IDが Id_0055 の実行中のPigジョブがあるとします。以下に示すように、 kill コマンドを使用してGruntシェルからそれを強制終了できます。
コマンドを実行
構文
以下に示すのは、 run コマンドの構文です。
例
HDFSの /pig_data/ ディレクトリに student.txt という名前のファイルがあり、次のコンテンツがあると仮定します。
そして、次の内容のローカルファイルシステムに sample_script.pig という名前のスクリプトファイルがあると仮定します。
次に、以下に示すようにrunコマンドを使用してGruntシェルから上記のスクリプトを実行します。
以下に示すように、 Dump operator を使用して、スクリプトの出力を確認できます。
注- exec と run コマンドの違いは、 run を使用すると、スクリプトのステートメントがコマンド履歴で利用できることです。