Apache-pig-min
提供:Dev Guides
Apache Pig-MIN()
Pig Latinの* MIN()関数は、単一列バッグ内の特定の列の最小(最小)値(数値または文字配列)を取得するために使用されます。 最小値の計算中、 MIN()*関数はNULL値を無視します。
注-
- グローバルな最小値を取得するには、 Group All 操作を実行し、MIN()関数を使用して最小値を計算する必要があります。
- グループの最小値を取得するには、 Group By 演算子を使用してグループ化し、最小関数を続行する必要があります。
構文
以下に、* MIN()*関数の構文を示します。
例
以下に示すように、HDFSディレクトリ /pig_data/ に student_details.txt という名前のファイルがあると仮定します。
そして、以下に示すように、このファイルを student_details という名前の関係でPigにロードしました。
最小GPAの計算
組み込み関数* MIN()(大文字と小文字を区別する)を使用して、指定された数値のセットから最小値を計算できます。 *Group All 演算子を使用してリレーション student_details をグループ化し、以下に示すように student_group_all という名前のリレーションに結果を保存します。
以下に示すような関係が生成されます。
次に、GPAのグローバル最小値、つまり、以下に示す* MIN()*関数を使用して、すべての生徒のGPA値の最小値を計算します。
検証
以下に示すように、 DUMP 演算子を使用して、リレーション student_gpa_min を確認します。
出力
リレーション student_gpa_min の内容を表示する次の出力を生成します。