Apache-pig-max
提供:Dev Guides
Apache Pig-MAX()
Pig Latin * MAX()関数は、単一列バッグ内の列(数値または文字配列)の最高値を計算するために使用されます。 最大値の計算中、 Max()*関数はNULL値を無視します。
注-
- グローバルな最大値を取得するには、 Group All 操作を実行し、MAX()関数を使用して最大値を計算する必要があります。
- グループの最大値を取得するには、 Group By 演算子を使用してグループ化し、maximum関数を続行する必要があります。
構文
以下に、* Max()*関数の構文を示します。
例
以下に示すように、HDFSディレクトリ /pig_data/ に student_details.txt という名前のファイルがあると仮定します。
そして、以下に示すように、このファイルをリレーション名 student_details でPigにロードしました。
最大GPAの計算
組み込み関数* MAX()(大文字と小文字を区別)を使用して、指定された数値のセットから最大値を計算できます。 *Group All 演算子を使用してリレーション student_details をグループ化し、以下に示すように student_group_all という名前のリレーションに結果を保存します。
これにより、次のような関係が生成されます。
次に、GPAのグローバルな最大値、つまり、以下に示すように* MAX()*関数を使用して、すべての学生のGPA値の最大値を計算します。
検証
以下に示すように、 DUMP 演算子を使用してリレーション student_gpa_max を確認します。
出力
リレーション student_gpa_max の内容を表示する次の出力を生成します。