Apache-pig-sum
提供:Dev Guides
Apache Pig-SUM()
Pig Latinの* SUM()関数を使用して、単一列バッグ内の列の数値の合計を取得できます。 合計の計算中、 SUM()*関数はNULL値を無視します。
注-
- グローバルな合計値を取得するには、 Group All 操作を実行し、SUM()関数を使用して合計値を計算する必要があります。
- グループの合計値を取得するには、 Group By 演算子を使用してグループ化し、sum関数を続行する必要があります。
構文
以下に、* SUM()*関数の構文を示します。
例
以下に示すように、HDFSディレクトリ /pig_data/ に employee.txt という名前のファイルがあると仮定します。
そして、以下に示すように、このファイルを関係名 employee_data でPigにロードしました。
すべてのGPAの合計を計算する
- SUM()関数を示すために、すべての従業員の毎日入力されるページの総数を計算してみましょう。 Apache Pigの組み込み関数 SUM()(大文字と小文字を区別)を使用して、数値の合計を計算できます。 *Group All 演算子を使用してリレーションemployee_dataをグループ化し、次に示すようにemployee_groupというリレーションに結果を保存します。
以下に示すような関係が生成されます。
毎日入力されたページのグローバル合計を計算してみましょう。
検証
以下に示すように、 DUMP 演算子を使用して、リレーション student_workpages_sum を確認します。
出力
次の出力が生成され、リレーション student_workpages_sum の内容が次のように表示されます。