Apache-pig-subtract
Apache Pig-SUBTRACT()
Pig Latinの* SUBTRACT()*関数は、2つのバッグを減算するために使用されます。 入力として2つのバッグを取り、2番目のバッグにない最初のバッグのタプルを含むバッグを返します。
構文
以下に示すのは、* SUBTRACT()*関数の構文です。
例
以下に示すように、HDFSディレクトリ /pig_data/ に emp_sales.txt と emp_bonus.txt の2つのファイルがあると仮定します。 emp_sales.txt には営業部門の従業員の詳細が含まれ、 emp_bonus.txt にはボーナスを受け取った従業員の詳細が含まれます。
そして、これらのファイルを、それぞれ emp_sales および emp_bonus というリレーション名でPigにロードしました。
次に、以下に示すようにCOGROUP演算子を使用して、キー sno を持つリレーション emp_sales および emp_bonus のレコード/タプルをグループ化します。
以下に示すように、 DUMP 演算子を使用してリレーション cogroup_data を確認します。
1つの関係を他の関係から減算する
ここで、 emp_sales 関係から emp_bonus 関係のタプルを減算します。 結果のリレーションは、 emp_bonus にない emp_sales のタプルを保持します。
検証
以下に示すように、DUMP演算子を使用してリレーション sub_data を確認します。 emp_sales リレーションは、リレーション emp_bonus にないタプルを保持します。
同様に、以下に示すように、 emp_bonus 関係から emp_sales 関係を減算します。
以下に示すように、ダンプ演算子を使用して sub_data 関係の内容を確認します。