Apache-pig-random

提供:Dev Guides
移動先:案内検索

Apache Pig-RAND(()

  • RANDOM()*関数は、0.0以上1.0未満の擬似乱数(double型)を取得するために使用されます。
grunt> RANDOM()

*HDFS* ディレクトリ */pig_data/* に *math.txt* という名前のファイルがあると仮定します。 このファイルには、以下に示すように整数値と浮動小数点値が含まれています。
*math.txt*
5
16
9
2.5
5.9
3.1

そして、以下に示すように、このファイルを math_data という名前の関係でPigにロードしました。

grunt> math_data = LOAD 'hdfs://localhost:9000/pig_data/math.txt' USING PigStorage(',')
   as (data:float);

以下に示すように、* RANDOM()*関数を使用して、math.txtファイルの内容のランダムな値を生成します。

grunt> random_data = foreach math_data generate (data), RANDOM();

上記のステートメントは、結果を random_data という名前のリレーションに保存します。 以下に示すように、ダンプ演算子を使用して関係の内容を確認します。

grunt> Dump random_data;

(5.0,0.6842057767279982)
(16.0,0.9725172591786139)
(9.0,0.4159326414649489)
(2.5,0.30962777780713147)
(5.9,0.705213727551145)
(3.1,0.24247708413861724)