Apache-pig-binstorage
提供:Dev Guides
Apache Pig-BinStorage()
- BinStorage()関数は、機械可読形式を使用して、Pigにデータをロードおよび保存するために使用されます。 Pigの BinStorge()*は通常、MapReduceジョブ間で生成された一時データを保存するために使用されます。 入力として複数の場所をサポートします。
構文
以下に、* BinStorage()*関数の構文を示します。
例
以下に示すように、HDFSディレクトリ /pig_data/ に stu_data.txt という名前のファイルがあると仮定します。
以下に示すように、このデータをPigにリレーションにロードしましょう。
これで、* BinStorage()関数を使用して、この関係を */pig_data/ という名前のHDFSディレクトリに*保存*できます。
上記のステートメントを実行すると、関係は指定されたHDFSディレクトリに保存されます。 以下に示すように、HDFS * lsコマンド*を使用して表示できます。
ここで、ファイル part-m-00000 からデータをロードします。
以下に示すように、関係の内容を確認します