Apache-pig-textloader

提供:Dev Guides
2020年6月23日 (火) 12:19時点におけるMaintenance script (トーク | 投稿記録)による版 (Imported from text file)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先:案内検索

Apache Pig-TextLoader()

Pig Latin関数* TextLoader()*は、非構造化データをUTF-8形式でロードするために使用されるLoad関数です。

構文

以下に、* TextLoader()*関数の構文を示します。

grunt> TextLoader()

以下に示すように、 /data/ という名前のHDFSディレクトリに stu_data.txt という名前のファイルがあると仮定します。

001,Rajiv_Reddy,21,Hyderabad
002,siddarth_Battacharya,22,Kolkata
003,Rajesh_Khanna,22,Delhi
004,Preethi_Agarwal,21,Pune
005,Trupthi_Mohanthy,23,Bhuwaneshwar
006,Archana_Mishra,23,Chennai
007,Komal_Nayak,24,trivendram
008,Bharathi_Nambiayar,24,Chennai
  • TextLoader()*関数を使用して上記のファイルをロードしましょう。
grunt> details = LOAD 'hdfs://localhost:9000/pig_data/stu_data.txt' USING TextLoader();

Dumpオペレーターを使用して、ロードされたデータを検証できます。

grunt> dump details;

(001,Rajiv_Reddy,21,Hyderabad)
(002,siddarth_Battacharya,22,Kolkata)
(003,Rajesh_Khanna,22,Delhi)
(004,Preethi_Agarwal,21,Pune)
(005,Trupthi_Mohanthy,23,Bhuwaneshwar)
(006,Archana_Mishra,23,Chennai)
(007,Komal_Nayak,24,trivendram)
(008,Bharathi_Nambiayar,24,Chennai)