Apache-pig-textloader

提供:Dev Guides
移動先:案内検索

Apache Pig-TextLoader()

Pig Latin関数* TextLoader()*は、非構造化データをUTF-8形式でロードするために使用されるLoad関数です。

構文

以下に、* TextLoader()*関数の構文を示します。

grunt> TextLoader()

以下に示すように、 /data/ という名前のHDFSディレクトリに stu_data.txt という名前のファイルがあると仮定します。

001,Rajiv_Reddy,21,Hyderabad
002,siddarth_Battacharya,22,Kolkata
003,Rajesh_Khanna,22,Delhi
004,Preethi_Agarwal,21,Pune
005,Trupthi_Mohanthy,23,Bhuwaneshwar
006,Archana_Mishra,23,Chennai
007,Komal_Nayak,24,trivendram
008,Bharathi_Nambiayar,24,Chennai
  • TextLoader()*関数を使用して上記のファイルをロードしましょう。
grunt> details = LOAD 'hdfs://localhost:9000/pig_data/stu_data.txt' USING TextLoader();

Dumpオペレーターを使用して、ロードされたデータを検証できます。

grunt> dump details;

(001,Rajiv_Reddy,21,Hyderabad)
(002,siddarth_Battacharya,22,Kolkata)
(003,Rajesh_Khanna,22,Delhi)
(004,Preethi_Agarwal,21,Pune)
(005,Trupthi_Mohanthy,23,Bhuwaneshwar)
(006,Archana_Mishra,23,Chennai)
(007,Komal_Nayak,24,trivendram)
(008,Bharathi_Nambiayar,24,Chennai)