Apache-pig-strsplit
提供:Dev Guides
Apache Pig-STRSPLIT()
この関数は、特定の区切り文字で特定の文字列を分割するために使用されます。
構文
- STRSPLIT()の構文は次のとおりです。 この関数は、分割が必要な文字列、正規表現、および制限(文字列を分割する部分文字列の数)を指定する整数値を受け入れます。 この関数は、文字列を解析し、指定された正規表現に遭遇すると、文字列を *n 個の部分文字列に分割します。 n は limit に渡される値です。
例
次に示すように、 HDFS ディレクトリ /pig_data/ に emp.txt という名前のファイルがあると仮定します。 このファイルには、ID、名前、年齢、市などの従業員の詳細が含まれています。
そして、以下に示すように、このファイルを emp_data という名前の関係でPigにロードしました。
以下は* STRSPLIT()関数の例です。 emp.txtファイルを見ると、 *name 列に、従業員の名前と姓がdelemeter '_' で区切られていることがわかります。
この例では、* STRSPLIT()*関数を使用して従業員の名前と姓を分割しようとしています。
ステートメントの結果は、strsplit_dataという名前のリレーションに保存されます。 以下に示すように、ダンプ演算子を使用して、リレーション strsplit_data の内容を確認します。