Apache-pig-strsplittobag
提供:Dev Guides
Apache Pig-STRSPLITTOBAG()
この関数は、* STRSPLIT()*関数に似ています。 文字列を指定された区切り文字で分割し、結果をバッグに返します。
構文
- STRSPLITTOBAG()の構文は次のとおりです。 この関数は、分割が必要な文字列、正規表現、および制限(文字列を分割する部分文字列の数)を指定する整数値を受け入れます。 この関数は文字列を解析し、指定された正規表現に遭遇すると、文字列を *n 個のサブストリングに分割します。 n は limit に渡される値です。
例
次に示すように、 HDFS ディレクトリ /pig_data/ に emp.txt という名前のファイルがあると仮定します。 このファイルには、ID、名前、年齢、市などの従業員の詳細が含まれています。
そして、以下に示すように、このファイルを emp_data という名前の関係でPigにロードしました。
以下は* STRSPLITTOBAG()関数の例です。 emp.txtファイルを見ると、 *name 列に、従業員の名前と姓がdelemeter *“ _” *で区切られていることがわかります。
この例では、従業員の名前と姓を分割し、* STRSPLITTOBAG()*関数を使用してバッグに結果を取得しようとしています。
ステートメントの結果は、 strsplittobag_data という名前のリレーションに保存されます。 以下に示すようにDump演算子を使用して、リレーション strsplittobag_data の内容を確認します。