Sqoop-job

提供:Dev Guides
移動先:案内検索

Sqoop-ジョブ

この章では、Sqoopジョブを作成および管理する方法について説明します。 Sqoopジョブは、インポートコマンドとエクスポートコマンドを作成して保存します。 保存されたジョブを識別して呼び出すためのパラメーターを指定します。 この再呼び出しまたは再実行は増分インポートで使用され、更新された行をRDBMSテーブルからHDFSにインポートできます。

構文

以下は、Sqoopジョブを作成するための構文です。

$ sqoop job (generic-args) (job-args)
   [-- [subtool-name] (subtool-args)]

$ sqoop-job (generic-args) (job-args)
   [-- [subtool-name] (subtool-args)]

ジョブの作成(-作成)

ここでは、RDBMSテーブルからHDFSにテーブルデータをインポートできる myjob という名前のジョブを作成しています。 次のコマンドは、 db データベースの employee テーブルからHDFSファイルにデータをインポートするジョブを作成するために使用されます。

$ sqoop job --create myjob \
-- import \
--connect jdbc:mysql://localhost/db \
--username root \
--table employee --m 1

検証ジョブ(--list)

*'-list'* 引数は、保存されたジョブを確認するために使用されます。 次のコマンドは、保存されたSqoopジョブのリストを確認するために使用されます。
$ sqoop job --list

保存されたジョブのリストが表示されます。

Available jobs:
   myjob

ジョブの検査(--show)

*'-show'* 引数は、特定のジョブとその詳細を検査または検証するために使用されます。 次のコマンドとサンプル出力を使用して、 *myjob* というジョブを検証します。
$ sqoop job --show myjob
*myjob* で使用されるツールとそのオプションが表示されます。
Job: myjob
 Tool: import Options:
 ----------------------------
 direct.import = true
 codegen.input.delimiters.record = 0
 hdfs.append.dir = false
 db.table = employee
 ...
 incremental.last.value = 1206
 ...

ジョブの実行(--exec)

*'-exec'* オプションは、保存されたジョブを実行するために使用されます。 次のコマンドは、 *myjob* という名前の保存済みジョブを実行するために使用されます。
$ sqoop job --exec myjob

次の出力が表示されます。

10/08/19 13:08:45 INFO tool.CodeGenTool: Beginning code generation
...