Sqoop-job
提供:Dev Guides
Sqoop-ジョブ
この章では、Sqoopジョブを作成および管理する方法について説明します。 Sqoopジョブは、インポートコマンドとエクスポートコマンドを作成して保存します。 保存されたジョブを識別して呼び出すためのパラメーターを指定します。 この再呼び出しまたは再実行は増分インポートで使用され、更新された行をRDBMSテーブルからHDFSにインポートできます。
構文
以下は、Sqoopジョブを作成するための構文です。
$ sqoop job (generic-args) (job-args)
[-- [subtool-name] (subtool-args)]
$ sqoop-job (generic-args) (job-args)
[-- [subtool-name] (subtool-args)]
ジョブの作成(-作成)
ここでは、RDBMSテーブルからHDFSにテーブルデータをインポートできる myjob という名前のジョブを作成しています。 次のコマンドは、 db データベースの employee テーブルからHDFSファイルにデータをインポートするジョブを作成するために使用されます。
$ sqoop job --create myjob \
-- import \
--connect jdbc:mysql://localhost/db \
--username root \
--table employee --m 1
検証ジョブ(--list)
*'-list'* 引数は、保存されたジョブを確認するために使用されます。 次のコマンドは、保存されたSqoopジョブのリストを確認するために使用されます。
$ sqoop job --list
保存されたジョブのリストが表示されます。
Available jobs:
myjob
ジョブの検査(--show)
*'-show'* 引数は、特定のジョブとその詳細を検査または検証するために使用されます。 次のコマンドとサンプル出力を使用して、 *myjob* というジョブを検証します。
$ sqoop job --show myjob
*myjob* で使用されるツールとそのオプションが表示されます。
Job: myjob
Tool: import Options:
----------------------------
direct.import = true
codegen.input.delimiters.record = 0
hdfs.append.dir = false
db.table = employee
...
incremental.last.value = 1206
...
ジョブの実行(--exec)
*'-exec'* オプションは、保存されたジョブを実行するために使用されます。 次のコマンドは、 *myjob* という名前の保存済みジョブを実行するために使用されます。
$ sqoop job --exec myjob
次の出力が表示されます。
10/08/19 13:08:45 INFO tool.CodeGenTool: Beginning code generation
...