Sqoop-installation
Sqoop-インストール
SqoopはHadoopのサブプロジェクトであるため、Linuxオペレーティングシステムでのみ機能します。 以下の手順に従って、システムにSqoopをインストールします。
ステップ1:JAVAインストールの確認
Sqoopをインストールする前に、システムにJavaをインストールする必要があります。 次のコマンドを使用してJavaのインストールを確認しましょう-
Javaがすでにシステムにインストールされている場合、次の応答が表示されます-
Javaがシステムにインストールされていない場合は、以下の手順に従ってください。
Javaのインストール
以下に示す簡単な手順に従って、システムにJavaをインストールします。
ステップ1
次のhttp://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads- [リンク]にアクセスして、Java(JDK <最新バージョン>-X64.tar.gz)をダウンロードします。
次に、jdk-7u71-linux-x64.tar.gzがシステムにダウンロードされます。
ステップ2
通常、ダウンロードしたJavaファイルは、ダウンロードフォルダーにあります。 それを確認し、次のコマンドを使用してjdk-7u71-linux-x64.gzファイルを抽出します。
ステップ3
Javaをすべてのユーザーが利用できるようにするには、Javaを「/usr/local/」の場所に移動する必要があります。 ルートを開き、次のコマンドを入力します。
ステップ4
PATHおよびJAVA_HOME変数を設定するには、次のコマンドを〜/.bashrcファイルに追加します。
すべての変更を現在実行中のシステムに適用します。
ステップ5
次のコマンドを使用して、Javaの代替を構成します-
上記で説明したように、ターミナルからコマンド java -version を使用してインストールを検証します。
ステップ2:Hadoopインストールの検証
Sqoopをインストールする前に、Hadoopをシステムにインストールする必要があります。 次のコマンドを使用してHadoopのインストールを確認しましょう-
Hadoopが既にシステムにインストールされている場合、次の応答が表示されます-
Hadoopがシステムにインストールされていない場合は、次の手順に進みます-
Hadoopをダウンロードする
次のコマンドを使用して、Apache Software FoundationからHadoop 2.4.1をダウンロードして抽出します。
擬似分散モードでのHadoopのインストール
以下の手順に従って、Hadoop 2.4.1を擬似分散モードでインストールします。
ステップ1:Hadoopのセットアップ
〜/.bashrcファイルに次のコマンドを追加することにより、Hadoop環境変数を設定できます。
次に、すべての変更を現在実行中のシステムに適用します。
ステップ2:Hadoopの構成
すべてのHadoop設定ファイルは、「$ HADOOP_HOME/etc/hadoop」の場所にあります。 Hadoopインフラストラクチャに応じて、これらの構成ファイルに適切な変更を加える必要があります。
javaを使用してHadoopプログラムを開発するには、JAVA_HOME値をシステム内のjavaの場所に置き換えて、 hadoop-env.sh ファイルのjava環境変数をリセットする必要があります。
以下に、Hadoopを構成するために編集する必要があるファイルのリストを示します。
core-site.xmlファイルには、Hadoopインスタンスに使用されるポート番号、ファイルシステムに割り当てられたメモリ、データを保存するためのメモリ制限、読み取り/書き込みバッファのサイズなどの情報が含まれています。
core-site.xmlを開き、<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
hdfs-site.xmlファイルには、レプリケーションデータの値、namenodeパス、ローカルファイルシステムのdatanodeパスなどの情報が含まれています。 これは、Hadoopインフラストラクチャを保存する場所を意味します。
次のデータを想定します。
このファイルを開き、このファイルの<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
注-上記のファイルでは、すべてのプロパティ値はユーザー定義であり、Hadoopインフラストラクチャに応じて変更できます。
このファイルは、Hadoopに糸を設定するために使用されます。 yarn-site.xmlファイルを開き、このファイルの<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
このファイルは、使用しているMapReduceフレームワークを指定するために使用されます。 デフォルトでは、Hadoopにはyarn-site.xmlのテンプレートが含まれています。 まず、次のコマンドを使用して、mapred-site.xml.templateからmapred-site.xmlファイルにファイルをコピーする必要があります。
mapred-site.xmlファイルを開き、このファイルの<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
Hadoopインストールの検証
次の手順を使用して、Hadoopのインストールを確認します。
ステップ1:ノードのセットアップに名前を付ける
次のようにコマンド「hdfs namenode -format」を使用して、namenodeをセットアップします。
期待される結果は次のとおりです。
ステップ2:Hadoop dfの検証
次のコマンドは、dfsを開始するために使用されます。 このコマンドを実行すると、Hadoopファイルシステムが起動します。
予想される出力は次のとおりです-
ステップ3:糸スクリプトの検証
次のコマンドを使用して、糸スクリプトを開始します。 このコマンドを実行すると、糸デーモンが起動します。
予想される出力は次のとおりです-
ステップ4:ブラウザーでHadoopにアクセスする
Hadoopにアクセスするためのデフォルトのポート番号は50070です。 次のURLを使用して、ブラウザーでHadoopサービスを取得します。
次の画像は、Hadoopブラウザーを示しています。
ステップ5:クラスターのすべてのアプリケーションを確認する
クラスターのすべてのアプリケーションにアクセスするためのデフォルトのポート番号は8088です。 このサービスにアクセスするには、次のURLを使用してください。
次の画像は、Hadoopクラスターブラウザーを示しています。
ステップ3:Sqoopをダウンロードする
Sqoopの最新バージョンは、次のhttps://sqoop.apache.org [link]からダウンロードできます。このチュートリアルでは、バージョン1.4.5、つまり sqoop-1.4.5.bin__hadoop-2.0.4を使用しています。 -alpha.tar.gz 。
ステップ4:Sqoopのインストール
次のコマンドを使用して、Sqoop tarボールを抽出し、「/usr/lib/sqoop」ディレクトリに移動します。
ステップ5:bashrcの構成
次の行を〜/*。bashrc *ファイルに追加して、Sqoop環境を設定する必要があります-
〜/*。bashrc *ファイルを実行するには、次のコマンドを使用します。
ステップ6:Sqoopの構成
HadoopでSqoopを設定するには、 $ SQOOP_HOME/conf ディレクトリにある sqoop-env.sh ファイルを編集する必要があります。 まず、Sqoop configディレクトリにリダイレクトし、次のコマンドを使用してテンプレートファイルをコピーします-
ステップ7:mysql-connector-javaをダウンロードして構成する
次のhttp://ftp.ntu.edu.tw/MySQL/Downloads/Connector-J/.[link]から mysql-connector-java-5.1.30.tar.gz ファイルをダウンロードできます。
次のコマンドを使用して、mysql-connector-java tarballを抽出し、 mysql-connector-java-5.1.30-bin.jar を/usr/lib/sqoop/libディレクトリに移動します。
ステップ8:Sqoopの検証
次のコマンドを使用して、Sqoopバージョンを確認します。
期待される出力-
Sqoopのインストールが完了しました。