Hive-installation
Hive-インストール
Hive、Pig、HBaseなどのすべてのHadoopサブプロジェクトは、Linuxオペレーティングシステムをサポートしています。 したがって、LinuxフレーバーOSをインストールする必要があります。 Hiveのインストールでは、次の簡単な手順が実行されます。
ステップ1:JAVAインストールの確認
Hiveをインストールする前に、Javaをシステムにインストールする必要があります。 次のコマンドを使用して、Javaのインストールを確認しましょう。
Javaがすでにシステムにインストールされている場合、次の応答が表示されます。
システムにjavaがインストールされていない場合は、javaをインストールするための以下の手順に従ってください。
Javaのインストール
ステップI:
次のリンクhttp://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260l[][[1]] <最新バージョン>-X64.tar.gz)をダウンロードします。 .oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260l。
次に、jdk-7u71-linux-x64.tar.gzがシステムにダウンロードされます。
ステップII:
通常、ダウンロードしたjavaファイルは、ダウンロードフォルダーにあります。 それを確認し、次のコマンドを使用してjdk-7u71-linux-x64.gzファイルを抽出します。
ステップIII:
すべてのユーザーがJavaを使用できるようにするには、「/usr/local/」の場所に移動する必要があります。 ルートを開き、次のコマンドを入力します。
ステップIV:
PATHおよびJAVA_HOME変数を設定するには、次のコマンドを〜/.bashrcファイルに追加します。
すべての変更を現在実行中のシステムに適用します。
ステップV:
次のコマンドを使用して、Javaの代替を構成します。
上記で説明したように、ターミナルからコマンドjava -versionを使用してインストールを検証します。
ステップ2:Hadoopインストールの検証
Hiveをインストールする前に、Hadoopをシステムにインストールする必要があります。 次のコマンドを使用して、Hadoopのインストールを確認しましょう。
Hadoopがシステムにすでにインストールされている場合、次の応答が返されます。
Hadoopがシステムにインストールされていない場合は、次の手順に進みます。
Hadoopをダウンロードする
次のコマンドを使用して、Apache Software FoundationからHadoop 2.4.1をダウンロードして抽出します。
擬似分散モードでのHadoopのインストール
以下の手順を使用して、Hadoop 2.4.1を擬似分散モードでインストールします。
ステップI:Hadoopのセットアップ
次のコマンドを*〜/.bashrc *ファイルに追加することにより、Hadoop環境変数を設定できます。
すべての変更を現在実行中のシステムに適用します。
ステップII:Hadoopの構成
すべてのHadoop設定ファイルは、「$ HADOOP_HOME/etc/hadoop」の場所にあります。 Hadoopインフラストラクチャに応じて、これらの構成ファイルに適切な変更を加える必要があります。
javaを使用してHadoopプログラムを開発するには、 JAVA_HOME 値をシステム内のjavaの場所に置き換えて、 hadoop-env.sh ファイルのjava環境変数をリセットする必要があります。
以下に、Hadoopを構成するために編集する必要があるファイルのリストを示します。
core-site.xmlを開き、<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
次のデータを想定します。
このファイルを開き、このファイルの<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
- 注意:*上記のファイルでは、すべてのプロパティ値はユーザー定義であり、Hadoopインフラストラクチャに応じて変更できます。
このファイルは、Hadoopに糸を設定するために使用されます。 yarn-site.xmlファイルを開き、このファイルの<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
このファイルは、使用しているMapReduceフレームワークを指定するために使用されます。 デフォルトでは、Hadoopにはyarn-site.xmlのテンプレートが含まれています。 まず、次のコマンドを使用して、mapred-site、xml.templateからmapred-site.xmlファイルにファイルをコピーする必要があります。
Hadoopインストールの検証
次の手順を使用して、Hadoopのインストールを確認します。
ステップI:ノードのセットアップに名前を付ける
次のようにコマンド「hdfs namenode -format」を使用して、namenodeをセットアップします。
期待される結果は次のとおりです。
ステップII:Hadoop dfの検証
次のコマンドは、dfsを開始するために使用されます。 このコマンドを実行すると、Hadoopファイルシステムが起動します。
予想される出力は次のとおりです。
ステップIII:糸スクリプトの検証
次のコマンドを使用して、糸スクリプトを開始します。 このコマンドを実行すると、糸デーモンが起動します。
予想される出力は次のとおりです。
ステップIV:ブラウザーでHadoopにアクセスする
Hadoopにアクセスするためのデフォルトのポート番号は50070です。 次のURLを使用して、ブラウザーでHadoopサービスを取得します。
ステップV:クラスターのすべてのアプリケーションを確認する
クラスターのすべてのアプリケーションにアクセスするためのデフォルトのポート番号は8088です。 このサービスにアクセスするには、次のURLを使用してください。
ステップ3:Hiveをダウンロードする
このチュートリアルでは、hive-0.14.0を使用します。 次のリンクhttp://apache.petsads.us/hive/hive-0.14.0/[[[2]]]にアクセスしてダウンロードできます。/Downloadsディレクトリにダウンロードされると仮定します。 ここでは、このチュートリアル用に「apache-hive-0.14.0-bin.tar.gz」という名前のHiveアーカイブをダウンロードします。 次のコマンドを使用して、ダウンロードを確認します。
ダウンロードが成功すると、次の応答が表示されます。
ステップ4:Hiveのインストール
システムにHiveをインストールするには、次の手順が必要です。 Hiveアーカイブが/Downloadsディレクトリにダウンロードされると仮定します。
Hive Archiveの抽出と検証
次のコマンドを使用して、ダウンロードを確認し、ハイブアーカイブを抽出します。
ダウンロードが成功すると、次の応答が表示されます。
====/usr/local/hiveディレクトリへのファイルのコピー
スーパーユーザー「su-」からファイルをコピーする必要があります。 次のコマンドを使用して、抽出したディレクトリから/usr/local/hive”ディレクトリにファイルをコピーします。
Hiveの環境をセットアップする
- 〜/.bashrc *ファイルに次の行を追加することにより、Hive環境をセットアップできます。
〜/.bashrcファイルを実行するには、次のコマンドを使用します。
ステップ5:Hiveの構成
HadoopでHiveを構成するには、 $ HIVE_HOME/conf ディレクトリにある hive-env.sh ファイルを編集する必要があります。 次のコマンドは、Hive config フォルダーにリダイレクトし、テンプレートファイルをコピーします。
次の行を追加して、 hive-env.sh ファイルを編集します。
Hiveのインストールは正常に完了しました。 メタストアを構成するには、外部データベースサーバーが必要になりました。 Apache Derbyデータベースを使用します。
ステップ6:Apache Derbyのダウンロードとインストール
以下の手順に従って、Apache Derbyをダウンロードしてインストールします。
Apache Derbyのダウンロード
Apache Derbyをダウンロードするには、次のコマンドを使用します。 ダウンロードには時間がかかります。
次のコマンドを使用して、ダウンロードを確認します。
ダウンロードが成功すると、次の応答が表示されます。
Derbyアーカイブの抽出と検証
以下のコマンドは、Derbyアーカイブの抽出と検証に使用されます。
ダウンロードが成功すると、次の応答が表示されます。
ファイルを/usr/local/derbyディレクトリにコピーする
スーパーユーザー「su-」からコピーする必要があります。 次のコマンドを使用して、抽出したディレクトリから/usr/local/derbyディレクトリにファイルをコピーします。
Derbyの環境をセットアップする
- 〜/.bashrc *ファイルに次の行を追加することにより、Derby環境をセットアップできます。
- 〜/.bashrc *ファイルを実行するには、次のコマンドを使用します。
メタストアを保存するディレクトリを作成します
$ DERBY_HOMEディレクトリにdataという名前のディレクトリを作成して、メタストアデータを保存します。
これで、Derbyのインストールと環境設定が完了しました。
ステップ7:Hiveのメタストアの構成
メタストアの構成とは、データベースの保存場所をHiveに指定することを意味します。 これを行うには、$ HIVE_HOME/confディレクトリにあるhive-site.xmlファイルを編集します。 まず、次のコマンドを使用してテンプレートファイルをコピーします。
jpox.propertiesという名前のファイルを作成し、次の行を追加します。
ステップ8:Hiveインストールの検証
Hiveを実行する前に、HDFSに /tmp フォルダーと別のHiveフォルダーを作成する必要があります。 ここでは、 /user/hive/warehouse フォルダーを使用します。 以下に示すように、これらの新しく作成されたフォルダーに書き込み許可を設定する必要があります。
Hiveを検証する前に、HDFSでそれらを設定します。 次のコマンドを使用します。
Hiveのインストールを確認するには、次のコマンドを使用します。
Hiveが正常にインストールされると、次の応答が表示されます。
次のサンプルコマンドを実行して、すべてのテーブルを表示します。