Map-reduce-installation
MapReduce-インストール
MapReduceはLinuxフレーバーオペレーティングシステムでのみ動作し、Hadoopフレームワークが組み込まれています。 Hadoopフレームワークをインストールするには、次の手順を実行する必要があります。
JAVAインストールの検証
Hadoopをインストールする前に、Javaをシステムにインストールする必要があります。 次のコマンドを使用して、システムにJavaがインストールされているかどうかを確認します。
Javaがすでにシステムにインストールされている場合、次の応答が表示されます-
システムにJavaがインストールされていない場合は、以下の手順に従ってください。
Javaのインストール
ステップ1
次のリンクから最新バージョンのJavaをダウンロードします-http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260l [このリンク]。
ダウンロード後、Downloadsフォルダーで jdk-7u71-linux-x64.tar.gz ファイルを見つけることができます。
ステップ2
次のコマンドを使用して、jdk-7u71-linux-x64.gzの内容を抽出します。
ステップ3
Javaをすべてのユーザーが利用できるようにするには、Javaを「/usr/local/」の場所に移動する必要があります。 ルートに移動し、次のコマンドを入力します-
ステップ4
PATHおよびJAVA_HOME変数を設定するには、次のコマンドを〜/.bashrcファイルに追加します。
現在実行中のシステムにすべての変更を適用します。
ステップ5
次のコマンドを使用して、Javaの代替を構成します-
次に、ターミナルからコマンド java -version を使用してインストールを確認します。
Hadoopインストールの検証
MapReduceをインストールする前に、Hadoopをシステムにインストールする必要があります。 次のコマンドを使用してHadoopのインストールを確認しましょう-
Hadoopが既にシステムにインストールされている場合、次の応答が表示されます-
Hadoopがシステムにインストールされていない場合は、次の手順に進みます。
Hadoopをダウンロードする
Apache Software FoundationからHadoop 2.4.1をダウンロードし、次のコマンドを使用してその内容を抽出します。
擬似分散モードでのHadoopのインストール
以下の手順を使用して、Hadoop 2.4.1を擬似分散モードでインストールします。
ステップ1-Hadoopのセットアップ
〜/.bashrcファイルに次のコマンドを追加することにより、Hadoop環境変数を設定できます。
現在実行中のシステムにすべての変更を適用します。
ステップ2-Hadoopの構成
すべてのHadoop設定ファイルは、「$ HADOOP_HOME/etc/hadoop」の場所にあります。 Hadoopインフラストラクチャに応じて、これらの構成ファイルに適切な変更を加える必要があります。
Javaを使用してHadoopプログラムを開発するには、JAVA_HOME値をシステム内のJavaの場所に置き換えて、 hadoop-env.sh ファイルのJava環境変数をリセットする必要があります。
Hadoopを設定するには、次のファイルを編集する必要があります-
- core-site.xml
- hdfs-site.xml
- yarn-site.xml
- mapred-site.xml
core-site.xml
core-site.xmlには次の情報が含まれています
- Hadoopインスタンスに使用されるポート番号
- ファイルシステムに割り当てられたメモリ
- データを保存するためのメモリ制限
- 読み取り/書き込みバッファのサイズ
core-site.xmlを開き、<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
hdfs-site.xml
hdfs-site.xmlには次の情報が含まれています-
- 複製データの価値
- namenodeパス
- ローカルファイルシステムのデータノードパス(Hadoopインフラを保存する場所)
次のデータを想定します。
このファイルを開き、<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
注-上記のファイルでは、すべてのプロパティ値はユーザー定義であり、Hadoopインフラストラクチャに応じて変更できます。
yarn-site.xml
このファイルは、Hadoopに糸を設定するために使用されます。 yarn-site.xmlファイルを開き、<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
mapred-site.xml
このファイルは、使用しているMapReduceフレームワークを指定するために使用されます。 デフォルトでは、Hadoopにはyarn-site.xmlのテンプレートが含まれています。 まず、次のコマンドを使用して、mapred-site.xml.templateからmapred-site.xmlファイルにファイルをコピーする必要があります。
mapred-site.xmlファイルを開き、<configuration>タグと</configuration>タグの間に次のプロパティを追加します。
Hadoopインストールの検証
次の手順を使用して、Hadoopのインストールを確認します。
ステップ1-ノードのセットアップに名前を付ける
次のようにコマンド「hdfs namenode -format」を使用してネームノードを設定します-
期待される結果は次のとおりです-
ステップ2-Hadoop dfの検証
次のコマンドを実行して、Hadoopファイルシステムを起動します。
予想される出力は次のとおりです-
ステップ3-糸スクリプトの検証
次のコマンドを使用して、糸スクリプトを開始します。 このコマンドを実行すると、糸デーモンが起動します。
予想される出力は次のとおりです-
ステップ4-ブラウザーでHadoopにアクセスする
Hadoopにアクセスするためのデフォルトのポート番号は50070です。 次のURLを使用して、ブラウザーでHadoopサービスを取得します。
次のスクリーンショットは、Hadoopブラウザーを示しています。
ステップ5-クラスターのすべてのアプリケーションを確認する
クラスターのすべてのアプリケーションにアクセスするためのデフォルトのポート番号は8088です。 このサービスを使用するには、次のURLを使用してください。
次のスクリーンショットは、Hadoopクラスターブラウザーを示しています。