Zookeeper-applications

提供:Dev Guides
移動先:案内検索

Zookeeper-アプリケーション

Zookeeperは、分散環境に柔軟な調整インフラストラクチャを提供します。 ZooKeeperフレームワークは、今日の最高の産業用アプリケーションの多くをサポートしています。 この章では、ZooKeeperの最も注目すべきアプリケーションのいくつかについて説明します。

Yahoo!

ZooKeeperフレームワークは元々「Yahoo!」で構築されました。 適切に設計された分散アプリケーションは、データの透過性、パフォーマンスの向上、堅牢性、一元化された構成、調整などの要件を満たす必要があります。 そのため、これらの要件を満たすようにZooKeeperフレームワークを設計しました。

Apache Hadoop

Apache Hadoopは、ビッグデータ業界の成長を支える原動力です。 Hadoopは、構成の管理と調整をZooKeeperに依存しています。 HadoopでのZooKeeperの役割を理解するシナリオを考えてみましょう。

  • Hadoopクラスタ*が* 100以上のコモディティサーバー*をブリッジすると仮定します。 そのため、調整およびネーミングサービスが必要です。 多数のノードの計算が関係するため、各ノードは相互に同期し、サービスにアクセスする場所と、それらの構成方法を知る必要があります。 この時点で、Hadoopクラスターにはクロスノードサービスが必要です。 ZooKeeperは、*ノード間同期*の機能を提供し、Hadoopプロジェクト全体のタスクがシリアル化および同期されるようにします。

複数のZooKeeperサーバーが大規模なHadoopクラスターをサポートします。 各クライアントマシンは、ZooKeeperサーバーの1つと通信して、同期情報を取得および更新します。 リアルタイムの例のいくつかは-

  • ヒトゲノムプロジェクト-ヒトゲノムプロジェクトにはテラバイトのデータが含まれています。 Hadoop MapReduceフレームワークを使用して、データセットを分析し、人間開発の興味深い事実を見つけることができます。
  • Healthcare -病院は、通常テラバイト単位の膨大な患者医療記録を保存、取得、分析できます。

Apache HBase

Apache HBaseは、大規模なデータセットのリアルタイムの読み取り/書き込みアクセスに使用されるオープンソースの分散型NoSQLデータベースであり、HDFS上で実行されます。 HBaseは、*マスター-スレーブアーキテクチャ*に従い、HBaseマスターがすべてのスレーブを管理します。 スレーブは*リージョンサーバー*と呼ばれます。

HBase分散アプリケーションのインストールは、実行中のZooKeeperクラスターに依存しています。 Apache HBaseは、ZooKeeperを使用して、*集中構成管理*および*分散ミューテックス*メカニズムの助けを借りて、マスターサーバーおよびリージョンサーバー全体の分散データのステータスを追跡します。 HBaseのユースケースの一部を次に示します-

  • Telecom -テレコム業界は数十億のモバイルコールレコード(約30 TB/月)を保存しており、これらのコールレコードにリアルタイムでアクセスすることは大きなタスクになります。 HBaseを使用すると、すべてのレコードをリアルタイムで簡単かつ効率的に処理できます。
  • ソーシャルネットワーク-通信業界と同様に、Twitter、LinkedIn、Facebookなどのサイトは、ユーザーが作成した投稿を通じて大量のデータを受け取ります。 HBaseを使用して、最近の傾向やその他の興味深い事実を見つけることができます。

Apache Solr

Apache Solrは、Javaで書かれた高速でオープンソースの検索プラットフォームです。 これは、非常に高速でフォールトトレラントな分散検索エンジンです。 Lucene の上に構築された、高性能でフル機能のテキスト検索エンジンです。

Solrは、構成管理、リーダー選出、ノード管理、データのロックおよび同期化など、ZooKeeperのすべての機能を広範囲に使用します。

Solrには、 indexingsearching の2つの異なる部分があります。 インデックス付けは、後で検索できるように、データを適切な形式で保存するプロセスです。 Solrは、ZooKeeperを使用して、複数ノードのデータのインデックス作成と複数ノードからの検索の両方を行います。 ZooKeeperは次の機能を提供します-

  • 必要に応じてノードを追加/削除します
  • ノード間のデータの複製と、その後のデータ損失の最小化
  • 複数のノード間でデータを共有し、検索結果を高速化するために複数のノードから検索する

Apache Solrのユースケースには、eコマース、求人検索などが含まれます。