Apache-tajo-integration-with-hbase
提供:Dev Guides
Apache Tajo-HBaseとの統合
Apache TajoはHBase統合をサポートしています。 これにより、TajoのHBaseテーブルにアクセスできます。 HBaseは、Hadoopファイルシステム上に構築された分散列指向データベースです。 これは、Hadoopファイルシステム内のデータへのランダムなリアルタイム読み取り/書き込みアクセスを提供するHadoopエコシステムの一部です。 HBase統合を構成するには、次の手順が必要です。
環境変数を設定する
「conf/tajo-env.sh」ファイルに次の変更を追加します。
HBaseパスを含めた後、TajoはHBaseライブラリファイルをクラスパスに設定します。
外部テーブルを作成する
次の構文を使用して外部テーブルを作成します-
HBaseテーブルにアクセスするには、テーブルスペースの場所を設定する必要があります。
ここに、
- Table -hbase originテーブル名を設定します。 外部テーブルを作成する場合、テーブルはHBaseに存在する必要があります。
- 列-キーはHBase行キーを指します。 列エントリの数は、Tajoテーブルの列の数と等しくする必要があります。
- hbase.zookeeper.quorum -ズーキーパークォーラムアドレスを設定します。
- hbase.zookeeper.property.clientPort -zookeeperクライアントポートを設定します。
問い合わせ
ここで、Location pathフィールドは、zookeeperクライアントのポートIDを設定します。 ポートを設定しない場合、Tajoはhbase-site.xmlファイルのプロパティを参照します。
HBaseでテーブルを作成する
次のクエリに示すように、「hbase shell」コマンドを使用して、HBaseインタラクティブシェルを起動できます。
問い合わせ
結果
上記のクエリは、次の結果を生成します。
HBaseをクエリする手順
HBaseを照会するには、次の手順を完了する必要があります-
- ステップ1 *-次のコマンドをHBaseシェルにパイプして、「チュートリアル」テーブルを作成します。
問い合わせ
- ステップ2 *-次に、hbaseシェルで次のコマンドを発行して、データをテーブルにロードします。
- ステップ3 *-Tajoシェルに戻り、次のコマンドを実行してテーブルのメタデータを表示します-
- ステップ4 *-テーブルから結果を取得するには、次のクエリを使用します-
- 問い合わせ *
結果
上記のクエリは、次の結果を取得します-