Es-hive-hive-introduction

提供:Dev Guides
移動先:案内検索

ハイブ-イントロドゥシオン

エルテルミーノ「ビッグデータ」は、グラントコンジャントスデダトスクインクルーエングランボリューメン、アルタヴェロシダード、ユグラングランヴァリタデデデダトスクエスタオーメンタンディアディアにあります。 Los sistemas degestiónde datos、que esdifícilde procesar grandes datos。 Apache Software Foundationが作成した、Hadoopパラレゾルバグランデジェスティオンデダトスイロスレトスクエスポンエステスプロセソ。

Hadoop

Hadoop es un marco decódigoabierto para almacenar y procesar grandes datos en entorno distribuido。 計画と管理のマップ、マップの再作成、およびHadoop分散ファイルシステム(HDFS)のMapReduce。

  • MapReduce:プログラミングのパラレラパラプロシージャルグランデの構造、セミストラクチャの構造、およびシンストラクチャのデータの素晴らしさ、ハードウェア製品のグランドモデル。
  • HDFS: Hadoop分散ファイルシステムは、Hadoopマルコの一部です。 ハードウェアの耐障害性を備えたアーカイブシステムです。

El Hadoop生態系contiene diferentes sub-proyectos(herramientas)como Sqoop、cerdo、y Hive que se usan para ayudar a Hadoopmódulos。

  • Sqoop:インポートおよびエクスポートは、HDFSをインポートおよびエクスポートすることができます。
  • Cerdo: MapReduceのスクリプトを使用して、スクリプトを実行するための手順を実行します。
  • Hive: MapReduceの操作性を向上させるためのSQLスクリプトを使用するためのSQLスクリプトの使用方法。

注意: MapReduceの操作方法のさまざまな形式:

  • El Enfoque tradicional utilizando Java programa de MapReduce estructurados、semiestructurados y sin estructurar los datos。
  • MapReduceのスクリプトを使用して、手順を実行します。
  • La Hive(Estructurado HiveQLまたはHQLのLenguaje de Consulta)は、MapReduceのpara procesar datos estructurados con Hive。

¿Quées Hive

Hadoopでのインフラストラクチャのインフラストラクチャの構築 Hadoop para resumir grand de das y facilita Consultar y analizarfácil。

Facebook、デスクトップ、Apache Software Foundationの最初のページからのハイブは、Apache Hiveの基本的な機能を備えています。 Es utilizado por diferentes empresas。 ejemploにより、Amazon Elastic MapReduceでAmazonを使用します。

ハイブのES

  • Una base de datos relacional
  • オンライントランザクション処理(OLTP)について
  • UN idioma en tiempo real las consultas y actualizaciones a nivel de fila

ハイブの特徴

  • HDFSのプロテサンロスデトスベースのアルケセナエスケマ。
  • OLAPの推定。
  • SQLの詳細は、HiveQL HQLに相談してください。 *Es馴染み、rápido、escalable y拡張可能。

アルキテクトゥラデハイブ

構成要素の構成図の分離:

Hive Architecture

構成図は、複数のコンポーネントから構成されています。 ラ・シギエンテ・タブラは、カサ・ウナ・デ・ラス・ウニダデスについて記述しています:

Nombre de la unidad Funcionamiento
Interfaz de usuario Sección es una infraestructura de almacenamiento de datos software que puede crear interacción entre usuario y HDFS. Las interfaces de usuario que son Hive Hive es compatible con interfaz Web, línea de comandos y Hive HD Insight (en Windows).
Meta Almacenar Hive elige respectivos servidores de bases de datos para almacenar el esquema o metadatos de tablas, bases de datos, las columnas de una tabla, sus tipos de datos y cartografía HDFS.
Motor de Procesos HiveQL HiveQL es similar a SQL para realizar consultas de información sobre el esquema Metastore. Es uno de los sustitutos del enfoque tradicional de MapReduce programa. En lugar de escribir MapReduce programa en Java, se puede escribir una consulta de MapReduce trabajo y proceso.
Motor de ejecución La conjunción de proceso HiveQL Motor y MapReduce es Hive Motor de ejecución. Motor de ejecución procesa la consulta y genera los resultados de la misma como MapReduce resultados. Utiliza el sabor de MapReduce.
HDFS o HBASE Hadoop distributed file system o HBASE son el almacenamiento de datos técnicas para almacenar datos en sistema de archivos.

ハイブデトラバホ

エルシギエンテダイアグラムミューフルエルフルジョデトラバホエントレハイブイハドープ。

How Hive Works

タブラの定義は、Hadoop Hiveのマルコの相互作用を定義します。

Paso No. Funcionamiento
1
  • Ejecutar consulta*

La HiveのユーザーインターフェイスとユーザーインターフェイスのWebコンサルティング環境(基本的なアルゴナのコントロール、JDBC、ODBCなど) )para que se jecute。

2

Obtener Plan

エルコンダクターティエネラアユダデコンサルタコンピラドールケアナリザラコンサルタパラベリフィカルラシンタクシスイ

3

Obtener metadatos

El compiladorenvíasolicitud de metadatos Metastore(クアルキエベースデダトス)。

4

Enviar Metadatos

Metastoreenvíalos metadatos、como una respuesta para el compilador。

5

Enviar Plan

エル・コンピラドール・コンプルエバ・エル・レクシトー・イ・ヴエルブ・エル・プラン・アル・コンダクター。 Hastaaquí氏は、コンサルタントと完全な協力関係を構築しています。

6

Ejecutar Plan

El controladorenvíaelは、計画と計画を立てます。

7

Ejecutar trabajo

MapReduceの国際会議場、国際会議場。 トラバージョ環境はJobTrackerであり、タスクトレイルはタスクトレイラーであり、タスクトラッカーはタスクトラッカーです。 Aquí、la consulta se ejecuta trabajos MapReduce。

7.1

Metadatos Po

メタストアのメタデータ、メタデータのメタデータ、メタデータのメタデータ。

8

Buscar resultados

モーターモーターは、結果が得られました。

9

Enviar Resultados

エルモーターデエジェクシオンエンバイアロスバロレスの結果はパラコンダクターです。

10

Enviar Resultados

El controladorenvíalos resultados a Hive Interfaces。