Obiee-data-warehouse
OBIEE –データウェアハウス
今日の競争の激しい市場では、成功している企業のほとんどが市場の変化と機会に迅速に対応しています。 迅速に対応するための要件は、データと情報を効果的かつ効率的に使用することです。 *「データウェアハウス」*は、組織の意思決定者をサポートするためにカテゴリ別に整理されたデータの中央リポジトリです。 データがデータウェアハウスに保存されると、分析のためにアクセスできます。
「データウェアハウス」という用語は、1990年にBill Inmonによって最初に発明されました。 彼によると、「データウェアハウスは、経営者の意思決定プロセスをサポートする、主題指向の統合された時変で不揮発性のデータの集まりです。」
Ralph Kimballは、その機能に基づいてデータウェアハウスの定義を提供しました。 「データウェアハウスは、クエリと分析のために特別に構成されたトランザクションデータのコピーです。」
データウェアハウス(DWまたはDWH)は、データの分析とレポートの目的に使用されるシステムです。 これらは、1つ以上の異種データソースからデータを保存するリポジトリです。 これらは、現在のデータと履歴データの両方を保存し、分析レポートの作成に使用されます。 DWを使用して、上級管理職向けのインタラクティブなダッシュボードを作成できます。
たとえば、分析レポートには、四半期ごとの比較用のデータや、会社の販売レポートの年次比較用のデータを含めることができます。
DWのデータは、販売、人事、マーケティング、倉庫管理などの複数の運用システムから取得されます。 さまざまなトランザクションシステムからの履歴データが含まれていますが、他のソースからのデータを含めることもできます。 DWは、データ処理および分析ワークロードをトランザクションワークロードから分離し、複数のデータソースからのデータを統合するために使用されます。
データウェアハウスの必要性
たとえば、住宅ローンの代理店があり、マーケティング、販売、ERP、HRMなどの複数のSAP/非SAPアプリケーションからデータが送られているとします。 このデータは抽出され、変換され、DWにロードされます。 製品の四半期/年次の売上比較を行う必要がある場合、業務システムを使用することはできません。トランザクションシステムがハングするためです。 これは、DWを使用する必要性が生じる場所です。
データウェアハウスの特性
DWの重要な特徴のいくつかは次のとおりです-
- レポートとデータ分析に使用されます。
- 1つ以上のソースから統合されたデータを備えた中央リポジトリを提供します。
- 現在および過去のデータを保存します。
データウェアハウスと トランザクションシステム
以下は、データウェアハウスと運用データベース(トランザクションシステム)のわずかな違いです-
- トランザクションシステムは、ユーザーレコードの更新、レコードの検索などの既知のワークロードおよびトランザクション用に設計されています。 ただし、DWトランザクションはより複雑で、一般的な形式のデータを提供します。
- トランザクションシステムには組織の現在のデータが含まれますが、DWには通常履歴データが含まれます。
- トランザクションシステムは、複数のトランザクションの並列処理をサポートしています。 データベースの一貫性を維持するには、同時実行制御とリカバリのメカニズムが必要です。
- オペレーションデータベースクエリでは、操作の読み取りおよび変更(削除および更新)が可能ですが、OLAPクエリでは、格納されたデータの読み取り専用アクセス(selectステートメント)のみが必要です。
- DWには、データクリーニング、データ統合、およびデータ統合が含まれます。
DWには、データソースレイヤー、統合レイヤー、プレゼンテーションレイヤーの3層アーキテクチャがあります。 次の図は、データウェアハウスシステムの一般的なアーキテクチャを示しています。
データウェアハウスシステムの種類
以下は、DWシステムの種類です-
- データ市場
- オンライン分析処理(OLAP)
- オンライントランザクション処理(OLTP)
- 予測分析
データ市場
データマートはDWの最も単純な形式であり、通常は販売、財務、マーケティングなどの単一の機能分野に焦点を当てています。 したがって、データマートは通常、少数のデータソースからのみデータを取得します。
ソースは、内部トランザクションシステム、中央データウェアハウス、または外部データソースアプリケーションです。 非正規化は、このシステムのデータモデリング手法の標準です。
オンライン分析処理(OLAP)
OLAPシステムに含まれるトランザクションの数は少なくなりますが、集計の使用(合計、カウント、平均など)などの複雑な計算が含まれます。
集約とは何ですか?
年(1行)、四半期(4行)、月(12行)などの集計データでテーブルを保存し、年ごとに1行だけが処理されるようにデータを比較したいと思います。 ただし、非集計データでは、すべての行が処理されます。
OLAPシステムは通常、データをスタースキーマ、ギャラクシースキーマなどの多次元スキーマに格納します(ファクトテーブルとディメンションテーブルは論理的に結合されます)。
OLAPシステムでは、クエリを実行する応答時間は有効性の指標です。 OLAPアプリケーションは、OLAPシステムからデータを取得するためにデータマイニング技術で広く使用されています。 OLAPデータベースは、集計された履歴データを多次元スキーマに格納します。 遅延が通常数日に近いデータマートと比較して、OLAPシステムには数時間のデータ遅延があります。
オンライントランザクション処理(OLTP)
OLTPシステムは、挿入、更新、削除などの多数の短いオンライントランザクションで知られています。 OLTPシステムは、高速のクエリ処理を提供し、マルチアクセス環境でデータの整合性を提供する役割も果たします。
OLTPシステムの場合、有効性は1秒あたりに処理されるトランザクションの数によって測定されます。 OLTPシステムには通常、現在のデータのみが含まれています。 トランザクションデータベースの格納に使用されるスキーマは、エンティティモデルです。 正規化は、OLTPシステムのデータモデリング手法に使用されます。
OLTPとOLAP
次の図は、OLTPシステムとOLAPシステムの主な違いを示しています。
インデックス-OLTPシステムでは、少数のインデックスしかありませんが、OLAPシステムでは、パフォーマンスの最適化のために多くのインデックスがあります。
結合-OLTPシステムでは、多数の結合とデータが正規化されます。ただし、OLAPシステムでは、結合が少なくなり、非正規化されます。
集計-OLTPシステムでは、データは集計されませんが、OLAPデータベースではより多くの集計が使用されます。