Dwh-terminologies
データウェアハウジング-用語
この章では、データウェアハウジングで最もよく使用される用語について説明します。
メタデータ
メタデータは、単にデータに関するデータとして定義されます。 他のデータを表すために使用されるデータは、メタデータと呼ばれます。 たとえば、本のインデックスは本の内容のメタデータとして機能します。 つまり、メタデータは、詳細データにつながる要約データであると言えます。
データウェアハウスの観点から、メタデータを次のように定義できます-
- メタデータは、データウェアハウスへのロードマップです。
- データウェアハウスのメタデータは、ウェアハウスオブジェクトを定義します。
- メタデータはディレクトリとして機能します。 このディレクトリは、意思決定支援システムがデータウェアハウスのコンテンツを見つけるのに役立ちます。
メタデータリポジトリ
メタデータリポジトリは、データウェアハウスシステムの不可欠な部分です。 次のメタデータが含まれています-
- ビジネスメタデータ-データ所有権情報、ビジネス定義、および変更ポリシーが含まれています。
- 運用メタデータ-データの通貨とデータ系統が含まれます。 データの通貨とは、アクティブ、アーカイブ、またはパージされるデータを指します。 データの系統とは、移行されたデータの履歴とそれに適用される変換を意味します。
- 運用環境からデータウェアハウスにマッピングするためのデータ-メタデータには、ソースデータベースとそのコンテンツ、データ抽出、データパーティション、クリーニング、変換ルール、データ更新、パージルールが含まれます。
- 要約のアルゴリズム-ディメンションアルゴリズム、粒度、集計、要約などのデータが含まれます。
データキューブ
データキューブは、複数のディメンションでデータを表すのに役立ちます。 ディメンションとファクトによって定義されます。 ディメンションは、企業がレコードを保持する対象となるエンティティです。
データキューブの図
ある会社が、販売データウェアハウスの助けを借りて、時間、アイテム、支店、場所に関して販売記録を追跡したいとします。 これらのディメンションにより、毎月の売上とアイテムが販売された支店を追跡できます。 各ディメンションに関連付けられたテーブルがあります。 このテーブルは、ディメンションテーブルと呼ばれます。 たとえば、「item」ディメンションテーブルには、item_name、item_type、item_brandなどの属性があります。
次の表は、時間、アイテム、および場所のディメンションに関する会社の販売データの2Dビューを表しています。
しかし、この2Dテーブルには、時間とアイテムのみに関するレコードがあります。 ニューデリーの売上高は、時間、および販売されたアイテムのタイプに応じたアイテムのディメンションに関して表示されます。 もう1つのディメンション(ロケーションディメンションなど)を使用して販売データを表示する場合は、3Dビューが役立ちます。 時間、アイテム、場所に関する販売データの3-Dビューは、以下の表に示されています-
上記の3-Dテーブルは、次の図に示すように3-Dデータキューブとして表すことができます-
データ市場
データマートには、組織内の特定の人々のグループにとって有益な組織全体のデータのサブセットが含まれています。 つまり、データマートには、特定のグループに固有のデータのみが含まれます。 たとえば、マーケティングデータマートには、アイテム、顧客、および販売に関連するデータのみが含まれる場合があります。 データマートは対象に限定されます。
データマートに関する注意点
- WindowsベースまたはUnix/Linuxベースのサーバーは、データマートを実装するために使用されます。 これらは低コストのサーバーに実装されています。
- データマートの実装サイクルは、短期間、つまり数か月または数年ではなく数週間で測定されます。
- データマートのライフサイクルは、計画と設計が組織全体に当てはまらない場合、長期的には複雑になる可能性があります。
- データマートのサイズは小さいです。
- データマートは部門ごとにカスタマイズされます。
- データマートのソースは、部門ごとに構造化されたデータウェアハウスです。
- データマートは柔軟です。
次の図は、データマートのグラフィカルな表現を示しています。
仮想倉庫
運用データウェアハウスのビューは、仮想ウェアハウスと呼ばれます。 仮想倉庫の構築は簡単です。 仮想倉庫を構築するには、稼働中のデータベースサーバーに過剰な容量が必要です。