Dwh-metadata-concepts
提供:Dev Guides
データウェアハウジング-メタデータの概念
メタデータとは何ですか?
メタデータは、単にデータに関するデータとして定義されます。 他のデータを表すために使用されるデータは、メタデータと呼ばれます。 たとえば、本のインデックスは本の内容のメタデータとして機能します。 言い換えれば、メタデータは、詳細なデータにつながる要約データであると言えます。 データウェアハウスに関しては、次のようにメタデータを定義できます。
- メタデータは、データウェアハウスへのロードマップです。
- データウェアハウスのメタデータは、ウェアハウスオブジェクトを定義します。
- メタデータはディレクトリとして機能します。 このディレクトリは、意思決定支援システムがデータウェアハウスのコンテンツを見つけるのに役立ちます。
注-データウェアハウスでは、特定のデータウェアハウスのデータ名と定義のメタデータを作成します。 このメタデータとともに、抽出データのソースである抽出データにタイムスタンプを付けるための追加のメタデータも作成されます。
メタデータのカテゴリ
メタデータは大きく3つのカテゴリに分類できます-
- ビジネスメタデータ-データ所有権情報、ビジネス定義、および変更ポリシーがあります。
- テクニカルメタデータ-データベースシステム名、テーブルと列の名前とサイズ、データ型、および許可された値が含まれます。 技術メタデータには、主キーおよび外部キーの属性とインデックスなどの構造情報も含まれます。
- 運用メタデータ-データの通貨とデータ系統が含まれます。 データの通貨とは、データがアクティブ、アーカイブ、またはパージされているかどうかを意味します。 データの系統とは、移行されたデータとそれに適用された変換の履歴を意味します。
メタデータの役割
メタデータは、データウェアハウスで非常に重要な役割を果たします。 ウェアハウスでのメタデータの役割はウェアハウスのデータとは異なりますが、重要な役割を果たしています。 メタデータのさまざまな役割を以下に説明します。
- メタデータはディレクトリとして機能します。
- このディレクトリは、意思決定支援システムがデータウェアハウスのコンテンツを見つけるのに役立ちます。
- メタデータは、データが運用環境からデータウェアハウス環境に変換されるときに、データをマッピングするための意思決定支援システムに役立ちます。
- メタデータは、現在の詳細データと高度に要約されたデータの要約に役立ちます。
- メタデータは、わずかに詳細なデータと高度に要約されたデータ間の要約にも役立ちます。
- メタデータはクエリツールに使用されます。
- メタデータは、抽出およびクレンジングツールで使用されます。
- メタデータはレポートツールで使用されます。
- メタデータは変換ツールで使用されます。
- メタデータは、関数の読み込みに重要な役割を果たします。
次の図は、メタデータの役割を示しています。
メタデータリポジトリ
メタデータリポジトリは、データウェアハウスシステムの不可欠な部分です。 次のメタデータがあります-
- データウェアハウスの定義-データウェアハウスの構造の説明が含まれています。 説明は、スキーマ、ビュー、階層、派生データ定義、およびデータマートの場所と内容によって定義されます。
- ビジネスメタデータ-データ所有権情報、ビジネス定義、および変更ポリシーが含まれています。
- 運用メタデータ-データの通貨とデータ系統が含まれます。 データの通貨とは、データがアクティブ、アーカイブ、またはパージされているかどうかを意味します。 データの系統とは、移行されたデータとそれに適用された変換の履歴を意味します。
- 運用環境からデータウェアハウスにマッピングするためのデータ-ソースデータベースとそのコンテンツ、データ抽出、データパーティションクリーニング、 変換ルール、データ更新およびパージルール。
- 要約のアルゴリズム-次元アルゴリズム、粒度、集計、要約などのデータが含まれます。
メタデータ管理の課題
メタデータの重要性を誇張することはできません。 メタデータは、レポートの精度を高め、データ変換を検証し、計算の精度を確保するのに役立ちます。 また、メタデータはビジネス用語の定義をビジネスエンドユーザーに強制します。 これらすべてのメタデータの使用には、課題もあります。 いくつかの課題を以下で説明します。
- 大きな組織のメタデータは、組織全体に散在しています。 このメタデータは、スプレッドシート、データベース、およびアプリケーションに広がります。
- メタデータは、テキストファイルまたはマルチメディアファイルに存在する可能性があります。 このデータを情報管理ソリューションに使用するには、データを正しく定義する必要があります。
- 業界全体で受け入れられている標準はありません。 データ管理ソリューションベンダーの焦点は狭い。
- メタデータを渡す簡単で受け入れられた方法はありません。