Dwh-data-warehousing
提供:Dev Guides
データウェアハウジング-概念
データウェアハウジングとは何ですか?
データウェアハウジングは、データウェアハウスを構築して使用するプロセスです。 データウェアハウスは、分析レポート、構造化および/またはアドホッククエリ、意思決定をサポートする複数の異種ソースからのデータを統合することで構築されます。 データウェアハウジングには、データクリーニング、データ統合、およびデータ統合が含まれます。
データウェアハウス情報の使用
データウェアハウスで利用可能なデータの利用を支援する意思決定支援技術があります。 これらのテクノロジーは、幹部が倉庫を迅速かつ効果的に使用するのに役立ちます。 データを収集して分析し、ウェアハウスに存在する情報に基づいて決定を下すことができます。 倉庫で収集された情報は、次のドメインのいずれかで使用することができます-
- 生産戦略の調整-製品の戦略は、四半期ごとまたは年ごとの売上を比較して製品の位置を変更し、製品ポートフォリオを管理することにより、適切に調整できます。
- 顧客分析-顧客分析は、顧客の購入の好み、購入時間、予算サイクルなどを分析することによって行われます。
- 運用分析-データウェアハウジングは、顧客関係管理や環境修正にも役立ちます。 また、この情報により、ビジネスオペレーションを分析できます。
異種データベースの統合
異種データベースを統合するには、2つのアプローチがあります-
- クエリ駆動型アプローチ
- 更新主導のアプローチ
クエリ駆動型アプローチ
これは、異種データベースを統合する従来のアプローチです。 このアプローチは、複数の異種データベースの上にラッパーとインテグレーターを構築するために使用されました。 これらのインテグレーターは、メディエーターとも呼ばれます。
クエリ駆動型アプローチのプロセス
- クエリがクライアント側に発行されると、メタデータディクショナリは、クエリを、関係する個々の異種サイトに適した形式に変換します。
- 現在、これらのクエリはマップされ、ローカルクエリプロセッサに送信されます。
- 異種サイトからの結果は、グローバルな回答セットに統合されます。
デメリット
- クエリ駆動型アプローチには、複雑な統合プロセスとフィルタリングプロセスが必要です。
- このアプローチは非常に非効率的です。
- 頻繁なクエリでは非常に高価です。
- このアプローチは、集計が必要なクエリにとっても非常に高価です。
更新主導のアプローチ
これは、従来のアプローチの代替手段です。 今日のデータウェアハウスシステムは、前述の従来のアプローチではなく、更新主導のアプローチを採用しています。 更新主導のアプローチでは、複数の異種ソースからの情報が事前に統合され、ウェアハウスに保存されます。 この情報は、直接のクエリと分析に利用できます。
利点
このアプローチには、次の利点があります-
- このアプローチは、高いパフォーマンスを提供します。
- データは、セマンティックデータストアで事前にコピー、処理、統合、注釈付け、要約、および再構築されます。
- クエリ処理では、ローカルソースでデータを処理するためのインターフェイスは必要ありません。
データウェアハウスのツールとユーティリティの機能
以下は、データウェアハウスのツールとユーティリティの機能です-
- データ抽出-複数の異種ソースからデータを収集します。
- データクリーニング-データのエラーを見つけて修正します。
- データ変換-データをレガシー形式からウェアハウス形式に変換します。
- データのロード-整合性の確認、インデックスおよびパーティションの構築、要約、統合、チェックを含みます。
- 更新-データソースからウェアハウスへの更新を伴います。
注-データのクリーニングとデータ変換は、データの品質とデータマイニングの結果を改善するための重要な手順です。