Dwh-overview
データウェアハウジング-概要
「データウェアハウス」という用語は、1990年にビル・インモンによって最初に造られました。 Inmonによると、データウェアハウスは、主題指向の統合された時変の不揮発性データコレクションです。 このデータは、アナリストが組織内で情報に基づいた意思決定を行うのに役立ちます。
運用データベースは、発生するトランザクションのために、毎日頻繁に変更されます。 経営幹部が製品、サプライヤ、消費者データなどのデータに関する以前のフィードバックを分析したい場合、幹部はトランザクションのために以前のデータが更新されているため、分析できるデータはありません。
データウェアハウスは、多次元ビューで一般化および統合されたデータを提供します。 データの一般化され統合されたビューに加えて、データウェアハウスはオンライン分析処理(OLAP)ツールも提供します。 これらのツールは、多次元空間のデータのインタラクティブで効果的な分析に役立ちます。 この分析により、データの一般化とデータマイニングが行われます。
関連付け、クラスタリング、分類、予測などのデータマイニング機能をOLAP操作と統合して、複数レベルの抽象化で対話型の知識マイニングを強化できます。 これが、データウェアハウスがデータ分析とオンライン分析処理の重要なプラットフォームになった理由です。
データウェアハウスについて
- データウェアハウスはデータベースであり、組織の運用データベースとは別に保管されます。
- データウェアハウスで頻繁に行われる更新はありません。
- 組織がビジネスを分析するのに役立つ、統合された履歴データを所有しています。
- データウェアハウスは、経営幹部がデータを整理、理解、使用して戦略的な意思決定を行えるようにします。
- データウェアハウスシステムは、多様なアプリケーションシステムの統合を支援します。
- データウェアハウスシステムは、統合された履歴データ分析に役立ちます。
データウェアハウスが運用データベースから分離されている理由
データウェアハウスは、次の理由により、運用データベースとは別に保管されます-
- 運用データベースは、特定のレコードの検索、インデックス作成など、よく知られているタスクとワークロード用に構築されます 契約では、データウェアハウスクエリはしばしば複雑であり、一般的な形式のデータを提示します。
- オペレーションデータベースは、複数のトランザクションの同時処理をサポートします。 データベースの堅牢性と一貫性を確保するために、運用データベースには同時実行制御と回復メカニズムが必要です。
- 操作可能なデータベースクエリでは、操作の読み取りと変更が可能ですが、OLAPクエリでは、保存されたデータの*読み取り専用*アクセスのみが必要です。
- 運用データベースは、現在のデータを維持します。 一方、データウェアハウスは履歴データを保持します。
データウェアハウスの機能
データウェアハウスの主要な機能は以下で説明されています-
- サブジェクト指向-データウェアハウスは、組織の継続的な運用ではなく、サブジェクトに関する情報を提供するため、サブジェクト指向です。 これらのサブジェクトには、製品、顧客、サプライヤー、売上、収益などがあります。 データウェアハウスは、進行中の運用に焦点を当てるのではなく、意思決定のためのデータのモデリングと分析に焦点を合わせます。
- 統合-データウェアハウスは、リレーショナルデータベース、フラットファイルなどの異種ソースからのデータを統合することにより構築されます。 この統合により、データの効果的な分析が強化されます。
- Time Variant -データウェアハウスで収集されたデータは、特定の期間で識別されます。 データウェアハウスのデータは、履歴の観点から情報を提供します。
- 不揮発性-不揮発性とは、新しいデータが追加されても以前のデータが消去されないことを意味します。 データウェアハウスは運用データベースとは別に保管されるため、運用データベースの頻繁な変更はデータウェアハウスに反映されません。
注意-データウェアハウスは、物理的に保存され、運用データベースから分離されているため、トランザクション処理、リカバリ、および同時実行性の制御は必要ありません。
データウェアハウスアプリケーション
前に説明したように、データウェアハウスは、経営幹部が意思決定のためにデータを整理、分析、使用するのに役立ちます。 データウェアハウスは、企業経営のための計画実行評価「クローズドループ」フィードバックシステムの唯一の部分として機能します。 データウェアハウスは、次の分野で広く使用されています-
- 金融業務
- 銀行サービス
- 消費財
- 小売部門
- 制御された製造
データウェアハウスの種類
情報処理、分析処理、およびデータマイニングは、以下で説明する3種類のデータウェアハウスアプリケーションです。
- 情報処理-データウェアハウスでは、そこに保存されているデータを処理できます。 データは、クエリ、基本的な統計分析、クロスタブ、テーブル、チャート、またはグラフを使用したレポートによって処理できます。
- 分析処理-データウェアハウスは、格納されている情報の分析処理をサポートします。 データは、スライスアンドダイス、ドリルダウン、ドリルアップ、ピボットなどの基本的なOLAP操作によって分析できます。
- データマイニング-データマイニングは、隠れたパターンと関連性を見つけ、分析モデルを構築し、分類と予測を実行することにより、知識発見をサポートします。 これらのマイニング結果は、視覚化ツールを使用して表示できます。
Sr.No. | Data Warehouse (OLAP) | Operational Database(OLTP) |
---|---|---|
1 | It involves historical processing of information. | It involves day-to-day processing. |
2 | OLAP systems are used by knowledge workers such as executives, managers, and analysts. | OLTP systems are used by clerks, DBAs, or database professionals. |
3 | It is used to analyze the business. | It is used to run the business. |
4 | It focuses on Information out. | It focuses on Data in. |
5 | It is based on Star Schema, Snowflake Schema, and Fact Constellation Schema. | It is based on Entity Relationship Model. |
6 | It focuses on Information out. | It is application oriented. |
7 | It contains historical data. | It contains current data. |
8 | It provides summarized and consolidated data. | It provides primitive and highly detailed data. |
9 | It provides summarized and multidimensional view of data. | It provides detailed and flat relational view of data. |
10 | The number of users is in hundreds. | The number of users is in thousands. |
11 | The number of records accessed is in millions. | The number of records accessed is in tens. |
12 | The database size is from 100GB to 100 TB. | The database size is from 100 MB to 100 GB. |
13 | These are highly flexible. | It provides high performance. |