Dwh-olap
データウェアハウジング-OLAP
オンライン分析処理サーバー(OLAP)は、多次元データモデルに基づいています。 これにより、マネージャーやアナリストは、情報への高速で一貫した対話型のアクセスを通じて情報の洞察を得ることができます。 この章では、OLAPの種類、OLAPの操作、OLAPの違い、および統計データベースとOLTPについて説明します。
OLAPサーバーの種類
4種類のOLAPサーバーがあります-
- リレーショナルOLAP(ROLAP)
- 多次元OLAP(MOLAP)
- ハイブリッドOLAP(HOLAP)
- 専用のSQLサーバー
リレーショナルOLAP
ROLAPサーバーは、リレーショナルバックエンドサーバーとクライアントフロントエンドツールの間に配置されます。 ウェアハウスデータを保存および管理するために、ROLAPはリレーショナルまたは拡張リレーショナルDBMSを使用します。
ROLAPには次のものが含まれます-
- 集約ナビゲーションロジックの実装。
- 各DBMSバックエンドの最適化。
- 追加のツールとサービス。
多次元OLAP
MOLAPは、データの多次元ビューに配列ベースの多次元ストレージエンジンを使用します。 多次元データストアでは、データセットがまばらな場合、ストレージの使用率が低くなる可能性があります。 したがって、多くのMOLAPサーバーは、2つのレベルのデータストレージ表現を使用して、密なデータセットと疎なデータセットを処理します。
ハイブリッドOLAP
ハイブリッドOLAPは、ROLAPとMOLAPの両方の組み合わせです。 ROLAPの高いスケーラビリティとMOLAPの高速計算を提供します。 HOLAPサーバーでは、大量の詳細データを保存できます。 集計は、MOLAPストアに個別に保存されます。
専用のSQLサーバー
専用SQLサーバーは、読み取り専用環境でスタースキーマとスノーフレークスキーマを介したSQLクエリの高度なクエリ言語とクエリ処理をサポートします。
OLAP操作
OLAPサーバーはデータの多次元ビューに基づいているため、多次元データでのOLAP操作について説明します。
ここにOLAP操作のリストがあります-
- 巻き上げる
- ドリルダウン
- スライスとサイコロ
- ピボット(回転)
巻き上げる
ロールアップは、次のいずれかの方法でデータキューブの集計を実行します-
- ディメンションの概念階層を登ることにより
- 次元削減により
次の図は、ロールアップの仕組みを示しています。
- ロールアップは、ディメンションの場所の概念階層を登ることにより実行されます。
- 当初、コンセプト階層は「通り<都市<州<国」でした。
- ロールアップ時に、データは、都市のレベルから国のレベルまでロケーション階層を昇順で集約します。
- データは国ではなく都市にグループ化されます。
- ロールアップが実行されると、データキューブから1つ以上のディメンションが削除されます。
ドリルダウン
ドリルダウンは、ロールアップの逆の操作です。 次のいずれかの方法で実行されます-
- ディメンションの概念階層をステップダウンすることにより
- 新しい次元を導入することにより。
次の図は、ドリルダウンの仕組みを示しています-
- ドリルダウンは、ディメンション時間の概念階層をステップダウンして実行されます。
- 当初、概念階層は「日<月<四半期&lt年」でした。
- ドリルダウンすると、時間ディメンションは四半期のレベルから月のレベルに下降します。
- ドリルダウンが実行されると、データキューブから1つ以上のディメンションが追加されます。
- データを詳細度の低いデータから詳細度の高いデータにナビゲートします。
スライス
スライス操作は、特定のキューブから特定の1つのディメンションを選択し、新しいサブキューブを提供します。 スライスの仕組みを示す次の図を検討してください。
- ここでは、基準time = "Q1"を使用して、ディメンション "time"に対してスライスが実行されます。
- 1つ以上のディメンションを選択することにより、新しいサブキューブを形成します。
Dice
Diceは、指定されたキューブから2つ以上のディメンションを選択し、新しいサブキューブを提供します。 サイコロの動作を示す次の図を検討してください。
次の選択基準に基づくキューブのサイコロ操作には、3つのディメンションが含まれます。
- (場所=「トロント」または「バンクーバー」)
- (時間= "Q1"または "Q2")
- (item = "Mobile"または "Modem")
ピボット
ピボット操作は回転とも呼ばれます。 データの代替表示を提供するために、ビューでデータ軸を回転させます。 ピボット操作を示す次の図を検討してください。
OLAP vs OLTP
Sr.No. | Data Warehouse (OLAP) | Operational Database (OLTP) |
---|---|---|
1 | Involves historical processing of information. | Involves day-to-day processing. |
2 | OLAP systems are used by knowledge workers such as executives, managers and analysts. | OLTP systems are used by clerks, DBAs, or database professionals. |
3 | Useful in analyzing the business. | Useful in running the business. |
4 | It focuses on Information out. | It focuses on Data in. |
5 | Based on Star Schema, Snowflake, Schema and Fact Constellation Schema. | Based on Entity Relationship Model. |
6 | Contains historical data. | Contains current data. |
7 | Provides summarized and consolidated data. | Provides primitive and highly detailed data. |
8 | Provides summarized and multidimensional view of data. | Provides detailed and flat relational view of data. |
9 | Number or users is in hundreds. | Number of users is in thousands. |
10 | Number of records accessed is in millions. | Number of records accessed is in tens. |
11 | Database size is from 100 GB to 1 TB | Database size is from 100 MB to 1 GB. |
12 | Highly flexible. | Provides high performance. |