Dwh-backup
データウェアハウジング-バックアップ
データウェアハウスは複雑なシステムであり、膨大な量のデータが含まれています。 そのため、すべてのデータをバックアップして、将来の要件に従ってリカバリできるようにすることが重要です。 この章では、バックアップ戦略の設計における問題について説明します。
バックアップ用語
さらに進む前に、以下で説明するバックアップ用語のいくつかを知っておく必要があります。
- 完全バックアップ-データベース全体を同時にバックアップします。 このバックアップには、すべてのデータベースファイル、制御ファイル、およびジャーナルファイルが含まれます。
- 部分バックアップ-名前が示すように、データベースの完全なバックアップは作成されません。 部分バックアップは、データベースのさまざまな部分を日常的にラウンドロビン方式でバックアップする戦略を可能にし、データベース全体が週に1回効果的にバックアップされるため、大規模なデータベースでは非常に便利です。
- コールドバックアップ-データベースが完全にシャットダウンされている間にコールドバックアップが取られます。 マルチインスタンス環境では、すべてのインスタンスをシャットダウンする必要があります。
- ホットバックアップ-ホットバックアップは、データベースエンジンが稼働しているときに行われます。 ホットバックアップの要件は、RDBMSごとに異なります。
- オンラインバックアップ-ホットバックアップと非常によく似ています。
ハードウェアバックアップ
バックアップに使用するハードウェアを決定することが重要です。 バックアップと復元の処理速度は、使用されているハードウェア、ハードウェアの接続方法、ネットワークの帯域幅、バックアップソフトウェア、およびサーバーのI/Oシステムの速度によって異なります。 ここでは、利用可能なハードウェアの選択肢とその長所と短所について説明します。 これらの選択肢は次のとおりです-
- テープ技術
- ディスクバックアップ
テープ技術
テープの選択は次のように分類することができます-
- テープメディア
- スタンドアロンのテープドライブ
- テープスタッカー
- テープサイロ
テープメディア
テープメディアにはいくつかの種類があります。 いくつかのテープメディア標準は、以下の表にリストされています-
Tape Media | Capacity | I/O rates |
---|---|---|
DLT | 40 GB | 3 MB/s |
3490e | 1.6 GB | 3 MB/s |
8 mm | 14 GB | 1 MB/s |
考慮する必要がある他の要因は次のとおりです-
- テープ媒体の信頼性
- ユニットあたりのテープ媒体のコスト
- スケーラビリティ
- テープシステムへのアップグレードのコスト
- ユニットあたりのテープ媒体のコスト
- テープ媒体の貯蔵寿命
スタンドアロンテープドライブ
テープドライブは次の方法で接続できます-
- サーバーに直接
- ネットワーク利用可能なデバイスとして
- 他のマシンにリモートで
テープドライブをデータウェアハウスに接続する際に問題が発生する可能性があります。
- サーバーが48node MPPマシンであると考えてください。 テープドライブを接続するノードがわからず、サーバーの中断や内部I/Oの遅延を最小限に抑えて最適なパフォーマンスを得るために、それらをサーバーノードに分散する方法もわかりません。
- ネットワーク利用可能なデバイスとしてテープドライブを接続するには、ネットワークが膨大なデータ転送速度の仕事に対応している必要があります。 必要な時間に十分な帯域幅が利用可能であることを確認してください。
- テープドライブをリモートで接続するには、高帯域幅も必要です。
テープスタッカー
複数のテープを単一のテープドライブにロードする方法は、テープスタッカーと呼ばれます。 スタッカーは、現在のテープの処理が終了するとマウントを解除し、次のテープをロードします。したがって、アクセスできるテープは一度に1つだけです。 価格と機能は異なる場合がありますが、一般的な機能は無人バックアップを実行できることです。
テープサイロ
テープサイロは、大容量の店舗を提供します。 テープサイロは、数千のテープを保存および管理できます。 複数のテープドライブを統合できます。 彼らは、保存するテープにラベルを付けて保存するソフトウェアとハードウェアを持っています。 サイロがネットワークまたは専用リンクを介してリモートで接続されることは非常に一般的です。 接続の帯域幅が仕事に合っていることを確認する必要があります。
ディスクバックアップ
ディスクバックアップの方法は次のとおりです-
- ディスクからディスクへのバックアップ
- 鏡面破壊
これらのメソッドはOLTPシステムで使用されます。 これらの方法は、データベースのダウンタイムを最小化し、可用性を最大化します。
ディスク間バックアップ
ここでは、テープではなくディスクでバックアップが行われます。 ディスクからディスクへのバックアップは、次の理由で行われます-
- 初期バックアップの速度
- 復元の速度
ディスクからディスクへのデータのバックアップは、テープよりもはるかに高速です。 ただし、これはバックアップの中間ステップです。 その後、データはテープにバックアップされます。 ディスクツーディスクバックアップのもう1つの利点は、最新のバックアップのオンラインコピーが提供されることです。
ミラーブレイク
アイデアは、稼働中に復元力のためにディスクをミラーリングすることです。 バックアップが必要な場合、ミラーセットの1つを分割できます。 この手法は、ディスク間バックアップの一種です。
注意-バックアップの一貫性を保証するために、データベースをシャットダウンする必要がある場合があります。
光学ジュークボックス
光ジュークボックスを使用すると、データを回線の近くに保存できます。 この手法により、テープスタッカーまたはテープサイロと同じ方法で多数の光ディスクを管理できます。 この手法の欠点は、ディスクよりも書き込み速度が遅いことです。 しかし、光メディアは長寿命で信頼性が高いため、アーカイブに適したメディアの選択肢になります。
ソフトウェアのバックアップ
バックアッププロセスを支援するソフトウェアツールが利用可能です。 これらのソフトウェアツールはパッケージとして提供されます。 これらのツールはバックアップを取るだけでなく、バックアップ戦略を効果的に管理および制御できます。 市場には多くのソフトウェアパッケージがあります。 それらのいくつかは、次の表に記載されています-
Package Name | Vendor |
---|---|
Networker | Legato |
ADSM | IBM |
Epoch | Epoch Systems |
Omniback II | HP |
Alexandria | Sequent |
ソフトウェアパッケージの選択基準
最適なソフトウェアパッケージを選択するための基準は以下のとおりです-
- テープドライブの追加に伴う製品の拡張性はどの程度ですか?
- パッケージにはクライアントサーバーオプションがありますか、またはデータベースサーバー自体で実行する必要がありますか?
- クラスターおよびMPP環境で動作しますか?
- どの程度の並列性が必要ですか?
- パッケージでサポートされているプラットフォームは何ですか?
- パッケージはテープの内容に関する情報への簡単なアクセスをサポートしていますか?
- パッケージデータベースは認識していますか?
- パッケージでサポートされているテープドライブとテープメディアは何ですか?