DPMの同期と整合性Check の違い

こんにちは、System Center サポート部の濱中です。

Data Protection Manager (DPM)は、保護グループ作成時に、保護対象ごとに ”レプリカ” と呼ばれるバックアップデータを作成し、レプリカと保護対象サーバー上の保護されたデータとの整合性を維持し続けることでデータを保護しています。この整合性を維持するため、 増分同期整合性チェック付き同期 と呼ばれる2つの同期方法が状況に応じて使い分けられますが、これらは所要時間や効率性において大きく異なっています。

今回は、この2つの同期方法の違いについてご説明いたします。

- 増分同期 (同期・高速完全バックアップ)

通常は、レプリカとデータ ソースとの整合性を維持するために増分同期を使用します。

増分同期 (単に同期とも呼ばれます) では、保護されたデータに加えられた変更が ファイル サーバーから DPM サーバーに転送され、その変更がレプリカに適用されます。この方法は前回の同期以降のデータ変更分のみ転送されレプリカに適用されるため、整合性チェックを行うよりも高速で効率的です。

- 整合性チェック付きの同期 (整合性チェック)

整合性チェックは、保護されたデータ ソースへの変更を DPM で追跡できない場合に必要となることがあります。変更ジャーナルがディスク領域を使い切ってしまった場合、同期処理中に保護されるコンピューターが予期せずシャットダウンした場合などが該当します。

整合性チェックが行われる場合、最後に DPM がバックアップに成功した時点以降に、保護対象のファイルに変更が発生したかを、レプリカと保護対象側のファイルを比較して検証していくという処理が実行されます。この比較自体が DPM サーバー、保護対象の双方において、ファイルを全て読み込む場合があるので I/O 負荷が高い処理となります。
比較処理の結果、保護対象上のファイルと DPM サーバー側にバックアップされたファイルに差異が無ければデータ転送は行われませんが、仮に差異があった場合 ファイルを丸ごと転送するため、さらに高い負荷がかかります。

ファイル単位でのデータ転送量に関しても、同期と整合性チェックでは大きな差が出てきます。

 同期はファイルの中の変更点をブロック単位で差分を検出し、変更されたブロックのみを転送する処理となります。対して、整合性チェックは、変更があったと判断されたファイル丸ごとのデータ転送が行われます。例えば、保護対象にひとつの 100 GB のファイルがあったとして、最後の同期・整合性チェック以降にその中の 1 GB が変更されたとします。同期の場合、1 GB の変更点のみが転送されますが、整合性チェック時には 100 GB のファイル丸ごとが転送されることになります。 

参考情報: レプリカを同期する方法
https://technet.microsoft.com/ja-jp/library/ff399458.aspx

- 整合性チェックが必要となる状況について

DPM サーバーとファイル サーバーの両方に処理負荷がかかるため、整合性チェックを実行する場合は適切なタイミングを見計らって管理者が手動で実行する必要があります。整合性チェックを毎日行うようスケジュールしている場合は、手動実行のかわりに DPM が自動的に実行するまで待っても良いでしょう。整合性チェックによる 保護対象、DPM サーバー双方のパフォーマンスへの影響は構成や環境により異なりますが、負荷のコントロールの観点から、整合性チェックを毎日実行する場合は ネットワークトラフィック が少ない時間帯にスケジュールしてください。

また、DPM 2010 からは、整合性エラーが検知された際に自動的に整合性チェックを実行する機能が追加されています。こちらの機能が有効な場合、あるジョブで同期を行い整合性エラーを検知すると、1 時間後に自動的に整合性チェックが実行されます。

整合性チェックが自動的に開始される状況は以下のようになります。

1. 新しい保護グループを作成した時
2. 新しいデータソースを追加した時
3. スケジュール通り実行する時 (整合性チェックを毎日行うようスケジュールしている場合) (※ 補足事項参照)
4. 不整合を検出した時 (整合性エラーが検知された際に自動的に整合性チェックを実行するオプションを選択している場合)

※ 補足事項: 毎日スケジュールする整合性チェックについては、既に整合性が取れているデータソースに対しての整合性チェックはスキップされます。

参考情報: 整合性チェックの定義
https://technet.microsoft.com/ja-jp/library/ff399470.aspx