DPM 2010 の自動修復機能 (AutoHeal) の詳細について

こんにちは、System Center サポート部の石井です。

今回は、DPM 2010 の目玉機能である、自動修復について詳細をお伝えいたします。

 

DPM 2010 では、バックアップの失敗に応じて自動的に修復する機能 (Auto Heal と呼ばれます) が追加されています。

これは、以下の 3 つの機能にて構成されています。

 

- AutoGrow: ボリュームの自動増加です。ディスクの使用量のしきい値を上回った際に自動的に容量を増加します。

- AutoRerun: 回復ポイント作成や、同期の失敗時に再実行します。

- AutoCC: 整合性エラーが発生した際に、自動的に整合性チェックを実施します。

 

DPM 2007 までは、管理者が週が明けてからコンソールを確認してみると、金曜日の夜中にバックアップが失敗していて、その後、土・日曜とバックアップが取れていなかった、ということがありました。

DPM 2010 だと、そういった状況は AutoHeal の機能が可能な限り改善します。

 

各機能の詳細は以下です。

 

AutoGrow ( ボリュームの自動拡張)

 

1. 各保護メンバごとに有効・無効を選択可能です。([保護] タブにて、保護メンバを右クリックし、"ディスク割り当ての変更" より、"ボリュームを自動的に拡大する" チェックボックスをオンにします。)

2. レプリカや回復ポイント ボリュームを、10 GB か容量の 25 % のいずれか、大きい方を拡張します。

3. 以前の自動拡張が 15 分以内に実行済みの場合、次の自動拡張は行われません。(複数のジョブ間で、同一ボリュームの自動拡張が不必要に繰り返される危険性を避けるための仕様です。)

 

注意点としては、上記の 3 で、あまりに大きな容量を一度に拡張する必要が発生した場合、15 分以内に 2 回の自動拡張は走らないため、バックアップが容量不足にて失敗したままとなる場合があります。

非常に小さいレプリカ ボリュームと回復ポイント ボリュームを設計し、あとは自動拡張に任せよう、という運用がお奨め出来ない理由の一つです。

 

自動拡張をあまりにも多く繰り返すことで、ディスク自体の断片化が進みやすくなりパフォーマンスが悪化するほか、ダイナミックディスクに存在するパーティションの拡張回数の制限 (ディスクごとに合計 2960 回まで) もありますので、ある程度正しくボリュームを設計し、その上で補助的な機能としてご利用いただくことがベストプラクティスとなります。

 

参考情報: Q ハードウェアとストレージのサイジングについて教えてください

https://technet.microsoft.com/ja-jp/systemcenter/dm/gg675295

 

AutoRerun ( ジョブの再実行)

 

1. 同期や回復ポイント作成のジョブが失敗した際に、既定で 1 時間後に再実行されます。

2. 既定の再実行回数は 1 回のみです。

3. AutoRerun は以下のアラート発生を契機に実行されます。

 - 回復ポイントの統合に失敗した場合

 - 回復ポイントの作成に失敗した場合

 - 同期に失敗した場合

 

AutoCC ( 整合性チェックの自動実行)

 

1. "保護グループの作成 (あるいは変更) ウィザード" 上で設定します。

2. "レプリカに整合性がありません" のアラート発生から、15 分の間をおいて実行されます。

3. 整合性チェック自体が整合性エラーを検出した場合、AutoCC は実行されません。

4. AutoCC は既定で 1 回のみ実行されます。

 

 

各種設定について

 

AutoRerun や AutoCC については、一部の設定をレジストリにて変更することが可能です。変更が有効なキーは以下です。

 

レジストリのパス:

HKLM\Software\Microsoft\Microsoft Data Protection Manager\Configuration

 

- AutoRerun の実行の遅延 (ディレイ) 値の変更

 

キー名: AutoRerunDelay

型: DWORD

 

既定では 60 (分) です。ジョブの失敗後、何分後にリトライするかを設定します。0 にすると即座に再実行します。

 

- AutoRerun の再実行回数

 

キー名: AutoRerunNumberOfAttempts

型: DWORD

 

既定は 1 (回) です。AutoRerun が失敗した場合、何度までリトライするかを定義します。

 

- AutoCC の実行の遅延 (ディレイ) 値の変更

 

キー名: AutoCCDelay

型: DWORD

 

整合性エラーの検知後、何分後に整合性チェックを実行するか定義します。既定値は 15 (分) ですが、当該レジストリ値で変更可能です。 0 にすると整合性エラー発生直後に整合性チェックを実行します。

 

- AutoCC の再実行回数

 

キー名: AutoCCNumberOfAttempts

型: DWORD

 

既定は 1 (回) です。AutoCC が失敗した場合、何度までリトライするかを定義します。

 

- AutoRerun の無効化

 

キー名: DisableAutoHeal

型: DWORD

 

既定は 0 (無効) です。 1 にすることで AutoRerun が無効化されます。(AutoGrow や AutoCC には影響しないようです。)

 

 

お問い合わせにおいて、「DPM 2010 には AutoHeal (自動回復) の機能があるにもかかわらずバックアップが失敗している」という点をご指摘いただくことがございますが、バックアップ自体の失敗を防ぐわけではなく、失敗時にジョブを再実行するような設計となっていますので、ご注意下さい。

また、DPM 2010 の AutoHeal によって、バックアップの安定性はかなり向上していると考えられますが、バックアップ対象上で何らかの異常 (VSS エラー等) が発生し、何度再実行してもジョブが失敗し続ける場合もあります。

従いまして、必ず、管理者様による対応が必要な異常が存在しないかという点については定期的にご確認下さいますようお願いします。

 

 

補足: AutoHeal のトラブルシュートについて

 

- AutoHeal が実行されていないという懸念が発生した場合、まずは上述いたしました、AutoHeal が実行されない条件に合致していないかについてご確認下さい。

 

- AutoHeal 機能は、"DPM AccessManager" サービスが担当しています。AutoHeal が何らかの理由で機能していないと判断される場合、当該サービスを再起動いただくことで改善するかご確認下さい。

 

- AutoHeal のトラブルシュート用ログは以下に存在します。

 

"<DPM のインストール パス>\DPM\Temp\DPMAccessManager*.errlog"

 

エラー ログの日時は GMT (国際標準時) フォーマットですので、日本時間の 9 時間前の日時が記録されていることにご注意下さい。

上記の他、イベント ログからディスク関連のエラーが発生していないか、といった点も参考となる場合がございますのでご確認下さい。

 

(弊社サポート サービスにお問い合わせいただく際にも、上記の "<DPM のインストール パス>\DPM\Temp\" 配下の .errlog の拡張子のファイルを採取いただけるとスムースです。)