Operations Manager のデータベース再接続に関する動作について

日本マイクロソフト System Center Support Team の宮崎です。今回は System Center Operations Manager 2007 R2 (以下、SCOM) のデータベース再接続に関する動作について小ネタを紹介したいと思います。

SCOM は、自身の動作に必要となる情報を OperationsManager データベースや OperationsManagerDW データベースに格納しています。これらのデータベースに対する接続が途切れた場合、そうした状況がごく短時間で復旧すれば SCOM は再接続を試みるため、処理に問題が発生することはありません。しかし接続が途切れた状態が長時間続いた後に復旧した場合、データベースへの再接続や復旧処理が失敗し、SCOM ルート管理サーバーが正常に動作しない状態に陥ることがあります。このような場合、ルート管理サーバー上の Operations Manager イベント ログには ID 2115 のイベントが記録され、当該サーバー上の SCOM 関連サービスを再起動するまで状態は復旧しません。(一般的な ID 2115 のトラブルシュートについては、こちらをご参照下さい。)

この問題は、SCOM のデータベース再接続に関する動作に起因して発生します。この部分の動作については、以下のレジストリを追加することで変更することが出来ます。

---------------------------------
レジストリのパス : HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft Operations Manager\3.0\DAL
レジストリ値の型 : DWORD
レジストリ値の名前 : DALInitiateClearPool
レジストリ値 : 1
---------------------------------

---------------------------------
レジストリのパス : HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft Operations Manager\3.0\DAL
レジストリ値の型 : DWORD
レジストリ値の名前 : DALInitiateClearPoolSeconds
レジストリ値 : 60
---------------------------------

こちらのレジストリを追加した上で SCOM 関連サービスを再起動することにより、長時間データベースの接続が途切れた後でもデータベースへの再接続を試行するように動作が変更されます。再試行の周期は、DALInitiateClearPoolSeconds に設定した値で規定されます。
データベースへの接続が頻繁に途切れるような環境において、SCOM ルート管理サーバーが正常に動作しない状態がしばしば発生している場合には、こちらのレジストリをお試し頂ければと思います。
なお接続が頻繁に途切れること自体も製品の動作上よろしい状況ではありませんので、別途トラブルシュートを実施するか、サポートまでお問い合わせ頂ければと思います。

※ こちらの作業を実施する際には、事前に SCOM の累積修正プログラム 5 以降を適用してください。

“Cumulative Update 5 for System Center Operations Manager 2007 R2 is available”
https://support.microsoft.com/kb/2495674

- 参考情報
“A new feature in R2-CU4 - reconnecting to SQL server after a SQL outage”
https://blogs.technet.com/b/kevinholman/archive/2011/02/07/a-new-feature-in-r2-cu4-reconnecting-to-sql-server-after-a-sql-outage.aspx

コミュニティにおけるマイクロソフト社員による発言やコメントは、マイクロソフトの正式な見解またはコメントではありません。