System Center Operations Manager 2007 エージェントのグレーアウトや問題が発生した際に役立つ情報 ~「KB2288515」「修正プログラム集」「レジストリ集」のご紹介~

システムセンターサポートチームの三島です。

 

今回は、System Center Operations Manager 2007 (SCOM) エージェントの監視状態がグレーアウトした際や問題が発生した際のトラブルシュート に役立つ情報として、以下の 3 点をご紹介いたします。

 

・ KB2288515 (エージェントのグレーアウトに対するトラブルシュート方法について)

・ 修正プログラム集 (エージェントに適用可能な公開済み修正プロラグム集について)

・ レジストリ集 (エージェントのヘルス状態に関連するレジストリについて)

 

上記 3 点は、エージェントで発生する種々の問題に対して、具体的なトラブルシュート手順を記載しています。以下にそれぞれの概要をまとめましたので、是非この機会に一度ご一読頂き、今後の運用にお役立て頂ければ幸いです。

 

==================================

KB2288515について

==================================

- リンク先 (英語)

Troubleshooting gray agent states in System Center Operations Manager 2007 and System Center Essentials

https://support.microsoft.com/kb/2288515

- 概

エージェント、管理サーバー、およびゲートウェイ サーバーがグレーアウトする現象に対して、5 つのシナリオを紹介し、そのシナリオ毎に対処方法を記載しています。

5 つのシナリオの詳細は以下のとおりです。

もし類似する現象が発生している場合には、一度上記のリンク先よりトラブルシュート方法をご参照頂ければと思います。

 

シナリオ (1) :

数台のエージェントがグレーアウトしており、これらのエージェントは別々の管理サーバーに通信を行っている。エージェントのキャッシュクリアによってグレーアウトが一時的に改善するが、数日後また現象が発生する。

 

シナリオ (2) :

数台のエージェントがグレーアウトしていて、これらのエージェントは別々の管理サーバーに通信している。エージェントのキャッシュクリアでは現象が改善しない。

 

シナリオ (3):

同一の管理サーバーに対して通信しているすべてのエージェントがグレーアウトしている。

 

シナリオ (4):

同一の管理サーバーに対して通信しているすべてのエージェントが断続的に健全の状態からグレーアウトし、またその逆を繰り返す。

 

シナリオ (5):

SCOM 環境下のすべてのエージェントが、断続的に健全の状態からグレーアウトし、またその逆を繰り返す。

 

==================================

修正プログラム集について

==================================

エージェントに適用可能な公開済み修正プログラムの一覧を、以下に記載します。
発生する現象の概要と、対応する修正プログラムを併せてまとめましたので、是非一度参照して頂き、現象発生時には適用をご検討頂ければと思います。
なお、この情報については、以下のとおり技術情報も公開しています。
よろしければ併せて参照してください。

System Center Operations Manager 2007 のエージェントの正常性に関するヒントと修正プログラム
https://support.microsoft.com/kb/2616936/ja

修正プログラム (1):

---------------------------------

最新の累積的な更新プログラム (CU) を、各SCOMコンポーネントに対して適用する事を推奨いたします。

SCOM 2007 R2 の現時点 (2012/01) における最新の CU5 は、以下のダウンロードサイトより入手することができます。

 

Cumulative Update 5 for System Center Operations Manager 2007 R2 (KB 2495674)

https://www.microsoft.com/download/en/details.aspx?id=26938

 

SCOM 2007 SP1 の現時点における最新の CU1 は、以下のダウンロードサイトより入手することができます。

 

System Center Operations Manager 2007 SP1 の累積的な更新プログラム 1 (KB 2028594)

https://www.microsoft.com/downloads/ja-jp/details.aspx?displaylang=ja&FamilyID=62b6c324-38b9-47df-bd89-a62908f0b642

 

修正プログラム (2):

---------------------------------

Windows Server 2003 および Windows Server 2008 上で稼働するルート管理サーバーや管理サーバーにて、ヘルスの状態が健全であるにも関わらず、管理サーバーやエージェントが利用不可と表示される。

 

Management servers or assigned agents unexpectedly appear as unavailable in the Operations Manager console in Windows Server 2003 or Windows Server 2008

https://support.microsoft.com/kb/981263/en-us

 

修正プログラム (3):

---------------------------------

Avg.Disk/Transfer のパフォーマンスカウンターに対して、誤った値が算出される

 

a.  監視対象が Windows Server 2008 R2 または Windows 7 の場合

The RegQueryValueEx function returns a very large incorrect value for the "Avg. Disk sec/Transfer" performance counter in Windows Server 2008 R2 or in Windows 7

https://support.microsoft.com/kb/2470949/en-us

 

b.  監視対象が Windows Server 2008 または Windows Vista の場合

Invalid "Avg. Disk sec/Transfer" value returned by the RegQueryValueEx function in Windows Server 2008 or in Windows Vista

https://support.microsoft.com/kb/2495300/en-us

 

修正プログラム (4):

---------------------------------

Windows Server 2008 および Windows Vista にて、ベントログのバックアップと削除を実施した後に、イベントログ監視のアラートが出力されない

 

You cannot receive event notifications after you back up and then clear event logs in Windows Server 2008 or in Windows Vista

https://support.microsoft.com/kb/2458331/en-us

 

修正プログラム (5):

---------------------------------

Windows Server 2008 R2 および Windows 7にて wmiprvse.exe のプロセスのメモリ使用量が増加し続け、WMI のメモリリークが発生する

 

The "Win32_Service" WMI class leaks memory in Windows Server 2008 R2 and in Windows 7

https://support.microsoft.com/kb/981314/en-us

※ Windows Server 2008 R2 SP1 および Windows 7 SP1 も対象として含まれます。

 

修正プログラム (6):

---------------------------------

Windows Server 2003 および Windows Vista の WMI レポジトリの安定性に関する修正プログラム

 

A hotfix is available that improves the stability of the Windows Management Instrumentation repository in Windows Server 2003

https://support.microsoft.com/kb/933061/en-us

 

修正プログラム (7):

---------------------------------

Windows Server 2003 および Windows XP において、SCOM 用にWindows Script 5.7 をインストールすると Windows Script Host (WSH) のバイナリが Windows File Protection によって上書きされ、CPU の使用率が大幅に上昇する

 

WSH binaries are overwritten by Windows File Protection after you install Windows Script 5.7 on a computer that is running Windows Server 2003 or Windows XP

https://support.microsoft.com/kb/955360/en-us

 

修正プログラム (8):

---------------------------------

.Net Framework 2.0 の環境下において、Monitoringhost.exe や HealthService.exe プロセスが大量のスレッド ハンドルやイベント ハンドルを取得したままの状態となる。

 

A managed application has a high number of thread handles and of event handles in the Microsoft .NET Framework 2.0

https://support.microsoft.com/kb/968760/en-us

 

修正プログラム (9):

---------------------------------

MSXML 6.0 を導入済みのWindows Server 2008、Windows Vista, Windows XP SP3 において、MonitoringHost.exe プロセスの CPU 使用率が 100 % となる。

 

The CPU usage of an application or a service that uses MSXML 6.0 to handle XML requests reaches 100% in Windows Server 2008, Windows Vista, Windows XP Service Pack 3, or other systems that have MSXML 6.0 installed

https://support.microsoft.com/kb/968967/en-us

 

修正プログラム (10):

---------------------------------

マルチ プロセッサーの Windows Server 2008 またはWindows Vista SP1 に、Transport Driver Interface (TDI) を使用するソフトウェアをインストールすると、新規の Ancillary Function Driver for Winsock (AFD) が失敗する。

 

https://support.microsoft.com/kb/961775/en-us New AFD connections fail when software that uses TDI drivers is installed on a Windows Server 2008 or Windows Vista SP1 system that is running on a computer that has multiple processors

 

修正プログラム (11):

---------------------------------

SQL Server 2005、2008、2008 R2 に関する情報を SQL Server WMI プロバイダーより取得しようとすると「0x80041013 “Provider Load Failure”」のエラーメッセージが出力され、Wmiprvse.exe の応答が停止する。

 

FIX: You receive a "Provider Load Failure" error message or the Wmiprvse.exe process stops responding when you use a SQL Server WMI provider to obtain information about SQL Server 2005, SQL Server 2008, or SQL Server 2008 R2 services

https://support.microsoft.com/kb/980142/en-us

 

修正プログラム (12):

---------------------------------

統合認証を使用したネットワーク通信に対する、監査保護の強化の修正プログラム。

※ こちらの修正プログラムは、エージェントのプッシュインストール時のネットワークトレースに出力される 「Server Error, (91) Invalid user identifier」エラーに対しても有効である場合があります。

 

Extended Protection for Authentication

https://support.microsoft.com/kb/968389/en-us

 

修正プログラム (13):

---------------------------------

Windows XP および Windows Server 2003環境への .NET Framework 3.5 SP1 のロールアップ。

※ このロールアップを適用することで、認証に関する保護を強化する事が可能です。

 

Description of the rollup update for the .NET Framework 3.5 Service Pack 1 on Windows XP and on Windows Server 2003 (976765, 980773 and 976769): June 8, 2010

https://support.microsoft.com/kb/982168/en-us

 

修正プログラム (14):

---------------------------------

Windows XP および Windows Server 2003 環境への、.NET Framework 3.5 SP1 および .NET Framework 2.0 SP2 のロールアップ。

※ このロールアップを適用することで、認証に関する保護を強化する事が可能です。

 

Description of the rollup update for the .NET Framework 3.5 Service Pack 1 and the .NET Framework 2.0 Service Pack 2 on Windows XP and on Windows Server 2003 (976765 and 980773): June 8, 2010

https://support.microsoft.com/kb/982167/en-us

 

修正プログラム (15):

---------------------------------

Windows Server 2008フェールオーバークラスタのノードに対する Hotfix のロールアップ。このロールアップは以下の 3 つの問題に対する修正を含みます。

 

- 問題1

以下のエラーが出力され、Failover Clustering WMI プロバイダーに対する WMI クエリが失敗する。

Number: 0x80041008

Facility: WMI

Description: Invalid parameter

 

条件:Windows Server 2008 にフェールオーバークラスタ を構築している。

また、クラスタ オブジェクトのプライベート プロパティ名において、WMI がサポートしていない文字を使用している。

 

- 問題 2

アプリケーションが、クラスタリソースに対するリソースクラスを特定する事ができず、アプリケーションが正常に動作しない事がある。なお、アプリケーションによって、現象が異なる場合がある。

 

条件:Windows Server 2008 にフェールオーバー クラスタ を構築している。

また、アプリケーションが、クラスタ リソースのクラスタ クラスを、Cluster WMI インターフェースを使用してクエリ実行している。

 

- 問題 3

エラーコード 5013 で、AddToCluster メソッドが失敗する。

 

条件:フェールオーバー クラスタを英語版以外の Windows Server 2008 に導入している。

また、フェールオーバークラスターディスクを MSCluster_AvailableDisks クラスの AddToCluster メソッドを使用して追加している。

 

A rollup hotfix package for Windows Server 2008 Failover Clustering WMI provider

https://support.microsoft.com/kb/968936/en-us

 

 

==================================

レジストリについて

==================================

エージェントのヘルス状態に関係するレジストリと、それぞれのレジストリの設定に依存して発生する現象を以下に記載します。
類似する現象が発生した際には、対処方法に記載いたしました手順にて、レジストリ値の変更を検討して下さい。
なお、この情報については、以下のとおり技術情報も公開しています。
よろしければ併せて参照してください。

System Center Operations Manager 2007 のエージェントの正常性に関するヒントと修正プログラム
https://support.microsoft.com/kb/2616936/ja

レジストリ (1):

---------------------------------

Subkey: HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\HealthService\Parameters

Type: REG_DWORD

Name: Persistence Version Store Maximum

Value: Number of 16-kilobyte pages

Base: Decimal

 

バージョン ストアの既定のサイズは、SCOM のロールによって異なります。また、16 KB のページ単位でメモリ上に割り当てられます。

- エージェント(クライアント OS):640 (10 MB)

- エージェント(サーバー OS):1920 (30 MB)

- 管理サーバー:5120 (80 MB)

 

- 現象

以下のようなイベントが出力される際には、上記のレジストリ値の設定に問題がある可能性があります。

 

Event Type: Error

Event Source: ESE

Event Category: Transaction Manager

Event ID: 623

Description: HealthService (<PID>) The version store for instance <instance> ("<name>") has reached its maximum size of <value>Mb. It is likely that a long-running transaction is preventing cleanup of the version store and causing it to build up in size. Updates will be rejected until the long-running transaction has been completely committed or rolled back. Possible long-running transaction:

SessionId: <value>

Session-context: <value>

Session-context ThreadId: <value>.

Cleanup:<value>

 

- 対処方法

バージョンストアのサイズを既定のサイズの 2 倍に設定して下さい。

 

レジストリ (2):

---------------------------------

Subkey: HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\HealthService\Parameters\Management Groups\<MGNAME>

Type: REG_DWORD

Name: MaxItemSizeBytes

Value: 52428800

Base: Decimal

 

- 現象

以下のイベントが出力される場合には、上記のレジストリ値の設定に問題がある可能性があります。

 

Event Source: HealthService

Event Category: Health Service

Event ID: 2015

User: N/A

Description:

A workflow in the Health Service has generated a message which exceeds the size limit, and has been discarded.

 

- 対処方法

既定の値よりも高い値に変更する事を検討して下さい。

ただし、値を増やす事によって管理サーバーやルート管理サーバーに収集される検知データの量が増加するため、管理グループのパフォーマンスが低下することがあります。この点についても予め考慮して下さい。