突然の Exchange サーバーへの接続障害


Exchange チームの河本です。

Windows 2003 サーバー上にExchange 2007 サーバーがインストールされている環境で Outlook や OWA を利用してメールボックス サーバーへ接続しているときに以下のような特徴のある接続障害が突然発生することがあります。

症状
======
1.数分から数十分ほどメールボックス サーバーからの応答がなくなる。
2.しばらくすると障害が自然に回復する。
3.問題発生期間にイベント ログ上には特に該当するようなエラーや警告がない。

さらに現象発生時、パフォーマンス モニタで監視していると、以下の兆候が見られます。
・問題発生期間にハードディスクへのページングが大量に発生している。
*注1)パフォーマンス カウンタ “Memory\Page Output/sec” にて監視可
・問題発生期間に利用可能な物理メモリ量が急激に増加している。
*注 2)パフォーマンス カウンタ  “ Memory\Available Mbytes” にて監視可
・ Store.exe が使用する物理メモリ量が急激に減少している。
*注 3)パフォーマンス カウンタ  “Process(store)\Working Set” にて監視可

*注釈
--------------
上述のパフォーマンス カウンタについて以下に補足説明致します。
注 1) Memory\Available Mbytes
プロセスへの割り当てまたはシステムでの使用に、すぐに使用可能な物理メモリの量 (MB 単位) を示します。当該カウンタを常時監視している場合は、現象発生直前に使用可能なメモリ量が数百 MB くらいまで減少し、現象発生期間に数 GB くらいまで急激に値が上昇する傾向を確認することができます。
注2)Memory\Page Output/sec
ページがディスクから読み取られる、またはディスクに書き込まれる速度を示します。当該カウンタを常時監視している場合は、現象発生中に値が急激に上昇している傾向を確認することができます。
注3)Process(store)\Working Set
Store.exe  が使用している物理メモリ領域のサイズ (Byte 単位) を示します。当該カウンタを常時監視している場合は、現象発生中に値が急激に減少している傾向を確認することができます。

原因/回避策
============
Windows 2003 サーバーでは、使用可能な物理メモリの量が低下している状態でシステムが大量のメモリを必要とする場合に、利用可能なメモリを確保しようとしてハードディスクへのページングが大量に発生します。この動作により OS が応答不能となり OS 上で動作している Exchange などのアプリケーションも使用できなくなってしまうことがあります。メールボックス サーバーで発生している場合は、Store.exe  が使用している物理メモリ領域のサイズ (ワーキング セット) が現象発生時に急激に減少します。
過去のお問い合わせの中からメモリ トリミングの現象は平日の午前中に発生する傾向にあります。夜間に実施されるデータベースの保守処理と朝方の多数のユーザーによる Outlook へのログオン処理によるメモリ消費が重なっていることが要因ではないでしょうか。
この問題は、KB 938486  により修正されています。上述の症状に合致している場合は、問題の Exchange サーバーに KB 938486  の修正プログラムまたは  KB938486 の修正が含まれている .Net 2.0 SP1  が適用されていることを確認し、適用されていない場合は速やかに適用下さい。また KB 938486  の問題を未然に防ぐためにも問題が発生していない他のメールボックス サーバーやクライアント アクセス及びトランスポート サーバーにも適用することをお勧めいたします。
実は午前中に度々 Outlook での接続問題があると感じているようでしたら、KB 938486  の問題に該当しているかもしれません。

英語版
------------
ID : 938486
TITLE : A Windows Server 2003-based computer becomes unresponsive because of a memory manager trimming operation that is caused by an indeterminate module that requests lots of memory
URL : http://support.microsoft.com/kb/938486/en-us

日本語版 (機械翻訳)
-----------------------
ID : 938486
TITLE : Windows Server 2003 ベースのコンピューターが、大量のメモリを要求する中間モジュールによって発生するメモリ マネージャー トリミング操作のため、応答しなくなった
URL : http://support.microsoft.com/kb/938486/ja

Skip to main content