Ask CORE

Microsoft Japan Windows Technology Support

フェールバックの動作について

こんにちは。Windows プラットフォーム サポートの加藤です。本日は、フェールオーバー クラスターの機能のひとつであるフェールバックについてご紹介させていただきます。 ■フェールバックとはフェールバックとは、障害が発生したノードが再び利用できる状態になった時点で、フェールオーバーにより移動したサービスまたはアプリケーションが既定のノードへ自動的に移動する設定です。既定値では無効となっていますが、[フェールバックを許可する] を有効にすることで設定いただくことができます。 以下、フェールバックの動作について Node 1 , Node 2 の 2 台のノードでクラスターを構成する環境を例にご紹介させていただきます。 (1) 通常稼働状態 通常時の構成は、下記の図のように仮想マシンを 2 台ずつそれぞれのノードがホストする構成です。仮想マシン 1 (VM 1 :以下仮想マシンは VM と記載)、VM 2 は優先所有者を Node 1 として [フェールバックを許可する] を設定しています。 Node 1 : VM 1、VM 2Node 2 : VM 3、VM 4 (2) 障害の発生 (クラスター サービスの停止) Node 1 で何らかの障害が発生し、Node 1 のクラスター サービス (または OS… Read more

フェールオーバー クラスターにディスク リソースが追加できない。

こんにちは。Windows プラットフォーム サポートの加藤です。 本日は、フェールオーバー クラスターにディスク リソースが追加できない事象について、ご案内します。 フェールオーバー クラスターにディスク リソースを追加するためには、以下の要件に合致する必要があります。 1. 共有ストレージが SCSI-3 の Persistent Reservation (永続的な予約) に対応している。2. MBR or GPT 形式で初期化されている。3. ダイナミック ディスクではなくベーシック ディスクを使用している。 しかしながら、上記の要件を満たしており、構成が正しいにも関わらず、フェールオーバー クラスター マネージャーで「ディスクの追加」ボタンをクリックしても、追加可能なディスクが無いメッセージが表示され、ディスク リソースが追加できない事象の報告がありました。 この事象では、当該ディスク (LUN) 上に、何らかの原因で前述の Persistent Reservation (永続的な予約) が残っていたために、新たに Persistent Reservation (永続的な予約) ができなくなり、その結果ディスク リソースの追加ができない状況に陥っていました。 クラスターは、Persistent Reservation (永続的な予約) を使用して、ディスクの所有権を管理するため、予約ができないディスクはクラスターに追加できません。 弊社過去事例では、ストレージの障害発生後に、ストレージ側で復旧処理を実施し、ディスク リソースをクラスターに再度登録しようとした際に本問題が発生していました。 そのため、構成が正しいにも関わらず、追加に失敗する場合には、Persistent Reservation (永続的な予約)が残っている可能性が考えられます。 もし、前述の要件を満たしており、構成が正しいにも関わらず、ディスク リソースが追加できない現象が発生した場合には Persistent Reservation (永続的な予約) を強制的に解除する以下のコマンドを実行して、正常にディスク… Read more

クラスター調査に必要な情報収集について

こんにちは。 平素は弊社製品をご愛顧いただき誠にありがとうございます。  運用を頂いておりますお客様のクラスター環境は問題無く動作しておりますでしょうか。高可用性を謳うフェールオーバー クラスター製品ですが、長く運用を頂く中で外部的な要因も含め、クラスターが障害を検知したりフェールオーバーが発生する場合もあるかと存じます。 障害調査依頼として弊社にお問い合わせを頂く場合、お伺いした現象や障害に対して調査の為の情報取得をお願いすることがあります。この記事では初期調査を行なううえで最低限必要になる情報をご案内します( 実際の調査ではその過程においてあらためて現象の確認や追加情報のお願いをさせていただく場合があります。お手数をお掛けする事となりますが何卒、ご理解と共にご協力を頂けますようよろしくお願い申し上げます)。一般的にフェールオーバー クラスターの調査では部分的なエラー情報だけではなく構成や動作を確認する必要がありますので、以下 (a)~(f) の様な情報が必要になります。またフェールオーバー クラスターは複数の Windows サーバーが連携して動作しますので、情報採取はクラスターを構成する全てのノードが対象になります。実機からのログ情報採取とは別に、確認いただいた発生障害と状況についても是非、お教えください (障害対応の現場は修羅場同然でそれどころではないと思いますが、後から思い出せる範囲でも結構です。現場で実際に目で観て頂いた情報は何よりも重要であることが多くあります)。 情報保存を頂きたい情報 ◆ Windows OS の情報 (a) システム情報 (msinfo32.exe) : 全ノードで採取(b) イベント ログ情報 Evtx+CSV形式 (eventvwr.exe) : 全ノードで採取(c) ネットワーク情報 (ipconfig.exe) : 全ノードで採取 ◆ フェールオーバー クラスターの情報 (d) クラスター診断ログ (cluster.exe/Get-ClusterLog) : 全ノードで採取 … ※(e) クラスター リソースとグループの情報 (cluster.exe/Get-Cluster)  : 1台のノードで採取(f) クラスター ハイブ (reg.exe) : 1台のノードで採取 ※ クラスター診断ログはサイズ固定の循環ログですので、時間が経過することにより古いログから上書きされてしまいます。障害が発生した後は可能な限り速やかに保存と回収をお願いします。… Read more

ソース: FailoverClustering, イベント ID :1135, イベント ID :1177 が記録されクラスター サービスが停止してしまう

平素より弊社製品をご愛顧くださいまして、誠にありがとうございます。日本マイクロソフトの加藤です。 クラスター サービスでは、ノード間通信が失敗するとクラスター サービスが停止してしまう障害が発生することがございます。クラスター サービスが停止した原因がノード間通信やクォーラム ディスクへのアクセス遅延の場合にはシステム ログに下記のようなログが記録されます。 ■ ログ: システム, ソース: FailoverClustering, イベント ID :1135   (ノード間通信のハートビートの疎通が失敗してしまい、クラスターを構成するノードがクラスター サービスから除外されたことを示すエラー) ■ ログ: システム, ソース: FailoverClustering,イベント ID :1177   (クラスターの起動時にクォーラム ディスクへの接続が遅くクラスター サービスが何度も再起動を繰り返す際に記録されるエラー) 上述のような障害は、クラスターを構成するノードの負荷が生じていたりディスクやノード間のアクセス経路に問題があったりと原因はさまざまです。しかしながら、原因はお客様環境に依存する問題であることがほとんどとなります。原因を調査し、その原因への対処策を実施することが根本的な解決ではございますが、原因への対処策を実施いただくまでの暫定的な対処として、障害を検知するまでの時間を遅らせる方法がございます。クラスターのパラメーターである QuorumArbitrationTimeMax や SameSubnetDelay, SameSubnetThreshold, CrossSubnetDelay, CrossSubnetThreshold の値の変更が障害を検知するまでの時間を遅らせる方法としては有効です。これらのパラメーターの値は GUI で変更することができないため、変更する方法をこの Blog でご紹介させていただきます。 GUI で設定の変更ができない理由としては、一般的な環境では変更する必要がなく、変更することによりクラスター サービス全体に影響を与える恐れがあるためでございます。そのため、設定及び設定変更いただく場合には十分影響について考慮いただいた上で実施くださいますようお願いいたします。 本項では、クラスターのパラメーターである QuorumArbitrationTimeMax や SameSubnetDelay, SameSubnetThreshold, CrossSubnetDelay, CrossSubnetThreshold についてご紹介させていただきます。 1. QuorumArbitrationTimeMax 2. SameSubnetDelay, SameSubnetThreshold, CrossSubnetDelay, CrossSubnetThreshold… Read more

FailoverClustering のイベント ID 1206 が記録される現象

こんにちは。Windows プラットフォーム サポートの戸田です。 本記事では弊社過去事例データベースからの情報を基に、 Windows Server 2012 R2 を用いたフェールオーバー クラスター環境で以下のイベント ID 1206 が 24 時間毎に記録される場合の対処策について紹介します (同時にイベント ID 1207 が記録されることもあります)。 ログの名前:         Systemソース:           Microsoft-Windows-FailoverClusteringイベント ID:       1206タスクのカテゴリ:      ネットワーク名リソースレベル:           エラー説明: クラスター ネットワーク名リソース '<ネットワーク リソース名>' に関連付けられたコンピューター オブジェクトをドメイン '<ドメイン名>' で更新できませんでした。エラー コードは 'Password change' でした。クラスター ID '<クラスター名$>' は、オブジェクトを更新するために必要なアクセス許可を持っていない可能性があります。ドメイン管理者と協力して、このクラスター ID がドメインのコンピューター オブジェクトを更新できるようにしてください。 ログの名前:         Systemソース:           Microsoft-Windows-FailoverClusteringイベント ID:       1207タスクのカテゴリ:      ネットワーク名リソースレベル:           エラー説明: クラスター ネットワーク名リソース '<ネットワーク リソース名>'… Read more

システム構成ツールの起動時に ”スタートアップのオプションを選択" が選択される現象について

こんにちは。 Windows プラットフォーム サポートの丸山です。 本日は、弊社にて調査中の “システム構成” ツールに関する不具合についてご紹介させていただきます。 もし、お使いの環境でも類似の事象が発生しておりましたら、本ブログ記事をご参考いただけますと幸いです。 ※2017/12/26 追記:本事象が Windows Server 2016 環境でも発生することを追記いたしました。 ■ 発生する事象について Windows では、msconfig コマンドを実行すると、“システム構成” ツールが起動して、Windows の起動時に開始するサービスを一部無効化したり、デバッグ機能を有効にして、Windows 起動時のトラブルシューティングを行うことができます。 また、“システム構成” ツールを起動すると、通常の環境では “全般” タブの “スタートアップの選択” にて “通常スタートアップ” が選択された状態となっています。 図 : ”システム構成” ツール起動時の状態 (正常時) ところが弊社では、一部の環境にて “システム構成” ツールを起動すると、“全般” タブの “スタートアップの選択” にて “スタートアップのオプションを選択” が選択されているという事象が報告されております。 図 : “システム構成” ツール起動時の状態 (異常時) 本事象は以下製品をお使いの場合に発生することが確認されております。 Windows 8 Windows 8.1 Windows 10… Read more

クラスターのハートビート通信の設定値の範囲について

こんにちは。Windows プラットフォーム サポートの永岡です。 今回のトピックはクラスターのハートビート通信に関わるパラメーターの設定値 (閾値) について分かりやすくご紹介したいと思います。 ハートビートとはクラスター ノード間で互いのノードの正常性を確認するための仕組みで、詳細につきましては以下の記事がございます。ハートビート通信の設定変更手順などの記載がございますので、こちらにつきましても、ぜひご一読ください。   フェールオーバー クラスターのハートビートについて  http://blogs.technet.com/b/askcorejp/archive/2012/03/22/3488080.aspx このハートビートに関するパラメータの設定可能な範囲については、Windows Server 2008 および Windows Server 2012 / 2012 R2 では公開された情報がありましたが、Windows Server 2008 R2 における設定可能値の情報は、公開されておりませんでした。 そのため、当ブログでは Windows Server 2008 R2 を含めた OS  バージョン毎のハートビート通信の設定値の範囲についてまとめさせていただきます。 ■ Windows Server 2008 における設定値の範囲 Parameter Default Minimum  Maximum SameSubnetDelay      1000 ミリ秒 (1秒) 250 ミリ秒 (0.25 秒) 2000 ミリ秒 (2… Read more

Hyper-V フェールオーバー クラスター環境で VM の移動後に、移動元のノードに VM の情報が残ってしまう

こんにちは。Windows プラットフォーム サポートの加藤です。本日は、Hyper-V フェールオーバー クラスターの環境で、仮想マシンの移動後に、移動元のノードに仮想マシンの情報が残ってしまう事象の回避策をご案内します。※ [移動] = ライブ、クイック マイグレーションとフェールオーバーを含む所有者変更を指します。 Hyper-V フェールオーバー クラスターの環境で、仮想マシンの移動後に、移動元のノードに情報が残ってしまい、移動元の Hyper-V マネージャーと、移動先の Hyper-V マネージャーの両方に同じ仮想マシンが表示される場合がございます。 また、この問題が発生すると、仮想マシンの情報が二つのノードで重複して表示される以外に、以下の事象が発生する場合もございます。 1. ライブ マイグレーションやクイック マイグレーションを実行すると [時間がかかっています] と表示され、完了しない。2. 仮想マシンを最新の情報に更新をしても同様に [時間がかかっています] と表示され、正常に完了しない。3. すべてのノードの Hyper-Vマネージャーで仮想マシンが表示されなくなる。※ この時、移動元のノードのクラスター サービスを停止すると、移動元の Hyper-V マネージャーと、移動先の Hyper-V マネージャーの両方に同じ仮想マシンが表示されることが確認できます。 通常であれば、移動元のノードからは、情報が削除されるため、両方のノードで表示されることはございません。表示されるのは、仮想マシン リソースのオーナーノードのみです。 しかしながら、何らかの原因で情報が残ってしまった場合には、両ノードで表示されてしまいます。上記状態に陥ってしまった場合には、以下の手順で復旧可能です。 以下の手順は移動元のノードで実施します。 1. まず、ノード上に不要な情報が残っているか確認します。———————————————————当該ノード上に仮想マシン リソースがすでに存在していない (他のノード上に存在している) にもかかわらず、以下のフォルダに XML ファイル (ファイル名:<VmID>.XML) が存在する場合は、情報が残っています。 —————————-"C:\ProgramData\Microsoft\Windows\Hyper-V\Virtual Machines Cache""C:\ProgramData\Microsoft\Windows\Hyper-V\Virtual Machines"—————————- ファイル名例:00866BD3-E68F-4724-B891-82048BD0D60C.xml※ 00866BD3-E68F-4724-B891-82048BD0D60C は VmID… Read more

フェールオーバー クラスター マネージャーを終了した際にクラッシュが発生する

こんにちは。Windows プラットフォーム サポートの吉田です。 本日は、最近お問い合わせのあった Windows Server 2012 のフェールオーバー クラスター環境でフェールオーバー クラスター マネージャーを終了した際にクラッシュが発生する事象についてご紹介します。 [現象]以下のような状況で問題が発生します。・Windows Server 2012 を使用している・フェールオーバー クラスター を構成している・フェールオーバー クラスター マネージャーをクローズ ボタン ([×] ボタン) で閉じる 上記のシナリオでは管理コンソールがクラッシュし動作を停止した旨を示すポップアップが表示されることがあります。 [原因]本現象は「ウインドウのクローズ ボタンが押下された際に Windows OS が行うウインドウ破棄の処理」と 「MMC スナップインが利用している Windows Presentation Foundation (WPF) および .NET Framework のファイナライザー」の実行タイミングに起因して発生する事象です。 ウインドウのクローズ ボタンが押下されると、クローズ ボタンのアニメーション効果を実行するため、特別なウインドウ メッセージが OS から送信されます。通常は、本メッセージを Windows のテーマ機能が受信し、アニメーション効果の処理を実行します。しかし、本現象の発生時には一連の動作が Windows Presentation Foundation (WPF) および .NET Framework のファイナライザーがオブジェクトを破棄するタイミングで実行されております。この実行タイミングが重なることによって、予期しない動作となり問題が発生します。 [対処について]本現象は終了時の問題となり、フェールオーバー… Read more

クラスター環境における修正プログラムの適用手順: WindowsServer2012 以降

こんにちは。Windows プラットフォーム サポートの世古です。   日々のサポート業務の中で、お問い合わせを頂く内容についてご紹介します。   Windows Server 2012 および Windows Server 2012 R2 においては ”ドレイン” という機能が追加されており、クラスター環境のメンテナンスがより容易になりました。メンテナンスの参考としまして、クラスターで修正プログラムを適用する手順を以下にご紹介いたします。     – 修正プログラムの適用手順 ————————————- 以下 2 ノード クラスター (ノード A および B) を想定した手順をご案内いたします。   1. システムのイベント ログを確認し、エラーが発生していないかどうか、およびシステムが正常に動作しているかどうかを確認します。  2. 各システムについて最新のバックアップがあることを確認します。ファイルの破損、電源障害、または互換性の問題が発生した場合は、修正プログラムのインストールを実行する前のシステムの状態に戻す必要が生じることがあります。 3. [フェールオーバー クラスター マネージャー] を開き、左ペインより [ノード] クリックし、中央画面より [ノード A] を右クリックし、[一時停止] – [役割のドレイン] をクリックします。すべてのグループがノード B に移動されます。 4. ノード A に修正プログラムをインストールしコンピューターを再起動します。… Read more