Ask CORE

Microsoft Japan Windows Technology Support

クラスター環境における特定のノードへの仮想マシンの移動失敗事象について

こんにちは。Windows プラットフォーム サポートの野村です。   今回は、Hyper-V クラスター環境において、クラスターに登録した仮想マシンがある特定のノードへ移動できなくなる事象についてご紹介いたします。     Hyper-V クラスターにおいて、ノード間での仮想マシンの移動は基本的に成功するにも関わらず、ある特定のノードへの移動時のみ失敗してしまう事象が発生したとの報告がございました。 この時、下記のエラーがイベント ログ (System、Microsoft-Windows-Hyper-V-Config-Admin) に記録されます。     ログの名前: System ソース: Microsoft-Windows-FailoverClustering イベント ID: 1069 タスクのカテゴリ: リソース コントロール マネージャー レベル: エラー ユーザー: SYSTEM 説明: クラスター化された役割 ‘×××’ の種類 ‘Virtual Machine Configuration’ のクラスター リソース ‘Virtual Machine Configuration ×××’ が失敗しました。エラー コード: ‘0x43’ (‘The network name cannot be found.’)。 リソースおよび役割のエラー ポリシーに基づいて、このノードでリソースをオンラインにする処理またはグループをクラスターの別のノードに移動した後に再起動する処理がクラスター… Read more

データ コレクター セットの停止に時間がかかる事象について

皆さんこんにちは。 Windows プラットフォーム サポートの丸山です。 本日は、パフォーマンス モニターのデータ コレクター セットの停止に時間がかかる事象について、ご紹介させていただきます。 ■ データ コレクター セットの停止にかかる時間について 弊社では、データ コレクター セットの停止を実行すると、数分から数十分かかる。といったお問い合わせや、データ コレクター セットを停止してから開始しようとすると失敗するときがある。といったお問い合わせをいただくことがあります。 このような場合、データ マネージャーの設定にて、“データ管理とレポート生成を有効にする” のチェックが有効になっているために、データ コレクター セットの停止処理に時間がかかっている可能性があります。 図:“データ管理とレポート生成を有効にする” のチェックの場所 データ マネージャーによる処理にはどれぐらい時間がかかるのか、実際に試してみましょう。 以下の例は、Azure 上に A1 Basic サイズの VM を作成し、System Performance のテンプレートを元に 24 時間のログ採取を行ったものです。データ コレクター セットの停止に 25 分ほどかかっています。 図:”データ コレクター セット” の停止に 25 分かかる例 またこちらは同じ A1 Basic サイズの VM において “データ管理とレポート生成を有効にする” のチェックを外し、24 時間のログ採取を行ったものですが、データ… Read more

リモート デスクトップ サービス環境で使用するポートについて

皆さん、こんにちは。 今回は Windows Server 2012、Windows Server 2012 R2、Windows Server 2016 における、リモート デスクトップ サービス (セッション ベースと仮想マシン ベース (VDI)) で使用するポートについてご紹介します。 最近では、セキュリティ対策の一環として、ファイアウォールにて通信に使用するポートを制限されている環境も多いのではないでしょうか。 リモート デスクトップ サービスをお使いいただいている場合、どのポートを制限すればいいのか、お悩みの方もいらっしゃるかと思います。 リモート デスクトップ サービスでは、クライアント PC から接続を行う際に、既定で 3389 のポートを使用します。 それ以外にも、リモート デスクトップ サービスは複数の役割サービスにより構成されており、各コンポーネント間でも様々な通信を行っています。また、その通信の目的によって使用されるポートが異なります。 以下に表形式で、コンポーネント毎に受信に使用するポートとその目的について記載しております。 ぜひリモート デスクトップ サービスの構成の際に、ご参考にしていただければと思います。 (※ 構築の前提条件といたしまして、対象サーバーが Active Directory に参加している環境としています。)   各役割サーバー間の通信で使用されるポート 各役割サーバー間の通信は、その目的によって使用するポートが異なります。役割ごとの使用するポートの一覧は以下の通りです。 RD 接続ブローカー 発信 受信 サービス ポート番号 目的 クライアント RD 接続ブローカー RDP… Read more

“Network List Service” が無効化されているとタスク スケジューラの管理コンソールでエラーが発生します

こんにちは。 Windows Platform サポートの丸山です。 本日は、タスク スケジューラーの管理コンソールで表示されるエラーの件について、ご紹介いたします。 ■ 発生する事象について Windows Vista や Windows Server 2008 以降の OS では、ネットワークの場所の管理のため、”Network List Service” というサービスが動作しておりますが、”Network List service” が無効化されている環境では、タスク スケジューラの管理コンソール画面で、タスクの条件を表示しようとすると、タスク スケジューラの管理コンソール画面にてエラーが発生し、スナップインがアンロードされてしまいます。 図:”Network List service” が無効化されている様子 図:タスク スケジューラの管理コンソールのエラー画面 (1) 図:タスク スケジューラの管理コンソールのエラー画面 (2) 図:タスク スケジューラの管理コンソールのエラー画面 (3) ■ 事象の回避策について 本事象は、”Network List Service” が無効化されており、”条件” タブの内容を表示するための情報の取得が失敗することで発生します。 “Network List Service” が無効化されている状況は、非推奨の状態となりますため、”Network List Service” のスタートアップの種類を “手動” または “自動”… Read more

“繰り返し間隔” が 1 分のタスクを実行すると、時間の経過とともにタスクの実行が徐々に遅れる事象について

こんにちは。Windows プラットフォーム サポートの丸山です。 本日は、Windows Server 2012 / Windows Server 2012 R2 環境にて “繰り返し間隔” が 1 分のタスクを実行すると、時間の経過とともにタスクの実行が徐々に遅れる事象について、ご紹介させていただきます。 ■ 発生する事象について タスク スケジューラでは、トリガーの作成時に “繰り返し間隔” を設定することができますが、Windows Server 2012 や Windows Server 2012 R2 環境にて、”繰り返し間隔”が 1 分のタスクを実行すると、時間の経過とともにタスクの実行が徐々に遅れる事象が確認されています。 また、Windows Server 2012 環境では、タスクの実行が 10 秒以上遅延すると、タスクが実行されなくなります。 なお、Windows 10 や、Windows Server 2016 環境では、本事象は発生しません。 図:繰り返し間隔の設定 上記のタスクを実行し、時間が経過すると、タスクの実行時間が徐々に遅れていきます。 例えば以下のスクリーンショットでは、TEST1 のタスクの実行が 7 秒遅れています。 図:タスクの実行が遅れる様子 ■ 確認されている回避策について 本事象は以下の回避策が有効であることが判明しています。 (1) ”タスクがすでに実行中の場合に適用される規則” を “新しいインスタンスを開始しない”… Read more

Windows Server バックアップにおける容量と世代管理について

こんにちは。Windows プラットフォーム サポートの野村です。 今回は Windows Server バックアップにおける容量と世代管理についてご紹介します。   Windows Server バックアップは OS 標準で搭載されている機能です。 GUI とコマンド (Wbadmin.exe) によるバックアップ・リストアができます。 バックアップ データの保存形式として仮想ディスク (VHD または VHDX 形式) を使用し、VSS (ボリューム シャドウ コピー サービス) の機能を用いて複数世代のバックアップを保持できます。 バックアップ データの格納先として、[バックアップ専用のハードディスクにバックアップする]、[ボリュームにバックアップする] と [共有ネットワーク フォルダーにバックアップする] を指定できますが、格納先の種類により保持可能なバックアップの世代数が異なります。 バックアップ格納先での容量の圧迫を避けるために、バックアップの容量・世代数を制限したいとのお問い合わせをいただくことがあります。 本ブログでは、この世代数の管理の違いについてご案内いたします。     ============================= 保持可能なバックアップの世代数について ============================= それぞれのバックアップ格納先における世代管理について纏めると、以下の表のようになります。 バックアップ格納先 世代 世代数の変更 バックアップ格納先の容量が圧迫した場合の動作 [バックアップ専用のハードディスクにバックアップする] 最大 512 世代保存 変更不可 シャドウ コピーを保存する容量が足りないと最も古い世代から自動的に削除 (※)… Read more

Windows Server 2012 および Windows Server 2012 R2 環境で発生する Explorer.exe のクラッシュについて

※2016/05/18 追記 : 問題を解決するための技術情報 が公開されました! こんにちは。 Windows プラットフォーム サポートの丸山です。 本日は、リモート デスクトップ環境で発生する Explorer.exe のクラッシュについて、ご紹介したいと思います。 最近弊社では、リモート デスクトップへのログオン時に、Explorer.exe がクラッシュしてしまう問題が報告されております。 事象発生時には、以下の動画のように Explorer.exe がクラッシュし、再起動を繰り返すためユーザーはデスクトップを操作することができません。 また、アプリケーションのイベント ログには、次のようなイベントが多数記録されます。 ログの名前:         Application ソース:           Application Error イベント ID:       1000 レベル:           エラー ユーザー:          N/A コンピューター:       XXXXXXXX 説明: 障害が発生しているアプリケーション名: explorer.exe、バージョン: 6.3.9600.16384、タイム スタンプ: 0x5215d379 障害が発生しているモジュール名: twinui.dll、バージョン: 6.3.9600.16384、タイム スタンプ: 0x5215d80a 例外コード: 0xc0000005 障害オフセット: 0x000000000001022c 障害が発生しているプロセス ID: 0x42c 障害が発生しているアプリケーションの開始時刻: 0x01d178287f81e4da… Read more

フェールバックの動作について

こんにちは。Windows プラットフォーム サポートの加藤です。本日は、フェールオーバー クラスターの機能のひとつであるフェールバックについてご紹介させていただきます。 ■フェールバックとはフェールバックとは、障害が発生したノードが再び利用できる状態になった時点で、フェールオーバーにより移動したサービスまたはアプリケーションが既定のノードへ自動的に移動する設定です。既定値では無効となっていますが、[フェールバックを許可する] を有効にすることで設定いただくことができます。 以下、フェールバックの動作について Node 1 , Node 2 の 2 台のノードでクラスターを構成する環境を例にご紹介させていただきます。 (1) 通常稼働状態 通常時の構成は、下記の図のように仮想マシンを 2 台ずつそれぞれのノードがホストする構成です。仮想マシン 1 (VM 1 :以下仮想マシンは VM と記載)、VM 2 は優先所有者を Node 1 として [フェールバックを許可する] を設定しています。 Node 1 : VM 1、VM 2Node 2 : VM 3、VM 4 (2) 障害の発生 (クラスター サービスの停止) Node 1 で何らかの障害が発生し、Node 1 のクラスター サービス (または OS… Read more

フェールオーバー クラスターにディスク リソースが追加できない。

こんにちは。Windows プラットフォーム サポートの加藤です。 本日は、フェールオーバー クラスターにディスク リソースが追加できない事象について、ご案内します。 フェールオーバー クラスターにディスク リソースを追加するためには、以下の要件に合致する必要があります。 1. 共有ストレージが SCSI-3 の Persistent Reservation (永続的な予約) に対応している。2. MBR or GPT 形式で初期化されている。3. ダイナミック ディスクではなくベーシック ディスクを使用している。4. 全ノードで同一のディスク (LUN) が認識されている ※ ディスク (LUN) の認識状況は [ディスクの管理] コンソールで確認可能です。 しかしながら、上記の要件を満たしており、構成が正しいにも関わらず、フェールオーバー クラスター マネージャーで「ディスクの追加」ボタンをクリックしても、追加可能なディスクが無いメッセージが表示され、ディスク リソースが追加できない事象の報告がありました。 この事象では、当該ディスク (LUN) 上に、何らかの原因で前述の Persistent Reservation (永続的な予約) が残っていたために、新たに Persistent Reservation (永続的な予約) ができなくなり、その結果ディスク リソースの追加ができない状況に陥っていました。 クラスターは、Persistent Reservation (永続的な予約) を使用して、ディスクの所有権を管理するため、予約ができないディスクはクラスターに追加できません。 弊社過去事例では、ストレージの障害発生後に、ストレージ側で復旧処理を実施し、ディスク リソースをクラスターに再度登録しようとした際に本問題が発生していました。… Read more

クラスター調査に必要な情報収集について

こんにちは。 平素は弊社製品をご愛顧いただき誠にありがとうございます。  運用を頂いておりますお客様のクラスター環境は問題無く動作しておりますでしょうか。高可用性を謳うフェールオーバー クラスター製品ですが、長く運用を頂く中で外部的な要因も含め、クラスターが障害を検知したりフェールオーバーが発生する場合もあるかと存じます。 障害調査依頼として弊社にお問い合わせを頂く場合、お伺いした現象や障害に対して調査の為の情報取得をお願いすることがあります。この記事では初期調査を行なううえで最低限必要になる情報をご案内します( 実際の調査ではその過程においてあらためて現象の確認や追加情報のお願いをさせていただく場合があります。お手数をお掛けする事となりますが何卒、ご理解と共にご協力を頂けますようよろしくお願い申し上げます)。一般的にフェールオーバー クラスターの調査では部分的なエラー情報だけではなく構成や動作を確認する必要がありますので、以下 (a)~(f) の様な情報が必要になります。またフェールオーバー クラスターは複数の Windows サーバーが連携して動作しますので、情報採取はクラスターを構成する全てのノードが対象になります。実機からのログ情報採取とは別に、確認いただいた発生障害と状況についても是非、お教えください (障害対応の現場は修羅場同然でそれどころではないと思いますが、後から思い出せる範囲でも結構です。現場で実際に目で観て頂いた情報は何よりも重要であることが多くあります)。 情報保存を頂きたい情報 ◆ Windows OS の情報 (a) システム情報 (msinfo32.exe) : 全ノードで採取(b) イベント ログ情報 Evtx+CSV形式 (eventvwr.exe) : 全ノードで採取(c) ネットワーク情報 (ipconfig.exe) : 全ノードで採取 ◆ フェールオーバー クラスターの情報 (d) クラスター診断ログ (cluster.exe/Get-ClusterLog) : 全ノードで採取 … ※(e) クラスター リソースとグループの情報 (cluster.exe/Get-Cluster)  : 1台のノードで採取(f) クラスター ハイブ (reg.exe) : 1台のノードで採取 ※ クラスター診断ログはサイズ固定の循環ログですので、時間が経過することにより古いログから上書きされてしまいます。障害が発生した後は可能な限り速やかに保存と回収をお願いします。… Read more