【Azure for IT Pro】Fault Domain を知っていますか?



*** IT Pro のための Windows Azure 運用管理ガイド 1.0 公開中 ***
IT Pro (IT 担当者) のための Windows Azure Platform 運用管理ガイド 1.0

Windows Azure の運用を考えるとき、Upgrade Domain(アップグレード ドメイン)という考え方があることは結構有名ですが、Fault Domain(フォールトドメイン)については意外と知られていません。

Windows Azure Platform のデータセンターには大量のマシンが設置されています。データセンターは、それはそれは広いスペースが用意されているわけですが、全てがペディスタルタイプで平置きしてあるはずもなく、1Uタイプのサーバーがラックに搭載されています。

image

IT Pro がハードウェアの構成を考えるとき、真っ先に気にかけるのが「単一障害点(Single of Failer)」が存在しないか....ということです。

当然、Windows Azure Platform をの設計者も同じことを考えました。それが Fault Domain です。

Fault Domain とは、「物理的な障害が及ぶ領域」のことです。「Domain」とは「領域」を意味しています。

詳細は明かされていませんが、Fault Domain の最小の単位は「ラック」であると言われています(必ずしもラックと1:1に対応しているわけではありません)。ラックには、Hyper-V のホストとなるノードが数十台積まれており、それらを束ねるスイッチや電源ユニットが設置されています。

Windows Azure 上にサービスを展開する場合、マイクロソフトは「複数のインスタンス」を用意してくださいとお願いしていますが、これらのインスタンスがどれか1つのラックに集中してしまうと、ラックの中の何らかの機構が破損することによってサービス全体が停止してしまうことになります。

そこで、Windows Azure Platform が誇る Fabric Controller(ファブリックコントローラー)は、インスタンスが最低 2 つの Fault Domain に分散されるように配置します。この「最低2つ」という表現についてはいろいろと疑問の余地があるかと思いますが、実を言えば詳細が公開されていません。いずれにしても、ハードウェア障害によってサービスが完全に停止することは回避されるような設計がなされている...ということです。

image

この、Fault Domain の考え方は、ノードのメンテナンスの際にも適用されます。つまり、Hyper-V ホストに障害修正やセキュリティパッチを適用しなければならない場合にも、この Fault Domain 単位に処理が行われるため、サービスの停止を回避することができます。

つづき 【Azure for IT Pro】インスタンスごとの Fault Domain を PowerShell で確認する

Comments (1)

  1. Anonymous より:

    Pingback from ???Azure for IT Pro???Fault Domain ??????????????????????????? : Erez Benari's Blog : The Official Microsoft IIS Site

Skip to main content