HPC のシナリオを簡単に整理しました。

昨日、Microsoft Developer Forum (MDF) にご参加いただいた皆様、お忙しい中にどうもありがとうございました。

さて、ご参加いただけなかった方は、こちらからビデオを見ていただくことができます。

https://www.microsoft.com/japan/powerpro/mdf2011/default.mspx

私も HPC on Azure のデモをさせていただきましたが、約4分という持ち時間の割にお伝えしたいことが多くて、砂金や高橋忍と違って落ち着きのない姿を見せてしまいました。

それは良いとして、とにかく「インパクト」と「簡単さ」を前に押し出してみました。

が。。。

その分、いろんな機能が整理できていないままに伝わった可能性もあり(確信犯)、ちゃんと整理せねばということで、とっても簡単ですが HPC on Azure と Dryad に関してのみ投稿させていただきます。

******

Windows HPC Server 2008 R2 SP1 =既に提供中

HPC on Azure スタート

・ Azure 上のロールは WorkerRole

・ Excel をフロントエンドで動かす場合、 「SOA」や「XLL」 を使って Azure 上で分散処理

※ XLL https://msdn.microsoft.com/ja-jp/library/bb687883(en-us).aspx

Windows HPC Server 2008 R2 SP2 =現在 Beta 提供中

・ Excel をフロントエンドで動かす場合、SP1同様、「SOA」や「XLL」 を使った Azure 利用が可能

・ HPC on Azure の VMRole 対応をスタート

・ Excel 2010 をインストールした VMRole の利用が可能に

・ Excel をフロントエンドで動かす場合、Azure 上でも Excel の処理が可能なので、VBA(マクロ) も動作

※ MDF で私がデモをしたのはこれ。

Azure ConnectRemote Desktop 接続も可能

・ Azure 上の計算ノードを使って MPI も実行可能

******

なぜ分散処理のデモにExcelなのか?という疑問を持たれた方もいるようですね。

Excel でやろうとしている=分散処理は本気でないと感じた方もいたとか(汗)

Excel のデモをした理由は簡単で、「見た目にわかりやすい」「HPCを身近に感じられる」という2点です。

Excel がないと分散処理が動かないわけではありません。

なので、HPC の世界にずっといる人は、MPI を使って並列処理をしてもいいですし、SOA もありますし、C/C++が書けるならExcel+XLLという選択肢もあるわけです。

******

で、ここまでは HPC と Excel の話し。

Hadoop をやっているような方は、一旦 Excel を忘れて下さい。

Windows HPC Server 2008 R2 の SP2 (現在ベータ)には Dryad が含まれているので、 「HPC の SP2 を使って Dryad をやるんだ!」 とだけ思ってください。

あとは HPC SP2 をインストールして、設定をし、 Windows HPC Server 2008 R2 SP2 ベータと共に提供されている Dryad のサンプルを動かしてみてください

この辺は、Excel ではなく Visual Studio の世界ですから。

ただし、現時点で Dryad は Azure 上で動きません。

なので、Dryad の計算ノードは用意する必要があります。できれば、物理マシンがいいでしょう。

社内には私が用意した5台の Dryad ノードが動いています。

1台は余っていたノートPC、残り4台はVDIの検証マシンや部署のファイルサーバーです。。。

そう、かなり強引ですが、あんまり負荷の高くないファイルサーバーなんかはHPCの処理ノードとして狙い目です(笑)

とにかく、こちらから Windows HPC Server 2008 R2 SP2 ベータをダウンロードしてみるところから始めてもらえればと思います。

日本マイクロソフト 高添