マイクロソフトの AI が「ミズ・パックマン」を完全攻略

[2017 年 6 月 14 日]   マイクロソフトの研究者が作った AI が、1980 年台のビデオゲームである Atari 2600バージョンの「ミズ・パックマン」で、過去に出たことがないパーフェクトスコアの 999,990 点を叩き出しました。(人間のハイスコアは 266,330 点といわれています) これは、今年初めにマイクロソフトが買収したカナダの深層学習スタートアップ Maluuba が、AI の一種である強化学習 (Reinforced Learning) と呼ばれる手法 (“ハイブリッド報酬アーキテクチャ (Hybrid Reward Architecture, HRA) ” と名付けた) を使い、分割統治法アルゴリズムを使って成し遂げたものです。分割統治法アルゴリズムは、 AI エージェントに人間の能力を真似た複雑なタスクの遂行を教えるにあたり広範囲にわたる影響を及ぼすといわれています。


TensorFlow から CNTK に移行する理由

深層学習は、過去数年間に人工知能 (AI) に革命をもたらしました。一部の上位の企業だけではなく誰でも自由に人工知能を使えるように、というマイクロソフトのビジョンに基づき、オープンソースの深層学習フレームワークであるMicrosoft Cognitive Toolkit (CNTK) が作成されました。今日では、GitHubスターの数で TensorFlowとCaffeに続く、そしてMxNet、Theano、Torchなどよりも順位が高い、3番目に人気のある深層学習フレームワークとなりました。 TensorFlowの人気が高いことを考えると、TensorFlowの代わりにCNTKを使用する理由はなになのかということをよく聞かれます。人間は大勢がやっていることに従う傾向があり、そうすること自体は間違いではありません。しかし、この記事では、CNTKに有利ないくつかの強力な理由を指摘したいと思います。


スケールする深層学習フレームワーク Cognitive Toolkit 2.0 を公開

[2017 年 6 月 1 日]   本日、マイクロソフトのオープンソースで、企業向けの品質で開発された深層学習フレームワーク Cognitive Toolkit 2.0 が一般提供開始されました。これは前に CNTK と呼ばれていたフレームワークで、2016 年 10 月にベータ版が登場し、今年の 4 月 3 日に製品候補版 (RC) が出ていたものです。複数の GPU、複数のマシンで大量のデータセットを用いてニューラルネットワークの計算を行う場合に効果的にスケールするのが特長です。 他のフレームワークとベンチマークを行うと、単体 GPU でも最善のパフォーマンスが得られます。   出典: http://dlbench.comp.hkbu.edu.hk/


急激に進化する深層学習フレームワーク Chainer と協業、3年間で5万人の人材育成

[2017 年 5 月 23 日]   今、急激な進化を遂げる人工知能 人工知能の分野はいま日進月歩で動いています。2010 年代に入ってから人工知能の分野で取り上げられ始めたディープニューラルネットワークの研究の発展と、クラウドコンピューティングや GPU の圧倒的進化により、画像認識や音声認識の分野で人間並みの認識率を達成するなど急激なブレークスルーが起こっています。ニューラルネットワークは一般的に、ネットワークの “層” が深くなるほど認識精度を上げることができますが、同時に莫大な計算パワーとアルゴリズムの工夫が必要になります。これらの 2 点を乗り越え、2014 年に 22 層だったニューラルネットワークの “深度” は翌年には 152 層、と 5 倍以上に進化しています。


解説アニメ「 3 分で分かる人工知能」を公開

(日本語字幕をご用意しています。「設定」から字幕の言語に日本語を選んでください。) 人工知能(AI)について分かりやすく解説したアニメーションを公開しました。今あらゆる場所でどんどん普及している AI は、人々が時間を節約し、効率的に作業できるように、より多くのことができるように支援してくれます。 しかし、AI から恩恵を受けるのは簡単ですが、それがどのように動作し、どこに向かうのか、理解しにくいのも事実です。今回公開したアニメーションは、Microsoft Story Labs シリーズ「Explanimators」の最初のエピソードです。今後もテクノロジを分かりやすく解説するアニメーションを公開していきますので、ご期待下さい。


ついに日本語で翻訳コンニャクが実現!? Skype と人工知能の組み合わせで

  ここ数年間、日本を訪れる海外からの観光客の数は着々と増加しています。今後数年間に、2019 年ラグビーワールドカップや 2020 年東京オリンピック・パラリンピック競技大会をはじめ数々の世界的なスポーツイベントが開催され、その数はさらに増加するでしょう。それにともない、日本と海外のコミュニケーション機会も増加していきます。 マイクロソフトでは、従来から AI による日本語の音声認識と機械翻訳への投資を行ってきましたが、この度、Microsoft Translator アプリ/ライブ機能や Skype 翻訳など音声認識と機械翻訳を行うサービス/製品において、いままでに得られたブレークスルーを提供します。また、開発者もMicrosoft Cognitive Services のひとつ、Translator API でそのパワーを利用できます。


お疲れ顔にエナジードリンク! 顔の特徴や表情で変わる広告を人工知能が提供

電通が毎年リリースしている「日本の広告費」2016 年版によると、広告業界はますますデジタル・ファーストの様相を強めています。インターネット広告費が制作費を除く媒体費用で初の1 兆円の大台に乗り、成長率は 13%、市場規模 6 兆 2,800 億円 (成長率 1.9%) の中で 20.8% を占めるまでになりました。 そんな中、デジタル屋外広告、いわゆるデジタル OOH と呼ばれる広告媒体でも、デジタルが近年急成長しています。交通・屋外広告自体は 2008 年のリーマンショック以降、市場規模はずっと 5,000 億円前後で推移していますが、デジタルサイネージ市場は富士キメラ総研によると、今後 7 年で約 3 倍に成長することが見込まれています。駅や街中に設置されたデジタルサイネージでデジタル広告を目にする機会がどんどん増えていくと予測されています。


人工知能との会話のハードルを下げることで「AI の民主化」を進めるマイクロソフト

[2016 年 12 月 13 日]   マイクロソフトは、1991 年に Microsoft Research を設立してから25 年以上にわたり、AI の可能性に投資してきました。複数の業界標準ベンチマークにおいて、マイクロソフトの画像認識アルゴリズムは業界他社を凌駕しました。10 月に、マイクロソフトは、業界で初めて音声認識で人間と同等の成績を達成しました。 9 カ国語をサポートする Skype Translator も功績を達成しています。これは、研究開発から製品への移行が加速している実例です。また、マイクロソフトのビジョンが HoloLens などの製品や AI を活用したアプリを構築している Uber などのお客様によって具体的成果を上げています。


深層学習を加速する GPU 搭載 Azure 仮想マシン (N シリーズ) を一般提供開始

  NVIDIA® GPU が搭載された、新しい Azure N シリーズの仮想マシンの一般提供が 2016 年 12 月 1 日から開始されます。GPU アクセラレーションを活用した業界最先端のコンピューティング性能を利用できます。米国中南部、米国東部、西ヨーロッパ、東南アジアでグローバルに提供され、いずれのリージョンでも 12 月 1 日からご利用いただけます。   Azure NC Virtual Machines – GPU コンピューティング


機械翻訳の概要

(この記事は Machine Translation の翻訳です。)   この記事では機械翻訳を支えるコア技術と、この領域でのマイクロソフトのソリューションの両方について説明します。   機械翻訳とは 機械翻訳システムは、アプリケーションや機械学習技術を使用して、大量のテキストから、サポートされている言語のいずれかに変換するオンラインサービスです。サービスは、ある言語の「ソース」のテキストを別の「ターゲット」言語に変換します。 2010年代初頭以来、新しい人工知能技術、ディープニューラルネットワーク (または深層学習) は、Microsoft Translator チームコアテキスト翻訳技術を使用し、新しい音声翻訳技術を起動して音声認識を結合する品質レベルに到達する音声認識の技術を可能にしています。