マイクロソフト、アマゾンと協業で深層学習をすべての開発者に解放~『Gluon』の発表

[2017 年 10 月 12 日] マイクロソフトは本日、アマゾン ウェブ サービスと共同で、「Gluon (グルーオン)」という新しい深層学習ライブラリを発表しました。このオープンソースベースの Gluon を使うと、訓練速度を損なうことなく深層学習モデルを作成するプロセスを大幅に簡素化でき、深層学習の専門家に限らずデータサイエンティストや一般の開発者に広く使っていただくことができるようになります。


港湾の水際対策! 人工知能でヒアリを防げ!

  今年、日本上陸が話題になっている危険外来生物のヒアリ (火蟻、fire ant) ですが、国内外において陸海空で莫大な量の貨物が毎日運搬されているため、日本国内のあらゆる場所でヒアリに遭遇する可能性があります。もしアリと遭遇した場合、みなさんはヒアリと普通のアリを見分けられますか? 環境省から以下の図のようなヒアリの特徴が公開されています。全体が赤茶色で「腰」の部分に二つのこぶがあり、腹部は黒っぽい色、となっていますが、アカカミアリなど類似のアリとの判別など、いろいろな写真をよくよく見ておかないと専門家でも判別が難しいケースが存在します。


リアルタイム AI を加速する深層学習アクセラレーターを公開

[2017 年8 月 22 日] IntelのFPGA「Stratix 10」を実装したProject Brainwaveシステム   本日、マイクロソフトは、コードネーム Brainwave と呼ばれる、深層学習の新しいクラウドベースのアクセラレーターを発表しました。クラウド上の深層学習モデルが様々なライブデータストリームを処理するようになってきていることから日々重要度を増しているリアルタイム AI を推進するために、受け取った情報を極めて小さな遅延で処理を行うシステムです。この仕組みにより高いパフォーマンスと柔軟性が実現されます。 Brainwave システムは「高パフォーマンスの分散システムアーキテクチャ」「FPGA 上に実装されたハードウェア DNN エンジン」「学習済みモデルを簡単に展開できるコンパイラとランタイム」の3つのパーツから成り立っています。


iPhone カメラと人工知能でアートな写真を撮ろう

[2017 年 6 月 16 日] 本日、マイクロソフトからリリースされた iPhone/iPad カメラアプリ Microsoft Pix の新機能を使うと、手元で撮った写真を有名美術館にある絵画のようにアートなスタイルに変換することができます。Microsoft Pix はシャッターチャンスを捕らえたり、イメージの品質を向上したりといったことを AI と深層学習をフルに使って行う最先端の写真アプリです。 Microsoft Research Asia および Skype チームと連携して開発された、人工知能を駆使したこの新機能を使えば、写真を撮ることがもっと楽しくなります。新機能のひとつである Pix Styles は、写真を有名な絵画に触発されたスタイルに変換したり、画像が燃えているように見える特殊効果を追加する11 種類のスタイルを使うことができます。


急激に進化する深層学習フレームワーク Chainer と協業、3年間で5万人の人材育成

[2017 年 5 月 23 日]   今、急激な進化を遂げる人工知能 人工知能の分野はいま日進月歩で動いています。2010 年代に入ってから人工知能の分野で取り上げられ始めたディープニューラルネットワークの研究の発展と、クラウドコンピューティングや GPU の圧倒的進化により、画像認識や音声認識の分野で人間並みの認識率を達成するなど急激なブレークスルーが起こっています。ニューラルネットワークは一般的に、ネットワークの “層” が深くなるほど認識精度を上げることができますが、同時に莫大な計算パワーとアルゴリズムの工夫が必要になります。これらの 2 点を乗り越え、2014 年に 22 層だったニューラルネットワークの “深度” は翌年には 152 層、と 5 倍以上に進化しています。


機械翻訳の概要

(この記事は Machine Translation の翻訳です。)   この記事では機械翻訳を支えるコア技術と、この領域でのマイクロソフトのソリューションの両方について説明します。   機械翻訳とは 機械翻訳システムは、アプリケーションや機械学習技術を使用して、大量のテキストから、サポートされている言語のいずれかに変換するオンラインサービスです。サービスは、ある言語の「ソース」のテキストを別の「ターゲット」言語に変換します。 2010年代初頭以来、新しい人工知能技術、ディープニューラルネットワーク (または深層学習) は、Microsoft Translator チームコアテキスト翻訳技術を使用し、新しい音声翻訳技術を起動して音声認識を結合する品質レベルに到達する音声認識の技術を可能にしています。


ニューラルネットワークに基づく機械翻訳のしくみ

(この記事は What is neural network based translation? の翻訳です。)   ニューラルネットワークに基づく機械翻訳とはどういうものでしょう? なぜ翻訳精度が上がるのでしょうか? 機械翻訳は 2000 年代半ばより様々なアプリや Web サイトで活用されてきました。 1960 年代から長期間にわたり、コンピューター科学者たちは文法と個々の言語構造に基づく機械翻訳を作ろうとしてきました。多くの場合、翻訳結果はあまり芳しくないものでした。 ブレークスルーは新しいコンセプト、機械学習が機械翻訳に取り入れられたときにやってきました。プロの翻訳家によりあらかじめ翻訳された莫大なデータを使い、特定の文脈の下であらかじめ翻訳された文章から、単語を翻訳する方法を、強力なアルゴリズムが学習します。


マイクロソフトの音声認識技術、人間と同等の認識率を達成

[2016 年 10 月 18 日] Microsoft Artificial Intelligence and Research の研究チームは、文字起こしの専門家よりも誤認識率が低い音声認識システムを開発したと発表しました。業界標準のベンチマークテスト Switchboard 会話認識タスクにおける WER(Word Error Rate:単語誤認識率)は5.9% で、先月同チームにより報告されたばかりの6.3%よりもさらに向上しています。5.9%という誤認識率は、同じ会話の文字起こしを行なった人間と同等であり最高記録です。研究チームが1年前に設定した目標を上回り、同時にあらゆる人の予測をも越えました。


マイクロソフト、オープンソースの深層学習フレームワーク CNTK 1.0 を GitHub で公開

[2016 年 1 月 25 日]   マイクロソフトはこの度、自社の研究者が人工知能の研究に使っていたツールを広く開発者向けにリリースされました。いままでベータ版が公開されていたオープンソースの Computational Network Toolkit (CNTK) と呼ばれるツールの正式版を GitHub に公開しました。これは昨年 4 月より大学研究者向けに、より限定されたオープンソースライセンスで Codeplex 上に公開していたものの正式版です。


マイクロソフトの画像認識技術が人間レベルの認識率を達成

[2015 年 12 月 10 日] マイクロソフトの写真やビデオ内の物体認識技術の精度が人間レベルに達しました。場合によっては人間を超えることもあります。Microsoft Research は新しい画像認識技術により、スタンフォード大学の研究者によって開発された世界最大級の画像データベース ” ImageNet” と、マイクロソフト、フェイスブックなどが出資する同様のデータベース “Common Object in Context (COCO)” の大規模画像認識競技会 (ILSVRC 2015+MS COCO 2015)で、他の大学、研究所、企業を抑えて首位を獲得しました。