マイクロソフトの画像認識技術が人間レベルの認識率を達成

[2015 年 12 月 10 日] マイクロソフトの写真やビデオ内の物体認識技術の精度が人間レベルに達しました。場合によっては人間を超えることもあります。Microsoft Research は新しい画像認識技術により、スタンフォード大学の研究者によって開発された世界最大級の画像データベース ” ImageNet” と、マイクロソフト、フェイスブックなどが出資する同様のデータベース “Common Object in Context (COCO)” の大規模画像認識競技会 (ILSVRC 2015+MS COCO 2015)で、他の大学、研究所、企業を抑えて首位を獲得しました。


音声認識技術の歴史~約 50 年にわたる歩み

1971: アメリカ国防高等研究計画局 (DARPA) が最初の音声認識プロジェクトに取り掛かる。 1975: 後で隠れマルコフモデルとして知られる技術が提案される。IBM が音声認識の研究を始める。 1978: Texas Instruments が Speak & Spell をリリース。 1982: 混合ガウスモデルが音声認識で利用され始める。 1986: 研究者がニューラルネットワークの実験を開始。 1994: Dragon Naturally Speaking (ドラゴンスピーチ) と IBM Via Voice が登場。 1995: マイクロソフトが Windows 95 に最初のスピーチツールを提供。 1996: SRI International が双方向のボイス応答ソフトウェアを提供。 2001: マイクロソフトが SAPI 5.0 で Windows XP と Office XP に音声認識を提供。


あなたもすぐに試せる!顔写真から感情を読む人工知能が登場!

[2015 年 11 月 11 日] 人間であれば顔の感情を簡単に認識できますが、コンピュータに認識させようとするとそう簡単ではありませんでした。しかし、最近の機械学習と人工知能の分野における進歩により、コンピュータ科学者は、音、言葉、画像、さらには表情などを識別できるよりスマートなアプリを作成することができるようになりました。


顔画像から年齢を推測する機械学習サイト「How Old Do I Look」が登場

[2015 年 5 月 4 日]   マイクロソフトのチームでは、開発者向けのカンファレンス Microsoft Build 2015 のデモ用に、新しくリリースされたばかりの顔認識 API を使った Azure の簡単でインテリジェントなデモサービスをリリースしました。人の年齢を推測する http://how-old.net というサービスです。このサイトでは、ユーザーがアップロードした画像の中から API が顔を見つけ出し、その年齢と性別を判定するというものです。現在のところ、このAPIでは顔の場所と性別はとても正確に同定できますが、年齢はそれほど正確ではありません (特にアジア人の年齢は若めに出ます)。それでも、ユーザーがちょっと試して楽しむには十分な精度があります。


マイクロソフト、オープンソースの深層学習フレームワーク CNTK Beta を公開

  マイクロソフトは深層学習フレームワーク Computational Network Toolkit (CNTK) のベータ版を米国時間 4 月 15 日にリリースしました。このツールキットにより、一連の計算ステップを記述する、ディープニューラルネットワーク (DNN)、畳み込みニューラルネットワーク (CNN)、再帰型ニューラルネットワーク (RNN)、長・短期記憶 (LSTM) 、ロジスティック回帰、最大エントロピーモデルなどの学習マシンの構築が可能です。CPU または GPU を使って Computational Network を実装することができます。