マイクロソフトのコルタナとアマゾンのアレクサが年内に相互接続して利便性が向上

[2017 年 8 月 30 日] 自宅で、オフィスで、移動中に — 1日の予定を確認したり、オーディオブックを開いたり、買い物リストにほしいものを追加したり — 近年、音声認識技術を使った「デジタルアシスタント」によるデバイスやサービスの操作が身近になってきていますが、人々の利便性を向上させるための前例のない提携を、このたびアマゾンとマイクロソフトで行うことになりました。


マイクロソフトの音声認識技術、人間と同等の認識率をさらに改善

[2017 年 8 月 20 日] 本日、マイクロソフトの研究チームが開発した音声認識システムによる 5.1%の誤認識率が達成されたことを発表します。これは業界の新たなマイルストーンであり、マイクロソフトが昨年達成した正確性を大きく上回ります。 昨年、マイクロソフトの音声認識システムは 5.9% の誤認識率を達成したと発表しました。これは人間と同等レベルですが、IBM の研究者により提唱されていたより厳格な基準である5.1%という数字が今回達成されました。過去 25 年間において、人間と同等の正確性を達成することがマイクロソフトにおける研究開発の目標でした。


ついに日本語で翻訳コンニャクが実現!? Skype と人工知能の組み合わせで

  ここ数年間、日本を訪れる海外からの観光客の数は着々と増加しています。今後数年間に、2019 年ラグビーワールドカップや 2020 年東京オリンピック・パラリンピック競技大会をはじめ数々の世界的なスポーツイベントが開催され、その数はさらに増加するでしょう。それにともない、日本と海外のコミュニケーション機会も増加していきます。 マイクロソフトでは、従来から AI による日本語の音声認識と機械翻訳への投資を行ってきましたが、この度、Microsoft Translator アプリ/ライブ機能や Skype 翻訳など音声認識と機械翻訳を行うサービス/製品において、いままでに得られたブレークスルーを提供します。また、開発者もMicrosoft Cognitive Services のひとつ、Translator API でそのパワーを利用できます。


人工知能との会話のハードルを下げることで「AI の民主化」を進めるマイクロソフト

[2016 年 12 月 13 日]   マイクロソフトは、1991 年に Microsoft Research を設立してから25 年以上にわたり、AI の可能性に投資してきました。複数の業界標準ベンチマークにおいて、マイクロソフトの画像認識アルゴリズムは業界他社を凌駕しました。10 月に、マイクロソフトは、業界で初めて音声認識で人間と同等の成績を達成しました。 9 カ国語をサポートする Skype Translator も功績を達成しています。これは、研究開発から製品への移行が加速している実例です。また、マイクロソフトのビジョンが HoloLens などの製品や AI を活用したアプリを構築している Uber などのお客様によって具体的成果を上げています。


マイクロソフトの音声認識技術、人間と同等の認識率を達成

[2016 年 10 月 18 日] Microsoft Artificial Intelligence and Research の研究チームは、文字起こしの専門家よりも誤認識率が低い音声認識システムを開発したと発表しました。業界標準のベンチマークテスト Switchboard 会話認識タスクにおける WER(Word Error Rate:単語誤認識率)は5.9% で、先月同チームにより報告されたばかりの6.3%よりもさらに向上しています。5.9%という誤認識率は、同じ会話の文字起こしを行なった人間と同等であり最高記録です。研究チームが1年前に設定した目標を上回り、同時にあらゆる人の予測をも越えました。


音声認識技術の歴史~約 50 年にわたる歩み

1971: アメリカ国防高等研究計画局 (DARPA) が最初の音声認識プロジェクトに取り掛かる。 1975: 後で隠れマルコフモデルとして知られる技術が提案される。IBM が音声認識の研究を始める。 1978: Texas Instruments が Speak & Spell をリリース。 1982: 混合ガウスモデルが音声認識で利用され始める。 1986: 研究者がニューラルネットワークの実験を開始。 1994: Dragon Naturally Speaking (ドラゴンスピーチ) と IBM Via Voice が登場。 1995: マイクロソフトが Windows 95 に最初のスピーチツールを提供。 1996: SRI International が双方向のボイス応答ソフトウェアを提供。 2001: マイクロソフトが SAPI 5.0 で Windows XP と Office XP に音声認識を提供。


機械学習とは!?

[2014 年 7 月 1 日] 「機械学習」という言葉が一般に浸透するようになってきましたが、「機械学習とは何ですか?」とよく聞かれることがあります。機械学習を使うシナリオは後述するようにいくつかありますが、機械学習に必ず使うのが「データセット」です。機械学習とは、データの集合である「データセット」から、それを特徴づける「モデル」と呼ばれるソフトウェアを作成し、このモデルにより新たなデータに関する予測を行う手法です。