機械翻訳の概要

(この記事は Machine Translation の翻訳です。)   この記事では機械翻訳を支えるコア技術と、この領域でのマイクロソフトのソリューションの両方について説明します。   機械翻訳とは 機械翻訳システムは、アプリケーションや機械学習技術を使用して、大量のテキストから、サポートされている言語のいずれかに変換するオンラインサービスです。サービスは、ある言語の「ソース」のテキストを別の「ターゲット」言語に変換します。 2010年代初頭以来、新しい人工知能技術、ディープニューラルネットワーク (または深層学習) は、Microsoft Translator チームコアテキスト翻訳技術を使用し、新しい音声翻訳技術を起動して音声認識を結合する品質レベルに到達する音声認識の技術を可能にしています。


ニューラルネットワークに基づく機械翻訳のしくみ

(この記事は What is neural network based translation? の翻訳です。)   ニューラルネットワークに基づく機械翻訳とはどういうものでしょう? なぜ翻訳精度が上がるのでしょうか? 機械翻訳は 2000 年代半ばより様々なアプリや Web サイトで活用されてきました。 1960 年代から長期間にわたり、コンピューター科学者たちは文法と個々の言語構造に基づく機械翻訳を作ろうとしてきました。多くの場合、翻訳結果はあまり芳しくないものでした。 ブレークスルーは新しいコンセプト、機械学習が機械翻訳に取り入れられたときにやってきました。プロの翻訳家によりあらかじめ翻訳された莫大なデータを使い、特定の文脈の下であらかじめ翻訳された文章から、単語を翻訳する方法を、強力なアルゴリズムが学習します。


マイクロソフトの音声認識技術、人間と同等の認識率を達成

[2016 年 10 月 18 日] Microsoft Artificial Intelligence and Research の研究チームは、文字起こしの専門家よりも誤認識率が低い音声認識システムを開発したと発表しました。業界標準のベンチマークテスト Switchboard 会話認識タスクにおける WER(Word Error Rate:単語誤認識率)は5.9% で、先月同チームにより報告されたばかりの6.3%よりもさらに向上しています。5.9%という誤認識率は、同じ会話の文字起こしを行なった人間と同等であり最高記録です。研究チームが1年前に設定した目標を上回り、同時にあらゆる人の予測をも越えました。


マイクロソフト、オープンソースの深層学習フレームワーク CNTK 1.0 を GitHub で公開

[2016 年 1 月 25 日]   マイクロソフトはこの度、自社の研究者が人工知能の研究に使っていたツールを広く開発者向けにリリースされました。いままでベータ版が公開されていたオープンソースの Computational Network Toolkit (CNTK) と呼ばれるツールの正式版を GitHub に公開しました。これは昨年 4 月より大学研究者向けに、より限定されたオープンソースライセンスで Codeplex 上に公開していたものの正式版です。


マイクロソフトの画像認識技術が人間レベルの認識率を達成

[2015 年 12 月 10 日] マイクロソフトの写真やビデオ内の物体認識技術の精度が人間レベルに達しました。場合によっては人間を超えることもあります。Microsoft Research は新しい画像認識技術により、スタンフォード大学の研究者によって開発された世界最大級の画像データベース ” ImageNet” と、マイクロソフト、フェイスブックなどが出資する同様のデータベース “Common Object in Context (COCO)” の大規模画像認識競技会 (ILSVRC 2015+MS COCO 2015)で、他の大学、研究所、企業を抑えて首位を獲得しました。


音声認識技術の歴史~約 50 年にわたる歩み

1971: アメリカ国防高等研究計画局 (DARPA) が最初の音声認識プロジェクトに取り掛かる。 1975: 後で隠れマルコフモデルとして知られる技術が提案される。IBM が音声認識の研究を始める。 1978: Texas Instruments が Speak & Spell をリリース。 1982: 混合ガウスモデルが音声認識で利用され始める。 1986: 研究者がニューラルネットワークの実験を開始。 1994: Dragon Naturally Speaking (ドラゴンスピーチ) と IBM Via Voice が登場。 1995: マイクロソフトが Windows 95 に最初のスピーチツールを提供。 1996: SRI International が双方向のボイス応答ソフトウェアを提供。 2001: マイクロソフトが SAPI 5.0 で Windows XP と Office XP に音声認識を提供。


マイクロソフト、オープンソースの深層学習フレームワーク CNTK Beta を公開

  マイクロソフトは深層学習フレームワーク Computational Network Toolkit (CNTK) のベータ版を米国時間 4 月 15 日にリリースしました。このツールキットにより、一連の計算ステップを記述する、ディープニューラルネットワーク (DNN)、畳み込みニューラルネットワーク (CNN)、再帰型ニューラルネットワーク (RNN)、長・短期記憶 (LSTM) 、ロジスティック回帰、最大エントロピーモデルなどの学習マシンの構築が可能です。CPU または GPU を使って Computational Network を実装することができます。


機械学習とは!?

[2014 年 7 月 1 日] 「機械学習」という言葉が一般に浸透するようになってきましたが、「機械学習とは何ですか?」とよく聞かれることがあります。機械学習を使うシナリオは後述するようにいくつかありますが、機械学習に必ず使うのが「データセット」です。機械学習とは、データの集合である「データセット」から、それを特徴づける「モデル」と呼ばれるソフトウェアを作成し、このモデルにより新たなデータに関する予測を行う手法です。