ニューラルネットワークに基づく機械翻訳のしくみ

(この記事は What is neural network based translation? の翻訳です。)   ニューラルネットワークに基づく機械翻訳とはどういうものでしょう? なぜ翻訳精度が上がるのでしょうか? 機械翻訳は 2000 年代半ばより様々なアプリや Web サイトで活用されてきました。 1960 年代から長期間にわたり、コンピューター科学者たちは文法と個々の言語構造に基づく機械翻訳を作ろうとしてきました。多くの場合、翻訳結果はあまり芳しくないものでした。 ブレークスルーは新しいコンセプト、機械学習が機械翻訳に取り入れられたときにやってきました。プロの翻訳家によりあらかじめ翻訳された莫大なデータを使い、特定の文脈の下であらかじめ翻訳された文章から、単語を翻訳する方法を、強力なアルゴリズムが学習します。


マイクロソフトが真にスケーラブルな汎用量子コンピューター実用化への取り組みを加速

[2016 年 11 月 20 日] [写真] マイクロソフトのエグゼクティブ、Todd Holmdahlは、スケーラブルな量子ハードウェアとソフトウェアを開発するための科学技術的な取り組みをリードしていきます。   マイクロソフトは、量子コンピューター分野へのコミットメントを倍増させ、トポロジカル量子ビットと呼ばれるものを使ってスケーラブルな量子コンピューターを作成することが可能であると確信しています。 長年にわたるマイクロソフトのエグゼクティブを務めるTodd Holmdahlは、魔法のような研究プロジェクトの製品化を成功させてきた経歴を持ち、スケーラブルな量子ハードウェアとソフトウェアを開発するための科学技術的な取り組みをリードしています。


テスラ CEO イーロン・マスク氏が共同創業者の OpenAI が Microsoft Azure を採用

[2016 年 11 月 15 日] (写真は Microsoft AI and Research グループ エグゼクティブ・バイスプレジデントのハリー・シャムと、OpenAI 共同会長のサム・オルトマン)   本日、マイクロソフトは非営利団体の AI 研究組織 OpenAI と提携して、一緒に AI の領域の発展を進めていき、AI を使って世界で最も難しい課題のいくつかにチャレンジしていくという共通ゴールを追求していくことで合意したことを発表しました。OpenAI はテスラ CEO のイーロン・マスク氏、Y コンビネーター CEO サム・オルトマン氏、電子決済サービス大手ストライプ元最高技術責任者 (CTO) グレッグ・ブロックマン氏、および Google のリサーチサイエンティストであるイリヤ・サツケバー氏らにより共同で創業された組織です。


マイクロソフトの音声認識技術、人間と同等の認識率を達成

[2016 年 10 月 18 日] Microsoft Artificial Intelligence and Research の研究チームは、文字起こしの専門家よりも誤認識率が低い音声認識システムを開発したと発表しました。業界標準のベンチマークテスト Switchboard 会話認識タスクにおける WER(Word Error Rate:単語誤認識率)は5.9% で、先月同チームにより報告されたばかりの6.3%よりもさらに向上しています。5.9%という誤認識率は、同じ会話の文字起こしを行なった人間と同等であり最高記録です。研究チームが1年前に設定した目標を上回り、同時にあらゆる人の予測をも越えました。


マイクロソフト、AI の民主化加速のため 5,000 人の AI 専門技術者組織を設立

[2017年9月29日] マイクロソフトでは、お客様のデジタルトランスフォーメーションを推進するために、マイクロソフトの広範囲の製品に AI (人工知能) を広範囲に取り入れていきます。この根本的変化に対するマイクロソフトのアプローチは、AIを民主化し、誰でも簡単にアクセス可能なものとし、価値を提供することです。 本日、マイクロソフトはこの進化を加速するための新組織の設立を発表しました。Microsoft Research そして、Information Platform Group, Bing and Cortana 製品チーム、Ambient Computing and Robotics チームをまとめたもので、合計5,000人以上のコンピューターサイエンティストとエンジニアを擁するチーム「Microsoft AI and Research グループ」が完成しました。


「AI の民主化」マイクロソフトの AI ビジョン~すべての人と組織が使えるように

[2016 年 9 月 30 日]   「AI を誰でも使えるようにする。」将来を考えるとき、過去の歴史に学ぶと方向性が見えてきます。マイクロソフトでは、AI を民主化して誰でも使えるようにする、という大規模でかつ大胆なアプローチを進めています。 近代の情報化の歴史を見ると、1400 年代に活版印刷の発明により情報の氾濫が始まりました。人類が広く学べるようになり「情報の民主化」が最初に行われた瞬間でした。 この時点から、人類は知識を創造して流布することができるようになり、人類の進歩の仕方が変わりました。ただし、時間がかかる、足りない、ということは相変わらず変わりませんでした。


マイクロソフト、オープンソースの深層学習フレームワーク CNTK 1.0 を GitHub で公開

[2016 年 1 月 25 日]   マイクロソフトはこの度、自社の研究者が人工知能の研究に使っていたツールを広く開発者向けにリリースされました。いままでベータ版が公開されていたオープンソースの Computational Network Toolkit (CNTK) と呼ばれるツールの正式版を GitHub に公開しました。これは昨年 4 月より大学研究者向けに、より限定されたオープンソースライセンスで Codeplex 上に公開していたものの正式版です。


マイクロソフトの画像認識技術が人間レベルの認識率を達成

[2015 年 12 月 10 日] マイクロソフトの写真やビデオ内の物体認識技術の精度が人間レベルに達しました。場合によっては人間を超えることもあります。Microsoft Research は新しい画像認識技術により、スタンフォード大学の研究者によって開発された世界最大級の画像データベース ” ImageNet” と、マイクロソフト、フェイスブックなどが出資する同様のデータベース “Common Object in Context (COCO)” の大規模画像認識競技会 (ILSVRC 2015+MS COCO 2015)で、他の大学、研究所、企業を抑えて首位を獲得しました。


音声認識技術の歴史~約 50 年にわたる歩み

1971: アメリカ国防高等研究計画局 (DARPA) が最初の音声認識プロジェクトに取り掛かる。 1975: 後で隠れマルコフモデルとして知られる技術が提案される。IBM が音声認識の研究を始める。 1978: Texas Instruments が Speak & Spell をリリース。 1982: 混合ガウスモデルが音声認識で利用され始める。 1986: 研究者がニューラルネットワークの実験を開始。 1994: Dragon Naturally Speaking (ドラゴンスピーチ) と IBM Via Voice が登場。 1995: マイクロソフトが Windows 95 に最初のスピーチツールを提供。 1996: SRI International が双方向のボイス応答ソフトウェアを提供。 2001: マイクロソフトが SAPI 5.0 で Windows XP と Office XP に音声認識を提供。


あなたもすぐに試せる!顔写真から感情を読む人工知能が登場!

[2015 年 11 月 11 日] 人間であれば顔の感情を簡単に認識できますが、コンピュータに認識させようとするとそう簡単ではありませんでした。しかし、最近の機械学習と人工知能の分野における進歩により、コンピュータ科学者は、音、言葉、画像、さらには表情などを識別できるよりスマートなアプリを作成することができるようになりました。