ついに日本語で翻訳コンニャクが実現!? Skype と人工知能の組み合わせで


 

ここ数年間、日本を訪れる海外からの観光客の数は着々と増加しています。今後数年間に、2019 年ラグビーワールドカップや 2020 年東京オリンピック・パラリンピック競技大会をはじめ数々の世界的なスポーツイベントが開催され、その数はさらに増加するでしょう。それにともない、日本と海外のコミュニケーション機会も増加していきます。

マイクロソフトでは、従来から AI による日本語の音声認識と機械翻訳への投資を行ってきましたが、この度、Microsoft Translator アプリ/ライブ機能や Skype 翻訳など音声認識と機械翻訳を行うサービス/製品において、いままでに得られたブレークスルーを提供します。また、開発者もMicrosoft Cognitive Services のひとつ、Translator API でそのパワーを利用できます。

日本語を話す人々は、既にサポートされている 9 言語(アラビア語、中国語(マンダリン)、英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語、ロシア語)を話す人々と、リアルタイムに対話ができるようになりました。

 

今回のブレークスルーにより実現できることにつきましては、以下のビデオをご覧ください。

 

2020 年に向けて多言語でのおもてなしの取り組みが始まっている

ビデオにもありました通り、Microsoft Translator のライブ翻訳機能は、旅行業の中の様々なシーンでご利用いただけます。

たとえば、ホテルにおいてはホテルスタッフとゲストが Microsoft Translator アプリを通してリアルタイムの会話を行うことができます。ゲストはMicrosoft Translator でホテルのWebページを翻訳することができ、それによりイベント情報、娯楽情報、アクティビティ、レストラン情報など日本語のみで書かれているページから情報を得ることができます。

ツアーガイドとゲストが Microsoft Translator アプリを通してリアルタイムでのやり取りができるため、従来は言語ごとに分かれていたガイド/ゲストの集団を統合することができます。町中にあるメニュー、標識、チラシなどはモバイルのカメラで画像を撮ってMicrosoft Translator アプリにかけると、画像の中の文字を認識して母国語に翻訳してくれます。

もちろん、電子メールやチャットもアドインを通してMicrosoft Translatorにかけることで、お互いが母国語でコミュニケーションを行うことが可能になります。

また、マイクロソフトでは自社で技術を磨くと同時に、日本でも大学やパートナー企業と連携してより多くの分野に応用できる多言語のおもてなしソリューションの整備を促進しています。一例として昨年からの取り組みとして豊橋技術科学大学や株式会社ブロードバンドタワーと、海外からの観光客が滞在中に必要となる医療、災害など、様々な言語による情報をリアルタイムに提供する翻訳サービスを、2020年までにインターネット上の様々なサービスで活用可能にすることを目指しています。

 

 

音声翻訳の仕組み

音声翻訳は単純な「音声認識エンジン」と「テキスト機械翻訳エンジン」の足し算ではありません。特に言語の追加に際しては言語独自の処理が必要となります。マイクロソフトの独自技術 TrueText は、以下のアニメーションの通り、音声認識用と機械翻訳用の 2 つの異なる AI の組み合わせにより実現されています。

最初の音声認識のステップでは、まず話し言葉でよく入っている「えーっと」「あのぅ」というような "淀み言葉" が入った状態で音声が認識されます。TrueText の音声認識AIは、このような言い淀みを認識して削除して、文章が成立するように文頭や特定名刺の大文字化 (英語などの場合)や句読点の追加などを行います。

第 2 のステップで機械翻訳 AI が第 1 ステップの出力結果を解釈し、認識された文章から、より流暢で人間らしく聞こえる翻訳が行われます。

 

Microsoft Translator アプリ/ライブ機能をぜひご利用ください

Microsoft Translator アプリは、Windows、iOS、Android、Kindleからご利用いただけます。以下のページからダウンロード可能です。

Microsoft Translator のダウンロード

 

Microsoft Translator ライブ機能を使う

 

この文章は以下の原文を要約したものです:

 

 

Skip to main content