Azure Media Indexer 2 Preview をリリース: 新たな言語に対応

執筆者: Adarsh Solanki (Program Manager, Azure Media Services)

このポストは、4 月 18 日に投稿された New languages with Azure Media Indexer 2 Preview の翻訳です。

 

メモ : このブログ記事では、Azure Media Analytics のコンポーネントについて説明しています。Azure Media Analytics の詳細と利用開始については、Azure Media Analytics の概要に関するブログ記事 (英語) を参照してください。

マイクロソフトの音声テキスト化製品である Azure Media Indexer の言語モデルが最後に更新されてから既に 2 ~ 3 か月経ちます。これまでは対応言語を 1 つずつ追加していっていましたが、今回はメディア プロセッサをコア部分から見直すという大幅な修正に取り組み、Indexer の公開後初めてとなるメジャー アップグレードの発表にこぎ着けました。

マイクロソフトはこのたび Azure Media Indexer v2 のプレビューを発表します。

このプレビューは最大 10 分間という処理時間の制限はありますが、Azure のパブリック データセンターをご利用のすべてのお客様に無償でお試しいただけます。

Azure Media Indexer 2 では、お客様から最もリクエストの多かった 2 つの機能に対応しています。インデックス作成の高速化サポート言語の拡充です。

パフォーマンスの向上

Azure Media Indexer では従来、インデックス作成タスクの処理を完了するのにソース ファイルの 2 ~ 3 倍ほどの時間がかかっていました。Azure Media Indexer 2 ではなんと、インデックスの作成スピードが 2 倍になります。 Azure Media Indexer 2 を使用すれば、ソースのわずか 1 ~ 1.5 倍の時間で処理を実行できるようになります。

新しい言語のサポート

Azure Media Indexer は、英語とスペイン語の音声テキスト化をサポートしています。Azure Media Indexer 2 では以下のとおり、新たな言語のサポートが追加されます。

  • 英語 (米国): en-us
  • スペイン語 (スペイン): es-es
  • 中国語 (中華人民共和国): zh-cn
  • フランス語 (フランス): fr-fr
  • ドイツ語 (ドイツ): de-de
  • イタリア語 (イタリア): it-it
  • ポルトガル語 (ブラジル): pt-br
  • アラビア語 (エジプト): ar-eg

Media Indexer 2 ではさらに、内部アーキテクチャが新しくなったことで、新しい言語の言語モデルを迅速に実装できるようになりました。つまり、これまでよりもずっと速いペースで、言語のサポートをリリースできるようになります。

出力ファイル

字幕

Azure Media Indexer でユーザーの皆様が主に使用していた出力ファイルは「字幕」形式でした。これを受けて、今回の Azure Media Indexer 2 プレビュー版では、以下の出力形式のみに対応することにしました。

  • WebVTT
  • TTML
  • SAMI

ラティス方式のサポート

Azure Media Indexer と MAVIS をよく活用される方は、出力形式に AIB がないことにお気付きでしょう。これは、製品寿命に関する当社の経験に基づいて判断した、設計上の対応です。

背景を簡単に説明すると、AIB ファイルとは SQL Server のカスタム IFilter と併用できる強力なバイナリ ファイル形式で、ラティス データ構造をベースとする、SQL による全文検索を可能にします。AIB を使用すると検索漏れの発生が抑えられる一方、アーキテクチャ上の制約により、Azure SQL などの他の全文検索エンジンとは併用できません。その代わりに、SQL Server を IaaS として導入した後、カスタム IFilter を手動でインストールする必要がありました。これはお客様にとって大きなデメリットです。そこで私たちは、ラティス方式検索シナリオのサポートについてより効果的なアプローチを検討することにしました。

現在は、新しい出力形式の設計を進めているところです。AIB ファイルの重要な部分はそのままに、新たな形式では、業界標準の全文検索エンジンのすべてに対する互換性を提供すると同時に、よりシンプルな解析と解釈の実現を目指しています。この新しいデータ構造は Azure Media Indexer 2 のプライベート プレビューの後でリリースされますので、続報をお待ちください。

利用を開始する

Media Indexer 2 の利用を開始するには、Azure Media Analytics の概要に関するブログ記事 (英語) で示した Media Analytics のサンプル プロジェクトと、以下の 2 つの情報を使用してください。

Azure Media Analytics の詳細については、概要に関するブログ記事 (英語) をご覧ください。Media Processor name“Azure Media Indexer Preview 2”Azure Media Indexer の詳細については、こちらを参照してください。ここで説明したアプローチについて、AIB ファイルの利用に関するご意見やご感想がありましたら、indexer@microsoft.com までご連絡いただくか、以下のコメント欄までお願いいたします。

項目
タスク構成
 {     "Version":1.0     "Features":[        {           "Options":{              "Formats":["Webvtt", "Sami", "Ttml"],              "Language":"EnUs",              "Type":"RecoOptions"           },           "Type":"SpReco"        }    ],}
サポート形式
  • WebVTT
  • TTML
  • SAMI
 サポート言語 (かっこ内の 4 文字のコードを使用)
  • 英語 (EnUs)
  • スペイン語 (EsEs)
  • 中国語 (ZhCn)
  • フランス語 (FrFr)
  • ドイツ語 (DeDe)
  • イタリア語 (ItIt)
  • ポルトガル語 (PtBr)
  • アラビア語 (ArEg)
 
メディア プロセッサ名 "Azure Media Indexer Preview 2"

 

Azure Media Indexer の詳細については、こちらを参照してください。

Azure Media Analytics の詳細については、概要に関するブログ記事 (英語) をご覧ください。

ここで説明したアプローチについて、AIB ファイルの利用に関するご意見やご感想がありましたら、indexer@microsoft.com までご連絡いただくか、以下のコメント欄までお願いいたします。