更新情報: Azure Media Indexer の完全な字幕機能と SQL Server アドオン v2.6

このポストは、11 月 12 日に投稿されたUpdate: Azure Media Indexer full caption feature and SQL Server Add-on v2.6 の翻訳です。

このたび、Azure Media Indexer の新機能をリリースしました。これは皆様からのご意見をもとに開発したものです。

完全な字幕の強制適用

Azure Media Indexer の基本アルゴリズムでは、誤った字幕が表示されることを防ぐために、信頼性スコアの結果がしきい値を下回ったすべての単語と語句が省略されます。その際、字幕ファイルの該当箇所には省略記号が挿入されます。

省略された場合、以下のようになります。

 <p begin="00:00:00.520" end="00:00:03.880">My name is holly shore ...in austin texas</p>
<p begin="00:00:03.880" end="00:00:08.710">...blogger and now of windows phone developer I</p>

このツールは、Indexer のユーザー補助機能として多くの方にご活用いただいています。この省略記号は信頼度が低いことを示しているため、手動で字幕の仕上げ作業を行うきっかけとしても使用されます。しかし、一部のユーザーからは、字幕が「抜ける」ことに不満を感じるというご意見をいただいていました。そのため、省略記号を挿入するのではなく、「ベストな推測」と言える単語や語句を挿入した完全な字幕が必要な場合があると考えました。

完全な字幕を強制適用した場合、以下のようになります。

 <p begin="00:00:00.520" end="00:00:03.880">My name is holly shore live in austin texas</p>
<p begin="00:00:03.880" end="00:00:08.710">I'm blogger and now of windows phone developer </p>

この新機能を使用するには、構成機能に次のキーと値のペアを追加します。

 <add key="ForceFullCaption" value="true" />

空の構成ファイル

このほか、プロセッサの弾力性も向上し、良好な「既定」のジョブに空の構成ファイルを使用できるようになりました。今回のリリースでは、構成ファイルが不完全な場合に使用される良好な「既定」が追加されたほか、構成ファイルについては、Azure Media Indexer を試用する場合の厳格な要求ではなく、カスタマイズのための追加機能と位置づけられることになりました。

構成ファイルが用意されない場合、Indexer のジョブが返すファイルは既定で以下のようになります。

  • Ÿ   字幕
    • TTML
    • SMI
    • VTT
  • Ÿ   メタデータ
    • kw.xml (キーワード)
    • AIB (SQL Server アドオンで使用される格子構造の音声テキスト情報)
    • aib.xml (AIB の格子構造の音声情報を XML 形式にしたもの)
    • .info (単語ごとのタイム スタンプと信頼度)

なお、従来と同様に、前回の記事 (英語) の説明に従って構成ファイルを変更し、返されるファイルをカスタマイズすることができます。

新しい SQL Server アドオン (v2.6)

Azure Media Indexer の検索インデックス出力ファイルである AIB ファイルを使用するためには SQL Server アドオンが必要ですが、これについて非常に多くのご意見をいただきました。これは、ビデオ検索のすべての単語候補が表示されることで偽陰性クエリが大幅に減少するため、現在でも最もよく使用されている検索方法です。今回のリリースでは、このクエリの制限事項が一部解除されています。

新しいバージョンの Indexer SQL Server アドオンでは、次の変更が実装されます。

  • 特定の AIB の冒頭のテキスト スニペットの取得がサポートされます。

  • 特定の AIB の末尾のテキスト スニペットの取得がサポートされます。

  • Retrieval.ComputeScore、Retrieval.GetBeginSnippet、Retrieval.GetEndSnippet の各メソッドで forceMaxContent パラメーターを指定すると、スニペット全体の期間を取得できます。これを指定しない場合は、最大値以下で単語の信頼度に応じて自動的にスニペットの期間が決定されます。

  • SQL Server 2012 より前のバージョンの SQL のサポートが廃止されます。

新しいアドオンはこちらのリンクからダウンロードできます。

SQL Server アドオンの使用方法の詳細については、こちらのブログ記事を参照してください。

ご意見やご不明な点がありましたら、いつものように indexer@microsoft.com までお気軽にお寄せください。

Azure Media Indexer の詳細については、こちらの紹介記事をお読みください。