Cognitive Services の Computer Vision が最新機能を搭載

執筆者: Cornelia Carapcea (Principal Product Lead, Cognitive Services)

このポストは、2019 年 2 月 27 日に投稿された Latest enhancements now available for Cognitive Services' Computer Vision の翻訳です。

 

今回の記事は、Computer Vision 担当主任リサーチ マネージャーを務める Lei Zhang と共同で執筆しました。

Cognitive Services の Computer Vision サービスの機能強化により、画像からさらに多くのインサイトを引き出したり、新しいワークフローを活用したりできるようになりました。

1. タグ付けボキャブラリが拡張されてインサイトがよりリッチに

画像ごとに認識できるオブジェクト、シチュエーション、アクションの種類が 2 倍以上に増えました。

拡張前

Black and white picture of New York City before Computer Vision

拡張後

Black and white picture of New York City now, after Computer vision

2. オブジェクト検出機能で自動クロップが可能に

新しいオブジェクト検出機能を使用すると、クロップを自動化したり、必要なオブジェクト数を簡単に計測したりできます。画像の中の生物や人工のオブジェクトを数千種類検知できます。さらに、各オブジェクトは境界ボックスで強調され、画像内の座標が示されます。

Picture of subway train and detecting real life or man-made objects

3. ブランド検出機能でブランド ロゴ監視も

家電、小売、製造、エンターテイメントといった業界の世界的なブランド数千社のロゴを把握できるようになりました。

Picture of Microsoft logo and the brand detection feature

これにより、以下のことが可能になります。

  • サイズの大きな画像やビデオ フレームのインデックスを作成し、メディア コンテンツを検索できます。メディア、エンターテイメント、広告、ストック フォトなどの業界では、リッチな画像やビデオ メタデータを活用してビジネスの生産性を高めることができます。
  • 画像やビデオのコンテンツを読み取ったり、関心のあるロゴを大量に検出したりすることで、ソーシャル メディアや広告キャンペーンからインサイトを取得できます。デジタル広告の代理店などがキャンペーンの効果を追跡する際に便利です。たとえば、インフルエンサー マーケティングを実施する際に Custom Vision を利用して、インフルエンサーが作成した画像やビデオから自動的にブランドのインクルージョン指標を生成できます。

ただし、今回の Computer Vision サービスの機能拡張よりも高度なことを行う場合には、ユース ケースに関連したタグ付けのボキャブラリやオブジェクトの種類を追加するなど、画像認識機能をさらにカスタマイズする必要があります。Custom Vision (英語)サービスでは、機械学習の専門知識がなくても簡単にモデルをカスタマイズしてデプロイできます。

Computer Vision のデモで実際の動作をご確認いただけます。すぐに利用を開始してインサイトを活用したい方は、画像へのタグ付けオブジェクト検出ブランド検出に関するドキュメントをご覧ください。