Azure Cosmos DB による世界規模の運用分析と AI

執筆者: Rimma Nehme (Product Manager and Architect, Azure Cosmos DB)

このポストは、2019 年 5 月 7 日に投稿された Planet scale operational analytics and AI with Azure Cosmos DB の翻訳です。

Title card, Planet Scale Opperational Analytics with Azure Cosmos DB.

このたび Microsoft Build 2019 において、Azure Cosmos DB の新機能を発表しました。Azure Cosmos DB は、世界規模で運用するグローバル分散インテリジェント アプリを容易に構築できるサービスです。

  • Azure Cosmos DB での Apache Spark のビルトイン サポートにより、世界規模での運用分析が可能に
  • すべての Azure Cosmos DB API で Jupyter ノートブックをビルトイン サポート

このほかの Azure Cosmos DB に関する発表お客様事例 (英語) も併せてお読みください。

Azure Cosmos DB での Apache Spark のビルトイン サポート

Map of Apache Spark locations.

Azure Cosmos DB は、世界規模で低レイテンシを確保しながら弾力的にスループットをスケーリングできる点で好評を得ていますが、お客様からは、Cosmos データベースに格納しているペタバイト級の運用データを直接分析したいというご要望も寄せられています。そこで今回、プレビューとして Apache Spark (英語) を Azure Cosmos DB にネイティブに統合しました。これにより、Cosmos データベースに格納しているトランザクション データに対して、世界規模の分散環境でレイテンシを低く抑えながら運用分析と AI を実行できるようになります。これには次のようなメリットがあります。

  • グローバル分散型 Spark でインサイトの獲得を加速。 グローバルに配置したマルチマスター構成の Cosmos データベースで Apache Spark をネイティブに利用できるため、世界中の情報から迅速にインサイトを得られるようになります。世界中の Cosmos データベースのすべてのデータを取り込んだり、世界各地のデータの生成元と利用者に最も近いローカル データベース レプリカに対してクエリを実行したりできます。
  • フル マネージド型エクスペリエンスと SLA を提供。 Apache Spark のジョブは、Azure Cosmos DB で提供される業界最高レベルの包括的な SLA による 99.999% の可用性 (英語) が保証されます。別途 Apache Spark クラスターを管理する手間はかかりません。Azure Cosmos DB は、Apache Spark ジョブの実行に必要なコンピューティング能力を、お客様の Cosmos データベースに関連付けられているすべての Azure リージョンで弾力的に自動スケーリングします。
  • マルチモデルの運用データに対して Spark ジョブを効率的に実行。 Spark ジョブはすべて、Cosmos コンテナー内部のデータ パーティション内に格納されているインデックス付きマルチモデル データに対して直接実行されるため、不要なデータ移動をなくすことができます。
  • トランザクション データや分析データを OSS API で処理。 運用ワークロードに対して Cassandra、MongoDB、Gremlin (および Core SQL API) の使い慣れた OSS クライアント ドライバーを使用できることに加えて、Apache Spark による分析も可能になりました。これらの操作はすべて、Cosmos データベースに格納している同じグローバル分散データに対して実行されます。

クラウド ネイティブなアプリケーションをグローバルに構築しているお客様にとって、トランザクションと分析の間の隔たりは大きな悩みの種でした。今回 Apache Spark を Azure Cosmos DB にネイティブに統合したことで、その垣根が取り払われます。

さまざまな大企業のお客様が、Apache Spark を使用して Cosmos データベースに対してグローバル分散型運用分析を行っています。その一例が Coca-Cola です。同社の事例ビデオ (英語) をご覧ください。

An image of Barry Simpson, SVP & Global Chief Information Officer for the Coca-Cola Company.

Coca-Cola は Azure Cosmos DB でグローバル分散型運用分析を実現

「グローバルなスケーリングが可能であること、わずか数分で世界規模のインサイトが得られることは、当社にとって非常に重要です。2、3 年前は、世界中からインサイトを収集するのに数時間もかかっていましたが、Azure Cosmos DB にデータを格納してからは、わずか数分で済むようになりました」

– Coca-Cola Company、CIO 兼デジタル イノベーション グローバル責任者、Neeraj Tolmare 氏

Apache Spark 用 Azure Cosmos DB API の詳細については、こちらからご確認ください。

世界規模のノートブック

今回は、Azure Cosmos DB 内で動作する Jupyter ノートブックのプレビューも開始しました。すべての API (Cassandra、MongoDB、SQL、Gremlin、Apache Spark など) で利用でき、Azure Cosmos DB の開発エクスペリエンスがさらに強化されます。すべての Azure Cosmos DB API とすべてのデータ モデルでノートブック エクスペリエンスがネイティブにサポートされたことで、インタラクティブにクエリや ML モデルを実行したり、Cosmos データベースに格納されているデータを調査、分析したりできます。また、使い慣れた Jupyter ノートブックを Azure Portal から直接使用して格納中のデータを調べたり、機械学習モデルの構築やトレーニングを行ったり、データに対して推論を実行したりできます。

Jupyter ノートブックのサポートの詳細については、こちらからご確認ください。

 A Jupyter notebook.

Azure Cosmos DB で Jupyter ノートブックをビルトイン サポート

このほかにも、ユーザーが管理する Azure 上の Kubernetes クラスター向けに、Cosmos DB をバックエンドとする etcd サービスをネイティブにサポートする新しい API を追加したほか、SQL API への OFFSET/SKIP のサポート追加や、SDK の機能強化など、開発者向けの新機能や機能強化 (英語) を多数リリースしました。

光栄なことに、Azure Cosmos DB はお客様の信頼を得て、画期的なグローバル分散アプリの構築や大規模でミッション クリティカルなワークロードの運用に利用していただいています。そうしたお客様の成功事例 (英語) は、当社にとって大きな刺激となっています。