Azure Data Lake のパブリック プレビューをリリース

このポストは、10 月 28 日に投稿された Azure Data Lake reaches Public Preview の翻訳です。

世界中の SQL Server と BI のプロが集う SQL PASS Summit 2015 (英語) の開催に先駆けて、マイクロソフトは Azure Data Lake AnalyticsAzure Data Lake Store (英語) のパブリック プレビューの提供を開始することを発表しました (英語)

以前開催された Strata カンファレンスでは、新しい分析サービスの導入と既存の Azure HDInsight ソリューションを Azure Data Lake に追加するという展望についてお伝えしたとおり (英語)、マイクロソフトはビッグ データ技術をよりシンプルかつ便利なものにし、より多くの皆様にご利用いただけるようにすることを目標としています。

今回、皆様が Azure Data Lake を活用してさらなる生産性向上を実現できるように、Azure Data Lake をさまざまな視点から解説する 全 6 回のブログ シリーズ の連載を開始することにしました。1 回目となるこの記事では、上記で触れた 2 つのサービスについてご紹介します。Azure でのビッグ データ処理の詳細については Channel 9 で説明していますので、そちらも併せてご覧ください。

Azure Data Lake Analytics とは?

Azure Data Lake Analytics はコードを動的にスケーリングする分散型のビッグ データ分析サービスで、これを活用することでお客様は分散型インフラストラクチャを気にすることなく、ビジネス ロジックに集中することができます。この分析サービスは Apache YARN を基盤としたクラウド向けに設計されてており、必要な処理速度に応じてダイヤルを設定するだけであらゆるスケールのジョブにすぐに対応できます。また、従量課金のサービスのためコスト効率が高く、Azure Active Directory がサポートされているため、アクセス許可やロールの管理、オンプレミスの ID システムとの統合が簡単です。

現在、多くの開発者やデータ サイエンティストが既存のテクノロジやツールを使用してビッグ データの活用に取り組んでいますが、Azure Data Lake Analytics では U-SQL (英語) 言語を使用できるため、お客様が自身で作成した強力なコードと SQL のメリットを統合することができます。U-SQL 言語は、マイクロソフト内部のビッグ データ システムで利用されているものと同一の分散型ランタイムで構築されています。そのため SQL や .NET の開発者の方であれば、あらゆるデータの処理や分析に現在のスキルを活用できます。

Azure Data Lake Tools for Visual Studio では 最新の U-SQL 作成機能、デバッグ機能、高度なパフォーマンス分析機能がサポートされており、膨大な数のノードでのジョブを最適化して生産性を向上させることができます。U-SQL コードを視覚化することで、スケールごとのコードの実行状況を確認でき、パフォーマンス上のボトルネックやコストの最適化に沿って簡単にクエリを調整できます。


Azure Data Lake Store とは?

Azure Data Lake Store は、サイズや種類を問わずさまざまなデータを簡単に取得できる単一のリポジトリで、どのようなスケールのデータでもアプリケーションを変更することなく高速に処理します。データを安全に共有して共同作業を行ったり、HDFS アプリケーションやその他のツールを利用して処理や分析を実行することができます。

詳細情報

  • Azure.com の Data Lake ソリューションのページは、こちらを参照してください。

ドキュメントと使用方法