Azure SQL Data Warehouse でレプリケート テーブルのプレビューを開始

執筆者: Ron Ortloff (Senior Program Manager)

このポストは、8 月 15 日に投稿された Replicated tables now in preview for Azure SQL Data Warehouse の翻訳です。

 

SQL Data Warehouse は、ペタバイト規模の完全管理型クラウド データ ウェアハウスです。弾力性に優れており、セットアップを数分間で、容量のスケーリングは数秒で行うことができます。このたび、SQL Data Warehouse の大量のデータに対するクエリの処理スピードをさらに向上させる、レプリケート テーブル機能のパブリック プレビューを発表いたします。これは、データの移動を減らすことでクエリを高速化する機能です。分散データ ウェアハウス システムでデータ移動が発生するのは、テーブルの結合時や集約時に、コンピューティング ノード間でのテーブルの分散状態に矛盾が生じる場合です。レプリケート テーブルでは、データの完全なコピーを各コンピューティング ノードに保存することで、データの移動を減らします。そのため、データ移動が必須だったクエリの実行時間が短縮できます。

replicated-table

レプリケート テーブル機能以前には、Date ディメンションなどのディメンション テーブルは、ラウンドロビンの分散方式で実装するのが一般的でした。ファクト テーブルとの結合時には、Date ディメンションをファクト テーブルと一致させるために、クエリ プランにデータ移動のステップが実装され、この処理のために全体的なクエリ実行時間が長くなっていました。レプリケート テーブルを使用すると、分散されたファクト データとディメンション データの完全なローカル コピーがコンピューティング ノード内で直接結合されます。早期に採用したお客様では、一部のクエリの実行時間が 40% も短縮し、クエリ実行に必要なステップ数も 10 分の 1 までに減少しました。

レプリケート テーブルの作成方法

レプリケート テーブル機能は、プレビュー期間中のすべてのデータ ウェアハウスで提供されており、今すぐクエリの最適化をお試しいただけます。レプリケート テーブル作成に関するサンプル構文は、以下のとおりです。

 CREATE TABLE DimDate
(
DateKey int NOT NULL,
FullDateAlternateKey date NOT NULL,
DayNameOfWeek nvarchar(10) NOT NULL,
CalendarQuarter tinyint NOT NULL,
CalendarYear smallint NOT NULL,
CalendarSemester tinyint NOT NULL
)
 
WITH
 
(
DISTRIBUTION = REPLICATE,
CLUSTERED COLUMNSTORE INDEX
)

SQL Data Warehouse の利用開始

Azure ポータルで SQL Data Warehouse のプロビジョニングを開始するか、1 か月の無料試用版にお申し込みください。

SQL Data Warehouse のスキーマ設計に関する推奨事項については、レプリケート テーブルの設計ガイダンスをご覧ください。

詳細情報

マイクロソフトでは、SQL Data Warehouse に関する資料を多数公開しています。ぜひお役立てください。