Azure HDInsight 中的 HBase 正式營運

原文發表於 Azure HDInsight makes HBase (NoSQL database) a GA Feature

在 2014 年 6 月,我們在 Azure HDInsight 中提供了 HBase 的預覽服務,而在 8 月 21 號,我們正式推出 HBase 的服務(同時也釋出了包含了像是 Azure DocumentDB、Azure Search 等服務)。Apache HBase 是 Apache Hadoop 生態系中,一個基於行式(columnar)的 NoSQL(Not only Structured Query Language)分散式資料庫的專案。

HBase 在 Apache Hadoop 生態系中提供了資料交易操作的功能,讓用戶能夠迅速地在 Azure Blob 儲存體中儲存資料,以及從大筆的資料中進行查詢。由於是分散式的資料庫架構,HBase 能夠依據負載及效能的需求來延展,所以 HBase 非常適合需要處理數以幾百萬或幾十億資料量的用戶(正式營運後,Azure HDInsight 中的 HBase 能支援 Azure Blob 儲存體中 500 TB 的資料),當然,HBase 缺乏了一些像是優化功能、第二層索引、以及進階的查詢語法,所以無法取代現有的關聯式資料庫管理系統(RDBMS)。

關於 HBase 一些常見的應用包括了:

  • 物聯網(IoT, Internet-of-Things) — HBase 能夠儲存由各式各樣的裝置、感測器、設備及社交網路來的大量即時資料,資料儲存在 Azure Blob 儲存體中,而 Azure HDInsight 及 HBase 則可以進行一些批次運算,來處理或分析這些大量的資料。
  • Web 記錄(Logs) — 可以用來處理網站的記錄檔(logs)或是一些點擊追蹤(clickstream)的資料,一樣由 Azure HDInsight 來處理及分析資料。
  • 社交網路資料 — 用來儲存從社交網路來的大量資料。

我們在 Azure 的官方網站上提供了許多關於 HBase 的學習資料,歡迎您多加利用:

另外,如果您想瞭解關於 Hadoop 以及 HDInsight 可以參考下列資料: