R をオンプレミスとクラウドの両方の企業環境に対応したクロス プラットフォーム分析ツールにするために


このポストは、1 月 12 日に投稿された Making R the Enterprise Standard for Cross-Platform Analytics, Both On-Premises and in the Cloud の翻訳です。

今回は、マイクロソフトのデータ グループ担当コーポレート バイス プレジデントの Joseph Sirosh の記事をご紹介します。

マイクロソフトは 1 年ほど前に、R の商用ソフトウェア/サービスの大手プロバイダーである Revolution Analytics を買収することを決定しました (英語)。R は統計計算や予測分析において世界で最も広く使用されているプログラム言語です。そのころマイクロソフトは、R と Revolution のテクノロジをデータベースやビッグ データ、ビジネス インテリジェンスといったさまざまなマイクロソフト サービスに組み込み、そのメリットをオンプレミスや Azure クラウド、新たなタイプのプラットフォームを使用するユーザーや学生に届けようと取り組んでいました (英語)

以来私たちは、お客様やパートナー様が R の力を活用できるように、以下のようなさまざまな技術革新や機能更新を行ってきました。

そして本日は、上記に加えてさらに嬉しい発表があります。R を基盤とする分析機能が、新しいプラットフォーム、開発者、R コミュニティに提供されることになりました。詳細は以下のとおりです。

Microsoft R Server を複数のプラットフォームで提供することで、Hadoop (Hortonworks、Cloudera、MapR)、Linux (Red Hat、SUSE)、Teradata のいずれを使用している場合でも、企業ユーザーが高度な分析を 1 つの中核ツールで標準化することができます。Windows については、Microsoft R Server が SQL Server R Services として SQL Server 2016 に含まれます。バンドルされた製品の価格は、RRE 単体よりも安価です。SQL Server 2016 がリリースされるまでは、Windows 向け Revolution R Enterprise は単体製品として提供が継続されます。

IDC のビジネス分析および情報管理担当プログラム バイス プレジデントを務める Dan Vesset 氏は次のように述べています。「高度な予測分析とは、新たなモデルを開発し、テストすることです。また、企業にとってメリットとなる意思決定支援ソリューションや自動化ソリューションを運用環境に組み込むことでもあります。マイクロソフトは今回 R エコシステムに新規サービスを導入することで、分析モデル ツールや生産性ツール、デプロイメント ツールを幅広いユーザーに提供するという大きな役目を果たしました」。

この発表以外にも、今後下記のような統合と技術革新を促進する新たな製品をリリースしていく予定です。

マイクロソフトはこうした取り組みを継続することで、企業や R 開発者、データ サイエンティストの皆様がオンプレミスとクラウドのいずれの環境でもコスト効率よくアプリケーションや高度な分析ソリューションをスケールに応じて容易に開発できるようになることを支援したいと考えています。 

Microsoft R Server とは

Microsoft R Server は R を基盤とする広範囲にデプロイ可能なエンタープライズ クラスの分析プラットフォームで、マイクロソフトのサポート対象が適用され、スケーラビリティと安全性を備えています。R Server はビッグ データの統計、予測モデル作成、機会学習などの機能をサポートしており、探索、分析、視覚化、モデル化といった分析処理全体に対応しています。Microsoft R Server ではオープン ソース R を拡張して使用しているため、R のスクリプトや関数、CRAN パッケージとの完全な互換性があり、企業規模でのデータ分析が可能です。また、Microsoft R Server ではデータの並列処理やチャンク化処理の追加によりオープン ソース R のインメモリ制限が解決されているため、メイン メモリよりもはるかに大きなメモリ容量を必要とするデータを分析できます。

Revolution Analytics の買収以降、マイクロソフトは製品の安全性向上、国際化の強化、アクセス性の向上、インストールの簡素化、そして多数の新機能の開発に取り組んできました (詳細は Microsoft R Server の新機能 (英語) に関するドキュメントを参照)。その例として、最新リリースには下記のような機能が含まれています。

  • R 言語バージョン 3.2.2
  • マイクロソフトによるエンタープライズ クラスのサポート
  • マイクロソフトのセキュリティ開発サイクルに沿ったエンタープライズ レベルのセキュリティ。脅威のモデル化、攻撃の分析、コード分析、拡張的なファジー テストなどが含まれる
  • マイクロソフトのアクセシビリティ規格 (英語) に沿ったアクセシビリティとコンプライアンス
  • GB18030 エンコードの中国語データ セットのサポート

Hadoop 向け Microsoft R Server では、Hadoop ユーザーがお好みの R 開発環境で排他的に作業を行いながら Microsoft R Server を使用して分散型クラスターで R モデルを構築し実行できます。このソフトウェアは、Hadoop ノード間でワークロードを分散することにより透過的にスケーリングできます。この際、複雑なプログラムを作成する必要はありません。

Hortonworks の CEO である Rob Bearden 氏は次のように述べています。「当社では、使用中や格納中のデータから得られる実用性の高い情報を最新のデータ アプリケーションの作成に活用できるようになりました。Microsoft R Server と自社の HDP プラットフォームおよび HDF プラットフォームを組み合わせることで、R 言語を基盤とするエンタープライズ クラスのスケーラブルなビッグ データ分析ソリューションを提供できます。インターネット上に存在する膨大な量のデータ ソースからリッチな予測分析アプリケーションを作成する場合、多くの R 開発者はこのソリューションを積極的に採用することでビジネスを変革させる価値を生み出すことができます」。

Teradata 向けの Microsoft R Server では、Teradata アプライアンス上のデータベース内で高度な分析モデルを実行するだけでデータを分析できるため、従来はデータの抽出後に分析を行っていましたが、このオーバーヘッドがなくなります。

Microsoft Data Science Virtual Machine (英語) には事前構成済みのプレインストール版 Microsoft R Server Developer Edition が含まれているため、R ユーザーはオンプレミスで完全に構成されたシステムをセットアップしなくても、クラウド上ですぐにデータの探索やモデル化を開始できます。

Microsoft R Open の概要

Revolution R Open の名称が Microsoft R Open に変更されましたが、マイクロソフトはその後も引き続きオープン ソース R プロジェクトのサポートに取り組んでおり、強化された R の無料ディストリビューションの更新を定期的にリリースしています。Microsoft R Open では、Intel Math Kernel Libraries (MKL) によるマルチスレッド プロセッサに最適化された演算能力で R のパフォーマンスが強化されていて、マトリックス指向の演算で特に大きく高速化されています。また、R パッケージのバージョン管理がシンプルになり、Windows、Mac、Linux での R による信頼性の高いアプリケーションの構築が簡単になっています。Microsoft R Open は R のすべてのスクリプトやパッケージと完全に互換性があり、R と同様にオープン ソースで、無料でダウンロード (英語)、使用、共有が可能です。

R コミュニティは R 言語の成功を握る鍵であり、これまでデータ サイエンティストや統計学者にとって重要なリソースでしたが、今や企業にとっても重要な存在となりました。Revolution Analytics の買収以降、マイクロソフトは R のユーザー グループやカンファレンスの後援を拡大するなど、コミュニティのサポートを継続しています。オープン ソース R プロジェクトへの投資も増加していて、Microsoft R Open および DeployR Open (Web サービスから R をデプロイするサーバー) の更新を定期的にリリースしており、また R パッケージのタイムマシンである checkpoint、クラスターでの並列 R プログラミングに使用する ParallelR、および R 関数を API として Azure クラウドで使用するための Azure ML など、新規または更新版の R パッケージを提供しています。さらに、マイクロソフトは R コンソーシアム (英語) に創設メンバーとして参加し、R プロジェクトをサポートすることを表明しました。

RStudio Inc. の CEO を務める JJ Allaire 氏は次のように述べています。「R コンソーシアムのフェロー メンバーとして、当社はマイクロソフトが R 言語の完全なサポートを進めていることに注目しています。製品の一流のエコシステムと R への投資を行う企業によって、R 言語は完全に大規模運用に対応するようになりました。当社はマイクロソフトと協力して、すぐにデプロイ可能で運用環境に対応した品質の高いツールとインフラストラクチャを開発し、お客様の成功を支援できることを楽しみにしています」。

Microsoft R Open の詳細については、R コミュニティのリードを務める David Smith 氏が執筆したこちらの記事 (英語) をお読みください。Microsoft R Server および Microsoft R Open の使用方法と詳細については、これから開催される Web セミナー シリーズ (英語) を聴講してください (各セミナーの日付は下記を参照)。

2016 年 1 月 28 日

Microsoft R Open の概要

David Smith

2016 年 2 月 4 日

Microsoft R Server を使用して R のスケーラビリティに関する問題を解決する

Derek Norton

2016 年 2 月 11 日

Microsoft R Server によるデータ マイニング

Derek Norton

2016 年 2 月 18 日

Hadoop で Microsoft R Server を使用する際のベスト プラクティス

Jamie Olson

2016 年 2 月 25 日

Microsoft R Server を使用して分析を運用化する

Jamie Olson

使用開始にあたって必要となるリンク先を下記にまとめました。

データ サイエンティストの分析スキルを向上させるための取り組みとして、マイクロソフトは当社の幅広く綿密なグローバル プログラムとパートナー エコシステムを活用し、R の学習に意欲的な開発者やデータ サイエンティストの教育とトレーニングを支援しています。また、データ サイエンスや機械学習の基本 (英語) などのオンライン コースも用意しています。マイクロソフトでは、オンプレミスとクラウドの両方の企業環境で役立つ、クロス プラットフォーム対応の高度な分析ツールとして R の活用に力を入れています。ぜひ皆様にもご協力いただけますと幸いです。

Joseph Sirosh
Twitter アカウントはこちら

Comments (0)

Skip to main content