マイクロソフト、オープンソースの深層学習フレームワーク CNTK 1.0 を GitHub で公開


[2016 年 1 月 25 日]

 

マイクロソフトはこの度、自社の研究者が人工知能の研究に使っていたツールを広く開発者向けにリリースされました。いままでベータ版が公開されていたオープンソースの Computational Network Toolkit (CNTK) と呼ばれるツールの正式版を GitHub に公開しました。これは昨年 4 月より大学研究者向けに、より限定されたオープンソースライセンスで Codeplex 上に公開していたものの正式版です。

マイクロソフトの音声認識チームは、どうすればコンピューターの音声認識精度がより向上するかについて検討している中で、開発ツールを整備する必要があることに気づきました。チームの中のボランティアがこの問題を解決し、音声認識や画像認識を行うのに必要なツールを作成しました。

この労力は功を奏し、内部のテストでは CNTK は他の 4 つの一般的な深層学習モデル構築のためのフレームワークよりもパフォーマンスが良いことが証明されました。

 

 

この手のパフォーマンス改善は、昨今急激に進化している深層学習の分野ではとても重要で、大掛かりな深層学習タスクになると完了まで何週間も計算を続ける必要があるからです。

過去数年にわたり、深層学習の分野は大きく進展しており、より多くの研究者が機械学習アルゴリズムをディープニューラルネットワーク (DNN) を使って記載し始めています。ディープニューラルネットワークは人間の脳の生理的処理に感化されて構築されたシステムで、多くの研究者が人工知能の更なる発展に深層学習が大きく寄与すると信じています。

深層学習により、研究者は会話の認識や翻訳、画像認識、質問への回答ができるシステムを構築できるようになってきました。

CNTK は GPU (Graphics Processing Unit) と呼ばれる、リアルタイム画像演算装置が積まれた強力なコンピューター上で処理を実行します。GPU はコンピューターグラフィックスの処理のために設計されていますが、研究者はこのプロセッサが音声認識/音声合成、画像認識などの領域で使われるアルゴリズムを高速に処理するのに向いていることを発見しましたからです。

CNTK は予算が限られていて 1 つのコンピューターのみで計算を行う研究者から、GPU 搭載の強力なコンピューターの巨大なクラスターを構成できる研究者まで、幅広い層のお役に立つことができます。

 

GitHub の CNTK リポジトリにアクセスする

 

 

この文章は以下の原文を要約したものです:

 

 

 

Skip to main content