音声認識技術の歴史~約 50 年にわたる歩み


1971: アメリカ国防高等研究計画局 (DARPA) が最初の音声認識プロジェクトに取り掛かる。

1975: 後で隠れマルコフモデルとして知られる技術が提案される。IBM が音声認識の研究を始める。

1978: Texas Instruments が Speak & Spell をリリース。

1982: 混合ガウスモデルが音声認識で利用され始める。

1986: 研究者がニューラルネットワークの実験を開始。

1994: Dragon Naturally Speaking (ドラゴンスピーチ) と IBM Via Voice が登場。

1995: マイクロソフトが Windows 95 に最初のスピーチツールを提供。

1996: SRI International が双方向のボイス応答ソフトウェアを提供。

2001: マイクロソフトが SAPI 5.0 で Windows XP と Office XP に音声認識を提供。

2007: マイクロソフトが Live Search (現 Bing) にモバイルボイス検索をリリース。

2010: マイクロソフトが Kinect for Xbox を提供開始。

2011: アップルが iPhone で Siri を提供開始。

2012: マイクロソフトが深層学習でブレークスルー。Google Now が登場。

2014: マイクロソフトがパーソナルアシスタント「コルタナ」を提供開始。

2015: マイクロソフトが Skype Translator をドイツ語、中国語などの多言語展開。

 

 

この文章は以下の記事の内容を再構成したものです:

 

 

 

Skip to main content