Estudo afirma que reconhecimento de voz da Microsoft agora é tão preciso quanto humanos

 

Um estudo feito pelo time de engenheiros da Microsoft aponta que o sistema de reconhecimento de voz da desenvolvedora evoluiu tanto que se tornou parecido com o de seres humanos. Para chegar a esta conclusão, a pesquisa analisou dados de sistemas de transcrição da própria Microsoft que são feitas por pessoas e comparou a taxa de erros com as obtidas pela tecnologia, quando aplicados aos mesmos testes.

Microsoft lança build 14931 do Windows 10 com SMS no Skype.Este processo é feito em duas etapas: uma pessoa escutando e escrevendo o áudio e outra repetindo o processo apenas buscando erros no primeiro relatório.
Melhoras na tecnologia garantem que assistentes como a Cortana possam se comunicar melhor com usuários . O sistema foi submetido a um teste de transcrição chamado NIST 2000 CTS, que resulta em pequenas sentenças ou fragmentos de sentenças. As mesmas condições foram aplicadas à tecnologia de reconhecimento de voz e ambas resultaram em taxas que variam entre 5% e 11%.

Esta é a primeira vez que uma tecnologia atinge níveis de paridade com humanos. “A chave para a nossa performance é o uso sistemático de redes neurais, combinados com métodos de detecção espacial e treinamento acústico”, afirma o estudo realizado pelos engenheiros.

As redes neurais são usadas para armazenar grandes quantidades de dados que ajudam os sistemas a reconhecer padrões. Além disso, há sons e imagens para treinar a rede a melhorar a eficiência do armazenamento de dados.

Historicamente, o processo de reconhecimento tem melhorado, mas ainda está longe da perfeição. Segundo a equipe, o objetivo é garantir que o reconhecimento de fala funcione melhor em situações cotidianas, que são influenciadas por fatores externos como ruído de restaurantes, ruas lotadas e ventos fortes.

A longo prazo, a expectativa é que os sistemas de reconhecimento de voz ajudem a melhorar o funcionamento de aplicativos como a Cortana ou dispositivos como o Xbox e o sistema operacional Windows.