Reconhecimento de voz da Microsoft tem menor margem de erro já alcançada

22/08/2017 às 17:00

1 min de leitura

Um novo recorde foi anunciado pela Microsoft em relação ao seu sistema de reconhecimento de voz: a plataforma é capaz de entender praticamente tudo o que capta por meio de fala, errando em apenas 5,1% das vezes. O valor é mais baixo do que o atingido em 2016, que não compreendia 5,9% das informações recebidas.

Para realizar esses testes, um conjunto de registros de conversas telefônicas foi utilizado. Chamado Switchboard, essa plataforma é a mesma usada desde os anos 1990 para realizar testes padronizados em sistemas de reconhecimento de voz. A melhora apresentada em relação ao ano passado deve-se a alterações no sistema de modelos acústicos e de linguagem com base em rede neural.

Entendendo antes de ser dito

A Microsoft atinge um marco importante para o futuro dessa tecnologia – agora, as máquinas são capazes de nos compreender (pelo menos literalmente) tanto quanto outras pessoas

A Microsoft também fortaleceu o modelo de reconhecimento de linguagem usando um sistema que consegue prever o que vai ser dito de acordo com o contexto do diálogo, uma das características-chave que nos ajudam a entender conversas no dia a dia. Isso é feito com a análise do histórico de trocas de informações por meio da fala – e a inteligência artificial do sistema cuida do resto.

Tendo como objetivo desenvolver um sistema de compreensão de voz similar à dos humanos há praticamente 25 anos, a Microsoft atinge um marco importante para o futuro dessa tecnologia – agora, as máquinas são capazes de nos compreender (pelo menos literalmente) tanto quanto outras pessoas.