Um novo recorde foi anunciado pela Microsoft em relação ao seu sistema de reconhecimento de voz: a plataforma é capaz de entender praticamente tudo o que capta por meio de fala, errando em apenas 5,1% das vezes. O valor é mais baixo do que o atingido em 2016, que não compreendia 5,9% das informações recebidas.
Para realizar esses testes, um conjunto de registros de conversas telefônicas foi utilizado. Chamado Switchboard, essa plataforma é a mesma usada desde os anos 1990 para realizar testes padronizados em sistemas de reconhecimento de voz. A melhora apresentada em relação ao ano passado deve-se a alterações no sistema de modelos acústicos e de linguagem com base em rede neural.
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
Entendendo antes de ser dito
A Microsoft atinge um marco importante para o futuro dessa tecnologia – agora, as máquinas são capazes de nos compreender (pelo menos literalmente) tanto quanto outras pessoas
A Microsoft também fortaleceu o modelo de reconhecimento de linguagem usando um sistema que consegue prever o que vai ser dito de acordo com o contexto do diálogo, uma das características-chave que nos ajudam a entender conversas no dia a dia. Isso é feito com a análise do histórico de trocas de informações por meio da fala – e a inteligência artificial do sistema cuida do resto.
Tendo como objetivo desenvolver um sistema de compreensão de voz similar à dos humanos há praticamente 25 anos, a Microsoft atinge um marco importante para o futuro dessa tecnologia – agora, as máquinas são capazes de nos compreender (pelo menos literalmente) tanto quanto outras pessoas.
Fontes