E se nós te disséssemos que existe uma inteligência artificial que pode recriar qualquer voz existente no planeta Terra? Pois, então, ela existe. Estamos falando da ferramenta VALL-E, criada pela Microsoft, que é capaz de imitar quaisquer vozes existentes com base em apenas três segundos de alguma amostragem.
Para conquistar esse incrível resultado, a inteligência artificial foi "treinada" por 60 mil horas com dados e discursos em inglês, utilizando-se de samples de três segundos de vozes específicas para criar seus sons. Porém, o que chama ainda mais a atenção no projeto é o fato de que a VALL-E, além de copiar vozes, consegue replicar o tom e as emoções de seus alvos (inclusive, em discursos inéditos). Algo que, até então, não havia sido feito.
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
Além de recriar vozes, a IA VALL-E é capaz de copiar tons e emoções baseados em amostragens curtas.Fonte: NicolasMcComber/Getty Images
Em alguns testes, é possível notar como a IA é capaz de recriar perfeitamente determinadas vozes. Porém, em alguns outros casos, os sons ainda têm características mais robóticas. O que é normal, visto que a ferramenta foi lançada há pouco tempo e ainda deve ser ajustada ao longo de sua existência.
Além disso, é preciso levar em consideração que o recurso utiliza apenas três segundos de amostragens para funcionar. Se fossem mais segundos, a probabilidade do recurso produzir resultados ainda melhores seria maior. Mas teremos que esperar por novos testes e desenvolvimentos para saber quais caminhos a IA irá tomar.
Enquanto aguardamos por atualizações, caso você esteja curioso para ouvir a VALL-E em ação, a Universidade de Cornell criou um documento com vários testes realizados com a inteligência artificial. Você pode ouvi-los aqui: valle-demo.github.io.
Por enquanto, o produto da Microsoft não está disponível para o público geral, visto que ainda passa por alguns testes. O que não deixa de ser algo positivo, já que a tecnologia poderia, de certa maneira, ser utilizada para golpes e esquemas maliciosos, criando vozes convincentes. Nesse sentido, a empresa do Windows terá que encontrar uma maneira de tornar a VALL-E em uma ferramenta segura.
Fontes
Categorias