Cientistas da Universidade de Stanford, do Instituto Max Planck de Informática, da Universidade de Princeton e da Adobe Research demonstraram como a técnica de deepfake tem se tornando cada vez mais acessível e convincente. Ela consiste na utilização de softwares baseados no aprendizado de máquina, com o objetivo de alterar o discurso de um falante em determinado vídeo, apenas a partir da edição de sua transcrição de texto.
Os pesquisadores realizaram um estudo com a presença de 138 voluntários. Nos testes em que os vídeos falsos foram exibidos, cerca de 60% apontaram haver edições; já em relação às versões originais dos vídeos, apenas 80% afirmaram que eles eram legítimos. Embora o resultado pareça ser meio controverso, o fato de os participantes saberem que se tratava de uma pesquisa sobre edição de vídeos pode ter influenciado as respostas.
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
Como as falsificações são criadas?
A técnica só funciona bem em vídeos que tenham foco em um falante e exige ao menos 40 minutos de dados de entrada, que é a base do treinamento da inteligência artificial do software utilizado. Para melhores resultados, é importante que o discurso fake não seja muito diferente do original.
Os vídeos de base passam por algumas etapas até as falsificações serem criadas. Eles são escaneados para a captação de fonemas e do modelo 3D da parte inferior do rosto dos falantes. Depois, os fonemas são combinados com as expressões faciais de cada som.
Ao alterar a transcrição do texto do vídeo, o programa combina todos os dados coletados para gerar novas imagens, na quais o falante produz os movimentos de acordo com os fonemas e sons exigidos pelo texto inserido. Então o processo é "colado" em cima do vídeo de origem para obter o resultado final.
No exemplo abaixo, o ator Bill Hader teve seu rosto trocado pelo rosto de Arnold Schwarzenegger.
Benefícios vs. malefícios
Os pesquisadores sugeriram que a técnica poderá trazer algumas vantagens: estúdios de cinema, por exemplo, poderiam consertar falas equivocadas sem a necessidade de regravar as cenas. No entanto, se as fake news em texto já causam enormes estragos, que são notícias que podem ser facilmente desmascaradas, pode-se imaginar o impacto negativo que vídeos fake poderiam gerar na sociedade se fossem, obviamente, usados com más intenções. Felizmente, no momento, eles estão sendo usados apenas em brincadeiras.
Fontes
Categorias