A Meta apresentou a Emu Video, a evolução da sua inteligência artificial (IA) generativa Emu capaz de gerar vídeos com base em descrição em texto. A ferramenta consegue criar clipes curtos em baixa resolução em questão de segundos.
O Emu Video é como um gerador de imagens. A ferramenta interpreta a descrição do usuário, processa a solicitação na base de dados e devolve um vídeo de quatro segundos na resolução 512 x 512 em 16 quadros por segundo.
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
"Esta é uma arquitetura unificada para tarefas de geração de vídeo que pode responder a uma variedade de entradas: somente texto, somente imagem e texto e imagem. Dividimos o processo em duas etapas: primeiro, gerar as imagens condicionadas a um prompt de texto e, em seguida, gerar um vídeo condicionado tanto ao texto quanto à imagem gerada", explica a Meta.
De acordo com a Meta, essa abordagem "dividida" permite treinar modelos generativos com mais eficiência. Os resultados são mais convincentes do que a IA geradora de vídeos desenvolvida anteriormente, a Make-A-Video.
Para editar o conteúdo, a Meta lançou o Emu Edit. Esse outro modelo generativo permite descrever modificações ao clipe gerado pelo Emu Video. O usuário pode usá-lo para adicionar ou remover elementos de uma cena, alterar a velocidade do clipe, mudar a ambientação e muito mais.
Os resultados são tão impressionantes quanto os do vídeo original, mas agora ainda mais fieis às solicitações do usuário. "Ao contrário de muitos modelos generativos de IA atuais, o Emu Edit segue instruções com precisão, garantindo que os pixels na imagem de entrada não relacionados às instruções permaneçam intactos", descreve a Meta.
Apenas para pesquisa
O Emu Video e o Emu Edit são avanços importantes no desenvolvimento de IAs generativas, mas ainda não estão disponíveis para o público. Por enquanto, o projeto é destinado exclusivamente para pesquisa, mas a Meta percebe que "os casos de uso em potencial são claramente evidentes".
A Meta reconhece que as novas ferramentas não substituem artistas, animadores e profissionais da área, mas são tecnologias que podem facilitar seu trabalho.
Fontes
Categorias