Meta apresenta Emu Video, IA capaz de gerar vídeos a partir de texto

1 min de leitura
Imagem de: Meta apresenta Emu Video, IA capaz de gerar vídeos a partir de texto
Imagem: Meta
Conteúdo oferecido por

A Meta apresentou a Emu Video, a evolução da sua inteligência artificial (IA) generativa Emu capaz de gerar vídeos com base em descrição em texto. A ferramenta consegue criar clipes curtos em baixa resolução em questão de segundos.

O Emu Video é como um gerador de imagens. A ferramenta interpreta a descrição do usuário, processa a solicitação na base de dados e devolve um vídeo de quatro segundos na resolução 512 x 512 em 16 quadros por segundo.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

"Esta é uma arquitetura unificada para tarefas de geração de vídeo que pode responder a uma variedade de entradas: somente texto, somente imagem e texto e imagem. Dividimos o processo em duas etapas: primeiro, gerar as imagens condicionadas a um prompt de texto e, em seguida, gerar um vídeo condicionado tanto ao texto quanto à imagem gerada", explica a Meta.

De acordo com a Meta, essa abordagem "dividida" permite treinar modelos generativos com mais eficiência.  Os resultados são mais convincentes do que a IA geradora de vídeos desenvolvida anteriormente, a Make-A-Video.

Para editar o conteúdo, a Meta lançou o Emu Edit. Esse outro modelo generativo permite descrever modificações ao clipe gerado pelo Emu Video. O usuário pode usá-lo para adicionar ou remover elementos de uma cena, alterar a velocidade do clipe, mudar a ambientação e muito mais.

Os resultados são tão impressionantes quanto os do vídeo original, mas agora ainda mais fieis às solicitações do usuário. "Ao contrário de muitos modelos generativos de IA atuais, o Emu Edit segue instruções com precisão, garantindo que os pixels na imagem de entrada não relacionados às instruções permaneçam intactos", descreve a Meta.

Apenas para pesquisa

O Emu Video e o Emu Edit são avanços importantes no desenvolvimento de IAs generativas, mas ainda não estão disponíveis para o público. Por enquanto, o projeto é destinado exclusivamente para pesquisa, mas a Meta percebe que "os casos de uso em potencial são claramente evidentes".

A Meta reconhece que as novas ferramentas não substituem artistas, animadores e profissionais da área, mas são tecnologias que podem facilitar seu trabalho.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.