Google lança Whisk, IA que faz 'remix' de fotos e cria imagens novas

2 min de leitura
Imagem de: Google lança Whisk, IA que faz 'remix' de fotos e cria imagens novas

A Google apresentou nesta segunda-feira (16) atualizações nas plataformas de inteligência artificial (IA) da companhia que lidam com fotos e vídeos. Além disso, a empresa revelou um novo experimento para você criar ilustrações divertidas que usa o mínimo de texto possível.

O serviço se chama Whisk, um site em que você pode criar imagens inéditas com base em fotos já salvas na sua galeria do PC ou celular — o que a Google chama de "remixar" conteúdos.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

A ideia da empresa é fornecer criações praticamente automáticas, abrindo espaço para que você use descrições em texto só quando necessário ou para obter resultados mais precisos.

O Whisk funciona com base em três etapas. Primeiro, você escolhe qual é o item principal da imagem, como uma pessoa ou objeto. Em seguida, é hora de selecionar o cenário, como uma paisagem ou um fundo monocromático.

A última fase envolve definir o estilo da criação — como pintura surrealista, estética de ficção científica ou filme de animação, entre muitas outras possibilidades.

Um exemplo de criação de imagem inédita com seleção de fotos no Whisk. (Imagem: Nilton Kleina/TecMundo)
Um exemplo de criação de imagem inédita com seleção de fotos no Whisk. (Imagem: Nilton Kleina/TecMundo)

O Whisk por enquanto se encontra em fase experimental e na versão Alpha, o que significa que os resultados ainda não são tão preciso e mensagens de erro ainda são comuns. É provável que a ferramenta não fique muito tempo no ar, já que ela é tida como um experimento da Google e pode ser incorporada no futuro em serviços já existentes, como o Gemini.

Para acessar o Whisk, basta clicar aqui. No momento, o serviço não está disponível no Brasil, mas é possível acessá-lo a partir de uma rede virtual privada (VPN).

Mais novidades da Google em IA

Além do Whisk, a Google ainda detalhou atualizações em dois serviços de IA da empresa que lidam com materiais visuais. Eles foram aprimorados para trazer resultados mais complexos e precisos, além de entender comandos mais precisos e cheios de referências.

Uma das evoluções é o Veo 2, nova geração do modelo de linguagem generativo de vídeos da empresa. Rival de serviços como o Sora, ele "entende a Física do mundo real e nuances humanas de expressão e movimento" para criar uma cena curta do zero. É possível até pedir características técnicas específicas usando linguagem profissional da cinematografia, como enquadramento e tipo de lente.

Esse modelo de IA generativa funciona de forma experimental no VideoFX, um recurso ainda em fase de testes e disponível para uma quantidade limitada de usuários.

Exemplos de figuras criadas pelas IAs da empresa. (Imagem: Google/Divulgação)
Exemplos de figuras criadas pelas IAs da empresa. (Imagem: Google/Divulgação)

Por fim, a Google também melhorou a geração de imagens estáticas a partir do modelo de linguagem Imagen 3. Ele agora renderiza figuras de mais estilos artísticos, com riqueza de detalhes e menos alucinações. Ele também funciona de forma experimental a partir do VideoFX.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.