Uma ferramenta baseada em inteligência artificial (IA), capaz de transformar qualquer texto em imagem é a mais nova criação da Google. Apresentada na segunda-feira (23), a tecnologia ainda não tem previsão de ser lançada para o público, pois precisa de alguns aprimoramentos, mas já tem chamado a atenção de especialistas.
Batizada de “Imagen”, a ferramenta funciona de forma semelhante ao DALL-E, programa que gera imagens a partir de textos desenvolvido pela OpenAI. De modo bem simples, basta abrir o software e digitar uma descrição aleatória que vier à sua cabeça, como “dois robôs sentados em uma mesa com a torre Eiffel ao fundo”, por exemplo, e aguardar a mágica ser feita.
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
A IA da plataforma pode se basear em uma série de estilos para gerar a imagem, como pinturas a óleo, fotografias e renderizações em CGI. Em alguns casos, o resultado não é o esperado pelo usuário, com a cena desenhada pelo robô da gigante das buscas aparecendo inacabada, borrada ou manchada, mas em outros a ilustração é bastante realista.
Foto gerada pelo novo conversor de texto em imagem da Google.Fonte: Google/Divulgação
Uma equipe de avaliadores humanos contratada pela companhia de Mountain View analisou as fotografias geradas pela tecnologia Imagen, comparando-as com ilustrações criadas por softwares concorrentes. Para alguns deles, o sistema da Google entregou resultados superiores aos do DALL-E, que é desenvolvido há mais tempo.
Problemas encontrados
Embora tenha se mostrado capaz de gerar fotos mais próximas da realidade, o programa da Google que cria imagens a partir de textos possui algumas limitações e problemas. Sem revelar maiores detalhes, a big tech afirmou que a IA também codifica preconceitos sociais, muitas vezes se mostrando racista, sexista ou tóxica de alguma outra forma.
A IA apresentou resultados surpreendentes.Fonte: Google/Divulgação
Como lembra o The Verge, o problema pode estar nos dados da web utilizados para o treinamento do algoritmo, provavelmente sem qualquer tipo de curadoria, incluindo aqueles que refletem estereótipos sociais e associações depreciativas a determinados grupos marginalizados. Isso fez com que a ferramenta aprendesse e replicasse alguns tipos de comportamentos encontrados no meio online.
Apenas imagens de animais, comidas e objetos foram mostradas pela empresa de Mountain View.Fonte: Google/Divulgação
A própria empresa reconheceu que o programa pode priorizar a "geração de imagens de pessoas com tons de pele mais claros e uma tendência para imagens retratando diferentes profissões para se alinhar com os estereótipos de gênero ocidentais". Curiosamente, as fotos de pessoas geradas pelo mecanismo não foram divulgadas pelo Google.
Mais imagens criadas automaticamente pela tecnologia.Fonte: Google/Divulgação
Por conta desses problemas, a tecnologia ainda necessita de alguns aprimoramentos e testes antes de ser liberada para os usuários em geral, disponibilidade que também não foi confirmada pela gigante da tecnologia.
Categorias