Sabe em qualquer episódio da franquia CSI, quando um dos agentes olha um objeto distante em uma foto ou gravação de câmera de segurança, pede para o técnico dar um zoom que parece infinito e a imagem ainda está nítida, com detalhes como a placa de um carro ou até um rosto? Calma, isso ainda é viagem da série. Mas a Google está treinando uma de suas inteligências artificiais para fazer exatamente esse tipo de coisa.
E não tem nada de bruxaria: tudo o que ela faz é "chutar" os elementos que normalmente constam nesse tipo de foto a partir de um processo de análise. Até agora, o Google Brain consegue transformar imagens de 8x8 pixels em uma foto de 32x32 pixels, com detalhes recriados que lembram bastante o arquivo original. Veja o resultado abaixo, comparando a foto de baixa resolução (esquerda) com a tentativa da IA de recriá-la (centro) e a imagem em alta resolução original (direita).
Como funciona?
O processo acontece graças a duas redes neurais que estão em constante processo de aprendizado. A primeira delas pega a tal imagem em baixíssima resolução e quase sem detalhes e a compara com um banco de dados de fotos de altíssima resolução, mas que foram "comprimidas" para ficarem menores. Assim, ela tem uma ideia de como arquivos grandes podem ficar quando reduzidos.
A primeira coluna da esquerda é a imagem original de baixa resolução. As demais são as tentativas das redes neurais de fazer a recriação.
A segunda rede neural é a que coloca a mão na massa: ela tenta aplicar pixels adicionais à foto de baixa resolução baseada nos resultados do primeiro teste. É a partir de puro aprendizado: pixels vermelhos abaixo dos olhos provavelmente são lábios, enquanto uma forma retangular de pixels na cor preta na foto de um quarto possivelmente forma uma tela de televisão. Em resumo, a foto não é uma reconstituição ou recuperação de dados: é como se a IA fosse um artista completando um trabalho inacabado.
A foto não é uma reconstituição ou recuperação de dados: é como se a IA fosse um artista completando um trabalho inacabado
É claro que a inteligência artificial ainda está longe de ser perfeita: várias das imagens ficam deformadas e rostos humanos acabam com uma cara ainda bem borrada. Em testes bastante animadores feitos com humanos, 10% dos participantes foram enganados pelas imagens de celebridades aprimoradas via computador, acreditando serem fotos de verdade. No caso de fotos de um quarto, os erros foram de 28%.
O algoritmo utilizado é o PixelCNN, criado na Universidade de Cornell. E, se o uso dele ainda não é bom o bastante para agentes de uma unidade especial de resolução de crimes, ele já pode servir para técnicas que envolvam compressão de imagens.
Fontes
Categorias