Conseguir imagens nítidas em situações desfavoráveis ou no caso daquele deslize quando você tirou a foto da galera toda fora de foco tem ficado mais fácil. A inteligência artificial (IA) e o aprendizado de máquina têm ajudado muito a superar essas barreiras e agora dois novos sistemas da gigante digital chinesa Tencent vêm para acelerar o avanço nesse setor.
Tencent diz que sua solução é mais rápida e poderosa, além de ser mais fácil de treinar, do que as IA dos concorrentes
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
A primeira frente é uma ferramenta que pode “corrigir” imagens desfocadas. De acordo com a companhia sua “Scale-recurrent Network for Deep Image Deblurring” é mais eficiente que as outras opções do mercado. “Comparado com as muitas abordagens baseadas em aprendizado recentes, o sistema possui uma estrutura de rede mais simples, um número menor de parâmetros e é mais fácil de treinar. Nós avaliamos nosso método em conjuntos de dados de grande escala com movimentos complexos. Os resultados mostram que o nosso método pode produzir resultados de melhor qualidade do que as soluções mais avançadas atualmente, quantitativa e qualitativamente”, explicam, na documentação do projeto.
Para ilustrar isso, a Tencent liberou imagens para comparação. Abaixo, são duas amostras, com quatro exemplos cada. A primeira coluna exibe o material original, seguido de duas com soluções de “un-blur” de outras companhias. A última é a da Tencent, que claramente leva vantagem. Confira:
“Editor de rostos” permite “envelhecer” fotos
O outro sistema de IA para o qual a Tencent vem se dedicando é um “editor de rostos”, mais complexo, que pode adicionar, remover e modificar as características de uma pessoa em uma foto. Isso já pode ser feito automaticamente e em apps que convertem conteúdo a partir de um esquema de aprendizagem profunda, a partir de grandes quantidades de dados.
A diferença desta novidade é que ela usa aplicações de codificação e decodificação compacta e local e não se trata de uma opção aberta para que terceiros desenvolvam diferentes finalidades. É uma solução completa para o consumidor final e que pode facilmente figurar em futuras câmeras e softwares muito em breve.
Como dá para notar nos exemplos abaixo, o programa ainda não está completo, mas é possível enxergar seu potencial:
Ambas as iniciativas já foram devidamente documentadas e devem ser apresentadas oficialmente na Conferência sobre Visão Computacional e Reconhecimento de Padrões 2018, que acontece entre os dias 18 e 22 de junho, em Salt Lake City, nos Estados Unidos.
Fontes
Categorias