O concurso de reconhecimento de imagem feito pela ImageNet é um dos principais eventos em que podemos ver as gigantes competindo diretamente para saber quem é a melhor nessa área, com nomes como Google, Intel, Qualcomm e Tencent participando. Quem esperava que uma dessas gigantes levasse a melhor se enganou, no entanto: a primeira posição do sexto concurso anual ficou para a Microsoft.
Segundo um anúncio feito no blog da empresa, a gigante de Redmond ficou em primeiro lugar em diversas categorias dos testes. Tudo isso se deve a uma tecnologia da empresa, chamada “Deep Residual Learning for Image Recognition” (“Aprendizado Residual Profundo para o Reconhecimento de Imagem”, em português), que venceu suas concorrentes por ser muito mais complexa.
A ideia por trás dessa tecnologia é combinar um aprendizado residual com uma rede neural incrivelmente densa – mais exatamente com 150 camadas, de acordo com a equipe do projeto. Embora normalmente uma maior profundidade de aprendizado não tenha efeitos significativos para outras inteligências artificiais, os pesquisadores afirmam ter encontrado uma maneira de contornar isso, otimizando o ganho de precisão através do treino da IA.
Primeiro colocado distante
Vale notar que essa é a primeira vez que a Microsoft conquista a dianteira no teste: a Google, a startup Clarifai e a NEC haviam ficado à frente dela nos anos anteriores. Para participar da competição da ImageNet, as empresas devem usar suas tecnologias para localizar e classificar 100 mil fotos de sites como o Flickr, bem como de outros motores de busca, em mil categorias diferentes; quanto menor o número de erros, melhor.
A Microsoft, por sua vez, ganhou com uma pontuação exemplar. A taxa de erros de classificação da tecnologia que ela apresentou foi de apenas 3,5%, enquanto a taxa de erros de localização foi de 9%. Como se não fosse suficiente, o software ainda ficou em primeiro lugar em outra competição da ImageNet – essa focada na detecção de objetos. Definitivamente, são ótimas notícias para mostrar que a Microsoft é um oponente de peso nessa área.
O que você acha das tecnologias de reconhecimento de imagem da Microsoft? Comente no Fórum do TecMundo
Fontes