O Google apresentou um novo método para análise e detecção de spam e phishing no Gmail recentemente. Chamado RETVec (Resilient & Efficient Text Vectorizer), o mecanismo é mais resistente a manipulação de caracteres comuns nesse tipo de golpe.
O RETVec é uma solução contra mensagens que usam homóglifos (caracteres muito parecidos), caracteres invisíveis ou outras manipulações de conteúdo para contornar os detectores do Gmail. Segundo o Google, ele melhorou a taxa de detecção de spam em 38%, reduzindo a ocorrência de falsos positivos em 19,4%.
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
Google Testes conduzidos internamente mostraram que o RETVec aprimorou a detecção de spam em 38% e reduziu a ocorrência de falsos positivos em 19,4%Fonte: Google
A estratégia também é mais econômica. Os testes do Google revelaram que o modelo reduz o consumo de TPU (núcleos do Google dedicados a operações com inteligência artificial) em 83%.
"O RETVec alcança essas melhorias apresentando um modelo de incorporação de palavras muito leve (cerca de 200 mil parâmetros), nos permitindo reduzir o tamanho do modelo Transformer com desempenho igual ou melhor e tendo a capacidade de dividir a computação entre o host e a TPU em uma rede de forma mais eficiente para a memória", explicou o Google.
Segundo o Google, o modelo é capaz de suportar todos os idiomas e caracteres UTF-8 sem pré-processamento do texto. Assim, o mecanismo fica otimizado para uso em dispositivos móveis e na web.
Todo o código do projeto foi exposto pelo Google Research no GitHub, permitindo que a comunidade avalie a iniciativa em detalhes. Além disso, desenvolvedores também podem aproveitar o mecanismo e implementá-lo em sistemas próprios.
Fontes