O Google desenvolveu uma ferramenta que promete identificar textos gerados por modelos Gemini. Batizada como "SynthID", a solução estará disponível para ser implementada em aplicativos de terceiros.
Construída pelo Google DeepMind, divisão do Google focada no desenvolvimento de inteligência artificial e tecnologias agregadas, o SynthID marca conteúdo gerado por IA com marcas d'água imperceptíveis por humanos, mas notadas por máquinas. Esses identificadores digitais são embutidos em imagens, áudios, texto ou vídeos sintéticos.
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
Nos outputs de texto, o SynthID se comporta como um processador de logits aplicado no fluxo de geração do modelo. Basicamente, a ferramenta estabelece um padrão detectável e secreto na geração de texto, mas sem interferir na qualidade dos resultados.
O SynthID apresenta a chance de o conteúdo ter sido gerado por modelos generativos.Fonte: Google/Reprodução
Como resultado, a detecção da marca-d'água é probabilística — isto é, apresenta a chance entre 0% e 100% de o conteúdo ser obra de IA. Na aplicação em nível de produção disponível no Hugging Face, a ferramenta apresenta três diferentes estados: marca d'água, sem marca d'água ou incerto, e os valores para cada status pode ser ajustado manualmente.
Sendo assim, o detector do Google não consegue dar 100% de certeza que um texto foi gerado por um modelo generativo, mas dizer a probabilidade daquele conteúdo ser sintético.
Detecção é limitada
Assim como outras ferramentas semelhantes, o SynthID tem suas limitações: em respostas factuais, curtas e concisas, ela tende a ser menos eficaz. Isso porque há "menos oportunidades de aumentar a geração sem diminuir a precisão", informa o Google.
Outra barreira é quando o texto gerado por IA é totalmente reescrito ou traduzido para outro idioma. Neste caso, os padrões gerados pela marca d'água podem ser perdidos.
A marca d'água em imagens é imperceptível para humanos, mas pode ser detectada por máquinas.Fonte: Google/Reprodução
"O texto do SynthID não foi projetado para impedir diretamente que adversários motivados causem mal. No entanto, pode dificultar o uso de conteúdo gerado por IA para sites maliciosos para fins diversos e pode ser combinada com outras abordagens para oferecer uma cobertura melhor em vários tipos de conteúdo e plataformas", explica a DeepMind.
Portanto, o SynthID não é infalível, então é de bom tom não confiar 100% em suas avaliações. Sendo assim, não é interessante que avaliadores de trabalhos acadêmicos, juristas e outros revisores se apoiem na ferramenta para acusar autores de plágio.
Atualmente, o SynthID está disponível no Hugging Face Transformers 4.46.0 (ou mais recente) e tem uma aplicação de referência exposta no GitHub. A documentação completa sobre a ferramenta está disponível no site oficial do Google.
Fontes
Categorias