Youtuber processa OpenAI por uso de vídeos para treinar ChatGPT

Segundo o criador, a startup tem obtido lucro significativo ao usar conteúdos de terceiros sem autorização

André Luiz Dias Gonçalves

schedule05/08/2024, às 14:45

Fonte: Getty Images/Reprodução

Imagem de Youtuber processa OpenAI por uso de vídeos para treinar ChatGPT no tecmundo

A OpenAI está sendo processada por supostamente usar milhões de transcrições de vídeos do YouTube para treinar seus modelos de inteligência artificial generativa sem autorização dos proprietários dos conteúdos. A ação coletiva foi aberta pelo youtuber David Millette no Tribunal Distrital dos Estados Unidos, na sexta-feira (2).

Conforme o usuário do YouTube, a dona do ChatGPT transcreveu os conteúdos postados em seu canal e aproveitou o material no treinamento do chatbot sem qualquer consentimento dado por ele. O mesmo teria acontecido com diversos outros criadores.

smart_display

Nossos vídeos em destaque

Leia também: Apple, Nvidia e outras usaram vídeos do YouTube para treinar IAs sem permissão

Os materiais de canais do YouTube teriam sido coletados sem nenhuma solicitação aos proprietários, segundo a ação.

Millette alega, ainda, que a startup “lucrou significativamente” com os conteúdos dos criadores que, por sua vez, não receberam nada em troca. O processo também cita a violação à lei de direitos autorais e a política do YouTube, que proíbe esse tipo de prática quando não há autorização do proprietário.

Desenvolvedoras podem ficar sem dados para treinamentos

O uso não autorizado de conteúdos de terceiros para o treinamento de IAs generativas tem preocupado os proprietários dos materiais. Para se proteger da prática, muitos sites estão começando a bloquear o rastreador web da OpenAI, dificultando a coleta das informações para alimentar a tecnologia.

Uma pesquisa divulgada recentemente pela Originality AI aponta que 35% dos 1 mil principais sites do mundo já bloquearam a desenvolvedora e outras empresas do segmento. Com isso, elas podem ficar sem uma boa parcela das fontes de alta qualidade usadas no processo em breve.

Saiba mais: Sony Music proíbe uso de seu catálogo para treinamento de IAs

Caso a tendência atual de bloqueio de acesso de rastreadores continue é possível que as empresas de IA fiquem sem dados para alimentar seus bots inteligentes entre 2026 e 2032, como prevê um estudo feito pela Data Provenance Initiative do Instituto de Tecnologia de Massachusetts (MIT).