Cerca de 245 organizações de media em vários países estão a tentar limitar o acesso de ferramentas de inteligência artificial a arquivos da Internet, como a Wayback Machine, do Internet Archive.
O objetivo é impedir que empresas de IA utilizem grandes volumes de conteúdos noticiosos arquivados para treinar modelos de linguagem sem autorização ou compensação financeira, o que pode configurar violação de direitos de autor.
Estes arquivos incluem milhões de artigos históricos de órgãos como o The New York Times, CNN e The Guardian, usados frequentemente como base de dados para treino de sistemas de IA.
As empresas de media defendem que o seu trabalho jornalístico exige investimento significativo e não deve ser reutilizado sem consentimento. Algumas já avançaram com processos contra empresas de IA, alegando uso indevido de conteúdos.
O Internet Archive, por sua vez, afirma que os bloqueios prejudicam também a preservação digital da informação, defendendo que o problema está no uso indevido por parte das empresas de IA e não no arquivo em si.
A disputa reflete o crescente conflito entre proteção de propriedade intelectual e o desenvolvimento acelerado da inteligência artificial.