O Wayback Machine, parte do archive.org, está sob pressão crescente devido a bloqueios de acesso impostos por veículos de imprensa. A plataforma, que arquiva bilhões de sites, é crucial para jornalistas, pesquisadores e historiadores acessarem conteúdo alterado ou removido. De acordo com informações do G1, bloqueios recentes por mais de duzentos portais, incluindo grandes nomes como The Guardian e New York Times, ameaçam sua operação.
A principal preocupação dos veículos de imprensa é que empresas de inteligência artificial utilizem os conteúdos arquivados sem autorização ou pagamento para treinar modelos de linguagem. Essa questão foi levantada pelo porta-voz do New York Times, que mencionou infração de direitos autorais por parte dessas empresas.
Por que as empresas de mídia estão bloqueando o Wayback Machine?
O bloqueio do Wayback Machine por veículos de imprensa se deve ao uso não autorizado de conteúdos por empresas de IA. A plataforma archive.org foi alvo de várias tentativas de aquisição de dados por robôs, sobrecarregando seus servidores, conforme relatado pelo diretor Mark Graham à Wired.
Essa situação levanta preocupações sobre a preservação digital da história da internet. A perda de artigos online, fusões empresariais e cortes de custos já comprometeram a memória digital. Mais de cem jornalistas manifestaram apoio ao Wayback Machine, destacando sua importância para a preservação da história recente.
Como o Internet Archive pode resolver esse impasse?
Segundo o jornalista Martin Fehrensen, existem soluções possíveis como criar um status jurídico especial para arquivos da web e tratar o arquivamento como uma infraestrutura pública. Fehrensen destacou que uma clara separação técnica entre arquivamento e treinamento de IA pode solucionar parte do problema.
O Internet Archive também enfrentou outros desafios no passado, como um ataque hacker em 2024 e um processo de direitos autorais que forçou a retirada de mais de 500 mil livros de sua plataforma. Contudo, a atual situação é vista como uma ameaça estrutural mais grave devido à sua natureza corporativa.