
Sol Sertão Online
Colunista
O Internet Archive, organização sem fins lucrativos sediada em São Francisco que preserva a memória digital da humanidade há três décadas, enfrenta hoje uma grave crise existencial. A plataforma Wayback Machine, que armazena mais de um bilhão de sites, vem sendo sistematicamente bloqueada por grandes empresas de comunicação.
O motivo central do bloqueio é a ascensão da Inteligência Artificial (IA). Grandes veículos de imprensa temem que empresas como OpenAI e Google utilizem seus conteúdos arquivados para treinar modelos de linguagem sem a devida autorização ou compensação financeira. Dados indicam que robôs de IA realizam milhares de requisições por segundo, chegando a sobrecarregar os servidores da organização.
Um levantamento da Nieman Foundation for Journalism, da Universidade de Harvard, aponta que ao menos 241 portais de notícias em nove países já bloquearam a ferramenta. Entre eles, nomes de peso como The New York Times, The Guardian, Le Monde e USA Today.
A contradição é evidente: muitos desses jornais utilizam a Wayback Machine para apurações jornalísticas. Recentemente, o USA Today usou o arquivo para expor a ocultação de dados do ICE (polícia de imigração dos EUA), enquanto, simultaneamente, proibia o acesso da plataforma aos seus próprios artigos.
Especialistas e defensores dos direitos digitais, como a Electronic Frontier Foundation (EFF), comparam a atitude dos jornais ao ato de proibir que bibliotecas guardem cópias de periódicos. Martin Fehrensen, especialista em mídia, sugere que a solução passa por um diálogo técnico para separar a função de arquivamento do treinamento de IA, defendendo que a preservação da web seja tratada como infraestrutura pública.
Esta não é a primeira batalha do Internet Archive. Em 2024, a entidade sofreu um ataque hacker que expôs 31 milhões de contas e perdeu um processo judicial contra editoras devido a um programa de empréstimo de e-books, resultando na remoção de 500 mil títulos.
No entanto, o bloqueio atual é visto como mais grave por ser estrutural. Diferente de decisões judiciais, a recusa corporativa de permitir o arquivamento mina a essência da Wayback Machine, comprometendo a capacidade da sociedade de acessar a documentação completa da internet pública.
Referência: Informações adaptadas de G1.
Carregando autenticação...
Carregando comentários...