Empresa dona do Claude destruiu milhões de livros para treinar a IA; entenda o caso

A empresa de inteligência artificial (IA) Anthropic, dona do chatbot

As obras tiveram as páginas todas retiradas da borda ou lombada do livro, cortadas para ter a dimensão correta do scanner e depois digitalizadas por um sistema que converte os arquivos PDF já com textos reconhecidos e extraídos. Ao fim do processo, todos os originais em papel foram descartados, também sem mais informações sobre o que aconteceu com o material.

Por que isso é considerado polêmico?

  • A iniciativa da Anthropic foi recebida com muitas críticas de integrantes do mercado editorial e projetos de preservação literária. Por mais que aparentemente não tenha destruído cópias raras, o descarte massivo de livros inteiros (e de imensas quantidades de papel) é uma ação controversa;
  • Parte do problema está no processo usado pela empresa, que impossibilita a reutilização ou até doação dos livros. Técnicas atuais de escaneamento já são capazes de copiar o conteúdo sem danificar a estrutura da obra, mas elas são mais lentas no processo e, por isso, não foram escolhidas;
  • O Google Livros também usa uma câmera que não danifica as obras, além de emprestar (e devolver) a maior parte do catálogo digitalizado de bibliotecas regionais;
  • A ação ainda é criticada pelo objetivo da companhia: alimentar a IA com o máximo de livros possíveis sobre os mais variados tópicos antes de regularizar essa situação, deixando para tentar resolver a questão mais tarde nos tribunais;
  • A OpenAI, dona do ChatGPT, atualmente enfrenta ações parecidas pelo mesmo motivo. Porém, ela também busca ações mais regulares na área, como em uma parceria com a Universidade de Harvard para usar o acervo digital de obras antigas da instituição;
  • Apesar de ter escapado da principal acusação, a Anthropic ainda precisará responder por baixar ilegalmente 7 milhões de livros piratas para “construir uma biblioteca de pesquisa”, em uma decisão que deve sair no fim de 2025. A Meta também encara acusações parecidas de download de obras ilegais;

Ao que tudo indica, a companhia já escapou do que seria o caso mais problemático, além de ter criado um precedente jurídico para outras empresa de IA do mercado.

 

Rolar para cima