MADRI 25 jun. (Portaltic/EP) -
A Anthropic poderá usar livros adquiridos legalmente para treinar seus modelos de inteligência artificial (IA) sem a necessidade de obter permissão dos autores, embora tenha que enfrentar um novo julgamento por se beneficiar de "milhões de livros piratas" baixados da Internet.
O treinamento de modelos de IA requer o uso de enormes quantidades de dados para melhorar seus resultados, o que às vezes pode levar ao uso indevido de conteúdo, principalmente da Internet, inclusive conteúdo protegido por direitos autorais.
Isso levou um grupo de escritores, liderado por Andrea Bartz, Charles Graeber e Kirk Wallace Johnson, a processar a Anthropic em agosto do ano passado, acusando-a de roubar "centenas de milhares de livros protegidos por direitos autorais" ao usar livros físicos e um conjunto de dados de código aberto chamado 'The Pile' para treinar seus modelos de IA, Claude, incluindo uma biblioteca de livros eletrônicos piratas chamada Books3.
Agora, o juiz distrital dos EUA William Alsup, do Distrito Norte da Califórnia, que ouviu o caso, determinou que o treinamento de modelos de IA com livros adquiridos legalmente, mesmo sem a permissão dos autores, constitui uso justo.
Especificamente, a Anthropic poderá usar livros adquiridos em formato físico e posteriormente digitalizados pela empresa porque isso é considerado um uso suficientemente "transformador" dessas obras e, portanto, não infringe os direitos autorais, embora seu uso deva se limitar exclusivamente ao treinamento de modelos de IA.
Isso porque, observou o juiz no documento de decisão, a tecnologia de IA da Anthropic "é uma das mais transformadoras" que muitos usuários verão em suas vidas. Ele também observou que a Lei de Direitos Autorais "busca promover trabalhos originais de autoria, não proteger autores concorrentes".
USO DE LIVROS PIRATAS
No entanto, Alsup determinou que a empresa de tecnologia também enfrentará um novo julgamento para examinar o uso de livros piratas, já que o armazenamento de cópias de livros, como os encontrados na biblioteca Books3, não é considerado uso justo.
O juiz questionou por que a Anthropic decidiu recorrer ao download de cópias originais de sites piratas quando poderia ter comprado os livros ou acessado seu conteúdo legalmente, e observou que o julgamento focado nesse comportamento será usado para determinar os danos resultantes.
A Anthropic baixou pelo menos sete milhões de livros ilegalmente, de acordo com o documento da sentença, e, conforme relatado pela Wired, a multa por esse download ilegal pode chegar a US$ 750 por livro.
Por sua vez, a Anthropic expressou sua satisfação com a decisão do tribunal, ao mesmo tempo em que esclareceu que "de acordo com o objetivo dos direitos autorais de incentivar a criatividade e o progresso científico", seus modelos foram treinados em obras literárias "não para se antecipar e replicar ou suplantá-las, mas para superar um obstáculo e criar algo diferente", como disse a porta-voz da empresa, Jennifer Martinez, ao The Verge.
Deve-se observar que a Anthropic já enfrentou uma ação judicial de grupos de editoras musicais nos EUA, incluindo Concord Music Group, Universal Music Group e ABKCO Music, que afirmaram que a empresa violou "sistemática e amplamente" os direitos autorais ao usar letras de músicas protegidas por direitos autorais para "construir e operar modelos de IA".
Nesse caso, o processo foi resolvido em favor dos grupos de editoras musicais, com a Anthropic tendo que garantir que seus modelos Claude não reproduzam letras de músicas protegidas por direitos autorais por meio de medidas de contenção em seus modelos de linguagem ampla.
Esta notícia foi traduzida por um tradutor automático