MADRID 4 abr. (Portaltic/EP) -
A largura de banda vinculada aos downloads de conteúdo da Wikimedia cresceu 50% no último ano, tráfego que a fundação identifica em programas automatizados para uso no treinamento de modelos de inteligência artificial (IA).
O Wikimedia Commons hospeda um catálogo de 144 milhões de imagens, vídeos e outros arquivos de domínio público que qualquer pessoa pode usar gratuitamente, até mesmo modificar, desde que o autor seja creditado.
A demanda por esse conteúdo vem crescendo desde janeiro de 2024. A largura de banda usada para baixá-los aumentou em 50% nesse período, com picos em momentos específicos, como a eleição presidencial dos EUA e a morte do ex-presidente dos EUA Jimmy Carter.
Embora a infraestrutura do Wikimedia Commons possa lidar com picos ocasionais de demanda, ela não lida tão bem com o aumento de downloads de conteúdo, o que já levou a lentidão no serviço em algumas ocasiões.
No entanto, como a Wikimedia Foundation denunciou, por trás desse aumento estão os "bots" que coletam conteúdo da Internet para alimentar modelos de IA, como explica em seu blog oficial.
Esses "bots", além disso, apresentam um comportamento particular, pois enquanto os usuários humanos tendem a procurar conteúdo sobre tópicos específicos, "os bots de rastreamento tendem a ler um número maior de páginas e visitar as menos populares também", o que consome mais recursos, pois exige que as solicitações cheguem ao centro de dados principal e não apenas ao centro de dados mais próximo.
De fato, de acordo com a fundação, "pelo menos 65% desse tráfego vem de 'bots', uma quantidade desproporcional, considerando que o total de visualizações de página causadas por bots representa aproximadamente 35% do total".
Essa situação se traduz em mais tempo e recursos gastos para responder ao tráfego não humano e, consequentemente, em custos mais altos para uso e manutenção da infraestrutura.
A Wikimedia Foundation, portanto, chamou a atenção para o fato de que seu conteúdo é gratuito, mas sua infraestrutura não é, e informou que está trabalhando para resolver as questões levantadas pela situação.
Esta notícia foi traduzida por um tradutor automático