A Anthropic pede desculpas por ter restringido secretamente o Fable 5 para desenvolver novos modelos de IA, mas mantém as medidas

Archivo - Arquivo – (Foto de arquivo) (Foto de arquivo) 1º de outubro de 2025, Java Ocidental, Indonésia: Nesta ilustração fotográfica

CONTACTO VÍA EUROPA PRESS - Arquivo

MADRID 11 jun. (Portaltic/EP) -

A Anthropic pediu desculpas por ter limitado secretamente as capacidades de seu novo modelo Claude Fable 5, como parte de uma política de salvaguardas que visava impedir que adversários estrangeiros utilizassem o modelo avançado para desenvolver seus próprios modelos de IA, o que impediu que outros desenvolvedores do setor pudessem utilizá-lo em seus projetos de pesquisa.

A empresa lançou o Claude Fable 5 nesta quarta-feira como o primeiro modelo da classe Mythos disponível ao público em geral, embora tenha sido disponibilizado com algumas medidas de segurança destinadas a evitar possíveis usos maliciosos e apenas para as organizações que fazem parte do Project Glasswing.

Essas medidas de segurança incluem questões como limitar os resultados a perguntas relacionadas à segurança cibernética, biologia ou química e, em vez disso, redirecionar essas consultas para um modelo de IA menos capaz. Dessa forma, o modelo continua oferecendo informações relacionadas, mas evita compartilhar dados relevantes que possam ser usados para, por exemplo, executar um ataque cibernético ou desenvolver uma arma biológica.

No entanto, essas não foram as únicas salvaguardas introduzidas no Fable 5. Conforme relatado pela WIRED, a Anthropic também limitou as capacidades do modelo para outras solicitações sem indicar isso claramente, incluindo tarefas como treinar modelos de lógica descritiva (LLM), realizar depuração de código de IA ou otimizar a arquitetura neural.

Isso foi confirmado pelas reclamações de alguns pesquisadores coletadas pela publicação citada, que denunciaram que as limitações não foram implementadas com transparência, mas sim ativadas automaticamente sem informar os usuários, prejudicando seus projetos de IA.

Agora, a Anthropic divulgou um pedido de desculpas por esse comportamento opaco e sinalizou que todas as salvaguardas do Claude Fable 5 serão totalmente visíveis para os usuários no dia a dia.

“Vamos alterar as salvaguardas do Fable 5 para torná-las visíveis”, declarou a empresa em declarações à WIRED, ao mesmo tempo em que admitiu ter feito “a troca errada” e que lamenta não ter encontrado o “equilíbrio adequado”.

Portanto, a Anthropic deixou claro que, se seus sistemas perceberem que o usuário está tentando usar o Fable 5 para desenvolver outro modelo de IA altamente capaz, notificará que rejeita a solicitação ou transferirá a questão para um modelo menos capaz.

Vale ressaltar que a empresa de tecnologia especifica em seus termos de uso que é totalmente proibido utilizar o Claude para treinar e desenvolver outros modelos de IA. Levando isso em conta, a empresa esclareceu que implementou essas salvaguardas para impedir que adversários estrangeiros utilizassem seus modelos mais avançados “de maneiras que representassem um grave risco à segurança”.

Essa abordagem já foi compartilhada em outras ocasiões, como quando, em fevereiro, acusou empresas chinesas como a DeepSeek ou a Moonshot de realizar ataques de destilação para abusar de seu modelo Claude, com o objetivo de aproveitar-se de suas capacidades e aprimorar seus próprios modelos.

Apesar de tudo isso, a comunidade de pesquisadores destacou que, ao restringir suas ferramentas mais avançadas para pesquisar e desenvolver tecnologia de IA, a Anthropic limita o acesso a essa tecnologia a um grupo restrito de pessoas ou, inclusive, à própria empresa de IA, o que poderia resultar em uma redução no desempenho da pesquisa global.

Esta notícia foi traduzida por um tradutor automático

A Anthropic pede desculpas por ter restringido secretamente o Fable 5 para desenvolver novos modelos de IA, mas mantém as medidas

Contenido patrocinado