MADRID 22 abr. (Portaltic/EP) -
Um grupo de usuários informou ter conseguido acessar de forma não autorizada o modelo Claude Mythos, que a Anthropic lançou de forma privada no âmbito de uma iniciativa de segurança cibernética chamada Projeto Glasswing.
Os usuários, que não foram identificados, são membros de um canal do Discord dedicado à busca de informações sobre modelos de inteligência artificial que ainda não foram lançados.
Segundo afirmaram à Bloomberg, eles conseguiram acessar o Mythos por meio de um terceiro e, para comprovar isso, forneceram ao veículo de comunicação mencionado capturas de tela e um vídeo nos quais supostamente se vê como eles fizeram isso.
O veículo também indica que esses usuários têm utilizado o Mythos desde o início, mas que sua intenção é experimentá-lo, não causar danos, conforme apontou a fonte.
O Claude Mythos é um modelo recentemente anunciado pela Anthropic, projetado para proteger softwares críticos, com base em sua capacidade de identificar vulnerabilidades de alta gravidade em todos os principais sistemas operacionais e navegadores da web.
No entanto, e para que essas capacidades não sejam exploradas de forma mal-intencionada, a Anthropic anunciou um lançamento em pré-visualização — ainda não publicado — no âmbito do Projeto Glasswing, que reúne empresas relevantes do setor tecnológico, como Amazon Web Services, Apple, Google, Microsoft e Nvidia, que podem utilizá-lo.
Também tem acesso o Instituto de Segurança da IA (AISI), pertencente ao Departamento de Ciência, Inovação e Tecnologia do governo do Reino Unido, que pôde testar as capacidades desse modelo por meio de avaliações controladas.
Com elas, descobriram que o Claude Mythos tem a capacidade de atacar de forma autônoma pequenas empresas que possuem proteções fracas.
Esta notícia foi traduzida por um tradutor automático