MADRID 1 jul. (Portaltic/EP) -
A Anthropic lançou o Sonnet 5, uma nova versão de seu modelo de Inteligência Artificial (IA) que não se destina apenas a responder às consultas diárias das pessoas, mas também ao gerenciamento de agentes de IA, com capacidades mais autônomas e a um custo menor do que outros modelos.
O novo modelo Sonnet 5 permite desde o uso de navegadores e terminais até o funcionamento autônomo, e adota a mesma nomenclatura do Fable 5, o modelo da classe Mythos da Anthropic, cuja implantação foi suspensa poucos dias após seu lançamento, há duas semanas, e que agora está novamente disponível globalmente, após a aprovação do governo dos Estados Unidos.
O laboratório de IA publicou todos os detalhes em seu site, onde destacou que “há apenas alguns meses”, oferecer um desempenho semelhante ao alcançado com este novo modelo — que se aproxima até mesmo dos modelos recentes da classe Opus — teria exigido um modelo maior e mais caro.
O Sonnet 5, em comparação com o Sonnet 4.6, apresenta uma taxa menor de comportamentos indesejáveis e, de modo geral, é mais seguro em contextos com agentes. Ele, porém, tem menor capacidade para tarefas de segurança cibernética, área em que o Fable 5, como modelo da classe Mythos, se destaca totalmente.
Nos testes de desempenho, o Sonnet 5 supera o Sonnet 4.6 em todos os testes publicados, e o avanço mais notável é observado na capacidade de conclusão de tarefas complexas de ponta a ponta, o que demonstra sua alta capacidade de autonomia, assim como no “Humanity’s Last Exam” (conhecimento especializado) e no “Terminal-Bench v2.1” (tarefas de terminal), com aumentos de 10,6 e 13,4 pontos, respectivamente, nesses dois últimos.
Ao comparar o Sonnet 5 com o Opus 4.8, esse modelo de gama média é capaz de desafiar um dos pesos pesados da Anthropic nos testes de trabalho de conhecimento agênico (AA-Briefcase e GDPval-AA) e até mesmo superá-lo. Da mesma forma, no teste de Esforço Máximo (OSWorld-Verified e BrowseComp), ao ativar o nível de raciocínio extra alto, ele se aproxima do Opus 4.8 em seu nível médio-alto.
Vale lembrar que o Opus 4.8 continua sendo superior em matemática e raciocínio puro, com uma diferença notável em relação ao Sonnet 5, assim como em segurança cibernética ofensiva, onde o próprio design do modelo limita as capacidades do Sonnet 5.
No entanto, a nova versão do Sonnet está disponível para todas as assinaturas como modelo padrão para as versões gratuita e Pro do Claude, embora tenha um custo básico de 3 dólares por milhão de “tokens” de entrada e de 15 dólares por milhão de “tokens” de saída.
Vale destacar que o Sonnet 5 utiliza um novo “tokenizador” que processa o texto de maneira diferente para tornar a IA mais inteligente. No entanto, há um porém: um mesmo texto pode ocupar entre 1 e 1,35 vezes mais “tokens”. Isso significa que pode haver um aumento de até 35% no volume de “tokens” para o mesmo “prompt”.
Esta notícia foi traduzida por um tradutor automático