Publicado 25/02/2025 06:22

A Anthropic apresenta o Claude 3.7 Sonnet, seu primeiro modelo de raciocínio híbrido com aprimoramentos em codificação e matemática.

O novo modelo Anthropic Claude 3.7 Sonnet.
ANTHROPIC

MADRI 25 fev. (Portaltic/EP) -

A Anthropic apresentou seu novo modelo de Inteligência Artificial (IA), o Claude 3.7 Sonnet, que define como o "primeiro modelo de raciocínio híbrido", pois permite obter respostas "quase instantâneas" ou resultados elaborados com pensamento prolongado, inclusive com a possibilidade de controlar o tempo durante o qual o modelo pode pensar.

A empresa revelou seu modelo de IA mais inteligente até o momento, que, além de apresentar melhorias "significativas" em setores como codificação e desenvolvimento web front-end, foi desenvolvido com uma "filosofia diferente" de outros modelos de raciocínio existentes no mercado.

Nesse caso, o Claude 3.7 Sonnet é tanto um modelo de linguagem grande (LLM) quanto um modelo de raciocínio completo, oferecendo uma abordagem unificada que cria uma experiência mais perfeita para os usuários.

Em outras palavras, como a Anthropic explicou em uma declaração em seu site, assim como os seres humanos usam "um único cérebro" para desenvolver respostas rápidas e reflexões profundas, o raciocínio "deve ser um recurso integrado de modelos de última geração", em vez de ser apresentado como um modelo separado.

Portanto, o Claude 3.7 Sonnet permite que os usuários escolham quando querem que o modelo responda rapidamente e quando querem que ele pense mais antes de responder, por meio de um menu suspenso que permite selecionar o "modo de raciocínio" para cada consulta.

A empresa também disse que os usuários que têm acesso à API poderão controlar o "orçamento de pensamento". Especificamente, eles poderão dizer ao Claude para pensar em um determinado número de tokens, até seu limite de saída de 128 tokens. Dessa forma, eles poderão equilibrar velocidade e custo, otimizando a qualidade da resposta.

No modo padrão, o novo modelo apresenta uma versão aprimorada do Claude 3.5 Sonnet, com capacidades aprimoradas de codificação e desenvolvimento web front-end, entre outros novos recursos. No modo de pensamento estendido, o Claude 3.7 Sonnet é capaz de pensar antes de responder, melhorando seu desempenho em matemática, física e consultas de acompanhamento de instruções, entre outras tarefas.

A empresa de tecnologia também indicou que, ao desenvolver o Claude 3.7 Sonnet, concentrou-se no desenvolvimento de tarefas do "mundo real" que refletem como as empresas realmente usam os LLMs.

Nos testes conduzidos pela Anthropic, o novo modelo se destacou em seguir instruções, raciocínio geral, recursos multimodais e codificação de agentes, além de oferecer um notável impulso em matemática e codificação usando o pensamento estendido.

Com tudo isso, a Anthropic disse que o Claude 3.7 Sonnet já está disponível para todos os usuários que assinam os planos do Claude, incluindo o gratuito, Pro, Team e Enterprise. O novo modelo também pode ser acessado por meio da API da Anthropic, do Amazon Bedrock e do Vertex AI do Google Cloud.

Da mesma forma, a empresa de tecnologia esclareceu que tanto o modo de pensamento padrão do Claude 3.7 Sonnet quanto o modo estendido têm o mesmo preço de seus antecessores. Ou seja, US$ 3 (cerca de 2,87 euros à taxa de câmbio) por um milhão de tokens de entrada e US$ 15 (14,34 euros) por cada milhão de tokens de saída.

CÓDIGO CLAUDE

Além de tudo isso, a Anthropic também revelou uma nova ferramenta de linha de comando para codificação de agentes, chamada de Claude Code, e que está em uma prévia limitada de pesquisa no momento.

Essa ferramenta depende de um colaborador ativo que pode pesquisar e ler códigos, bem como editar arquivos, escrever e executar testes. A empresa de tecnologia também destacou sua capacidade de confirmar e enviar código para o GitHub e usar ferramentas de linha de comando, informando o usuário em cada etapa.

Embora seja um produto inicial, a Anthropic destacou seu uso para desenvolvimento orientado por testes, depuração de problemas complexos e "refatoração em grande escala". Assim, nos primeiros testes, o Claude Code concluiu tarefas que normalmente levariam mais de 45 minutos de trabalho manual.

A empresa de tecnologia disse que continuará a aprimorar a ferramenta de codificação de agentes para adicionar suporte a comandos de longa duração e melhorar a renderização no aplicativo, entre outras coisas.

Esta notícia foi traduzida por um tradutor automático