A Nvidia revela a família Nemotron 3 de modelos abertos, projetados para desenvolver sistemas de agentes de IA precisos

NVIDIA

MADRI 16 dez. (Portaltic/EP) -

A Nvidia revelou uma nova família de modelos abertos de inteligência artificial (IA) Nemotron 3 que, composta pelos tamanhos Nano, Super e Ultra, usa uma arquitetura híbrida de mistura de especialistas (MoE) que impulsiona o desenvolvimento e a implantação de sistemas multiagentes mais transparentes e eficientes.

A empresa destacou como as empresas enfrentam desafios "crescentes" ao passar de chatbots de modelo único para sistemas de IA multiagentes colaborativos, resultando em sobrecarga de comunicação, desvio de contexto e altos custos de inferência.

Nesse sentido, a Nvidia enfatizou a importância de usar sistemas de IA transparentes que permitam às empresas confiar nos modelos usados para automatizar seus fluxos de trabalho e, para atender a essas necessidades, revelou sua nova família Nemotron 3.

Esses novos modelos abertos de IA foram projetados para impulsionar o desenvolvimento de uma IA agêntica mais "transparente, eficiente e especializada", projetada para impulsionar o trabalho em todos os setores, disse a empresa em um comunicado em seu blog.

Para isso, a família Nemotron 3 baseia-se em uma nova arquitetura híbrida de mistura de especialistas, que ajuda os desenvolvedores a criar e implementar "sistemas de IA multiagentes mais confiáveis em escala".

Especificamente, essa arquitetura permite que o modelo em questão selecione e use apenas as partes necessárias para executar uma tarefa específica, aumentando a eficiência na entrega de resultados e no gerenciamento de tarefas, especialmente ao executar várias tarefas ao mesmo tempo, como é o caso dos sistemas agênticos.

A família está disponível em três tamanhos, começando pela versão Nemotron 3 Nano, que é a menor, com 30 bilhões de parâmetros ativos, e atende a tarefas específicas e altamente eficientes.

Notavelmente, de acordo com a Nvidia, essa versão é "a mais eficiente" em termos de custo computacional, pois foi otimizada para tarefas como depuração de software, resumo de conteúdo, condução de fluxos de trabalho de assistentes de IA e recuperação de informações com baixos custos de inferência. Tudo isso com uma taxa de transferência de tokens até quatro vezes maior que a de seu modelo anterior, o Nemotron 2 Nano.

"O Nemotron 3 Nano lembra mais, tornando-o mais preciso e capaz de conectar informações em tarefas longas e de várias etapas", disse a empresa de tecnologia.

Em consonância com isso, a família também inclui a versão Nemotron 3 Super, que tem aproximadamente 100 bilhões de parâmetros e oferece até 10 bilhões de ativos por token, projetada para aplicações de IA multiagente.

Finalmente, a versão Nemotron 3 Ultra, a maior opção, tem cerca de 500 bilhões de parâmetros e oferece até 50 bilhões de ativos por token, tornando-a capaz de executar tarefas mais complexas.

Tanto o modelo Super quanto o Ultra usam o formato de treinamento NVFP4 de 4 bits da Nvidia na arquitetura Nvidia Blackwell, que, segundo a empresa, "reduz significativamente os requisitos de memória e acelera o treinamento".

Com todas essas opções, os desenvolvedores podem escolher o modelo aberto da família Nemotron 3 que melhor atenda às suas necessidades, dimensionado para suas cargas de trabalho específicas de agentes de IA.

"Com o Nemotron, estamos transformando a IA avançada em uma plataforma aberta que oferece aos desenvolvedores a transparência e a eficiência de que precisam para criar sistemas agênticos em escala", disse o fundador e CEO da Nvidia, Jensen Huang.

O Nemotron 3 Nano já está disponível na Hugging Face e em provedores de serviços de inferência, bem como em plataformas de IA corporativas e infraestruturas de dados. Ele também está disponível através do Amazon Bedrock e é compatível com o Google Cloud, CoreWeave e Microsoft Foundry, entre outras opções. A Nvidia também especificou que ele está disponível como um microsserviço Nvidia NIM.

Espera-se que as versões Super e Ultra do Nemotron 3 estejam disponíveis para os usuários no primeiro semestre de 2026.

Esta notícia foi traduzida por um tradutor automático

A Nvidia revela a família Nemotron 3 de modelos abertos, projetados para desenvolver sistemas de agentes de IA precisos

Contenido patrocinado