MADRID 17 mar. (Portaltic/EP) - A Nvidia apresentou a nova CPU Vera, projetada especificamente para otimizar os agentes de inteligência artificial, para o que duplica a eficiência e aumenta a velocidade em 50% em relação às CPUs tradicionais.
A empresa de semicondutores projetou a Vera com base no “sucesso” da Grace e a apresenta como uma nova geração de CPUs que oferece “maior desempenho, capacidade de resposta e eficiência” para inteligência artificial em grande escala.
Para isso, ela integra 88 núcleos Olympus personalizados, cada um com a capacidade de executar duas tarefas simultaneamente graças à tecnologia proprietária “Spatial Multithreading”. Além disso, utiliza a segunda geração do subsistema de memória de baixo consumo da Nvidia para melhorar a eficiência energética. Ela é baseada na tecnologia de memória LPDDR5X e oferece até 1,2 TB/s de largura de banda, o dobro da largura de banda e com metade do consumo de energia em comparação com as CPUs tradicionais, conforme detalhado pela Nvidia em um comunicado. Sua capacidade de orquestrar tarefas impulsionará os agentes de IA, que têm autonomia para “raciocinar e agir”. “A Vera permite que os sistemas de IA pensem mais rápido e escalem mais”, afirmou o fundador e diretor executivo da Nvidia, Jensen Huang, durante a conferência GTC 2026. A CPU Vera foi integrada à plataforma Vera Rubin, também apresentada na GTC, para as fábricas de IA. Especificamente, ela está integrada a um novo “rack” de CPUs com 256 Vera refrigeradas a líquido para suportar mais de 22.500 ambientes de CPU simultâneos, cada um operando de forma independente em plena capacidade.
Outro “rack” no qual ela está integrada é o Vera Rubin NVL72, composto por 72 GPUs Rubin e 36 CPUs Vera conectadas ao switch NVLink 6, ConnectX-9 SuperNIC e BlueField-4 DPU. Ele foi projetado para o treinamento de modelos de mistura de especialistas (MoE) e faz isso com um quarto do número de GPUs em comparação com a plataforma Nvidia Blackwell, alcançando até dez vezes mais desempenho de inferência por watt a um décimo do custo por token.
Esta notícia foi traduzida por um tradutor automático