Publicado 06/11/2025 12:31

O Google Cloud potencializa a era da inferência com as novas TPUs Ironwood e máquinas virtuais Axion

Infraestrutura de IA
GOOGLE

MADRID 6 nov. (Portaltic/EP) -

O Google Cloud anunciou a disponibilidade geral do Ironwood, sua unidade de processamento tensorial (TPU) de sétima geração, e novas instâncias de máquinas virtuais baseadas no Axion Arm.

As infraestruturas de inteligência artificial (IA) estão exigindo ferramentas para ajudar a acompanhar o rápido crescimento da tecnologia. Para atender a essa demanda, o Google introduziu inovações que proporcionam alto desempenho e custos mais baixos para cargas de trabalho de IA (Ironwood) e CPUs de uso geral (Axion) que suportam esses aplicativos de IA.

Ironwood é o nome das TPUs de sétima geração do Google Cloud. Esses são aceleradores de inteligência artificial otimizados para treinamento e inferência de modelos grandes.

Conforme detalhado em um comunicado à imprensa, elas têm dez vezes o desempenho máximo das TPUs v5p e mais de quatro vezes o desempenho por chip para cargas de trabalho de treinamento e inferência em comparação com a TPU v6e (Trillium).

Com o Ironwood, é possível integrar até 9.216 chips em um "superpod", conectando-os por meio da rede ICI (Inter-Chip Interconnect), que opera a 9,6 Tb/s, o que permite atingir cerca de 1,77 petabytes de memória compartilhada de alta largura de banda.

As TPUs Ironwood, que estarão disponíveis nas próximas semanas, ajudarão a Anthropic a executar seus modelos Claude, que acessarão cerca de um milhão de unidades.

Além disso, as novas máquinas virtuais Axion baseadas em Arm foram expandidas com a instância N4A, que está atualmente em pré-visualização e oferece mais que o dobro do desempenho das máquinas virtuais comparáveis baseadas em x86 da geração atual.

O Google também anunciou sua primeira instância bare-metal, o C4A metal, que em breve estará disponível em versão prévia. Ela fornece servidores físicos dedicados para cargas de trabalho especializadas, como o desenvolvimento do Android ou fazendas de teste em grande escala.

Essas máquinas virtuais já foram testadas com parceiros do setor. De acordo com a empresa de tecnologia, o Vimeo observou uma melhoria de 30% no desempenho do N4A para sua principal carga de trabalho de transcodificação, e a ZoomInfo mediu uma melhoria de 60% no preço-desempenho para suas principais cargas de trabalho de processamento de dados no N4A.

Esta notícia foi traduzida por um tradutor automático

Contenido patrocinado