MADRID 6 nov. (Portaltic/EP) -
O Google Cloud anunciou a disponibilidade geral do Ironwood, sua unidade de processamento tensorial (TPU) de sétima geração, e novas instâncias de máquinas virtuais baseadas no Axion Arm.
As infraestruturas de inteligência artificial (IA) estão exigindo ferramentas para ajudar a acompanhar o rápido crescimento da tecnologia. Para atender a essa demanda, o Google introduziu inovações que proporcionam alto desempenho e custos mais baixos para cargas de trabalho de IA (Ironwood) e CPUs de uso geral (Axion) que suportam esses aplicativos de IA.
Ironwood é o nome das TPUs de sétima geração do Google Cloud. Esses são aceleradores de inteligência artificial otimizados para treinamento e inferência de modelos grandes.
Conforme detalhado em um comunicado à imprensa, elas têm dez vezes o desempenho máximo das TPUs v5p e mais de quatro vezes o desempenho por chip para cargas de trabalho de treinamento e inferência em comparação com a TPU v6e (Trillium).
Com o Ironwood, é possível integrar até 9.216 chips em um "superpod", conectando-os por meio da rede ICI (Inter-Chip Interconnect), que opera a 9,6 Tb/s, o que permite atingir cerca de 1,77 petabytes de memória compartilhada de alta largura de banda.
As TPUs Ironwood, que estarão disponíveis nas próximas semanas, ajudarão a Anthropic a executar seus modelos Claude, que acessarão cerca de um milhão de unidades.
Além disso, as novas máquinas virtuais Axion baseadas em Arm foram expandidas com a instância N4A, que está atualmente em pré-visualização e oferece mais que o dobro do desempenho das máquinas virtuais comparáveis baseadas em x86 da geração atual.
O Google também anunciou sua primeira instância bare-metal, o C4A metal, que em breve estará disponível em versão prévia. Ela fornece servidores físicos dedicados para cargas de trabalho especializadas, como o desenvolvimento do Android ou fazendas de teste em grande escala.
Essas máquinas virtuais já foram testadas com parceiros do setor. De acordo com a empresa de tecnologia, o Vimeo observou uma melhoria de 30% no desempenho do N4A para sua principal carga de trabalho de transcodificação, e a ZoomInfo mediu uma melhoria de 60% no preço-desempenho para suas principais cargas de trabalho de processamento de dados no N4A.
Esta notícia foi traduzida por um tradutor automático