A AMD apresenta os aceleradores da série Instinct MI350, que aumentam o desempenho da inferência em 35%.

AMD

MADRI 13 jun. (Portaltic/EP) -

A AMD revelou os novos aceleradores da série AMD Instinct MI350 e compartilhou uma prévia de outras tecnologias com as quais pretende se tornar uma referência em desempenho, eficiência e escalabilidade em IA generativa.

A série Instinct MI350 oferece uma melhoria de até quatro vezes no processamento de IA, geração após geração, e um aumento de até 35 vezes no desempenho de inferência.

Ela consiste nas GPUs e plataformas Instinct MI350X e MI355X, sendo que a última também oferece melhorias de preço e desempenho, gerando até 40% mais tokens por dólar em comparação com as soluções da concorrência, disse a AMD em um comunicado à imprensa.

Com elas, a empresa de tecnologia busca estabelecer uma nova referência de desempenho, eficiência e escalabilidade em IA generativa e computação de alto desempenho, disse em seu evento Advancing AI 2025.

A série MI350 oferece 288GB de capacidade de memória HBM3E (da Micron e Samsung Electronics) e largura de banda de até 8TB/s, bem como configurações flexíveis de resfriamento a ar e resfriamento líquido direto. Ela suporta até 64 GPUs em um rack refrigerado a ar e até 128 GPUs em um rack com refrigeração líquida direta, oferecendo até 2,6 exaFLOPS de desempenho FP4/FP6.

Além disso, o mecanismo de software de aceleração de IA aberto ROCm capacita algumas das maiores plataformas de IA do mundo, oferecendo suporte aos principais modelos, como Llama e DeepSeek, desde o primeiro dia e fornecendo mais de 3,5x melhorias de inferência na próxima versão do ROCm 7.

Com atualizações frequentes, tipos de dados avançados, como o FP4, e novos algoritmos, como o FAv3, o ROCm permite um desempenho de IA de última geração, ao mesmo tempo em que potencializa estruturas de código aberto, como vLLM e SGLang.

A AMD também apresentou no Advancing AI 2025 uma prévia da série Instinct MI400 e do rack de IA 'Helios'. Juntos, eles oferecerão até dez vezes mais desempenho ao executar inferência em modelos Mixture of Experts, CPUs EPYC 'Venice' baseadas na arquitetura Zen 6 e placas de rede AMD Pensando 'Vulcan'.

COLABORAÇÃO COM PARCEIROS DO SETOR

Empresas como a Meta, OpenAI e Microsoft já incorporaram a tecnologia AMD no desenvolvimento de seus projetos de inteligência artificial.

A Meta já implantou a série Instinct MI300X para inferência em seus modelos Llama 3 e Llama 4, e está ansiosa para trabalhar com os aceleradores da série Instinct MI350, que foram destacados por sua potência computacional, desempenho de TCO e memória de última geração.

A OpenAI destacou os modelos de pesquisa e GPT no Azure em produção no MI300X, bem como os compromissos de design profundo nas plataformas da série MI400, enquanto a Microsoft anunciou que o Instinct MI300X agora alimenta modelos proprietários e de código aberto em produção no Azure.

Esta notícia foi traduzida por um tradutor automático

A AMD apresenta os aceleradores da série Instinct MI350, que aumentam o desempenho da inferência em 35%.

COLABORAÇÃO COM PARCEIROS DO SETOR

Contenido patrocinado