Publicado 20/05/2025 09:02

A Red Hat traz a IA generativa na nuvem híbrida para as empresas com o Red Hat Inference Server e o Enterprise Linux 10

Archivo - Arquivo - Logotipo da Red Hat.
RED HAT - Arquivo

MADRI 20 maio (Portaltic/EP) -

A Red Hat apresentou sua nova solução Red Hat AI Inference Server, à qual se refere como um passo em direção à "democratização da IA generativa" na nuvem híbrida, uma vez que, enquadrada em sua plataforma Red Hat AI, oferece às empresas maior velocidade, eficiência no uso de aceleradores e lucratividade ao implantar e dimensionar a IA generativa em seu trabalho, ao mesmo tempo em que lançou a nova plataforma Red Hat Enterprise Linux 10.

No evento Red Hat Summit 2025 & AnsibleFest, que reúne profissionais de TI, líderes de negócios e parceiros em Boston, EUA, de 19 a 22 de maio, a empresa apresentou suas mais recentes inovações e avanços em suas tecnologias de IA, nuvem híbrida e sistema operacional Linux para impulsionar o trabalho de todas as empresas de maneira aberta.

Sob a premissa de executar qualquer modelo, em qualquer acelerador e em qualquer nuvem, sem altos custos, a empresa de tecnologia destacou seu objetivo de ajudar as organizações a adotar modelos de IA "menores, otimizados e abertos" que podem ser executados em qualquer lugar, além de ajudar as empresas a "abordar a próxima fase da IA", que engloba tecnologias como inferência por meio da nuvem híbrida.

Como ele explicou, a inferência é "o mecanismo de execução essencial da IA", pois oferece vantagens "significativas" às empresas ao processar dados em tempo real, por exemplo, permitindo a previsão e a tomada de decisões instantâneas, o que é relevante ao gerenciar problemas relacionados à detecção de fraudes ou ao atendimento ao cliente.

À medida que os modelos de IA generativa se tornam "cada vez mais complexos" e a taxa de transferência aumenta, a Red Hat alertou em uma coletiva de imprensa que a inferência "pode se tornar um grande gargalo", consumindo recursos de hardware e até mesmo prejudicando a capacidade de resposta dos negócios.

SERVIDOR DE INFERÊNCIA DE IA DA RED HAT ALIMENTADO POR VLLM

As empresas de hoje, portanto, precisam de servidores de inferência que desbloqueiem o potencial da IA em escala e, para enfrentar esses desafios, a Red Hat anunciou sua nova solução Red Hat AI Inference Server, que está integrada à plataforma Red Hat AI da empresa - juntamente com os produtos OpenShift AI e Red Hat Enterprise Linux AI - e inclui opções de IA generativa otimizadas de "alta qualidade e alto desempenho" em ambientes de nuvem híbrida.

Especificamente, a empresa de tecnologia disse que inclui ferramentas de compressão de modelos grandes (LLM), que reduzem o tamanho do modelo em questão e melhoram sua eficiência em um tamanho menor. Isso se traduz em modelos otimizados para o desempenho, com menor latência, melhores recursos de resposta e uso mais eficiente dos recursos de computação da empresa.

Ele também oferece um repositório de modelos otimizados que, hospedado pela organização de IA da Red Hat na Hugging Face, fornece acesso instantâneo a uma coleção "validada e otimizada" de modelos de IA para implantação de inferência. Ao fazer isso, ele ajuda a acelerar a eficiência de duas a quatro vezes sem comprometer a precisão do modelo.

Alinhado a isso, o Red Hat AI Inference Server é baseado no projeto vLLM (Virtual Large Language Model), que é capaz de executar uma ampla variedade de modelos de código aberto de forma eficiente, como os modelos Meta's Llama, DeepSeek, Gemma do Google, Phi da Microsoft, Nemoton da Nvidia e Mistral AI, em uma variedade de plataformas de hardware, incluindo GPU da Nvidia, TPU (Tensor Processing Unit) do Google e aceleradores Gaudi da Intel.

Dessa forma, o projeto oferece suporte para grandes contextos de entrada, aceleração de modelos com várias GPUs e suporte para processamento em lote, entre outros recursos. Isso permitirá que as empresas obtenham "flexibilidade e consistência" para implantar e gerenciar modelos "onde for mais fácil para sua estratégia de trabalho de IA".

Além disso, o Red Hat AI Inference Server também inclui o novo projeto da comunidade llm-d que, apoiado por empresas como CoreWeave, Google, IBM e Nvidia, e alimentado pela Kubernetes Platform e VLLM, desbloqueia a inferência de forma eficiente e escalável para "servir LLMs a vários usuários".

EXPANSÃO DE SEU ECOSSISTEMA DE IA

Para oferecer essas soluções, a empresa de tecnologia também anunciou que está lançando um novo programa de validação para modelos de terceiros, como os mencionados acima da Meta, Google e DeepSeek, que estarão disponíveis on-line por meio de seu repositório Hugging Face e no OpenShift AI por meio de seu novo catálogo de modelos. Isso torna mais fácil para as organizações encontrarem rapidamente modelos que funcionem para seus objetivos de forma otimizada e personalizada.

Além disso, a Red Hat tem trabalhado no desenvolvimento de IA agêntica. Ela observou que o OpenShift AI já fornece uma plataforma para executar agentes de IA, mas está avançando para adicionar novos recursos que permitem aos clientes "implantar, criar e gerenciar agentes". Isso inclui a integração da API Llama Stack.

RED HAT ENTERPRISE LINUX 10

A empresa de tecnologia também revelou o Red Hat Enterprise Linux 10 (RHEL 10), a evolução da plataforma Linux empresarial líder global que está "pronta para IA" como um sistema estratégico para ambientes de nuvem híbrida, bem como uma base "sólida" para a inovação de IA no local de trabalho.

Mais do que apenas uma atualização, o Red Hat Enterprise Linux 10 fornece um "backbone estratégico e inteligente" para que a TI corporativa gerencie a "complexidade crescente", acelere a inovação e construa "uma base de computação segura para o futuro". Tudo isso tem como pano de fundo a proliferação de ambientes híbridos e a necessidade de integrar cargas de trabalho de IA.

Nesse caso, é uma versão que "redefine o padrão para um Linux simplificado", já que, segundo a Red Hat, integra tudo, desde recursos para proteção de dados "na era pós-quântica", até agilidade, flexibilidade e opções de gerenciamento no Linux, e a adoção de contêineres como a linguagem do sistema operacional.

Especificamente, a empresa observou que essa nova versão ajudará os usuários a resolver sua falta de conhecimento do Linux com o assistente RHEL Lightspeed baseado em IA. Ele fornece orientação contextualizada e recomendações práticas por meio de uma interface de linguagem natural, ajudando a resolver problemas comuns ou a aplicar as melhores decisões para dominar ambientes de TI complexos.

Ele também inclui recursos como o modo de imagem para RHEL, que unifica o desenvolvimento, a implementação e o gerenciamento do sistema operacional e dos aplicativos em um fluxo de trabalho simplificado. Ele permite que "melhores decisões" sejam tomadas nos momentos de construção, com assistência para informar às empresas quando é "mais fácil e mais barato" fazer implementações ou alterações.

Ele também facilita o uso da nuvem híbrida com imagens pré-configuradas para serem executadas no Amazon Web Services, no Google Cloud e no Microsoft Azure.

Em termos de estratégias de segurança, o RHEL 10 inclui o Red Hat Enterprise Linux Security Select Add-On, que oferece a possibilidade de solicitar correções para até 10 vulnerabilidades e exposições comuns (CVEs) por ano.

Esta notícia foi traduzida por um tradutor automático

Contenido patrocinado