MADRI 12 mar. (Portaltic/EP) -
O Google revelou sua nova coleção Gemma 3 de modelos abertos de IA. Disponível em tamanhos de 1, 4, 12 e 27 milhões de parâmetros, o Gemma 3 é o modelo "mais capaz" da empresa que pode ser executado em uma única unidade de processamento gráfico (GPU), com o objetivo de ajudar os desenvolvedores a criar aplicativos de IA "onde quer que eles precisem".
A Gemma é a família de modelos de IA de código aberto da empresa de tecnologia, que foi inicialmente apresentada em fevereiro do ano passado em dois tamanhos: 2 bilhões de parâmetros (2B) e 7 bilhões de parâmetros (7B), e atualizada em maio em sua conferência anual de desenvolvedores com o lançamento da Gemma 2, elevando-a para 27 bilhões de parâmetros (27B) e, com isso, o desempenho no mesmo nível do Llama 3 da Meta.
Agora, o Google expandiu a família com seu novo modelo de IA Gemma 3, que ele descreve como "o modelo mais capaz" de ser executado em uma única unidade de processamento gráfico (GPU), disponível em tamanhos de 1, 4, 12 e 27 milhões de parâmetros para escolher a opção que melhor se adapta às necessidades específicas de hardware e desempenho.
Esses modelos foram projetados para serem executados rapidamente em qualquer dispositivo, de smartphones a laptops e estações de trabalho, e foram concebidos para ajudar os desenvolvedores a criar aplicativos de IA "onde quer que eles precisem".
Além disso, é uma coleção de modelos abertos e leves que se baseiam "na mesma pesquisa e tecnologia" que alimenta seus modelos Gemini 2.0, disse o Google em um comunicado em seu blog.
A esse respeito, a empresa enfatizou que o Gemma 3 oferece alto desempenho para seu tamanho, alegando que ele supera outros modelos do setor, como o Llama-405B da Meta, o DeepSeek-V3 e o o3-mini da OpenAI, em avaliações preliminares nos rankings da LMArena. Como resultado, ele permite a criação de "experiências de usuário atraentes" que são adaptadas a um único host de GPU ou TPU, especificamente com desempenho otimizado em GPUs da Nvidia.
Em consonância com isso, o novo modelo aberto de IA suporta 140 idiomas, com suporte pronto para uso para mais de 35 idiomas, permitindo que os desenvolvedores criem aplicativos no idioma de seus usuários.
O Google disse que, com o Gemma 3, os desenvolvedores também poderão criar facilmente aplicativos que analisam imagens, textos e vídeos curtos. Ele também oferece uma janela de contexto de token de 128K para permitir que os aplicativos processem e compreendam grandes quantidades de informações.
O Gemma 3 também é compatível com chamadas de função e saída estruturada, permitindo a automação de tarefas, bem como a criação de experiências de agente em aplicativos.
O Google também apresentou o ShieldGemma 2, seu novo verificador de segurança de imagens de tamanho 4B baseado no Gemma 3. Essa solução avalia imagens e gera rótulos de segurança em três categorias, como conteúdo perigoso, sexualmente explícito e violento.
Dessa forma, os desenvolvedores podem usar o ShieldGemma 2 para integrá-lo aos seus aplicativos e personalizar as necessidades de segurança dos usuários. Ele também aproveita o desempenho e a arquitetura do Gemma 3 para promover o desenvolvimento responsável de IA.
Além disso, o Google observou que, ao desenvolver o modelo, realizou uma avaliação de risco "completa" com base em seus protocolos de segurança, incluindo o alinhamento com suas políticas de segurança por meio de "ajuste fino e benchmarking robusto".
O Gemma 3 e o ShieldGemma 2 já estão disponíveis para integração em fluxos de trabalho com ferramentas como Hugging Face, Kaggle, Google AI Edge, Vertex AI e outras. Os recursos do Gemma 3 também podem ser acessados no Google AI Studio.
Esta notícia foi traduzida por um tradutor automático