Publicado 27/06/2025 06:31

Gemma 3n, a IA de código aberto do Google capaz de ser executada em um smartphone com 2 GB de RAM, já está disponível

O novo modelo Gemma 3n AI.
GOOGLE

MADRI 27 jun. (Portaltic/EP) -

O Google lançou oficialmente seu novo modelo de inteligência artificial (IA) de código aberto, o Gemma 3n, que, sem a necessidade de uma conexão com a internet, é capaz de funcionar de forma eficiente em um smartphone com 2 GB de RAM.

A empresa revelou seu novo modelo em maio, projetado para funcionar sem problemas em tablets, smartphones e laptops e oferecer experiências de IA rápidas e de baixo consumo de energia localmente.

Conforme anunciado na época, o Gemma 3n inclui o ene em seu nome por causa de seu vínculo direto com o Gemini Nano, pois usa a mesma arquitetura avançada encontrada nesse outro modelo do Google, que é otimizado para IA multimodal eficiente no dispositivo.

Agora, o Google expandiu oficialmente sua família Gemma 3 de modelos de IA, com o novo Gemma 3n, que já está disponível com todo o seu potencial de arquitetura móvel e suporta ferramentas como Hugging Face Transformers, llama.cpp, Google AI Edge, Ollama e MLX, entre outras.

Isso foi anunciado pela empresa de tecnologia em uma declaração em seu blog de desenvolvedores, onde detalhou que representa um "avanço" para a IA no dispositivo, trazendo "poderosos recursos multimodais" com desempenho que "anteriormente só era visto em modelos de fronteira baseados em nuvem".

Entre os novos recursos incluídos no Gemma 3n, o Google destacou que ele é um modelo multimodal por design que suporta nativamente entrada e saída de texto, imagem, áudio e vídeo.

Ele também está disponível nos tamanhos E2B e E4B, que têm 2 bilhões e 4 bilhões de parâmetros, respectivamente, com a capacidade de operar com apenas 2 GB de RAM no caso do tamanho E2B e 3 GB de RAM para a versão E4B. No caso deste último, o Google esclareceu que ele atinge uma pontuação LMArena de mais de 1,3 bilhão, o primeiro modelo com menos de 10 bilhões a atingir esse padrão.

Além disso, o núcleo Gemma 3n integra uma arquitetura inovadora chamada MatFormer para melhorar a flexibilidade computacional. De acordo com a empresa, essa arquitetura é baseada nas bonecas russas conhecidas como Matryoshka e permite a inferência elástica, de modo que modelos maiores contêm versões menores de si mesmos para se adaptar às necessidades do momento e otimizar os recursos.

Juntamente com o MatFormer, ele também tem embeddings por camada (PLE) para aumentar a eficiência da memória, o que permite que o modelo seja executado em dispositivos com apenas 2 GB de RAM, pois melhora a qualidade do modelo sem aumentar o consumo de memória, permitindo que uma parte significativa dos parâmetros seja carregada de forma eficiente na CPU, em vez de carregar todos os parâmetros na VRAM.

Ele também integra áudio avançado e codificadores de visão baseados em áudio, como o MobileNet-V5, entre outros recursos. Em suma, quando se trata de fornecer resultados, o Gemma 3n está disponível em 140 idiomas para texto, acompanhado de compreensão multimodal em 35 idiomas. Com isso, ele é capaz de resolver questões relacionadas à matemática, programação e raciocínio.

Os usuários agora podem experimentar diretamente o Gemma 3n no Google AI Studio, bem como fazer o download do modelo do Hugging Face e do Kaggle, e criar ferramentas de IA no dispositivo com o Google AI Edge Gallery, Ollama, MLX e llama.cpp, entre outros.

Esta notícia foi traduzida por um tradutor automático

Contenido patrocinado