MADRI 21 maio (Portaltic/EP) -
A família Gemma de modelos abertos de IA foi ampliada com o Gemma 3n, projetado para funcionar sem problemas em tablets, smartphones e laptops e oferecer experiências de inteligência artificial (IA) rápidas e de baixo consumo de energia.
O Gemma 3 foi apresentado em março como um modelo de IA aberto "mais capaz" que pode ser executado em uma única GPU, permitindo o desenvolvimento de uma nova versão do modelo para dispositivos de uso diário.
O Gemma 3n inclui o ene em seu nome devido à sua ligação direta com o Gemini Nano. Especificamente, ele usa a mesma arquitetura avançada presente nesse outro modelo do Google, que é otimizado para uma IA multimodal eficiente no dispositivo, conforme explica a empresa em seu blog oficial.
Mas ele faz menos uso da RAM com uma inovação tirada diretamente do Google DeepMind, chamada Per Layer Embeddings (PLE). Como resultado, ele pode ser executado em dispositivos com 2 GB de RAM.
O novo modelo compreende e processa áudio, texto, vídeo e imagens e, em breve, oferecerá suporte a entradas multimodais complexas. Ele é executado localmente, o que ajuda a manter a privacidade do usuário e permite que ele trabalhe off-line, além de aprimorar os recursos multilíngues em espanhol, francês, japonês, alemão, coreano e japonês.
Com esses recursos, os desenvolvedores poderão criar novas experiências para tablets, smartphones e computadores Android e ChromeOS que aproveitam as dicas visuais e auditivas do ambiente do usuário para introduzir novas interações com os aplicativos. Por exemplo, aponte a câmera para um item e pergunte o que você vê, traduza um cartaz de evento ou crie uma notificação a partir de um texto escrito em um pedaço de papel.
Em comparação com o Gemma 3, que tem 4 bilhões de parâmetros, o Gemma 3n responde 1,5 vez mais rápido em dispositivos móveis, pois foi otimizado com o apoio dos fabricantes de chips.
O Gemma 3n tem 4 bilhões de parâmetros, mas inclui um submodelo menor, de 2 bilhões, que permite a escolha dinâmica de qualidade de pico, velocidade e desempenho, com o mesmo espaço de memória e um único modelo.
Esta notícia foi traduzida por um tradutor automático