Publicado 27/08/2025 05:34

O Gemini aprimora a edição de imagens com o Gemini 2.5 Flash Image, que permite combinar várias imagens de forma coerente.

Edição de imagens no Gemini com o novo modelo Gemini 2.5 Flash Image.
GOOGLE

MADRI 27 ago. (Portaltic/EP) -

O Google apresentou o Gemini 2.5 Flash Image, seu novo modelo de geração e edição de imagens de última geração, que inclui recursos para combinar várias imagens em uma só, mantendo a consistência dos caracteres que aparecem, bem como realizar transformações específicas com linguagem natural, tudo por meio do aplicativo Gemini e do Google AI Studio.

A gigante da tecnologia lançou seu modelo de raciocínio Gemini 2.5 Flash em abril deste ano para a Vertex AI, projetado como uma opção híbrida, permitindo que seus recursos de raciocínio sejam ativados ou desativados para encontrar o equilíbrio certo entre a qualidade de suas respostas, o custo e a latência.

Agora, para proporcionar uma melhor experiência de edição de imagens para desenvolvedores e usuários no aplicativo Gemini, com resultados de maior qualidade e "controle criativo mais poderoso", o Google revelou seu novo modelo de imagem Gemini 2.5 Flash Image.

Conhecido internamente como "nanobanana", esse modelo permite que várias imagens sejam combinadas em uma única imagem, mantendo a consistência dos personagens ou objetos incluídos. Ele também permite que transformações específicas de imagens sejam realizadas usando linguagem natural.

Conforme detalhado pela empresa em uma declaração em seu blog para desenvolvedores, esses recursos foram implementados no "modo de criação" do Google AI Studio em caráter experimental. Assim, os desenvolvedores podem remixar ou dar vida às suas ideias com uma única instrução de linguagem natural e depois compartilhá-la no Google AI Studio ou salvar o código no GitHub.

A edição nativa de imagens no aplicativo Gemini também foi atualizada para todos os usuários, com o objetivo de aprimorar os recursos de edição e "manter a semelhança entre as imagens", já que "uma representação semelhante, mas não a mesma, não parece boa".

Será suficiente compartilhar uma foto com o Gemini para editar questões específicas e "dar a ela um toque exclusivo". Por exemplo, solicitando que a pessoa na foto apareça em novas configurações, mas mantendo sua aparência original em cada imagem. A Gemini também pode variar seus trajes ou profissões, até mesmo reimaginar a pessoa em outra época "sem perder sua identidade".

Da mesma forma, os usuários também podem mesclar fotos, compartilhando várias imagens e mesclando-as em uma só para criar uma cena completamente nova. Assim, uma imagem de um cachorro e uma pessoa podem ser compartilhadas para que apareçam de forma coesa na mesma imagem.

Além de tudo isso, você também pode solicitar modificações específicas na imagem, como alterar a cor das paredes de um cômodo ou adicionar móveis, mantendo o restante da imagem intacto.

O Google também detalhou que outro dos novos recursos oferecidos pelo modelo é a mistura de designs. Ou seja, aplicar o estilo de uma imagem a um objeto em outra. Por exemplo, usar a cor e a textura das pétalas de uma flor para botas de chuva.

"Essa atualização faz um trabalho muito melhor, permitindo que as edições sejam mais fluidas, e os resultados do modelo podem ser usados para o que você quiser", disse Nicole Brichtova, gerente de produto para modelos de geração visual no Google DeepMind, ao TechCrunch.

Ela também especificou que todas as imagens criadas ou editadas no aplicativo Gemini incluem uma marca d'água visível, bem como a marca d'água digital invisível SynthID.

Em suma, o Gemini 2.5 Flash Image já está disponível por meio da API Gemini e do Google AI Studio para desenvolvedores, bem como por meio do Vertex AI para empresas. Deve-se observar que custa US$ 30 (25,86 euros à taxa de câmbio) por milhão de tokens de saída, e cada imagem é equivalente a 1.290 tokens de saída. Em outras palavras, gerar uma imagem custa 0,039 dólares (0,034 euros pela taxa de câmbio).

Enquanto isso, a atualização nativa de edição de imagens no aplicativo Gemini já está disponível gratuitamente para todos os usuários.

Esta notícia foi traduzida por um tradutor automático

Contador