Apresentamos o Gemini 2.5 Flash Image, nosso modelo de imagem de última geração

26 DE AGOSTO DE 2025
Alisa Fortin Product Manager
Guillaume Vernade Gemini Developer Advocate
Kat Kampf Product Manager
Ammaar Reshi Product and Design Lead AI Studio

Hoje, temos o prazer de introduzir o Gemini 2.5 Flash Image (também conhecido como nano-banana), nosso modelo de geração e edição de imagens de última geração. Essa atualização permite que você combine várias imagens em uma, mantenha a consistência de personagens para uma narrativa mais rica, faça transformações direcionadas usando linguagem natural e use o conhecimento de mundo do Gemini para gerar e editar imagens.

Quando lançamos pela primeira vez a geração de imagens nativa no Gemini 2.0 Flash, no início deste ano, vocês nos disseram que adoraram a baixa latência, a boa relação custo-benefício e a facilidade de uso. Mas também nos disseram que precisavam de imagens com qualidade mais alta e de um controle criativo mais poderoso.

Esse modelo já está disponível por meio da API Gemini e do Google AI Studio para desenvolvedores e da Vertex AI para empresas. O Gemini 2.5 Flash Image custa US$ 30,00 por 1 milhão de tokens de saída, sendo que cada imagem tem 1290 tokens de saída (US$ 0,039 por imagem). Todas as outras modalidades de entrada e saída seguem os preços do Gemini 2.5 Flash.

O Gemini 2.5 Flash Image em ação

Para facilitar ainda mais a criação com o Gemini 2.5 Flash Image, fizemos atualizações significativas no "modo de criação" do Google AI Studio (e mais atualizações serão disponibilizadas em breve). Nos exemplos abaixo, você não só pode testar rapidamente os recursos do modelo com apps habilitados por IA personalizados, como também pode remixá-los ou dar vida a ideias com apenas um prompt. Quando quiser compartilhar um app criado por você, faça a implantação diretamente a partir do Google AI Studio ou salve o código no GitHub.

Experimente um prompt como "Crie um app de edição de imagens que permita que um usuário faça upload de uma imagem e aplique vários filtros" ou escolha um dos modelos predefinidos e remixe-o, tudo gratuitamente!


Mantenha a consistência de personagens

Um desafio fundamental na geração de imagens é manter a aparência de um personagem ou objeto entre vários prompts e edições. Agora, você pode colocar o mesmo personagem em ambientes diferentes, exibir um único produto por vários ângulos em novos ambientes ou gerar ativos de marca consistentes, sempre preservando o assunto.

Criamos um aplicativo de modelo no Google AI Studio (que você pode facilmente personalizar e usar como base para vibe coding) para demonstrar os recursos de consistência de personagens do modelo.

(Sequência resumida)

Além da consistência de personagens, o modelo também é excelente em seguir modelos visuais. Já vimos desenvolvedores explorarem áreas como anúncios de imóveis, crachás uniformes para funcionários ou mockups dinâmicos de produtos para um catálogo inteiro, tudo a partir de um único modelo de design.

gemini-2-5-image-editing-character-consistency

Edição de imagens baseada em prompts

O Gemini 2.5 Flash Image permite a transformação direcionada e edições locais precisas com linguagem natural. Por exemplo, o modelo pode desfocar o fundo de uma imagem, remover uma mancha em uma camiseta, remover por completo uma pessoa de uma foto, alterar a pose de um assunto, adicionar cor a uma foto em preto e branco ou fazer qualquer outra coisa que você possa imaginar com um simples prompt.

Para mostrar esses recursos em ação, criamos um app de modelo de edição de fotos no AI Studio, com IU e controles baseados em prompts.

gemini-2-5-flash-prompt-based-image-editing

Conhecimento de mundo nativo

Os modelos de geração de imagens sempre se destacaram em imagens estéticas, mas não tinham uma compreensão profunda e semântica do mundo real. No Gemini 2.5 Flash Image, o modelo se beneficia do conhecimento de mundo do Gemini, o que desbloqueia novos casos de uso.

Para demonstrar isso, criamos um app de modelo no Google AI Studio que transforma uma tela simples em um tutor interativo. Ele demonstra a capacidade do modelo de ler e entender diagramas desenhados à mão, ajudar com perguntas sobre o mundo real e seguir instruções de edição complexas em uma única etapa.

(Exemplos de prompts e resultados do modelo)

Fusão de várias imagens

O Gemini 2.5 Flash Image pode entender e mesclar várias imagens de entrada. Você pode colocar um objeto em uma cena, redecorar uma sala com um esquema de cores ou uma textura e fundir imagens com um único prompt.

Para demonstrar a fusão de várias imagens, criamos um app de modelo no Google AI Studio que permite arrastar produtos para uma nova cena e criar rapidamente uma nova imagem fundida com realidade fotográfica.

(Sequências resumidas)

Comece a criar

Confira nossos documentos para desenvolvedores para começar a criar com o Gemini 2.5 Flash Image. Hoje, o modelo está na versão de pré-visualização por meio da API Gemini e do Google AI Studio, mas estará estável nas próximas semanas. Todos os apps de demonstração que destacamos aqui passaram por vibe coding no Google AI Studio para que possam ser remixados e personalizados com apenas um prompt.

A OpenRouter.ai fez uma parceria conosco para ajudar a levar o Gemini 2.5 Flash Image para seus mais de 3 milhões de desenvolvedores no mundo ainda hoje. Esse é o primeiro modelo na OpenRouter, dentre os mais de 480 existentes no momento, capaz de gerar imagens.

Também estamos empolgados com nossa parceria com a fal.ai, uma plataforma líder de desenvolvedores para mídia generativa, para disponibilizar o Gemini 2.5 Flash Image para a comunidade de desenvolvedores em geral.

Todas as imagens criadas ou editadas com o Gemini 2.5 Flash Image incluirão uma marca d'água SynthID digital invisível, para que possam ser identificadas como geradas por IA ou editadas.

from google import genai
from PIL import Image
from io import BytesIO
 
client = genai.Client()
 
prompt = "Create a picture of my cat eating a nano-banana in a fancy restaurant under the gemini constellation"
 
image = Image.open('/path/to/image.png')
 
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt, image],
)
 
for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))   
    image.save("generated_image.png")
Python

Estamos trabalhando ativamente para melhorar a renderização de texto de formato longo, tornar a consistência de personagens ainda mais confiável e melhorar a representação factual, como pequenos detalhes em imagens. Continue enviando seu feedback em nosso fórum de desenvolvedores ou no X.

Mal podemos esperar para ver o que você vai criar com o Gemini 2.5 Flash Image!