Gemini 2.5 Flash Image pronto para produção, agora com novas proporções

2 DE OUTUBRO DE 2025
Alisa Fortin Product Manager
Naina Raisinghani Product Manager GenAI Product
Seth Odoom Product Manager
Guillaume Vernade Gemini Developer Advocate
image7

O modelo de geração e edição de imagens de última geração que conquistou a imaginação do mundo, o Gemini 2.5 Flash Image 🍌, está oficialmente disponível. Pronto para ambientes de produção e com novos recursos, como uma variedade maior de proporções e a opção de gerar apenas imagens.

O Gemini 2.5 Flash Image permite que os usuários combinem perfeitamente várias imagens, mantenham a consistência de personagens para uma narrativa mais rica, realizem edições direcionadas com linguagem natural e aproveitem o extenso conhecimento de mundo do Gemini para geração e modificação de imagens. O modelo pode ser acessado pela API Gemini no Google AI Studio e na Vertex AI para uso corporativo.

Expandindo ainda mais as possibilidades criativas, o modelo agora conta com 10 proporções diferentes, facilitando a criação de conteúdo em vários formatos, desde paisagens cinematográficas a postagens verticais para redes sociais.

As proporções com suporte incluem:

  • Paisagem: 21:9, 16:9, 4:3, 3:2
  • Quadrado: 1:1
  • Retrato: 9:16, 3:4, 2:3
  • Flexível: 5:4, 4:5
image3
Imagens criadas com diferentes proporções

O que as pessoas estão criando

A Cartwheel está aproveitando a IA para ir além da "experiência de caça-níqueis" proporcionada pela maioria dos geradores de imagens, oferecendo aos artistas controle direto para transformar visão criativa em realidade. Depois de meses desenvolvendo o recurso "Pose Mode" e enfrentando limitações com outros modelos, a equipe encontrou uma solução no Gemini 2.5 Flash Image. Ao combinar a ferramenta de poses 3D da Cartwheel com o Gemini 2.5 Flash Image, a equipe desenvolveu um novo e poderoso sistema de criação de imagens que oferece controle e consistência de personagens incomparáveis.

"Outros modelos não conseguiam renderizar personagens de ângulos de câmera aleatórios nem manter a fidelidade a uma pose sem comprometer o conhecimento do mundo ao redor. O novo modelo Gemini 2.5 Flash Image foi o primeiro a fornecer ambos." – Andrew Carr, cofundador da Cartwheel

Link to Youtube Video (visible only when JS is disabled)

A Volley, criadora do dungeon crawler habilitado para IA Wit's End, usa o Gemini 2.5 Flash Image para gerar e editar visuais em tempo real: retratos de personagens, fotos de cenas dinâmicas, composições de vários personagens e edições iterativas rápidas por chat ou voz.

"O modelo apresenta desempenho de ponta na interpretação de regras para diretrizes estéticas, mantendo a latência abaixo de <10 segundos. Isso desbloqueia muitas aplicações em tempo real, como permitir que os jogadores selecionem estilos e ajustem as saídas em ciclos interativos." – James Wilsterman, CTO da Volley

Link to Youtube Video (visible only when JS is disabled)

Foi incrível ver a criatividade da comunidade em ação durante os recentes hackathons com o Kaggle e a Cerebral Valley, com centenas de apresentações mostrando o potencial do modelo em diversas áreas, como educação STEM, materiais de marketing e realidade aumentada em tempo real.

Comece a criar

Os desenvolvedores podem começar hoje mesmo a criar com o Gemini 2.5 Flash Image. Confira os documentos para desenvolvedores e o manual para obter orientações sobre os novos recursos, incluindo as novas proporções e a capacidade de especificar a saída somente de imagens. O modelo está disponível por meio da API Gemini e para testes no Google AI Studio.

Desenvolver com o Gemini 2.5 Flash Image é fácil usando o "modo de criação" do Google AI Studio. Crie e remixe instantaneamente apps personalizados habilitados por IA a partir de um único prompt, como "Crie um app de edição de imagens com filtros". Quando estiver pronto, você pode implantar diretamente pelo AI Studio ou salvar o código no GitHub – tudo gratuitamente. Experimente e remixe alguns dos apps de exemplo:

  • Bananimate: crie GIFs animados com o Nano Banana usando imagens e prompts.
  • Enhance: amplie infinitamente qualquer fotografia com o dimensionador criativo. Veja se consegue encontrar o "easter-egg" (dica: 🍌).
  • Fit check: faça upload de uma foto sua e de uma roupa para ver como ela fica em você. Um provador virtual com a tecnologia Nano Banana.

O preço do Gemini 2.5 Flash Image é de US$ 0,039 por imagem, com uma taxa de US$ 30,00 por 1 milhão de tokens de saída. O preço para outras modalidades de entrada e saída está alinhado à tabela de preços padrão do Gemini 2.5 Flash.

Veja um exemplo de código para começar:

from google import genai
from google.genai import types
from PIL import Image
 
client = genai.Client()
 
prompt = "Create a photograph of the subject in this image as if they were living in the 1980s. The photograph should capture the distinct fashion, hairstyles, and overall atmosphere of that time period."
 
image = Image.open('/path/to/image.png')
 
response = client.models.generate_content(
    model="gemini-2.5-flash-image",
    contents=[prompt, image],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio="16:9",
        )
    )
)
 
for part in response.parts:
  if part.inline_data is not None:
    generated_image = part.as_image()
    generated_image.show()
Python

A criatividade da comunidade de desenvolvedores é sempre impressionante. Mal podemos esperar para ver o que você vai criar a seguir!