É com prazer que disponibilizamos o Imagen 4, nosso melhor modelo de texto para imagem, na versão de pré-lançamento paga na API Gemini e para testes gratuitos limitados no Google AI Studio. O Imagen 4 oferece renderização de texto significativamente melhor do que em nossos modelos de imagem anteriores e ultrapassa os limites da qualidade da geração de texto para imagem.
Estamos introduzindo dois modelos da família Imagen 4, criados para atender a uma variedade de necessidades criativas:
Esse é nosso principal modelo de texto para imagem, projetado para lidar com uma ampla gama de tarefas de geração de imagens com melhorias de qualidade significativas em relação ao Imagen 3, principalmente para geração de texto. O preço do Imagen 4 é US$ 0,04 por imagem de saída.
Quando você deseja que suas imagens sigam precisamente as instruções, o Imagen 4 Ultra é o modelo certo. Ele foi projetado para produzir resultados mais alinhados aos prompts de texto, alcançando resultados sólidos em comparação com outros modelos líderes de geração de imagens. O preço do Imagen 4 Ultra é US$ 0,06 por imagem de saída.
Introduziremos outras modalidades de cobrança nas próximas semanas. Enquanto isso, você pode solicitar limites de taxa mais altos para o Imagen 4 e o Imagen 4 Ultra.
Para dar a você uma ideia dos recursos do Imagen 4, seguem alguns exemplos do que é possível criar. Os prompts abaixo, criados com o Imagen 4 Ultra, mostram a versatilidade do modelo em vários estilos e conteúdos. (Observação: os prompts nesta postagem foram traduzidos livremente do original em inglês para fins de compreensão.)
Prompt: Uma história em quadrinhos épica cósmica com 3 painéis. Painel 1: o pequenino "Stardust" em uma nebulosa; o radar mostra uma anomalia (texto "ANOMALY DETECTED"), texto do casco da nave "stardust". O piloto sussurra. Painel 2: Surge um leviatã bioluminescente; console vermelho com texto "WARNING!". Painel 3: o leviatã persegue a nave em meio a asteroides; console vermelho com texto "SHIELD CRITICAL", texto na tela "EVADE!". O piloto grita, SFX "CRUNCH!", "ROOOOAAARR!".
Prompt: Frente de um cartão postal de viagem vintage para Kyoto: pagoda icônica sob flores de cerejeira, montanhas cobertas de neve à distância, céu azul claro, cores vibrantes.
Prompt: Fotografia de um casal aventureiro fazendo hiking no pico de uma montanha ao nascer do sol, braços levantados em triunfo, vista panorâmica épica dos vales abaixo, luz dramática.
Prompt: Imagem editorial de moda avant-garde: uma modelo em um vestido volumoso e arquitetônico em pé em uma paisagem alienígena cintilante sob um pôr do sol binário, cores surreais, alto conceito, cinematográfica.
Para ajudar a manter a confiança e a transparência, todas as imagens geradas pelos modelos Imagen 4 continuarão a incluir uma marca d'água SynthID digital não visível. Para começar, confira a documentação oficial e os manuais:
Mal podemos esperar para ver o que você vai criar com o Imagen 4 usando a API do Gemini e o Google AI Studio e para disponibilizar esses modelos em geral nas próximas semanas.