Presentamos Gemini 2.5 Flash Image, nuestro modelo de imágenes de última generación

26 DE AGOSTO DE 2025
Alisa Fortin Product Manager
Guillaume Vernade Gemini Developer Advocate
Kat Kampf Product Manager
Ammaar Reshi Product and Design Lead AI Studio

Nos complace presentar Gemini 2.5 Flash Image (también conocido como Nano-banana), nuestro novedoso modelo de generación y edición de imágenes. Esta actualización te permite combinar múltiples imágenes en una sola imagen, mantener la coherencia de los personajes para una narración enriquecida, realizar transformaciones específicas utilizando lenguaje natural y utilizar el conocimiento mundial de Gemini para generar y editar imágenes.

Cuando lanzamos por primera vez la generación de imágenes nativas en Gemini 2.0 Flash a principios de este año, nos dijiste que te encantaba su baja latencia, rentabilidad y facilidad de uso. Pero también nos comentaste que necesitabas imágenes de mayor calidad y un control creativo más potente.

Este modelo está disponible en este momento a través de la API de Gemini y Google AI Studio para desarrolladores y Vertex AI para empresas. Gemini 2.5 Flash Image tiene un precio de USD 30.00 por 1 millón de tokens de salida, siendo cada imagen de 1,290 tokens de salida (USD 0.039 por imagen). Todas las demás modalidades de entrada y salida siguen los precios de Gemini 2.5 Flash.

Gemini 2.5 Flash Image en acción

Para que la compilación con Gemini 2.5 Flash Image sea aún más fácil, realizamos actualizaciones significativas en el “modo de compilación” de Google AI Studio (con más actualizaciones por venir). En los siguientes ejemplos, no solo puedes probar rápidamente las funciones del modelo con aplicaciones personalizadas impulsadas por IA, también puedes remezclarlas o dar vida a las ideas con una sola indicación. Cuando tengas todo listo para compartir una aplicación que hayas creado, puedes implementarla directamente desde Google AI Studio o guardar el código en GitHub.

Prueba una indicación como “Crea una aplicación de edición de imágenes que permita a un usuario cargar una imagen y aplicar diferentes filtros” o elige una de las plantillas preestablecidas y mézclala de nuevo, ¡todo gratis!


Mantiene la coherencia de los personajes

Un desafío fundamental en la generación de imágenes es mantener la apariencia de un personaje u objeto en múltiples indicaciones y ediciones. Ahora puedes colocar el mismo personaje en diferentes entornos, mostrar un solo producto desde múltiples ángulos en nuevos entornos o generar activos de marca coherentes, todo mientras preservas el tema.

Creamos una aplicación de plantilla en Google AI Studio (que puedes personalizar y codificar en Vibe fácilmente) para demostrar las capacidades de coherencia de personajes del modelo.

(Secuencia acortada)

Más allá de la coherencia de los personajes, el modelo también es excelente para adherirse a las plantillas visuales. Ya vimos a desarrolladores explorar áreas como tarjetas de listado de bienes raíces, insignias uniformes de empleados o bocetos dinámicos de productos para un catálogo completo, todo desde una sola plantilla de diseño.

gemini-2-5-image-editing-character-consistency

Edición de imágenes basada en indicaciones

Gemini 2.5 Flash Image permite una transformación específica y ediciones locales precisas con lenguaje natural. Por ejemplo, el modelo puede difuminar el fondo de una imagen, eliminar una mancha en una camiseta, eliminar a una persona de una foto, alterar la pose de un sujeto, agregar color a una foto en blanco y negro o cualquier otra cosa que puedas evocar con una simple indicación.

Para mostrarte estas funciones en acción, creamos una aplicación de plantilla de edición de fotos en AI Studio, con controles basados en la interfaz de usuario y en mensajes.

gemini-2-5-flash-prompt-based-image-editing

Conocimiento nativo del mundo

Históricamente, los modelos de generación de imágenes se han destacado en imágenes estéticas, pero carecían de una comprensión profunda y semántica del mundo real. Con Gemini 2.5 Flash Image, el modelo se beneficia del conocimiento mundial de Gemini, lo que abre nuevos casos de uso.

Para demostrarlo, creamos una aplicación de plantilla en Google AI Studio que convierte un lienzo simple en un tutor educativo interactivo. Muestra la capacidad del modelo para leer y comprender diagramas dibujados a mano, ayudar con preguntas del mundo real y seguir instrucciones de edición complejas en un solo paso.

(Indicaciones de ejemplo y resultados del modelo)

Fusión de múltiples imágenes

Gemini 2.5 Flash Image puede comprender y combinar múltiples imágenes de entrada. Puedes poner un objeto en una escena, rediseñar una habitación con una combinación de colores o textura, y fusionar imágenes con una sola indicación.

Para mostrar la fusión de múltiples imágenes, creamos una aplicación de plantilla en Google AI Studio que te permite arrastrar productos a una nueva escena para crear rápidamente una nueva imagen fusionada fotorrealista.

(Secuencias acortadas)

Comienza a compilar

Echa un vistazo a nuestros documentos para desarrolladores para comenzar a compilar con Gemini 2.5 Flash Image. El modelo está en versión preliminar hoy a través de la API de Gemini y Google AI Studio, pero se volverá estable en las próximas semanas. Todas las aplicaciones de demostración que resaltamos aquí estaban codificadas en Vibe en Google AI Studio para que se puedan volver a combinar y personalizar con solo una indicación.

OpenRouter.ai se asoció con nosotros para ayudar a llevar Gemini 2.5 Flash Image a sus más de 3 millones de desarrolladores actuales de todos lados. Este es el primer modelo en OpenRouter, de los más de 480 activos hoy en día, que puede generar imágenes.

También tenemos un gran entusiasmo por asociarnos con fal.ai, una plataforma para desarrolladores líder para medios generativos, para hacer que Gemini 2.5 Flash Image esté disponible para la comunidad de desarrolladores en general.

Todas las imágenes creadas o editadas con Gemini 2.5 Flash Image incluirán una marca de agua digital SynthID invisible, para que puedan identificarse como generadas o editadas por IA.

from google import genai
from PIL import Image
from io import BytesIO
 
client = genai.Client()
 
prompt = "Create a picture of my cat eating a nano-banana in a fancy restaurant under the gemini constellation"
 
image = Image.open('/path/to/image.png')
 
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt, image],
)
 
for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))   
    image.save("generated_image.png")
Python

Estamos trabajando activamente para mejorar la renderización de texto de formato largo, una coherencia de personajes aún más confiable y una representación objetiva como detalles finos en las imágenes. Continúa enviándonos comentarios en nuestro foro de desarrolladores o en X.

¡Ya queremos ver lo que creas con Gemini 2.5 Flash Image!