Imagen 3 llega a la API de Gemini

FEB 06, 2025
Ivan Solovyev Product Manager

Ahora, los desarrolladores pueden acceder a Imagen 3, el modelo de generación de imágenes de última generación de Google, a través de la API de Gemini. Inicialmente, solo podrán acceder los usuarios de pago, pero dentro de poco se lanzará en el nivel gratuito.

Imagen 3 se destaca por producir imágenes visualmente atractivas y sin artefactos en una amplia variedad de estilos, desde las hiperrealistas hasta paisajes impresionistas, composiciones abstractas y personajes de anime. El seguimiento de indicaciones mejorado facilita la conversión de grandes ideas en imágenes de alta calidad. En general, Imagen 3 logra un rendimiento de vanguardia en una variedad de puntos de referencia. Imagen 3 alcanza este objetivo al precio de USD 0,03 por imagen en la API de Gemini y ofrece control sobre las relaciones de aspecto, la cantidad de opciones para generar y más.

Para ayudar a combatir la desinformación y la atribución errónea, todas las imágenes generadas por Imagen 3 incluyen una marca de agua digital SynthID no visible, que las identifica como generadas por IA.


Mira Imagen 3 en acción

En la galería que se muestra a continuación, se destacan las capacidades de Imagen 3 en una variedad de estilos.

Imagen 3 generated image of a group of people looking happy, natural light, 8k
Instrucción: Grupo de personas felices, luz natural, 8K.
Imagen 3 generated Hyperrealistic portrait of a person dressed in 1920s flapper fashion, vintage style, black and white photograph, elegant pose, 8k
Instrucción: Retrato hiperrealista de una persona vestida según la moda flapper de la década de 1920, estilo vintage, fotografía en blanco y negro, pose elegante, 8K.
Imagen 3 generated image of a close-up of a vintage watch with realistic and detailed mechanism
Instrucción: Imagina un primer plano de un reloj vintage. Genera una representación realista con un mecanismo detallado.
Imagen 3 generated image of an impressionistic landscape painting of a sunset over a field of sunflowers, vibrant colors, thick brushstrokes, inspired by Monet
Instrucción: Pintura paisajística impresionista de una puesta de sol sobre un campo de girasoles, colores vibrantes, pinceladas gruesas, inspirada en Monet.
Imagen 3 generated image of A surreal dreamscape featuring a giant tortoise with a lush forest growing on its back, floating through a starry sky, glowing mushrooms, bioluminescent plants, ethereal atmosphere
Instrucción: Un paisaje de ensueño surrealista con una tortuga gigante en cuyo caparazón crece un exuberante bosque; va flotando a través en un cielo estrellado, entre hongos brillantes y plantas bioluminiscentes, en una atmósfera etérea.
Imagen 3 generated lifestyle image of freshly roasted coffee beans spilling out of a burlap sack onto a rustic wooden table next to a up of coffee with 'Awaken Your Senses' written on the cup in cursive
Instrucción: Imagen de estilo de vida con granos de café recién tostados que se derraman de un saco de arpillera sobre una mesa de madera rústica. Cerca, de una taza de café sale vapor. En la taza se lee “Awaken Your Senses” en cursiva. Ambiente cálido y acogedor, luz solar de la mañana, fotografía de producto.
Imagen 3 generated hyperrealistic portrait of a woman with piercing blue eyes, laughing, freckles, dramatic lighting, detailed skin texture, 8k
Instrucción: Retrato hiperrealista de una mujer con ojos azules penetrantes, que ríe y tiene pecas. Iluminación dramática, textura detallada de la piel, 8K.
Imagen 3 generated panoramic view of a majestic mountain range at dawn
Instrucción: Una vista panorámica de una majestuosa cordillera al amanecer.
Imagen 3 generated scene from a game where the player needs to find a specific object by looking into drawers in a messy desk
Instrucción: Muestra una escena de un juego en la que el jugador necesita encontrar un objeto específico y busca en los cajones de un escritorio desordenado.
Imagen 3 generated painted cityscape in the style of Van Gogh
Instrucción: Un paisaje urbano pintado al estilo de Van Gogh, con pinceladas arremolinadas y colores vibrantes.

Comienza a usar Imagen 3 en la API de Gemini

En este fragmento de código, se de Python muestra cómo generar una imagen con Imagen 3 utilizando la API de Gemini.

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
 
client = genai.Client(api_key='GEMINI_API_KEY')
 
response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='a portrait of a sheepadoodle wearing cape',
    config=types.GenerateImagesConfig(
        number_of_images=1,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

Imagen generada

Imagen 3 generated portrait of a sheepadoodle wearing a cape

Puedes consultar más consejos y estilos de imagen en los documentos para desarrolladores de la API de Gemini, en los que hay más detalles disponibles sobre las puntuaciones, la metodología y la mejora del rendimiento, en el Apéndice D del informe técnico actualizado.

Tenemos muchas ganas de dar el primer paso para ampliar la disponibilidad de los modelos de medios generativos en la API de Gemini y planeamos ofrecer más modelos pronto para que los desarrolladores puedan unir los medios generativos y los modelos de lenguaje.