Estamos encantados de llevar Imagen 4, nuestro mejor modelo de texto a imagen hasta ahora, a una vista previa pagada en la API de Gemini y para pruebas gratuitas limitadas en Google AI Studio. Imagen 4 ofrece una renderización de texto significativamente mejorada con respecto a nuestros modelos de imagen anteriores y amplía los límites de la calidad de generación de texto a imagen.
Presentamos dos modelos dentro de la familia de Imagen 4, diseñados para satisfacer una variedad de necesidades creativas:
Este es nuestro modelo insignia de texto a imagen diseñado para manejar una amplia gama de tareas de generación de imágenes con mejoras significativas en la calidad, particularmente para la generación de texto, con respecto a Imagen 3. Imagen 4 tiene un precio de USD 0.04 por imagen de salida.
Si necesitas que tus imágenes sigan las instrucciones con precisión, Imagen 4 Ultra es el modelo para ti. Está diseñado para producir resultados que estén más alineados con sus indicaciones de texto, logrando resultados sólidos en comparación con otros modelos líderes de generación de imágenes. Imagen 4 Ultra tiene un precio de USD 0.06 por imagen de salida.
Introduciremos niveles de facturación adicionales en las próximas semanas. Mientras tanto, puedes solicitar límites de tarifa más altos para Imagen 4 y 4 Ultra.
Para darte una idea de las capacidades de Imagen 4, aquí hay algunos ejemplos de lo que puede crear. Las indicaciones que aparecen a continuación, creadas con Imagen 4 Ultra, muestran la versatilidad del modelo en varios estilos y contenidos.
Indicación: Un cómic épico cósmico de 3 paneles. Panel 1: Pequeño “Stardust” en la nebulosa; el radar muestra una anomalía (texto “ANOMALÍA DETECTADA”), texto del casco “stardust”. El piloto susurra. Panel 2: emerge el leviatán bioluminiscente; se ve el texto rojo en la consola que dice “¡ADVERTENCIA!”. Panel 3: El leviatán persigue a la nave a través de asteroides; el texto de la consola es “¡ESCUDO EN GRAVE PELIGRO!”, el texto de la pantalla es “¡EVADIR!”. Gritos del piloto, efecto especial de CRUJIDO, “¡ROOOOAAARR!”.
Indicación: Frente de una postal antigua de un viaje a Kioto: pagoda icónica bajo flores de cerezo, montañas nevadas a lo lejos, cielo azul claro, colores vibrantes.
Indicación: Fotografía de una pareja aventurera caminando por el pico de una montaña al amanecer, brazos levantados en señal de triunfo, vista panorámica épica de los valles que hay debajo, luz dramática.
Indicación: Fotografía editorial de moda vanguardista: una modelo con un voluminoso vestido arquitectónico de pie sobre un paisaje brillante y extraño bajo un atardecer binario, colores surrealistas, concepto elevado, cinematográfico.
Para ayudar a mantener la confianza y la transparencia, todas las imágenes generadas por los modelos de Imagen 4 seguirán incluyendo una marca de agua digital SynthID no visible. Para comenzar, consulta la documentación oficial y las guías paso a paso:
Esperamos ver pronto lo que creas con Imagen 4 a través de la API de Gemini y Google AI Studio, y esperamos que estos modelos estén disponibles de forma general en las próximas semanas.