Veo 3 Fast y las nuevas funciones de imagen a video

31 DE JULIO DE 2025
Alisa Fortin Product Manager
Seth Odoom Product Manager

Basándonos en el reciente lanzamiento de Veo 3, ahora presentamos Veo 3 Fast, un modelo con velocidad y precio optimizados, que permite a los desarrolladores iterar más rápido mientras producen resultados de alta calidad de manera eficiente.

También llevamos las funciones de imagen a video a Veo 3 y Veo 3 Fast, lo que permite transformar imágenes fijas en clips que mantienen la coherencia. Ambos modelos, con funciones de imagen a video, están disponibles en versión preliminar paga a través de la API de Gemini.

Link to Youtube Video (visible only when JS is disabled)

Indicación en la nota al pie (1)

Un modelo más rápido y eficiente

Veo 3 Fast es una versión más rápida y rentable de Veo 3, que permite a los desarrolladores crear videos con sonido y, al mismo tiempo, mantener una alta calidad y optimizar la velocidad y los casos de uso comercial. Veo 3 Fast ofrece modalidades de texto a video e imagen a video.

Es la opción ideal para lo siguiente:

  • Publicidad programática: Potencia los servicios de backend que generan automáticamente creatividades publicitarias.

  • Creación rápida de prototipos: Habilita pruebas A/B rápidas de diferentes conceptos creativos.

  • Creación de contenido a escala: Crea aplicaciones que necesitan producir rápidamente contenido de redes sociales.


Veo 3 Fast costará USD 0.40 por segundo con audio.


Nuevas funciones de imagen a video

Ahora, los desarrolladores pueden usar Veo 3 y Veo 3 Fast para generar contenido de video de alta calidad (con sonido) a partir de imágenes de entrada. Esta nueva función permite la creación de secuencias de video dinámicas que pueden mantener la coherencia en la primera imagen. Simplemente proporciona una imagen junto con una indicación de texto y podrás guiar al modelo para lograr el movimiento, la narrativa y el audio deseados. Los resultados generados con imagen a video tendrán el mismo precio que los resultados de texto a video.

Link to Youtube Video (visible only when JS is disabled)

Indicación en la nota al pie (2)

Imagen a video se diseñó para ofrecerte más control creativo y flexibilidad:

  • Generación de videos de alta calidad: Crea videos fluidos y de calidad cinematográfica a partir de una sola imagen, manteniendo la coherencia estilística y los detalles, todo con audio.

  • Indicaciones precisas: Combina las entradas de imágenes con indicaciones de texto descriptivo para dirigir la acción, el estilo y la evolución de tu contenido de video.

  • Integración perfecta con la API: Accede a esta nueva y poderosa función a través de la misma API intuitiva de Gemini, lo que facilita la integración en tus flujos de trabajo y aplicaciones existentes.

Queda a USD 0.75 por segundo con audio.

En OpusClip, utilizamos Veo 3 para mejorar la experiencia de edición de video de nuestros clientes y generar videos B-roll a través de su capacidad de imagen a video. Veo 3 toma una imagen estática como primer fotograma y le da vida generando un movimiento suave y cinematográfico. Esto ayuda a los creadores a obtener contenido de video atractivo con el mínimo esfuerzo.


Comienza a crear el futuro de los videos hoy mismo

No podemos esperar para ver lo que los desarrolladores crearán con Veo 3, Veo 3 Fast y las funciones de imagen a video a través de la API de Gemini.

¡Explora la documentación de la API de Gemini para la generación de videos o la guía paso a paso de Veo y comienza a crear hoy mismo!



Indicaciones

1: La zapatilla del cartel cobra vida de repente, con sus cordones atándose. Salta de la pantalla, aterriza en la azotea de abajo con un suave ruido sordo y sale corriendo del encuadre. Audio: El sonido de atar cordones, un silbido digital, un suave sonido de aterrizaje.

2: El logotipo de la montaña en el bolso tote se anima sutilmente. El sol del logotipo se eleva detrás del pico de la montaña y pequeños pájaros salen volando de él. Audio: Un silbido suave y un suave gorjeo de pájaros.