- Google Developers Blog

15 DE OCTUBRE DE 2025 / AI

Presentamos Veo 3.1 y las nuevas capacidades creativas en la API de Gemini

Google lanza Veo 3.1 y Veo 3.1 Fast, un modelo de generación de video actualizado, en versión preliminar paga a través de la API de Gemini. Esta versión ofrece un audio nativo más rico, un mayor control narrativo y capacidades mejoradas de imagen a video. Las nuevas funciones incluyen guiar la generación con imágenes de referencia, ampliar los videos de Veo existentes y generar transiciones entre fotogramas. Empresas como Promise Studios, Latitude y Whering ya están utilizando Veo 3.1 en varias aplicaciones.
15 DE AGOSTO DE 2025 / Google AI Studio

Anuncio de Imagen 4 Fast y la disponibilidad general de la familia Imagen 4 en la API de Gemini

Google anuncia la disponibilidad general de Imagen 4, su modelo avanzado de texto a imagen, en la API de Gemini y Google AI Studio, con mejoras significativas en la representación de texto. El nuevo modelo Imagen 4 Fast, diseñado para la velocidad y la generación rápida de imágenes, ahora está disponible junto con Imagen 4 e Imagen 4 Ultra, que también admiten la generación de imágenes con una resolución de hasta 2K.
31 DE JULIO DE 2025 / AI

Veo 3 Fast y las nuevas funciones de imagen a video

Google presenta Veo 3 Fast, un modelo con velocidad y precio optimizados, junto con nuevas funciones de imagen a video para Veo 3 y Veo 3 Fast, que permiten a los desarrolladores crear de manera eficiente contenido de video de alta calidad a partir de texto o imágenes fijas, con precios variables según el modelo y la inclusión de audio, ahora disponible en la API de Gemini.
17 DE JULIO DE 2025 / Gemini

Compila con Veo 3, ahora disponible en la disponible en la API de Gemini

Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.
10 DE JULIO DE 2025 / Gemini

Anunciamos GenAI Processors: compila aplicaciones basadas en Gemini potentes y flexibles

GenAI Processors es una nueva biblioteca Python de código abierto de Google DeepMind diseñada para simplificar el desarrollo de aplicaciones de IA, especialmente aquellas que manejan entradas multimodales y requieren capacidad de respuesta en tiempo real, al proporcionar una interfaz de “procesador” coherente para todos los pasos, desde el manejo de entradas hasta el procesamiento de llamadas y salidas de modelos, para un encadenamiento sin interrupciones y una ejecución simultánea.
24 DE JUNIO DE 2025 / Gemini

Gemini 2.5 para robótica e inteligencia integrada

Gemini 2.5 Pro y Flash están transformando la robótica a través de la mejora de la codificación, el razonamiento y las capacidades multimodales, incluida la comprensión espacial. Estos modelos se utilizan para la comprensión semántica de escenas, la generación de código para el control de robots y la creación de aplicaciones interactivas con la API Live, con un fuerte énfasis en las mejoras de seguridad y las aplicaciones comunitarias.
24 DE JUNIO DE 2025 / Gemini

Imagen 4 ahora está disponible en la API de Gemini y Google AI Studio

Imagen 4, el modelo avanzado de texto a imagen de Google, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio, y ofrece mejoras de calidad significativas, especialmente para la generación de texto dentro de las imágenes. La familia de Imagen 4 incluye Imagen 4 para tareas generales e Imagen 4 Ultra para una adherencia de alta precisión a las indicaciones, con todas las imágenes generadas con una marca de agua SynthID no visible.

Buscar

Tipo de contenido

Producto

Tecnología

Presentamos Veo 3.1 y las nuevas capacidades creativas en la API de Gemini

Anuncio de Imagen 4 Fast y la disponibilidad general de la familia Imagen 4 en la API de Gemini

Veo 3 Fast y las nuevas funciones de imagen a video

Compila con Veo 3, ahora disponible en la disponible en la API de Gemini

Anunciamos GenAI Processors: compila aplicaciones basadas en Gemini potentes y flexibles

Gemini 2.5 para robótica e inteligencia integrada

Imagen 4 ahora está disponible en la API de Gemini y Google AI Studio

Tipo de contenido

Producto

Tecnología