- Google Developers Blog

15 DE OCTUBRE DE 2025 / AI

Presentamos Veo 3.1 y las nuevas capacidades creativas en la API de Gemini

Google lanza Veo 3.1 y Veo 3.1 Fast, un modelo de generación de video actualizado, en versión preliminar paga a través de la API de Gemini. Esta versión ofrece un audio nativo más rico, un mayor control narrativo y capacidades mejoradas de imagen a video. Las nuevas funciones incluyen guiar la generación con imágenes de referencia, ampliar los videos de Veo existentes y generar transiciones entre fotogramas. Empresas como Promise Studios, Latitude y Whering ya están utilizando Veo 3.1 en varias aplicaciones.

5 DE SEPTIEMBRE DE 2025 / Mobile

Google AI Edge Gallery: Ahora con audio y en Google Play

Google AI Edge amplió la versión preliminar de Gemma 3n para incluir compatibilidad con audio. Los usuarios pueden reproducir contenido en su propio teléfono móvil utilizando Google AI Edge Gallery, que ahora está disponible en la versión beta abierta en Play Store.

4 DE SEPTIEMBRE DE 2025 / Gemma

Presentamos EmbeddingGemma: el mejor modelo abierto para integraciones en el dispositivo

Presentamos EmbeddingGemma: un nuevo modelo de integración de Google diseñado para aplicaciones de IA eficientes en el dispositivo. Este modelo abierto es el modelo de integración multilingüe de solo texto de más alto rango con menos de 500 millones de parámetros en el punto de referencia MTEB, lo que permite usar funciones potentes, como la búsqueda semántica y RAG directamente en dispositivos móviles sin conexión a Internet.

15 DE AGOSTO DE 2025 / Google AI Studio

Anuncio de Imagen 4 Fast y la disponibilidad general de la familia Imagen 4 en la API de Gemini

Google anuncia la disponibilidad general de Imagen 4, su modelo avanzado de texto a imagen, en la API de Gemini y Google AI Studio, con mejoras significativas en la representación de texto. El nuevo modelo Imagen 4 Fast, diseñado para la velocidad y la generación rápida de imágenes, ahora está disponible junto con Imagen 4 e Imagen 4 Ultra, que también admiten la generación de imágenes con una resolución de hasta 2K.

Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API

31 DE JULIO DE 2025 / AI

Veo 3 Fast y las nuevas funciones de imagen a video

Google presenta Veo 3 Fast, un modelo con velocidad y precio optimizados, junto con nuevas funciones de imagen a video para Veo 3 y Veo 3 Fast, que permiten a los desarrolladores crear de manera eficiente contenido de video de alta calidad a partir de texto o imágenes fijas, con precios variables según el modelo y la inclusión de audio, ahora disponible en la API de Gemini.

Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API

24 DE JULIO DE 2025 / Google Labs

Presentamos Opal: describe, crea y comparte tus miniapps con IA

Opal es una nueva herramienta experimental de Google Labs que te ayuda a redactar indicaciones para convertirlas en miniapps dinámicas de varios pasos utilizando un lenguaje natural, eliminando la necesidad de código y permitiendo a los usuarios crear e implementar aplicaciones de IA compartibles con funciones potentes y una integración perfecta con las herramientas existentes de Google.

17 DE JULIO DE 2025 / Gemini

Compila con Veo 3, ahora disponible en la disponible en la API de Gemini

Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.

Build with Veo 3, now available in the Gemini API and Google AI Studio

14 DE JULIO DE 2025 / Gemini

Gemini Embedding ahora disponible de forma general en la API de Gemini

El modelo de texto Gemini Embedding ahora está disponible de forma general en la API de Gemini y Vertex AI. Este versátil modelo se ha clasificado constantemente como el número 1 en el ranking multilingüe de MTEB desde su lanzamiento experimental en marzo, admite más de 100 idiomas, tiene una longitud máxima de token de entrada de 2,048 y tiene un precio de USD 0.15 por 1 millón de tokens de entrada.

Gemini Embedding now generally available in the Gemini API

10 DE JULIO DE 2025 / Cloud

Avances en el desarrollo de IA agéntica con Firebase Studio

Las actualizaciones en Firebase Studio incluyen nuevos modos de agente, soporte fundamental para el protocolo de contexto de modelo (MCP) e integración de Gemini CLI, todos diseñados para redefinir el desarrollo asistido por IA, lo que permite a los desarrolladores crear aplicaciones de pila completa a partir de una sola indicación e integrar potentes capacidades de IA directamente en su flujo de trabajo.

Advancing agentic AI development with Firebase Studio

9 DE JULIO DE 2025 / Gemma

T5Gemma: una nueva colección de modelos Gemma codificadores-decodificadores

T5Gemma es una nueva familia de LLM de codificador-decodificador desarrollados mediante la conversión y adaptación de modelos preentrenados de solo decodificador basados en el marco Gemma 2, que ofrecen un rendimiento y una eficiencia superiores en comparación con sus contrapartes de solo decodificador, en particular para tareas que requieren una profunda comprensión de entrada, como resúmenes y traducción.

Buscar

Tipo de contenido

Producto

Tecnología