43 resultados
15 DE OCTUBRE DE 2025 / AI
Google lanza Veo 3.1 y Veo 3.1 Fast, un modelo de generación de video actualizado, en versión preliminar paga a través de la API de Gemini. Esta versión ofrece un audio nativo más rico, un mayor control narrativo y capacidades mejoradas de imagen a video. Las nuevas funciones incluyen guiar la generación con imágenes de referencia, ampliar los videos de Veo existentes y generar transiciones entre fotogramas. Empresas como Promise Studios, Latitude y Whering ya están utilizando Veo 3.1 en varias aplicaciones.
5 DE SEPTIEMBRE DE 2025 / Mobile
Google AI Edge amplió la versión preliminar de Gemma 3n para incluir compatibilidad con audio. Los usuarios pueden reproducir contenido en su propio teléfono móvil utilizando Google AI Edge Gallery, que ahora está disponible en la versión beta abierta en Play Store.
4 DE SEPTIEMBRE DE 2025 / Gemma
Presentamos EmbeddingGemma: un nuevo modelo de integración de Google diseñado para aplicaciones de IA eficientes en el dispositivo. Este modelo abierto es el modelo de integración multilingüe de solo texto de más alto rango con menos de 500 millones de parámetros en el punto de referencia MTEB, lo que permite usar funciones potentes, como la búsqueda semántica y RAG directamente en dispositivos móviles sin conexión a Internet.
15 DE AGOSTO DE 2025 / Google AI Studio
Google anuncia la disponibilidad general de Imagen 4, su modelo avanzado de texto a imagen, en la API de Gemini y Google AI Studio, con mejoras significativas en la representación de texto. El nuevo modelo Imagen 4 Fast, diseñado para la velocidad y la generación rápida de imágenes, ahora está disponible junto con Imagen 4 e Imagen 4 Ultra, que también admiten la generación de imágenes con una resolución de hasta 2K.
31 DE JULIO DE 2025 / AI
Google presenta Veo 3 Fast, un modelo con velocidad y precio optimizados, junto con nuevas funciones de imagen a video para Veo 3 y Veo 3 Fast, que permiten a los desarrolladores crear de manera eficiente contenido de video de alta calidad a partir de texto o imágenes fijas, con precios variables según el modelo y la inclusión de audio, ahora disponible en la API de Gemini.
24 DE JULIO DE 2025 / Google Labs
Opal es una nueva herramienta experimental de Google Labs que te ayuda a redactar indicaciones para convertirlas en miniapps dinámicas de varios pasos utilizando un lenguaje natural, eliminando la necesidad de código y permitiendo a los usuarios crear e implementar aplicaciones de IA compartibles con funciones potentes y una integración perfecta con las herramientas existentes de Google.
17 DE JULIO DE 2025 / Gemini
Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.
14 DE JULIO DE 2025 / Gemini
El modelo de texto Gemini Embedding ahora está disponible de forma general en la API de Gemini y Vertex AI. Este versátil modelo se ha clasificado constantemente como el número 1 en el ranking multilingüe de MTEB desde su lanzamiento experimental en marzo, admite más de 100 idiomas, tiene una longitud máxima de token de entrada de 2,048 y tiene un precio de USD 0.15 por 1 millón de tokens de entrada.
10 DE JULIO DE 2025 / Cloud
Las actualizaciones en Firebase Studio incluyen nuevos modos de agente, soporte fundamental para el protocolo de contexto de modelo (MCP) e integración de Gemini CLI, todos diseñados para redefinir el desarrollo asistido por IA, lo que permite a los desarrolladores crear aplicaciones de pila completa a partir de una sola indicación e integrar potentes capacidades de IA directamente en su flujo de trabajo.
9 DE JULIO DE 2025 / Gemma
T5Gemma es una nueva familia de LLM de codificador-decodificador desarrollados mediante la conversión y adaptación de modelos preentrenados de solo decodificador basados en el marco Gemma 2, que ofrecen un rendimiento y una eficiencia superiores en comparación con sus contrapartes de solo decodificador, en particular para tareas que requieren una profunda comprensión de entrada, como resúmenes y traducción.