43 resultados
4 DE SEPTIEMBRE DE 2025 / Gemma
Presentamos EmbeddingGemma: un nuevo modelo de integración de Google diseñado para aplicaciones de IA eficientes en el dispositivo. Este modelo abierto es el modelo de integración multilingüe de solo texto de más alto rango con menos de 500 millones de parámetros en el punto de referencia MTEB, lo que permite usar funciones potentes, como la búsqueda semántica y RAG directamente en dispositivos móviles sin conexión a Internet.
17 DE JULIO DE 2025 / Gemini
Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.
25 DE JUNIO DE 2025 / Gemini
Un prototipo de investigación que simula un sistema operativo neural genera una interfaz de usuario en tiempo real que se adapta a las interacciones del usuario con Gemini 2.5 Flash-Lite, utilizando el rastreo de interacciones para la conciencia contextual, la transmisión de la interfaz de usuario para la capacidad de respuesta y el logro de estado con un gráfico de interfaz de usuario en memoria.
28 DE MAYO DE 2025 / Gemini
El proyecto “Espejo Mágico” utiliza la API de Gemini, e incluye la API Live, la llamada a funciones y la conexión con la Búsqueda de Google, para crear una experiencia interactiva y dinámica, y demostrar el poder de los modelos de Gemini para generar imágenes, contar historias y brindar información en tiempo real a través de un objeto familiar.
23 DE MAYO DE 2025 / Gemini
Anunciamos nuevas funciones y modelos para la API de Gemini, con la introducción de Gemini 2.5 Flash Preview con un mejor razonamiento y mayor eficiencia, Gemini 2.5 Pro y Flash de texto a voz que admiten múltiples idiomas y hablantes, y el diálogo de audio nativo de Gemini 2.5 Flash para IA conversacional.
20 DE MAYO DE 2025 / Gemma
Gemma 3n es un modelo abierto de vanguardia, diseñado para una IA rápida y multimodal en dispositivos que ofrece un rendimiento optimizado, una flexibilidad única con un modelo 2 en 1 y una comprensión multimodal ampliada con audio, lo que permite a los desarrolladores compilar aplicaciones interactivas en vivo y sofisticadas experiencias centradas en el audio.
20 DE MAYO DE 2025 / AI Edge
Entre las mejoras de Google AI Edge, se incluyen nuevos modelos de Gemma 3, mayor compatibilidad con modelos y funciones, como RAG en el dispositivo y llamada a funciones, para optimizar capacidades de IA generativa en dispositivos.
9 DE MAYO DE 2025 / Cloud
Revisa los anuncios de la Games Developer Conference (GDC) de este año. Explora cómo los modelos de Gemma y Gemini pueden ayudar a crear experiencias de IA en los juegos con el lanzamiento de Gemma 3, el complemento de Unity y su aplicación en un juego de muestra, y cómo expandir juegos con IA generativa en Google Cloud.
8 DE MAYO DE 2025 / Gemini
El lanzamiento del almacenamiento en caché implícito en la API de Gemini amplía la API de almacenamiento en caché explícito existente y proporciona un sistema de almacenamiento en caché “siempre activo” que ofrece ahorros de costos automáticos a los desarrolladores que utilizan los modelos de Gemini 2.5 y la disponibilidad continua de la API de almacenamiento en caché explícito a fin de garantizar ahorros.
30 DE ABRIL DE 2025 / Gemma
Las nuevas funciones de Gemma 3 incluyen capacidades de lenguaje-visión y cambios arquitectónicos para mejorar la eficiencia de la memoria y procesar contextos más extensos, en comparación con los modelos anteriores de Gemma.