21 resultados
26 DE AGOSTO DE 2025 / Gemini
Gemini 2.5 Flash Image es un nuevo modelo de generación y edición de imágenes que permite combinar múltiples imágenes, mantener la coherencia de los personajes y las transformaciones específicas utilizando lenguaje natural, aprovechando el conocimiento mundial de Gemini, ahora disponible a través de la API de Gemini, Google AI Studio y Vertex AI.
15 DE AGOSTO DE 2025 / Google AI Studio
Google anuncia la disponibilidad general de Imagen 4, su modelo avanzado de texto a imagen, en la API de Gemini y Google AI Studio, con mejoras significativas en la representación de texto. El nuevo modelo Imagen 4 Fast, diseñado para la velocidad y la generación rápida de imágenes, ahora está disponible junto con Imagen 4 e Imagen 4 Ultra, que también admiten la generación de imágenes con una resolución de hasta 2K.
17 DE JULIO DE 2025 / Gemini
Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.
14 DE JULIO DE 2025 / Gemini
El modelo de texto Gemini Embedding ahora está disponible de forma general en la API de Gemini y Vertex AI. Este versátil modelo se ha clasificado constantemente como el número 1 en el ranking multilingüe de MTEB desde su lanzamiento experimental en marzo, admite más de 100 idiomas, tiene una longitud máxima de token de entrada de 2,048 y tiene un precio de USD 0.15 por 1 millón de tokens de entrada.
24 DE JUNIO DE 2025 / Gemini
Gemini 2.5 Pro y Flash están transformando la robótica a través de la mejora de la codificación, el razonamiento y las capacidades multimodales, incluida la comprensión espacial. Estos modelos se utilizan para la comprensión semántica de escenas, la generación de código para el control de robots y la creación de aplicaciones interactivas con la API Live, con un fuerte énfasis en las mejoras de seguridad y las aplicaciones comunitarias.
24 DE JUNIO DE 2025 / Gemini
Imagen 4, el modelo avanzado de texto a imagen de Google, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio, y ofrece mejoras de calidad significativas, especialmente para la generación de texto dentro de las imágenes. La familia de Imagen 4 incluye Imagen 4 para tareas generales e Imagen 4 Ultra para una adherencia de alta precisión a las indicaciones, con todas las imágenes generadas con una marca de agua SynthID no visible.
23 DE MAYO DE 2025 / Gemini
Anunciamos nuevas funciones y modelos para la API de Gemini, con la introducción de Gemini 2.5 Flash Preview con un mejor razonamiento y mayor eficiencia, Gemini 2.5 Pro y Flash de texto a voz que admiten múltiples idiomas y hablantes, y el diálogo de audio nativo de Gemini 2.5 Flash para IA conversacional.
21 DE MAYO DE 2025 / Google AI Studio
Para mejorar la experiencia del desarrollador, Google AI Studio se actualizó con generación de código nativo con Gemini 2.5 Pro, herramientas agénticas y funcionalidades potenciadas de generación multimodal, además de nuevas funciones como la pestaña Build, Live API y herramientas mejoradas para crear aplicaciones de IA sofisticadas.
9 DE MAYO DE 2025 / Cloud
Revisa los anuncios de la Games Developer Conference (GDC) de este año. Explora cómo los modelos de Gemma y Gemini pueden ayudar a crear experiencias de IA en los juegos con el lanzamiento de Gemma 3, el complemento de Unity y su aplicación en un juego de muestra, y cómo expandir juegos con IA generativa en Google Cloud.
9 DE MAYO DE 2025 / DeepMind
Gemini 2.5 implica un gran salto en la comprensión de video, ya que logra un rendimiento de vanguardia en puntos de referencia clave de comprensión de video y puede usar sin problemas información audiovisual con código y otros formatos de datos.