10 resultados
28 DE AGOSTO DE 2025 / AI
Detailed prompting techniques and best practices for various applications, including photorealistic scenes, stylized illustrations, product mockups, and more using Google's newly released Gemini 2.5 Flash Image; a natively multimodal model capable of generating, editing, and composing images using text, supporting capabilities like text-to-image, image editing, style transfer, and multi-image composition.
26 DE AGOSTO DE 2025 / Gemini
Gemini 2.5 Flash Image is a new state-of-the-art image generation and editing model that allows for blending multiple images, maintaining character consistency, and targeted transformations using natural language, leveraging Gemini's world knowledge, now available through the Gemini API, Google AI Studio, and Vertex AI.
18 DE AGOSTO DE 2025 / Gemini
La herramienta de contexto de URL de la API de Gemini ahora está disponible de forma general, lo que permite a los desarrolladores establecer indicaciones utilizando contenido web en lugar de cargas manuales. Esta versión amplía la compatibilidad con PDF e imágenes.
15 DE AGOSTO DE 2025 / Google AI Studio
Google anuncia la disponibilidad general de Imagen 4, su modelo avanzado de texto a imagen, en la API de Gemini y Google AI Studio, con mejoras significativas en la representación de texto. El nuevo modelo Imagen 4 Fast, diseñado para la velocidad y la generación rápida de imágenes, ahora está disponible junto con Imagen 4 e Imagen 4 Ultra, que también admiten la generación de imágenes con una resolución de hasta 2K.
31 DE JULIO DE 2025 / AI
Google presenta Veo 3 Fast, un modelo con velocidad y precio optimizados, junto con nuevas funciones de imagen a video para Veo 3 y Veo 3 Fast, que permiten a los desarrolladores crear de manera eficiente contenido de video de alta calidad a partir de texto o imágenes fijas, con precios variables según el modelo y la inclusión de audio, ahora disponible en la API de Gemini.
17 DE JULIO DE 2025 / Gemini
Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.
24 DE JUNIO DE 2025 / Gemini
Imagen 4, el modelo avanzado de texto a imagen de Google, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio, y ofrece mejoras de calidad significativas, especialmente para la generación de texto dentro de las imágenes. La familia de Imagen 4 incluye Imagen 4 para tareas generales e Imagen 4 Ultra para una adherencia de alta precisión a las indicaciones, con todas las imágenes generadas con una marca de agua SynthID no visible.
23 DE MAYO DE 2025 / Gemini
Anunciamos nuevas funciones y modelos para la API de Gemini, con la introducción de Gemini 2.5 Flash Preview con un mejor razonamiento y mayor eficiencia, Gemini 2.5 Pro y Flash de texto a voz que admiten múltiples idiomas y hablantes, y el diálogo de audio nativo de Gemini 2.5 Flash para IA conversacional.
15 DE ABRIL DE 2025 / Gemini
Genera videos de alta calidad a partir de instrucciones en texto e imágenes con Veo 2, un modelo de generación de videos que ya cuenta con disponibilidad general en la API de Gemini y Google AI Studio para mejorar la forma en que creas contenido y tus iniciativas de marketing.
9 DE ABRIL DE 2025 / Gemini
Las actualizaciones de la API de Gemini, incluida la preparación para la producción de Veo 2 para generación de video, la versión preliminar de la API Live para interacciones en tiempo real y el próximo modelo de Gemini 2.5 Flash, junto con el modelo Gemini 2.5 Pro actual, tienen como objetivo mejorar las capacidades de los desarrolladores en la creación de aplicaciones de IA con modelos de pensamiento mejorados, interacciones dinámicas y generación de video de alta calidad.