Buscar

5 resultados

Borrar filtros
  • 31 DE JULIO DE 2025 / AI

    Veo 3 Fast y las nuevas funciones de imagen a video

    Google presenta Veo 3 Fast, un modelo con velocidad y precio optimizados, junto con nuevas funciones de imagen a video para Veo 3 y Veo 3 Fast, que permiten a los desarrolladores crear de manera eficiente contenido de video de alta calidad a partir de texto o imágenes fijas, con precios variables según el modelo y la inclusión de audio, ahora disponible en la API de Gemini.

    Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API
  • 17 DE JULIO DE 2025 / Gemini

    Compila con Veo 3, ahora disponible en la disponible en la API de Gemini

    Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 10 DE JULIO DE 2025 / Gemini

    Anunciamos GenAI Processors: compila aplicaciones basadas en Gemini potentes y flexibles

    GenAI Processors es una nueva biblioteca Python de código abierto de Google DeepMind diseñada para simplificar el desarrollo de aplicaciones de IA, especialmente aquellas que manejan entradas multimodales y requieren capacidad de respuesta en tiempo real, al proporcionar una interfaz de “procesador” coherente para todos los pasos, desde el manejo de entradas hasta el procesamiento de llamadas y salidas de modelos, para un encadenamiento sin interrupciones y una ejecución simultánea.

    Announcing GenAI Processors: Streamline your Gemini application development
  • 24 DE JUNIO DE 2025 / Gemini

    Gemini 2.5 para robótica e inteligencia integrada

    Gemini 2.5 Pro y Flash están transformando la robótica a través de la mejora de la codificación, el razonamiento y las capacidades multimodales, incluida la comprensión espacial. Estos modelos se utilizan para la comprensión semántica de escenas, la generación de código para el control de robots y la creación de aplicaciones interactivas con la API Live, con un fuerte énfasis en las mejoras de seguridad y las aplicaciones comunitarias.

    Gemini 2.5 for robotics and embodied intelligence
  • 24 DE JUNIO DE 2025 / Gemini

    Imagen 4 ahora está disponible en la API de Gemini y Google AI Studio

    Imagen 4, el modelo avanzado de texto a imagen de Google, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio, y ofrece mejoras de calidad significativas, especialmente para la generación de texto dentro de las imágenes. La familia de Imagen 4 incluye Imagen 4 para tareas generales e Imagen 4 Ultra para una adherencia de alta precisión a las indicaciones, con todas las imágenes generadas con una marca de agua SynthID no visible.

    Imagen 4 is now available on Gemini API and Google AI Studio