Buscar

25 resultados

Borrar filtros
  • 15 DE OCTUBRE DE 2025 / AI

    Presentamos Veo 3.1 y las nuevas capacidades creativas en la API de Gemini

    Google lanza Veo 3.1 y Veo 3.1 Fast, un modelo de generación de video actualizado, en versión preliminar paga a través de la API de Gemini. Esta versión ofrece un audio nativo más rico, un mayor control narrativo y capacidades mejoradas de imagen a video. Las nuevas funciones incluyen guiar la generación con imágenes de referencia, ampliar los videos de Veo existentes y generar transiciones entre fotogramas. Empresas como Promise Studios, Latitude y Whering ya están utilizando Veo 3.1 en varias aplicaciones.

    Veo3.1_16x9_meta
  • 18 DE AGOSTO DE 2025 / Gemini

    La herramienta de contexto de URL para la API de Gemini ahora está disponible de forma general

    La herramienta de contexto de URL de la API de Gemini ahora está disponible de forma general, lo que permite a los desarrolladores establecer indicaciones utilizando contenido web en lugar de cargas manuales. Esta versión amplía la compatibilidad con PDF e imágenes.

    URL context tool for Gemini API now generally available
  • 15 DE AGOSTO DE 2025 / Google AI Studio

    Anuncio de Imagen 4 Fast y la disponibilidad general de la familia Imagen 4 en la API de Gemini

    Google anuncia la disponibilidad general de Imagen 4, su modelo avanzado de texto a imagen, en la API de Gemini y Google AI Studio, con mejoras significativas en la representación de texto. El nuevo modelo Imagen 4 Fast, diseñado para la velocidad y la generación rápida de imágenes, ahora está disponible junto con Imagen 4 e Imagen 4 Ultra, que también admiten la generación de imágenes con una resolución de hasta 2K.

    Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API
  • 31 DE JULIO DE 2025 / AI

    Veo 3 Fast y las nuevas funciones de imagen a video

    Google presenta Veo 3 Fast, un modelo con velocidad y precio optimizados, junto con nuevas funciones de imagen a video para Veo 3 y Veo 3 Fast, que permiten a los desarrolladores crear de manera eficiente contenido de video de alta calidad a partir de texto o imágenes fijas, con precios variables según el modelo y la inclusión de audio, ahora disponible en la API de Gemini.

    Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API
  • 30 DE JULIO DE 2025 / Gemini

    Presentamos LangExtract: una biblioteca de extracción de información impulsada por Gemini

    LangExtract es una nueva biblioteca Python de código abierto impulsada por modelos Gemini para extraer información estructurada de texto no estructurado. Ofrece una base de fuentes precisa, resultados estructurados confiables mediante generación controlada, extracción optimizada de contexto largo, visualización interactiva y soporte de backend LLM flexible.

    LangExtract_meta
  • 17 DE JULIO DE 2025 / Gemini

    Compila con Veo 3, ahora disponible en la disponible en la API de Gemini

    Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 16 DE JULIO DE 2025 / AI

    Descubre el razonamiento de Gemini: una guía paso a paso de logprobs en Vertex AI

    La función "logprobs" se introdujo oficialmente en la API de Gemini en Vertex AI. Proporciona información sobre la toma de decisiones del modelo al mostrar puntajes de probabilidad para tokens elegidos y alternativos. Esta guía paso a paso te mostrará cómo habilitar e interpretar esta función, y aplicarla a casos de uso poderosos, como la clasificación segura, el autocompletado dinámico y la evaluación cuantitativa de RAG.

    logprobs_meta
  • 14 DE JULIO DE 2025 / Gemini

    Gemini Embedding ahora disponible de forma general en la API de Gemini

    El modelo de texto Gemini Embedding ahora está disponible de forma general en la API de Gemini y Vertex AI. Este versátil modelo se ha clasificado constantemente como el número 1 en el ranking multilingüe de MTEB desde su lanzamiento experimental en marzo, admite más de 100 idiomas, tiene una longitud máxima de token de entrada de 2,048 y tiene un precio de USD 0.15 por 1 millón de tokens de entrada.

    Gemini Embedding now generally available in the Gemini API
  • 10 DE JULIO DE 2025 / Gemini

    Anunciamos GenAI Processors: compila aplicaciones basadas en Gemini potentes y flexibles

    GenAI Processors es una nueva biblioteca Python de código abierto de Google DeepMind diseñada para simplificar el desarrollo de aplicaciones de IA, especialmente aquellas que manejan entradas multimodales y requieren capacidad de respuesta en tiempo real, al proporcionar una interfaz de “procesador” coherente para todos los pasos, desde el manejo de entradas hasta el procesamiento de llamadas y salidas de modelos, para un encadenamiento sin interrupciones y una ejecución simultánea.

    Announcing GenAI Processors: Streamline your Gemini application development
  • 7 DE JULIO DE 2025 / Gemini

    Modo por lotes en la API de Gemini: procesa más por menos

    El nuevo modo por lotes en la API de Gemini está diseñado para cargas de trabajo de IA de alto rendimiento y no críticas para la latencia, simplificando los trabajos grandes mediante el manejo de la programación y el procesamiento, y haciendo que tareas como el análisis de datos, la creación masiva de contenido y la evaluación de modelos sean más rentables y escalables, para que los desarrolladores puedan procesar grandes volúmenes de datos de manera eficiente.

    Scale your AI workloads with batch mode in the Gemini API