40 resultados
15 DE AGOSTO DE 2025 / Google AI Studio
Google anuncia la disponibilidad general de Imagen 4, su modelo avanzado de texto a imagen, en la API de Gemini y Google AI Studio, con mejoras significativas en la representación de texto. El nuevo modelo Imagen 4 Fast, diseñado para la velocidad y la generación rápida de imágenes, ahora está disponible junto con Imagen 4 e Imagen 4 Ultra, que también admiten la generación de imágenes con una resolución de hasta 2K.
31 DE JULIO DE 2025 / AI
Google presenta Veo 3 Fast, un modelo con velocidad y precio optimizados, junto con nuevas funciones de imagen a video para Veo 3 y Veo 3 Fast, que permiten a los desarrolladores crear de manera eficiente contenido de video de alta calidad a partir de texto o imágenes fijas, con precios variables según el modelo y la inclusión de audio, ahora disponible en la API de Gemini.
24 DE JULIO DE 2025 / Google Labs
Opal es una nueva herramienta experimental de Google Labs que te ayuda a redactar indicaciones para convertirlas en miniapps dinámicas de varios pasos utilizando un lenguaje natural, eliminando la necesidad de código y permitiendo a los usuarios crear e implementar aplicaciones de IA compartibles con funciones potentes y una integración perfecta con las herramientas existentes de Google.
17 DE JULIO DE 2025 / Gemini
Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.
14 DE JULIO DE 2025 / Gemini
El modelo de texto Gemini Embedding ahora está disponible de forma general en la API de Gemini y Vertex AI. Este versátil modelo se ha clasificado constantemente como el número 1 en el ranking multilingüe de MTEB desde su lanzamiento experimental en marzo, admite más de 100 idiomas, tiene una longitud máxima de token de entrada de 2,048 y tiene un precio de USD 0.15 por 1 millón de tokens de entrada.
10 DE JULIO DE 2025 / Cloud
Las actualizaciones en Firebase Studio incluyen nuevos modos de agente, soporte fundamental para el protocolo de contexto de modelo (MCP) e integración de Gemini CLI, todos diseñados para redefinir el desarrollo asistido por IA, lo que permite a los desarrolladores crear aplicaciones de pila completa a partir de una sola indicación e integrar potentes capacidades de IA directamente en su flujo de trabajo.
9 DE JULIO DE 2025 / Gemma
T5Gemma es una nueva familia de LLM de codificador-decodificador desarrollados mediante la conversión y adaptación de modelos preentrenados de solo decodificador basados en el marco Gemma 2, que ofrecen un rendimiento y una eficiencia superiores en comparación con sus contrapartes de solo decodificador, en particular para tareas que requieren una profunda comprensión de entrada, como resúmenes y traducción.
7 DE JULIO DE 2025 / Gemini
El nuevo modo por lotes en la API de Gemini está diseñado para cargas de trabajo de IA de alto rendimiento y no críticas para la latencia, simplificando los trabajos grandes mediante el manejo de la programación y el procesamiento, y haciendo que tareas como el análisis de datos, la creación masiva de contenido y la evaluación de modelos sean más rentables y escalables, para que los desarrolladores puedan procesar grandes volúmenes de datos de manera eficiente.
26 DE JUNIO DE 2025 / Gemma
El modelo Gemma 3n se lanzó por completo, aprovechando el éxito de los modelos Gemma anteriores y brindando capacidades multimodales integradas y avanzadas a dispositivos perimetrales con un rendimiento sin precedentes. Explora las innovaciones de Gemma 3n, incluida su arquitectura que prioriza los dispositivos móviles, la tecnología MatFormer, incorporaciones por capas, el uso compartido de caché KV y los nuevos codificadores de audio y visión MobileNet-V5, y cómo los desarrolladores pueden comenzar a crear hoy mismo.
24 DE JUNIO DE 2025 / Gemini
La nueva Google Colab con prioridad en la IA aumenta la productividad con mejoras impulsadas por funciones como las consultas iterativas para codificación conversacional, un Agente de ciencia de datos de última generación para flujos de trabajo autónomos y transformación de la codificación simplificada. Los usuarios pioneros informan un significativo aumento en la productividad a través de la aceleración en los proyectos de AA, depuración más rápida del código y creación sin esfuerzo de visualizaciones de alta calidad.