Gemini 1.5 Flash-8B está listo para la producción

OCT 03, 2024
Logan Kilpatrick Senior Product Manager Gemini API and Google AI Studio
Shrestha Basu Mallick Group Product Manager Gemini API

Hoy, Gemini 1.5 Flash-8B, nuestra última variante de Flash, está lista para la producción con los siguientes beneficios:

  • Precio un 50% más bajo (en comparación con Flash 1.5)

  • Límites de velocidad 2 veces más altos (en comparación con Flash 1.5)

  • Menor latencia en instrucciones cortas (en comparación con Flash 1.5)


Los desarrolladores pueden acceder a gemini-1.5-flash-8b de forma gratuita a través de Google AI Studio y la API de Gemini.


Nuestro modelo ligero ahora es más pequeño y rápido

En I/O, presentamos Gemini 1.5 Flash, nuestro modelo ligero, optimizado para brindar velocidad y eficiencia. En los últimos meses, Google DeepMind progresó considerablemente y mejoró aun más 1.5 Flash en función de los comentarios de los desarrolladores y probando los límites de lo que es posible.

El mes pasado, lanzamos una versión experimental de Gemini 1.5 Flash-8B, una variante más pequeña y rápida de 1.5 Flash. Hoy nos entusiasma que esté disponible de forma general para su uso en producción. Flash-8B casi iguala el rendimiento del modelo 1.5 Flash lanzado en mayo en muchos puntos de referencia. Tiene un rendimiento especialmente bueno en tareas como el chat, la transcripción y la traducción de idiomas de contexto extenso.

Nuestro lanzamiento de los mejores modelos pequeños de su clase sigue teniendo en cuenta los comentarios de los desarrolladores y nuestras propias pruebas de lo que es posible con estos modelos. Creemos que el mayor potencial de este modelo está en tareas que van desde casos de uso multimodales de alto volumen hasta tareas de resumen de contexto extenso.

Performance chart of the 1.5 Flash model launched in May across many benchmark

El menor costo por inteligencia de cualquier modelo Gemini

Con el lanzamiento estable de Gemini 1.5 Flash-8B, ofrecemos el menor costo por inteligencia de cualquier modelo Gemini:

  • USD 0.0375 por 1 millón de tokens de entrada en instrucciones por debajo de los 128,000 tokens

  • USD 0.15 por 1 millón de tokens de salida en instrucciones por debajo de los 128,000 tokens

  • USD 0.01 por 1 millón de tokens en instrucciones en caché por debajo de los 128,000 tokens


Para los desarrolladores del nivel de pago, la facturación comenzará el lunes 14 de octubre.

Este nuevo precio, junto con el trabajo que ya realizamos para reducir los costos de los desarrolladores con 1.5 Flash y 1.5 Pro, destaca nuestro compromiso de garantizar que los desarrolladores tengan la libertad de crear los productos y servicios que hacen avanzar el mundo.

A pricing table for the Gemini 1.5 Flash model, outlining the cost per one million tokens for input and output

Límites de velocidad 2 veces más altos para Flash-8B

Gemini 1.5 Flash-8B es el modelo más adecuado para tareas simples y de mayor volumen. Para que este modelo sea lo más útil posible, duplicamos los límites de velocidad de 1.5 Flash-8B, lo que significa que los desarrolladores pueden enviar hasta 4,000 solicitudes por minuto (RPM).

Diviértete compilando y estate atento para recibir más novedades.