Hoy, Gemini 1.5 Flash-8B, nuestra última variante de Flash, está lista para la producción con los siguientes beneficios:
Los desarrolladores pueden acceder a gemini-1.5-flash-8b de forma gratuita a través de Google AI Studio y la API de Gemini.
En I/O, presentamos Gemini 1.5 Flash, nuestro modelo ligero, optimizado para brindar velocidad y eficiencia. En los últimos meses, Google DeepMind progresó considerablemente y mejoró aun más 1.5 Flash en función de los comentarios de los desarrolladores y probando los límites de lo que es posible.
El mes pasado, lanzamos una versión experimental de Gemini 1.5 Flash-8B, una variante más pequeña y rápida de 1.5 Flash. Hoy nos entusiasma que esté disponible de forma general para su uso en producción. Flash-8B casi iguala el rendimiento del modelo 1.5 Flash lanzado en mayo en muchos puntos de referencia. Tiene un rendimiento especialmente bueno en tareas como el chat, la transcripción y la traducción de idiomas de contexto extenso.
Nuestro lanzamiento de los mejores modelos pequeños de su clase sigue teniendo en cuenta los comentarios de los desarrolladores y nuestras propias pruebas de lo que es posible con estos modelos. Creemos que el mayor potencial de este modelo está en tareas que van desde casos de uso multimodales de alto volumen hasta tareas de resumen de contexto extenso.
Con el lanzamiento estable de Gemini 1.5 Flash-8B, ofrecemos el menor costo por inteligencia de cualquier modelo Gemini:
Para los desarrolladores del nivel de pago, la facturación comenzará el lunes 14 de octubre.
Este nuevo precio, junto con el trabajo que ya realizamos para reducir los costos de los desarrolladores con 1.5 Flash y 1.5 Pro, destaca nuestro compromiso de garantizar que los desarrolladores tengan la libertad de crear los productos y servicios que hacen avanzar el mundo.
Gemini 1.5 Flash-8B es el modelo más adecuado para tareas simples y de mayor volumen. Para que este modelo sea lo más útil posible, duplicamos los límites de velocidad de 1.5 Flash-8B, lo que significa que los desarrolladores pueden enviar hasta 4,000 solicitudes por minuto (RPM).
Diviértete compilando y estate atento para recibir más novedades.