Hoy nos complace compartir las actualizaciones generales de nuestra familia de modelos Gemini 2.5:
Los modelos Gemini 2.5 son capaces de razonar a través de sus pensamientos antes de responder, lo que permite obtener un mejor rendimiento y una mayor exactitud. Cada modelo tiene control sobre el presupuesto de pensamiento, de modo que los desarrolladores pueden elegir cuándo y cuánto “piensa” el modelo antes de generar una respuesta.
Hoy presentamos 2.5 Flash-Lite en versión preliminar con la latencia y el costo más bajos de la familia de modelos 2.5. Se diseñó como una actualización rentable de nuestros modelos anteriores 1.5 y 2.0 Flash. Además, ofrece un mejor rendimiento en la mayoría de los niveles y un menor tiempo hasta el primer token, y logra una decodificación de tokens por segundo más alta. Este modelo es ideal para tareas de grandes volúmenes, como la clasificación o el resumen a gran escala.
Gemini 2.5 Flash-Lite es un modelo de razonamiento que permite controlar de forma dinámica el presupuesto de pensamiento con un parámetro de API. Debido a que Flash-Lite se optimizó en términos de costo y velocidad, la función de “pensamiento” está desactivada de forma predeterminada, a diferencia de nuestros otros modelos. 2.5 Flash-Lite también es compatible con todas nuestras herramientas nativas, como la fundamentación con la Búsqueda de Google, la ejecución de código y el contexto de URL, además de la llamada a función.
Durante el último año, nuestros equipos de investigación siguieron mejorando la relación precio-calidad con nuestra serie de modelos Flash. Cuando se anunció inicialmente 2.5 Flash, todavía no estaban listas las capacidades de 2.5 Flash-Lite. También lanzamos los modelos con un precio “con pensamiento” y otro “sin pensamiento”, lo que generó confusión entre los desarrolladores.
Con el lanzamiento de la versión estable de Gemini 2.5 Flash (que es la misma versión preliminar del modelo 05-20 que pusimos a disposición en Google I/O) y el increíble rendimiento de 2.5 Flash, actualizamos los precios de 2.5 Flash:
Si bien nos esforzamos por mantener precios consistentes entre la versión preliminar y las versiones estables a fin de minimizar las interrupciones, este es un ajuste específico que refleja el valor excepcional de Flash, que sigue ofreciendo el mejor costo por inteligencia disponible.
Y con Gemini 2.5 Flash-Lite, ahora tenemos una opción de costo aún menor (con o sin pensamiento) para casos de uso sensibles al costo y la latencia que requieren menos inteligencia de modelo.
Si usas la versión preliminar 04-17 de Gemini 2.5 Flash, los precios actuales seguirán vigentes hasta su baja planificada para el 15 de julio de 2025, momento en el que se desactivará ese extremo del modelo. Puedes hacer la transición al modelo con disponibilidad general “gemini-2.5-flash” o cambiar a la versión preliminar de 2.5 Flash-Lite como una opción de menor costo.
El crecimiento y la demanda de Gemini 2.5 Pro siguen siendo los más altos de todos nuestros modelos. Para permitir que más clientes desarrollen este modelo en producción, la versión 06-05 del modelo ahora es estable y tiene la misma relación precio-calidad de siempre.
Esperamos que aproveches todas las ventajas de la versión Pro en los casos en los que necesites la mayor inteligencia y la mayoría de las capacidades, como la codificación y las tareas agénticas. Gemini 2.5 Pro es una parte esencial de muchas de las herramientas para desarrolladores más queridas.
Si usas la versión preliminar 05-06 de 2.5 Pro, el modelo seguirá disponible hasta el 19 de junio de 2025 y, luego, se desactivará. Si usas la versión preliminar 06-05 de 2.5 Pro, simplemente puedes actualizar tu string de modelo a “gemini-2.5-pro”.
Tenemos muchas ganas de que más dominios aprovechen los beneficios de la inteligencia de 2.5 Pro y esperamos compartir pronto más novedades sobre el escalamiento más allá de Pro.