Los modelos de Gemini 2.5 ahora admiten almacenamiento en caché implícito

8 DE MAYO DE 2025
Logan Kilpatrick Group Product Manager

Innovamos en el almacenamiento en caché de contexto en mayo de 2024, con lo que ayudamos a los desarrolladores a ahorrar un 75% en el contexto repetitivo que se pasa a nuestros modelos con almacenamiento en caché explícito. Hoy, implementamos la función altamente solicitada en la API de Gemini: almacenamiento en caché implícito.


Almacenamiento en caché implícito con API de Gemini

El almacenamiento en caché implícito transfiere directamente el ahorro de costos de caché a los desarrolladores sin la necesidad de crear una caché explícita. Desde ahora, cuando envíes una solicitud a uno de los modelos de Gemini 2.5, si esta tiene un prefijo en común con una de las solicitudes anteriores, entonces es apta para un resultado en caché. Te devolveremos dinámicamente los ahorros de costos y proporcionaremos el mismo descuento del 75%.

Para que tu solicitud tenga más posibilidades de contener un resultado en caché, debes mantener el mismo contenido al comienzo de la solicitud y agregar elementos como la pregunta de un usuario u otro contexto adicional que pueda cambiar de una solicitud a otra al final de la instrucción. Puedes consultar más prácticas recomendadas sobre el uso del almacenamiento en caché implícito en los documentos de la API de Gemini.

Con el objetivo de que más solicitudes sean aptas para resultado en caché, redujimos el tamaño mínimo de la solicitud para 2.5 Flash a 1,024 tokens y 2.5 Pro a 2,048 tokens.


Sobre los descuentos de tokens con Gemini 2.5

Si deseas garantizar ahorros de costos, puedes usar nuestra API de almacenamiento en caché explícito, que es compatible con nuestros modelos Gemini 2.5 y 2.0. Si está usando modelos Gemini 2.5 en este momento, comenzarás a ver cached_content_token_count en los metadatos de uso que indican cuántos tokens de la solicitud se almacenaron en caché y, por lo tanto, se cobrarán al precio más bajo.


Comenzar

Nos entusiasma seguir mejorando la relación precio-calidad con aun más rentabilidad y esperamos tus comentarios sobre nuestras actualizaciones de almacenamiento en caché.