Gemini Embedding ahora disponible de forma general en la API de Gemini

14 DE JULIO DE 2025
Min Choi Product Manager

Nos complace anunciar que nuestro primer modelo de texto Gemini Embedding (gemini-embedding-001)gemini-embedding-001) ahora está disponible de forma general para los desarrolladores en la API de Gemini y Vertex AI.

Este modelo de incorporación siempre ocupó el primer lugar en el ranking multilingüe de Massive Text Embedding Benchmark (MTEB) desde el lanzamiento experimental en marzo.

Superando tanto nuestros modelos de inserción de texto anteriores como las ofertas externas en diversas tareas, desde la recuperación hasta la clasificación, gemini-embedding-001 proporciona una experiencia de vanguardia unificada en todos los dominios, entre los que se incluye la ciencia, el derecho, las finanzas y la codificación. Así es como Gemini Embedding se compara con otros modelos patentados disponibles comercialmente:

Embedings Chart
* Los modelos heredados de Google son una combinación de las puntuaciones más altas de 3 modelos de API de Gemini y VertexAI: text-embedding-004, text-embedding-005 y text-multilingual-embedding-002

Los resultados más detallados están disponibles en nuestro informe técnico*.


Detalles del modelo

Gemini Embedding, que es un modelo increíblemente versátil, admite más de 100 idiomas y tiene una longitud máxima de token de entrada de 2,048.

También utiliza la técnica Matryoshka Representation Learning (MRL), que permite a los desarrolladores reducir las dimensiones de salida del valor predeterminado de 3,072. Esta flexibilidad te permite optimizar el rendimiento y los costos de almacenamiento para satisfacer tus necesidades específicas. Para obtener resultados de la más alta calidad, recomendamos usar las dimensiones de salida 3,072, 1,536 o 768.


Límites de velocidad y precios

Ofrecemos niveles gratuitos y de pago en la API de Gemini, para que puedas experimentar con gemini-embedding-001 sin costo, o aumentar tu productividad con límites significativamente más altos para tus necesidades de producción.

El modelo Gemini Embedding tiene un precio de USD 0.15 por 1 millón de tokens de entrada.


Comienza a compilar con Gemini Embedding

Los desarrolladores ahora pueden acceder al modelo Gemini Embedding (gemini-embedding-001) a través de la API de Gemini, con la que puedes comenzar a trabajar de forma gratuita a través de Google AI Studio.

Es compatible con el extremo embed_content.

desde google importa genai
 
client = genai.Client()
 
result = client.models.embed_content(
        model="gemini-embedding-001",
        contents="What is the meaning of life?"
)
 
print(result.embeddings)
Python

Para comenzar, consulta la documentación oficial y las guías paso a paso para desarrolladores:

Si estás utilizando la versión experimental gemini-embedding-exp-03-07, no necesitarás volver a incrustar tus contenidos, pero la compatibilidad con la API de Gemini dejará de funcionar el 14 de agosto de 2025. Los modelos heredados también quedarán en desuso en los próximos meses:

  • embedding-001 el 14 de agosto de 2025 y

  • text-embedding-004 el 14 de enero de 2026

Te recomendamos que migres tus proyectos a nuestro modelo más nuevo lo más pronto posible.

No podemos esperar para ver cómo Gemini Embedding revela nuevos casos de uso que antes no eran posibles. Además, pronto tendremos soporte para Gemini Embedding en la API de lotes, lo que permitirá el procesamiento asincrónico de tus datos para obtener costos más bajos.

Mantente pendiente a los futuros anuncios sobre la incorporación de modelos con modalidades y funciones aún más amplias.


*Los resultados de referencia de MTEB del documento publicado reflejan la versión experimental de Gemini Embedding, lanzada en marzo de 2025.