Nos complace anunciar que nuestro primer modelo de texto Gemini Embedding (gemini-embedding-001)gemini-embedding-001
) ahora está disponible de forma general para los desarrolladores en la API de Gemini y Vertex AI.
Este modelo de incorporación siempre ocupó el primer lugar en el ranking multilingüe de Massive Text Embedding Benchmark (MTEB) desde el lanzamiento experimental en marzo.
Superando tanto nuestros modelos de inserción de texto anteriores como las ofertas externas en diversas tareas, desde la recuperación hasta la clasificación, gemini-embedding-001
proporciona una experiencia de vanguardia unificada en todos los dominios, entre los que se incluye la ciencia, el derecho, las finanzas y la codificación. Así es como Gemini Embedding se compara con otros modelos patentados disponibles comercialmente:
Los resultados más detallados están disponibles en nuestro informe técnico*.
Gemini Embedding, que es un modelo increíblemente versátil, admite más de 100 idiomas y tiene una longitud máxima de token de entrada de 2,048.
También utiliza la técnica Matryoshka Representation Learning (MRL), que permite a los desarrolladores reducir las dimensiones de salida del valor predeterminado de 3,072. Esta flexibilidad te permite optimizar el rendimiento y los costos de almacenamiento para satisfacer tus necesidades específicas. Para obtener resultados de la más alta calidad, recomendamos usar las dimensiones de salida 3,072, 1,536 o 768.
Ofrecemos niveles gratuitos y de pago en la API de Gemini, para que puedas experimentar con gemini-embedding-001
sin costo, o aumentar tu productividad con límites significativamente más altos para tus necesidades de producción.
El modelo Gemini Embedding tiene un precio de USD 0.15 por 1 millón de tokens de entrada.
Los desarrolladores ahora pueden acceder al modelo Gemini Embedding (gemini-embedding-001
) a través de la API de Gemini, con la que puedes comenzar a trabajar de forma gratuita a través de Google AI Studio.
Es compatible con el extremo embed_content.
desde google importa genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)
Para comenzar, consulta la documentación oficial y las guías paso a paso para desarrolladores:
Si estás utilizando la versión experimental gemini-embedding-exp-03-07, no necesitarás volver a incrustar tus contenidos, pero la compatibilidad con la API de Gemini dejará de funcionar el 14 de agosto de 2025. Los modelos heredados también quedarán en desuso en los próximos meses:
Te recomendamos que migres tus proyectos a nuestro modelo más nuevo lo más pronto posible.
No podemos esperar para ver cómo Gemini Embedding revela nuevos casos de uso que antes no eran posibles. Además, pronto tendremos soporte para Gemini Embedding en la API de lotes, lo que permitirá el procesamiento asincrónico de tus datos para obtener costos más bajos.
Mantente pendiente a los futuros anuncios sobre la incorporación de modelos con modalidades y funciones aún más amplias.
*Los resultados de referencia de MTEB del documento publicado reflejan la versión experimental de Gemini Embedding, lanzada en marzo de 2025.