Temos o prazer de anunciar que nosso primeiro modelo de texto Gemini Embedding (gemini-embedding-001
) já está geralmente disponível para os desenvolvedores na API Gemini e na Vertex AI.
Esse modelo de incorporação tem se mantido consistentemente no topo do placar Multilingual do Massive Text Embedding Benchmark (MTEB) desde seu lançamento experimental, em março.
Ao superar nossos modelos de incorporação de texto anteriores e as ofertas externas em diversas tarefas, da recuperação até a classificação, o gemini-embedding-001
fornece uma experiência de ponta unificada em diversos domínios, incluindo ciências, jurídico, finanças e codificação. Veja como o Gemini Embedding se compara a outros modelos proprietários disponíveis comercialmente:
Resultados mais detalhados estão disponíveis em nosso relatório técnico*.
Um modelo incrivelmente versátil, o Gemini Embedding dá suporte a mais de 100 idiomas e tem um comprimento máximo de token de entrada de 2048.
Ele também utiliza a técnica Matryoshka Representation Learning (MRL), que permite aos desenvolvedores reduzir as dimensões de saída do padrão 3072. Essa flexibilidade permite otimizar o desempenho e os custos de armazenamento de acordo com necessidades específicas. Para obter resultados da mais alta qualidade, recomendamos o uso de dimensões de saída 3072, 1536 ou 768.
Oferecemos níveis gratuitos e pagos na API Gemini, para que você possa experimentar o gemini-embedding-001
sem custos ou começar com limites significativamente mais altos para suas necessidades de produção.
O modelo Gemini Embedding custa US$ 0,15 por 1 milhão de tokens de entrada.
Os desenvolvedores já podem acessar o modelo Gemini Embedding (gemini-embedding-001
) por meio da API Gemini, com a qual é possível começar a trabalhar gratuitamente via Google AI Studio.
Ele é compatível com o ponto de extremidade embed_content existente.
from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)
Para dar os primeiros passos, confira a documentação oficial para desenvolvedores e os manuais:
Se você estiver usando o gemini-embedding-exp-03-07 experimental, não precisará reincorporar o conteúdo, mas ele não terá mais suporte na API Gemini em 14 de agosto de 2025. Os modelos legados também serão descontinuados nos próximos meses:
É altamente recomendável migrar seus projetos para nosso modelo mais recente assim que possível.
Mal podemos esperar para ver como o Gemini Embedding desbloqueará novos casos de uso que não eram possíveis anteriormente. Além disso, teremos suporte ao Gemini Embedding na API Batch em breve, o que possibilitará o processamento assíncrono de dados para reduzir os custos.
Fique de olho nos anúncios futuros sobre modelos de incorporação com modalidades e capacidades ainda mais amplas!
*Os resultados do comparativo de mercado do MTEB no artigo publicado refletem a versão experimental do Gemini Embedding, lançado em março de 2025.