Gemini Embedding com disponibilidade geral na API Gemini

14 DE JULHO DE 2025
Min Choi Product Manager

Temos o prazer de anunciar que nosso primeiro modelo de texto Gemini Embedding (gemini-embedding-001) já está geralmente disponível para os desenvolvedores na API Gemini e na Vertex AI.

Esse modelo de incorporação tem se mantido consistentemente no topo do placar Multilingual do Massive Text Embedding Benchmark (MTEB) desde seu lançamento experimental, em março.

Ao superar nossos modelos de incorporação de texto anteriores e as ofertas externas em diversas tarefas, da recuperação até a classificação, o gemini-embedding-001 fornece uma experiência de ponta unificada em diversos domínios, incluindo ciências, jurídico, finanças e codificação. Veja como o Gemini Embedding se compara a outros modelos proprietários disponíveis comercialmente:

Embedings Chart
*Os modelos legados do Google são uma combinação das pontuações mais altas de três modelos da API Gemini e da VertexAI: text-embedding-004, text-embedding-005 e text-multilingual-embedding-002

Resultados mais detalhados estão disponíveis em nosso relatório técnico*.


Detalhes do modelo

Um modelo incrivelmente versátil, o Gemini Embedding dá suporte a mais de 100 idiomas e tem um comprimento máximo de token de entrada de 2048.

Ele também utiliza a técnica Matryoshka Representation Learning (MRL), que permite aos desenvolvedores reduzir as dimensões de saída do padrão 3072. Essa flexibilidade permite otimizar o desempenho e os custos de armazenamento de acordo com necessidades específicas. Para obter resultados da mais alta qualidade, recomendamos o uso de dimensões de saída 3072, 1536 ou 768.


Preços e limites de taxas

Oferecemos níveis gratuitos e pagos na API Gemini, para que você possa experimentar o gemini-embedding-001 sem custos ou começar com limites significativamente mais altos para suas necessidades de produção.

O modelo Gemini Embedding custa US$ 0,15 por 1 milhão de tokens de entrada.


Comece a criar com o Gemini Embedding

Os desenvolvedores já podem acessar o modelo Gemini Embedding (gemini-embedding-001) por meio da API Gemini, com a qual é possível começar a trabalhar gratuitamente via Google AI Studio.

Ele é compatível com o ponto de extremidade embed_content existente.

from google import genai
 
client = genai.Client()
 
result = client.models.embed_content(
        model="gemini-embedding-001",
        contents="What is the meaning of life?"
)
 
print(result.embeddings)
Python

Para dar os primeiros passos, confira a documentação oficial para desenvolvedores e os manuais:

Se você estiver usando o gemini-embedding-exp-03-07 experimental, não precisará reincorporar o conteúdo, mas ele não terá mais suporte na API Gemini em 14 de agosto de 2025. Os modelos legados também serão descontinuados nos próximos meses:

  • embedding-001 em 14 de agosto de 2025; e

  • text-embedding-004 em 14 de janeiro de 2026.

É altamente recomendável migrar seus projetos para nosso modelo mais recente assim que possível.

Mal podemos esperar para ver como o Gemini Embedding desbloqueará novos casos de uso que não eram possíveis anteriormente. Além disso, teremos suporte ao Gemini Embedding na API Batch em breve, o que possibilitará o processamento assíncrono de dados para reduzir os custos.

Fique de olho nos anúncios futuros sobre modelos de incorporação com modalidades e capacidades ainda mais amplas!


*Os resultados do comparativo de mercado do MTEB no artigo publicado refletem a versão experimental do Gemini Embedding, lançado em março de 2025.