Gemini Embedding 现已在 Gemini API 中正式推出

2025年7月14日
Min Choi Product Manager

我们很高兴地宣布,我们的首个 Gemini Embedding 文本模型 (gemini-embedding-001) 现已向使用 Gemini API 和 Vertex AI 中的开发者开放。

自 3 月份推出实验性版本以来,该嵌入模型一直在 Massive Text Embedding Benchmark (MTEB) 多语言排行榜上位居榜首。

在检索、分类等各类任务中,无论是我们之前的文本嵌入模型,还是外部提供的产品,都难以与 gemini-embedding-001 相媲美。此模型提供了跨领域的统一前沿体验,涵盖科学、法律、金融和编程等领域。Gemini Embedding 与其他商用专有模型的对比情况如下:

Embedings Chart
*旧版 Google 模型整合了来自 3 个 Gemini API 和 Vertex AI 模型的最高分:text-embedding-004、text-embedding-005 以及 text-multilingual-embedding-002

如要了解更详细的结果,请参阅我们的技术报告*。


模型详情

Gemini Embedding 是一种用途极为广泛的模型,支持超过 100 种语言,最大输入令牌长度为 2048。

该模型还采用了 Matryoshka 表征学习(Matryoshka Representation Learning,MRL)技术,允许开发者将输出维度从默认的 3072 缩减。这种灵活性使您能够根据具体需求优化性能与存储成本。为获得最佳效果,我们推荐使用 3072、1536 或 768 输出维度。


速率限制和定价

我们在 Gemini API 中提供免费和付费等级,因此您可以免费试用gemini-embedding-001,或者根据您的生产需求提升服务额度,以获得更高的限制级别。

Gemini Embedding 模型的价格为每 100 万个输入令牌 0.15 美元


使用 Gemini Embedding 开始构建

开发者现在可以通过 Gemini API 访问 Gemini Embedding 模型 (gemini-embedding-001),您可以在 Google AI Studio 中免费开始使用该模型。

模型与现有的 embed_content 端点兼容。

from google import genai
 
client = genai.Client()
 
result = client.models.embed_content(
        model="gemini-embedding-001",
        contents="What is the meaning of life?"
)
 
print(result.embeddings)
Python

首先,请查看官方开发者文档和手册:

如果您正在使用实验性的 gemini-embedding-exp-03-07,,则无需重新嵌入内容,但自 2025 年 8 月 14 日起,Gemini API 将不再支持该功能。旧版模型也将在未来几个月内弃用:

  • embedding-001 将于 2025 年 8 月 14 日弃用;

  • text-embedding-004 将于 2026 年 1 月 14 日弃用

我们强烈建议您尽早将项目迁移到我们的最新模型。

我们迫不及待地想看到 Gemini Embedding 如何解锁之前无法实现的全新用例。此外,我们即将在 Batch API 中支持 Gemini Embedding,您可借此以更低的成本异步处理数据。

请密切关注未来有关具有更广泛模式和功能的嵌入模型的相关公告!


*已发表论文中的 MTEB 基准测试结果反映的是 2025 年 3 月发布的实验版 Gemini Embedding 模型性能。