我们很高兴地宣布,我们的首个 Gemini Embedding 文本模型 (gemini-embedding-001
) 现已向使用 Gemini API 和 Vertex AI 中的开发者开放。
自 3 月份推出实验性版本以来,该嵌入模型一直在 Massive Text Embedding Benchmark (MTEB) 多语言排行榜上位居榜首。
在检索、分类等各类任务中,无论是我们之前的文本嵌入模型,还是外部提供的产品,都难以与 gemini-embedding-001
相媲美。此模型提供了跨领域的统一前沿体验,涵盖科学、法律、金融和编程等领域。Gemini Embedding 与其他商用专有模型的对比情况如下:
如要了解更详细的结果,请参阅我们的技术报告*。
Gemini Embedding 是一种用途极为广泛的模型,支持超过 100 种语言,最大输入令牌长度为 2048。
该模型还采用了 Matryoshka 表征学习(Matryoshka Representation Learning,MRL)技术,允许开发者将输出维度从默认的 3072 缩减。这种灵活性使您能够根据具体需求优化性能与存储成本。为获得最佳效果,我们推荐使用 3072、1536 或 768 输出维度。
我们在 Gemini API 中提供免费和付费等级,因此您可以免费试用gemini-embedding-001
,或者根据您的生产需求提升服务额度,以获得更高的限制级别。
Gemini Embedding 模型的价格为每 100 万个输入令牌 0.15 美元。
开发者现在可以通过 Gemini API 访问 Gemini Embedding 模型 (gemini-embedding-001
),您可以在 Google AI Studio 中免费开始使用该模型。
模型与现有的 embed_content 端点兼容。
from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)
首先,请查看官方开发者文档和手册:
如果您正在使用实验性的 gemini-embedding-exp-03-07,,则无需重新嵌入内容,但自 2025 年 8 月 14 日起,Gemini API 将不再支持该功能。旧版模型也将在未来几个月内弃用:
我们强烈建议您尽早将项目迁移到我们的最新模型。
我们迫不及待地想看到 Gemini Embedding 如何解锁之前无法实现的全新用例。此外,我们即将在 Batch API 中支持 Gemini Embedding,您可借此以更低的成本异步处理数据。
请密切关注未来有关具有更广泛模式和功能的嵌入模型的相关公告!
*已发表论文中的 MTEB 基准测试结果反映的是 2025 年 3 月发布的实验版 Gemini Embedding 模型性能。