このたび、初の Gemini エンベディング テキスト モデル(gemini-embedding-001
)が Gemini API と Vertex AI でデベロッパー向けに一般提供開始されたことをお知らせいたします。
このエンベディング モデルは、3 月の試験運用版リリース以降、Massive Text Embedding Benchmark(MTEB)多言語リーダーボードで一貫してトップの座を維持しています。
検索から分類まで、さまざまなタスクにおいて従来の Google テキスト エンベディング モデルや外部提供モデルを上回る gemini-embedding-001
は、科学、法務、金融、コーディングなどのあらゆる分野で統一された最先端のエクスペリエンスを提供します。以下で、Gemini エンベディングと他の市販の独自モデルを比較した結果をご確認ください。
より詳細な結果は、テクニカル レポート*でご覧いただけます。
Gemini エンベディングは非常に汎用性の高いモデルで、100 以上の言語に対応し、最大入力トークン長は 2,048 です。
また、マトリョーシカ表現学習(MRL)手法を活用しており、デベロッパーはデフォルトの 3,072 から出力次元を縮小することが可能です。この柔軟性により、特定のニーズに合わせてパフォーマンスとストレージ費用を最適化できます。最適な結果を得るには、3,072、1,536、または 768 の出力次元を使用することをおすすめします。
Gemini API では無料プランと有料プランの両方を用意しています。無料で gemini-embedding-001
を試すことも、本番環境のニーズに合わせて大幅にスケールアップすることもできます。
Gemini エンベディング モデルの料金は、100 万入力トークンあたり 0.15 ドルです。
デベロッパーは、Gemini API を介して Gemini エンベディング モデル(gemini-embedding-001
)にアクセスできるようになりました。Google AI Studio から無料で作業を開始できます。
既存の embed_content エンドポイントと互換性があります。
from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)
使用を開始する際は、以下のデベロッパー向けのドキュメントとクックブックを参照してください。
試験運用版の gemini-embedding-exp-03-07 を使用している場合、コンテンツを再度埋め込む必要はありませんが、2025 年 8 月 14 日をもって Gemini API によるサポートが終了します。また、レガシーモデルも以下のとおり今後数か月以内に廃止される予定です。
できる限り早くプロジェクトを最新モデルに移行することを強くおすすめします。
Gemini エンベディングがこれまで不可能だった新しいユースケースをどのように実現するのか、とても楽しみです。さらに、Batch API でも Gemini エンベディングがまもなくサポートされる予定で、より低コストでデータの非同期処理が可能になります。
さらに幅広いモダリティと機能を備えたエンベディング モデルに関する今後の発表に、ぜひご注目ください!
*公開された論文の MTEB ベンチマーク結果は、2025 年 3 月に開始された Gemini エンベディングの試験運用版を反映しています。