Gemini API で Gemini エンベディングが一般公開に

2025年7月14日

Min Choi Product Manager Google DeepMind

Janie Zhang

このたび、初の Gemini エンベディングテキストモデル（gemini-embedding-001）が Gemini API と Vertex AI でデベロッパー向けに一般提供開始されたことをお知らせいたします。

このエンベディングモデルは、3 月の試験運用版リリース以降、Massive Text Embedding Benchmark（MTEB）多言語リーダーボードで一貫してトップの座を維持しています。

検索から分類まで、さまざまなタスクにおいて従来の Google テキストエンベディングモデルや外部提供モデルを上回る gemini-embedding-001 は、科学、法務、金融、コーディングなどのあらゆる分野で統一された最先端のエクスペリエンスを提供します。以下で、Gemini エンベディングと他の市販の独自モデルを比較した結果をご確認ください。

* Google のレガシーモデルは、3 つの Gemini API と VertexAI モデル（text-embedding-004、text-embedding-005、text-multilingual-embedding-002）の最高スコアを組み合わせたものです。

より詳細な結果は、テクニカルレポート*でご覧いただけます。

モデルの詳細

Gemini エンベディングは非常に汎用性の高いモデルで、100 以上の言語に対応し、最大入力トークン長は 2,048 です。

また、マトリョーシカ表現学習（MRL）手法を活用しており、デベロッパーはデフォルトの 3,072 から出力次元を縮小することが可能です。この柔軟性により、特定のニーズに合わせてパフォーマンスとストレージ費用を最適化できます。最適な結果を得るには、3,072、1,536、または 768 の出力次元を使用することをおすすめします。

レート制限と料金設定

Gemini API では無料プランと有料プランの両方を用意しています。無料で gemini-embedding-001 を試すことも、本番環境のニーズに合わせて大幅にスケールアップすることもできます。

Gemini エンベディングモデルの料金は、100 万入力トークンあたり 0.15 ドルです。

Gemini エンベディングで開発を始める

デベロッパーは、Gemini API を介して Gemini エンベディングモデル（gemini-embedding-001）にアクセスできるようになりました。Google AI Studio から無料で作業を開始できます。

既存の embed_content エンドポイントと互換性があります。

from google import genai
 
client = genai.Client()
 
result = client.models.embed_content(
        model="gemini-embedding-001",
        contents="What is the meaning of life?"
)
 
print(result.embeddings)

Python

使用を開始する際は、以下のデベロッパー向けのドキュメントとクックブックを参照してください。

エンベディングのドキュメント

クイックスタートノートブック

試験運用版の gemini-embedding-exp-03-07 を使用している場合、コンテンツを再度埋め込む必要はありませんが、2025 年 8 月 14 日をもって Gemini API によるサポートが終了します。また、レガシーモデルも以下のとおり今後数か月以内に廃止される予定です。

embedding-001 は 2025 年 8 月 14 日

text-embedding-004 は 2026 年 1 月 14 日

できる限り早くプロジェクトを最新モデルに移行することを強くおすすめします。

Gemini エンベディングがこれまで不可能だった新しいユースケースをどのように実現するのか、とても楽しみです。さらに、Batch API でも Gemini エンベディングがまもなくサポートされる予定で、より低コストでデータの非同期処理が可能になります。

さらに幅広いモダリティと機能を備えたエンベディングモデルに関する今後の発表に、ぜひご注目ください！

*_{公開された論文の MTEB ベンチマーク結果は、2025 年 3 月に開始された Gemini エンベディングの試験運用版を反映しています。}