Gemini エンベディング: RAG とコンテキスト エンジニアリングを強化

2025年7月30日
Vishal Dharmadhikari Product Solutions Engineer

Gemini エンベディング テキスト モデルの一般提供が発表されて以降、高度な AI アプリケーションの構築を目指すデベロッパーによってこのモデルは急速に採用されています。分類、セマンティック検索、検索拡張生成(RAG)といった従来のユースケースに加えて、多くのデベロッパーがコンテキスト エンジニアリングと呼ばれる技術を使用し、AI エージェントに完全な運用コンテキストを提供するようになりました。ここで鍵となるのは、埋め込みです。埋め込みは、ドキュメント、会話履歴、ツール定義などの重要な情報を効率的に識別し、モデルのワーキング メモリに直接統合する役割を果たすからです。

すでにさまざまな業界の組織が Gemini エンベディング モデルを活用して、高度なシステムを構築しています。以下でその事例を紹介します。


Gemini エンベディングの活用例


グローバルなコンテンツ インテリジェンス能力を解き放つ

インテリジェントなコンテンツ管理プラットフォームである Box は、Gemini エンベディングを統合することで、質問への回答や複雑なドキュメントからの分析情報の抽出といった重要なユースケースを可能にしています。その評価期間に、gemini-embedding-00181% 以上の確率で正しい回答を見つけ、他のエンベディング モデルと比較して 3.6% の再現率向上を示しました。このパフォーマンス向上に加えて、Google のモデルに組み込まれた多言語サポートは、世界中のユーザーにとって有望な進展です。これにより、Box AI はさまざまな言語や地域のコンテンツから分析情報を引き出すことができます。

Box AI - Gemini Embedding

財務データ分析の精度向上

金融テクノロジー企業の re: cap は、埋め込みを使用して大量の B2B 銀行取引を分類しています。同社は、gemini-embedding-001 の効果を従来の Google モデル(text-embedding-004text-embedding-005)とベンチマーク評価で比較しました。21,500 件のトランザクションのデータセットで測定したところ、F1 スコアがそれぞれ 1.9% と 1.45% 上昇したことが確認されました。モデルの精度と再現率の均衡を図る F1 スコアは、分類タスクにとって重要です。この結果は、Gemini エンベディングのような優れたモデルがパフォーマンスの大幅な向上に直接つながることを裏付けるものであり、re: cap が顧客により精度の高い資金流動性に関する分析情報を提供できることを示しています。

re:cap - Gemini Embedding

法的証拠開示におけるセマンティック精度の確保

Everlaw は、法律専門家が大量のディスカバリ ドキュメントを分析できるように検証可能な RAG を提供するプラットフォームです。ここでは、何百万もの専門的なテキストで正確なセマンティック マッチングを行う必要があります。社内ベンチマークの結果、Everlaw は gemini - embedding -001 が最も優れたモデルであることを確認しました。このモデルは、業界特有の複雑な法律用語で満ちた 140 万件もの文書から適切な回答を引き出す際、87% の精度を達成したのです。これは、Voyage(84%)や OpenAI(73%)といったモデルを上回るものでした。さらに、Gemini エンベディングのマトリョーシカ プロパティにより、Everlaw はコンパクトな表現を使用して、重要な情報をより少ない次元に集約できるようになりました。これは、パフォーマンスの損失を最小限に抑え、ストレージ コストを削減し、取得と検索の効率を高めることにつながります。

Everlaw - Gemini Embedding

デベロッパー向けコードベース検索のレベルアップ

オープンソースの AI コーディング アシスタントである Roo Code は、コードベースのインデックス作成とセマンティック検索に Gemini エンベディング モデルを使用しています。Roo Code を使用するデベロッパーは、アシスタントが人間のチームメイトのように複数のファイル間をやり取りする際に、構文だけでなく意図を理解する検索機能を必要とします。Roo Code は gemini-embedding-001 と Tree-sitter を組み合わせて論理コードを分割することで、不正確なクエリに対しても関連性の高い結果を提供します。最初のテストの結果、Gemini エンベディングによって LLM 駆動型のコード検索が大幅に改善され、柔軟性と精度が向上し、デベロッパーのワークフローに適合していることが確認されました。

ROO Code - Gemini Embedding

パーソナライズされたメンタル ウェルネス サポートの提供

Mindlid の AI ウェルネス コンパニオンは、gemini-embedding-001 を活用して会話履歴を理解し、コンテキストに応じた有用な情報をユーザーにリアルタイムで提供しています。同社は、一貫して 1 秒未満のレイテンシ(中央値: 420 ミリ秒)と有意な 82% のトップ 3 の再現率(OpenAI の text-embedding-3-small の再現率と比較して 4% 向上)という優れたパフォーマンスを記録しました。これは、Gemini エンベディングが最も関連性の高い情報を提供して AI サポートの関連性と速度を向上させることを示しています。

Mindlid - Gemini Embedding

AI アシスタントのコンテキストと効率性の向上

Interaction Co. は、タスクを自動化し、Gmail から情報を抽出する AI メール アシスタント Poke を開発しています。Poke は、ユーザーの「記憶」の取得と、コンテキストを強化するための関連メールの特定という 2 つの主要な機能に Gemini エンベディングを使用しています。Poke の言語モデルは gemini-embedding-001 を統合することで、より高速かつ高精度にデータを取得できるようになりました。同社は、Voyage-2 と比較して、100 件のメールを埋め込む際の平均時間が 90.4% も短縮され、わずか 21.45 秒でタスクを完了したと報告しています。

Poke - Gemini Embedding

将来のエージェントの基盤

AI システムがより自律的になるにつれて、その有効性は私たちが提供するコンテキストの質にかかってきます。gemini-embedding-001 のような高性能のエンベディング モデルは、推論し、情報を取得し、私たちに代わって行動できる次世代エージェントを構築するための基盤となる要素です。

埋め込みを開始するには、Gemini API ドキュメントをご覧ください。


パフォーマンス指標はデベロッパーによって提供されたものであり、Google によって独自に確認されたものではありません。