Gemini エンベディング: RAG とコンテキストエンジニアリングを強化

2025年7月30日

Vishal Dharmadhikari Developer Experience

Janie Zhang

Gemini エンベディングテキストモデルの一般提供が発表されて以降、高度な AI アプリケーションの構築を目指すデベロッパーによってこのモデルは急速に採用されています。分類、セマンティック検索、検索拡張生成（RAG）といった従来のユースケースに加えて、多くのデベロッパーがコンテキストエンジニアリングと呼ばれる技術を使用し、AI エージェントに完全な運用コンテキストを提供するようになりました。ここで鍵となるのは、埋め込みです。埋め込みは、ドキュメント、会話履歴、ツール定義などの重要な情報を効率的に識別し、モデルのワーキングメモリに直接統合する役割を果たすからです。

すでにさまざまな業界の組織が Gemini エンベディングモデルを活用して、高度なシステムを構築しています。以下でその事例を紹介します。

Gemini エンベディングの活用例

グローバルなコンテンツインテリジェンス能力を解き放つ

インテリジェントなコンテンツ管理プラットフォームである Box は、Gemini エンベディングを統合することで、質問への回答や複雑なドキュメントからの分析情報の抽出といった重要なユースケースを可能にしています。その評価期間に、gemini-embedding-001 は 81% 以上の確率で正しい回答を見つけ、他のエンベディングモデルと比較して 3.6% の再現率向上を示しました。このパフォーマンス向上に加えて、Google のモデルに組み込まれた多言語サポートは、世界中のユーザーにとって有望な進展です。これにより、Box AI はさまざまな言語や地域のコンテンツから分析情報を引き出すことができます。

財務データ分析の精度向上

金融テクノロジー企業の re: cap は、埋め込みを使用して大量の B2B 銀行取引を分類しています。同社は、gemini-embedding-001 の効果を従来の Google モデル（text-embedding-004 と text-embedding-005）とベンチマーク評価で比較しました。21,500 件のトランザクションのデータセットで測定したところ、F1 スコアがそれぞれ 1.9% と 1.45% 上昇したことが確認されました。モデルの精度と再現率の均衡を図る F1 スコアは、分類タスクにとって重要です。この結果は、Gemini エンベディングのような優れたモデルがパフォーマンスの大幅な向上に直接つながることを裏付けるものであり、re: cap が顧客により精度の高い資金流動性に関する分析情報を提供できることを示しています。

法的証拠開示におけるセマンティック精度の確保

Everlaw は、法律専門家が大量のディスカバリドキュメントを分析できるように検証可能な RAG を提供するプラットフォームです。ここでは、何百万もの専門的なテキストで正確なセマンティックマッチングを行う必要があります。社内ベンチマークの結果、Everlaw は gemini - embedding -001 が最も優れたモデルであることを確認しました。このモデルは、業界特有の複雑な法律用語で満ちた 140 万件もの文書から適切な回答を引き出す際、87% の精度を達成したのです。これは、Voyage（84%）や OpenAI（73%）といったモデルを上回るものでした。さらに、Gemini エンベディングのマトリョーシカプロパティにより、Everlaw はコンパクトな表現を使用して、重要な情報をより少ない次元に集約できるようになりました。これは、パフォーマンスの損失を最小限に抑え、ストレージコストを削減し、取得と検索の効率を高めることにつながります。

デベロッパー向けコードベース検索のレベルアップ

オープンソースの AI コーディングアシスタントである Roo Code は、コードベースのインデックス作成とセマンティック検索に Gemini エンベディングモデルを使用しています。Roo Code を使用するデベロッパーは、アシスタントが人間のチームメイトのように複数のファイル間をやり取りする際に、構文だけでなく意図を理解する検索機能を必要とします。Roo Code は gemini-embedding-001 と Tree-sitter を組み合わせて論理コードを分割することで、不正確なクエリに対しても関連性の高い結果を提供します。最初のテストの結果、Gemini エンベディングによって LLM 駆動型のコード検索が大幅に改善され、柔軟性と精度が向上し、デベロッパーのワークフローに適合していることが確認されました。

パーソナライズされたメンタルウェルネスサポートの提供

Mindlid の AI ウェルネスコンパニオンは、gemini-embedding-001 を活用して会話履歴を理解し、コンテキストに応じた有用な情報をユーザーにリアルタイムで提供しています。同社は、一貫して 1 秒未満のレイテンシ（中央値: 420 ミリ秒）と有意な 82% のトップ 3 の再現率（OpenAI の text-embedding-3-small の再現率と比較して 4% 向上）という優れたパフォーマンスを記録しました。これは、Gemini エンベディングが最も関連性の高い情報を提供して AI サポートの関連性と速度を向上させることを示しています。

AI アシスタントのコンテキストと効率性の向上

Interaction Co. は、タスクを自動化し、Gmail から情報を抽出する AI メールアシスタント Poke を開発しています。Poke は、ユーザーの「記憶」の取得と、コンテキストを強化するための関連メールの特定という 2 つの主要な機能に Gemini エンベディングを使用しています。Poke の言語モデルは gemini-embedding-001 を統合することで、より高速かつ高精度にデータを取得できるようになりました。同社は、Voyage-2 と比較して、100 件のメールを埋め込む際の平均時間が 90.4% も短縮され、わずか 21.45 秒でタスクを完了したと報告しています。