Vertex AI RAG Engine: デベロッパー ツール

1月 15, 2025

生成 AI と大規模言語モデル (LLM) は業界を変革していますが、2 つの重要な課題が企業の導入を妨げる可能性があります。それは、幻覚 (不正確または無意味な情報の生成) とトレーニング データ以外の限られた知識です。検索拡張生成 (RAG) とグラウンディングは、LLM を外部データ ソースに接続することでソリューションを提供し、最新の情報にアクセスし、より事実に基づいた関連性の高い応答を生成できるようにします。

この投稿では、Vertex AI RAG Engine と、ソフトウェアおよび AI 開発者が堅牢で根拠のある生成 AI アプリケーションを構築できるようにする方法について説明します。


RAG とは何ですか? なぜそれが必要なのでしょうか?

RAG は、ナレッジ ベースから関連情報を取得して LLM にフィードし、より正確で情報に基づいた応答を生成できるようにします。これは、古くなったり不完全な可能性がある LLM の事前トレーニングされた知識のみに依存することとは対照的です。 RAG は、以下を必要とするエンタープライズ グレードの Gen AI アプリケーションを構築するために不可欠です。

  • 正確さ: 幻覚を最小限に抑え、回答が事実に基づいていることを確認します。

  • 最新情報: 最新のデータと分析情報にアクセスします。

  • ドメインの専門知識: 特定のユースケースに特化した知識ベースを活用します。


RAG vs グラウンディング vs 検索

  • RAG: 関連情報を取得して LLM に提供し、応答を生成する技術。情報には、最新の情報、トピックとコンテキスト、または真実が含まれる場合があります。

  • グラウンディング: AI が生成したコンテンツを検証済みの情報ソースに固定することで、そのコンテンツの信頼性と信頼性を確保します。接地には RAG が手法として使用される場合があります。

  • 検索: 高度な AI モデルを活用したテキストまたはマルチモーダル クエリに基づいて、データ ソースから関連情報を迅速に検索して配信するアプローチ。


Vertex AI RAG エンジンの紹介

Vertex AI RAG Engine はマネージド オーケストレーション サービスであり、関連情報を取得して LLM に供給する複雑なプロセスを合理化します。これにより、開発者はインフラストラクチャの管理ではなく、アプリケーションの構築に集中できるようになります。

Diagram of Vertex RAG architecture

Vertex AI RAG Engine の主な利点:

  • 使いやすさ: シンプルな API を使用してすぐに使い始められるため、迅速なプロトタイピングと実験が可能になります。

  • マネージド オーケストレーション: データ取得と LLM 統合の複雑さを処理し、開発者をインフラストラクチャ管理から解放します。

  • カスタマイズとオープンソースをサポート: さまざまな解析、チャンクキング、アノテーション、エンベディング、ベクトル ストレージ、オープンソース モデルを選択することも、独自のコンポーネントをカスタマイズすることもできます。

  • 高品質の Google コンポーネント: Google の最先端テクノロジーを利用し、最適なパフォーマンスを実現します。

  • 柔軟な連携機能: Pinecone や Weaviate など、さまざまなベクトル データベースに接続することも、Vertex AI Vector Search を使うこともできます。


Vertex AI RAG: さまざまなソリューション

Google Cloud では、さまざまな RAG やグラウンディングのソリューションが提供されているので、さまざまなレベルの複雑さやカスタマイズに対応できます。

  • Vertex AI Search: フルマネージドの検索エンジンと取得 API は、すぐに使える高い品質、スケーラビリティ、きめ細かいアクセス制御を必要とする複雑なエンタープライズ ユースケースに最適です。これにより、多様なエンタープライズ データ ソースへの接続が簡素化され、複数のソースにわたる検索が可能になります。

  • 完全な DIY RAG: 完全な制御を求める開発者向けに、Vertex AI はカスタム RAG パイプラインを構築するための個別のコンポーネント API (テキスト埋め込み API、ランキング API、Vertex AI のグラウンディングなど) を提供します。このアプローチは最大限の柔軟性を提供しますが、多大な開発努力が必要になります。非常に特殊なカスタマイズが必要な場合、または既存の RAG フレームワークと統合する場合は、これを使用します。

  • Vertex AI RAG エンジン: 使いやすさとカスタマイズのバランスを求める開発者にとって最適な場所です。柔軟性を犠牲にすることなく、迅速なプロトタイピングと開発が可能になります。


業界での RAG Engine の一般的なユースケース:

  1. 金融サービス: 個別の投資アドバイスとサービスリスクアセスメント:

問題: 金融アドバイザーが個人に合わせた投資アドバイスや正確なリスク評価を行うには、クライアントのプロフィール、市場データ、規制申告書類、内部調査資料といった膨大な情報をすばやくまとめなければなりません。すべてを手動で行おうとすると、時間がかかり、ミスも増えます。

RAG Engine ソリューション: RAG Engine は、関連するデータソースを取り込み、インデックスを作成することができます。金融アドバイザーが、クライアントの特定のプロフィールや投資目標を使ってシステムに問い合わせると、RAG Engine は関連ドキュメントから簡潔でエビデンスに基づいた回答を返します。回答には、裏付けとなる引用情報も含まれています。そのためアドバイザーの効率が上がり、ヒューマン エラーのリスクが軽減され、これまで以上に個人に合わせたアドバイスを提供できるようになります。取り込まれたデータの中で利益相反や規制違反の可能性が見つかった場合に、フラグを立てるようなこともできます。


2. ヘルスケア: 創薬の加速と加速個別の治療計画:

問題: 創薬や個人に合わせた医療を行うには、臨床試験、研究論文、患者記録、遺伝情報の膨大なデータセットの分析が絶対に欠かせません。このデータに目を通して、潜在的な薬物標的を特定したり、患者の治療への反応を予測したり、個人に合わせた治療計画を作ったりするのは、非常に困難な作業です。

RAG Engine ソリューション: 適切なプライバシー対策やセキュリティ対策を行ったうえで、RAG Engine に膨大な生物医学文献や患者データを取り込み、インデックスを作成することができます。そうすると、研究者が、「遺伝子型 Y の患者における薬 X の潜在的な副作用は何ですか?」といった複雑な質問をできるようになります。RAG エンジンは、さまざまなソースの関連情報を合成し、手動検索では見逃す可能性のある知見を研究者に提供します。臨床医がこれを活用すれば、関連研究のエビデンスによる裏付けがあり、患者固有の特徴や病歴に基づいた治療計画を、個人に合わせて提案できます。


3. 法務: デューデリジェンスと契約レビューの強化:

問題: 法務専門家は、デュー デリジェンス プロセス、契約交渉、訴訟における文書の確認にかなりの時間を費やしています。関連する条項を見つけ、潜在的なリスクを特定して、規制へのコンプライアンスを確保するには、たくさんの時間と深い専門知識が必要です。

RAG Engine ソリューション: RAG Engine は、法務文書、判例法、規制情報を取り込んでインデックスを作成することができます。法務専門家は、システムに問い合わせることで、契約内の特定の条項を見つけたり、潜在的な法的リスクを特定したり、関連する先例を調査したりできます。不一致、潜在的責任、関連する判例法をハイライトできるので、審査プロセスを大幅にスピードアップでき、正確性も向上します。これにより、成約までの時間の短縮、法的リスクの軽減、法務専門知識の有効活用につながります。


Vertex AI RAG エンジンを使ってみる

Google は、これを使ってみるにあたり、次のようなさまざまなリソースを提供しています。


根拠のある生成 AI を構築する

Vertex AI の RAG エンジンと一連のグラウンディング ソリューションにより、開発者はより信頼性が高く、事実に基づいた、洞察力に富んだ生成 AI アプリケーションを構築できます。これらのツールを活用することで、LLM の可能性を最大限に引き出し、幻覚や限られた知識の課題を克服し、生成 AI をより広範に企業に導入する道を開くことができます。ニーズに最適なソリューションを選択し、次世代のインテリジェント アプリケーションの構築を開始してください。