Vertex AI RAG 엔진: 개발자 도구

1월 15, 2025

Generative AI and Large Language Models (LLMs) are transforming industries, but two key challenges can hinder enterprise adoption: hallucinations (generating incorrect or nonsensical information) and limited knowledge beyond their training data. Retrieval Augmented Generation (RAG) and grounding offer solutions by connecting LLMs to external data sources, enabling them to access up-to-date information and generate more factual and relevant responses.

This post explores Vertex AI RAG Engine and how it empowers software and AI developers to build robust, grounded generative AI applications.


What is RAG and why do you need it?

RAG retrieves relevant information from a knowledge base and feeds it to an LLM, allowing it to generate more accurate and informed responses. This contrasts with relying solely on the LLM's pre-trained knowledge, which can be outdated or incomplete. RAG is essential for building enterprise-grade Gen AI applications that require:

  • Accuracy: Minimizing hallucinations and ensuring responses are factually grounded.

  • Up-to-date Information: Accessing the latest data and insights.

  • Domain Expertise: Leveraging specialized knowledge bases for specific use cases.


RAG vs Grounding vs Search

  • RAG: a technique to retrieve and provide relevant information to LLMs to generate responses. The information can include fresh information, topic and context, or ground truth.

  • Grounding: Ensure the reliability and trustworthiness of AI-generated content by anchoring it to verified sources of information. Grounding may use RAG as a technique.

  • Search: an approach to quickly find and deliver relevant information from a data source based on text or multi-modal queries powered by advanced AI models.


Introducing Vertex AI RAG Engine

Vertex AI RAG Engine is a managed orchestration service, streamlining the complex process of retrieving relevant information and feeding it to an LLM. This allows developers to focus on building their applications rather than managing infrastructure.

Diagram of Vertex RAG architecture

Vertex AI RAG Engine의 주요 장점:

  • Ease of Use: Get started quickly with a simple API, enabling rapid prototyping and experimentation.

  • Managed Orchestration: Handles the complexities of data retrieval and LLM integration, freeing developers from infrastructure management.

  • 맞춤설정 및 오픈소스 지원: 다양한 구문 분석, 청킹, 주석, 임베딩, 벡터 저장, 오픈소스 모델 중에서 선택하거나 자체 구성요소를 맞춤 설정할 수 있습니다.

  • 고품질 Google 구성요소: Google의 최첨단 기술을 활용하여 최적의 성능을 달성합니다.

  • 통합 유연성: Pinecone 및 Weaviate와 같은 다양한 벡터 데이터베이스에 연결하거나 Vertex AI Vector Search를 사용할 수 있습니다.


Vertex AI RAG: 다양한 솔루션

Google Cloud는 다양한 수준의 복잡성과 맞춤설정을 충족하는 다양한 RAG 및 그라운딩 솔루션을 제공합니다.

  • Vertex AI Search: A fully managed search engine and retriever API ideal for complex enterprise use cases requiring high out-of-the-box quality, scalability, and fine-grained access controls. It simplifies connecting to diverse enterprise data sources and enables searching across multiple sources.

  • Fully DIY RAG: For developers seeking complete control, Vertex AI provides individual component APIs (e.g., Text Embedding API, Ranking API, Grounding on Vertex AI) to build custom RAG pipelines. This approach offers maximum flexibility but requires significant development effort. Use this if you need very specific customizations or want to integrate with existing RAG frameworks.

  • Vertex AI RAG Engine: The sweet spot for developers seeking a balance between ease of use and customization. It empowers rapid prototyping and development without sacrificing flexibility.


RAG 엔진의 일반적인 산업 사용 사례:

  1. Financial Services: Personalized Investment Advice & Risk Assessment:

문제: 재무 고문은 맞춤형 투자 조언과 정확한 위험 평가를 제시하기 위해 고객 프로필, 시장 데이터, 규제 관련 기록물, 내부 조사 등 방대한 양의 정보를 빠르게 종합해야 합니다. 이 모든 정보를 수동으로 검토하는 일은 시간이 많이 걸리고 오류가 발생하기 쉽습니다.

RAG 엔진 솔루션: RAG 엔진은 관련 데이터 소스를 수집하고 색인을 생성할 수 있습니다. 그러면 재무 고문이 고객의 특정 프로필과 투자 목표를 사용하여 시스템에 쿼리할 수 있습니다. RAG 엔진은 권장 사항을 뒷받침하는 인용 등 관련 문서에서 도출된 간결한 증거 기반 응답을 제공합니다. 이는 재무 고문의 업무 효율성을 높이고 인적 오류 발생 위험을 줄이며 조언의 맞춤설정 수준을 향상시킵니다. 또한 이 시스템은 수집된 데이터에서 발견된 정보를 기반으로 잠재적인 이해 상충 또는 규제 위반 사항을 표시하여 미리 주의를 줄 수도 있습니다.


2. Healthcare: Accelerated Drug Discovery & Personalized Treatment Plans:

문제: 신약 개발 및 맞춤형 의학 서비스는 임상 시험, 연구 논문, 환자 기록, 유전 정보 등으로 구성된 방대한 데이터 세트 분석에 크게 의존합니다. 잠재적인 약물 표적을 식별하거나 치료에 대한 환자의 반응을 예측하거나 또는 맞춤형 치료 계획을 만들기 위해 이 모든 데이터를 철저히 살펴보는 것은 매우 어렵습니다.

RAG 엔진 솔루션: RAG 엔진은 적절한 개인정보 보호 및 보안 조치를 통해 방대한 생물 의학 문헌과 환자 데이터를 수집하고 색인을 생성할 수 있습니다. 그러면 연구자들이 "유전자형이 Y인 환자에게 약물 X 투여 시 발생할 수 있는 부작용은 뭔가요?"와 같은 복잡한 질문을 던질 수 있습니다. RAG 엔진은 다양한 소스에서 관련 정보를 종합하여 연구자가 수동 검색에서 놓칠 수 있는 유용한 정보를 제공합니다. 임상의의 경우, RAG 엔진은 환자의 고유한 특성과 의료 기록을 기반으로 제안된 맞춤형 치료 계획 생성을 지원할 수 있습니다. 이때 관련 연구에서 얻은 증거가 제안된 치료 계획을 뒷받침합니다.


3. Legal: Enhanced Due Diligence and Contract Review:

문제: 법률 전문가는 실사 절차와 계약 협상, 소송 중에 문서를 검토하는 데 상당한 시간을 할애합니다. 관련 조항을 찾고 잠재적 위험을 식별하고 규정을 준수하는 데는 많은 시간이 소요되고 심도 있는 전문 지식이 필요합니다.

RAG 엔진 솔루션: RAG 엔진은 법률 문서, 판례법, 규제 정보를 수집하고 색인을 생성할 수 있습니다. 법률 전문가는 시스템을 쿼리하여 계약서 내에서 특정 조항을 찾고, 잠재적인 법률상 위험을 식별하며, 관련 판례를 조사할 수 있습니다. RAG 엔진은 불일치 사항, 잠재적 책임, 관련 판례법을 강조표시하여 검토 과정의 속도를 크게 높이고 정확성을 개선할 수 있습니다. 이는 더 빠른 사건 종결, 법률상 위험 감소, 법률 전문 지식의 보다 효율적인 사용으로 이어집니다.


Getting started with Vertex AI RAG Engine

Google은 다음을 포함하여 시작하는 데 도움이 되는 충분한 리소스를 제공합니다.


Build grounded generative AI

Vertex AI's RAG Engine and suite of grounding solutions empower developers to build more reliable, factual, and insightful generative AI applications. By leveraging these tools, you can unlock the full potential of LLMs and overcome the challenges of hallucinations and limited knowledge, paving the way for wider enterprise adoption of generative AI. Choose the solution that best fits your needs and start building the next generation of intelligent applications.