Vertex AI RAG 엔진: 개발자 도구

2025년 1월 15일

생성 AI 및 LLM(대형 언어 모델)은 산업을 변화시키고 있지만 기업의 채택을 방해할 수 있는 두 가지 주요 과제는 환각(잘못되거나 무의미한 정보 생성)과 훈련 데이터 이외의 제한된 지식입니다. 검색 증강 생성(RAG) 및 접지는 LLM을 외부 데이터 소스에 연결하여 최신 정보에 액세스하고 보다 사실적이고 관련성이 높은 응답을 생성할 수 있도록 하는 솔루션을 제공합니다.

이 게시물에서는 Vertex AI RAG 엔진을 살펴보고 이 엔진이 소프트웨어 및 AI 개발자가 강력하고 기반이 있는 생성 AI 애플리케이션을 구축할 수 있도록 지원하는 방법을 살펴봅니다.

RAG는 무엇이며 왜 필요한가요?

RAG는 지식 기반에서 관련 정보를 검색하여 LLM에 제공하므로 보다 정확하고 정보에 입각한 응답을 생성할 수 있습니다. 이는 구식이거나 불완전할 수 있는 LLM의 사전 훈련된 지식에만 의존하는 것과 대조됩니다. RAG는 다음이 필요한 엔터프라이즈급 Gen AI 애플리케이션을 구축하는 데 필수적입니다.

정확성: 환각을 최소화하고 사실에 근거한 대응을 보장합니다.

최신 정보: 최신 데이터 및 통계에 액세스합니다.

도메인 전문 지식: 특정 사용 사례에 대한 전문 지식 기반을 활용합니다.

RAG 대 접지 대 검색

RAG: 관련 정보를 검색하고 LLM에 제공하여 응답을 생성하는 기술입니다. 정보에는 최신 정보, 주제 및 맥락 또는 실제 사실이 포함될 수 있습니다.

접근: AI 생성 콘텐츠를 검증된 정보 소스에 연결하여 신뢰성과 신뢰성을 보장합니다. 접지는 RAG를 기술로 사용할 수 있습니다.

검색: 고급 AI 모델로 구동되는 텍스트 또는 다중 모드 쿼리를 기반으로 데이터 소스에서 관련 정보를 신속하게 찾고 제공하는 접근 방식입니다.

Vertex AI RAG 엔진 소개

Vertex AI RAG 엔진은 관련 정보를 검색하고 이를 LLM에 제공하는 복잡한 프로세스를 간소화하는 관리형 조정 서비스입니다. 이를 통해 개발자는 인프라 관리보다는 애플리케이션 구축에 집중할 수 있습니다.

Vertex AI RAG Engine의 주요 장점:

사용 편의성: 간단한 API로 빠르게 시작하여 신속한 프로토타이핑과 실험이 가능합니다.

관리형 오케스트레이션: 데이터 검색 및 LLM 통합의 복잡성을 처리하여 개발자가 인프라 관리에서 벗어날 수 있도록 해줍니다.

맞춤설정 및 오픈소스 지원: 다양한 구문 분석, 청킹, 주석, 임베딩, 벡터 저장, 오픈소스 모델 중에서 선택하거나 자체 구성요소를 맞춤 설정할 수 있습니다.

고품질 Google 구성요소: Google의 최첨단 기술을 활용하여 최적의 성능을 달성합니다.

통합 유연성: Pinecone 및 Weaviate와 같은 다양한 벡터 데이터베이스에 연결하거나 Vertex AI Vector Search를 사용할 수 있습니다.

Vertex AI RAG: 다양한 솔루션

Google Cloud는 다양한 수준의 복잡성과 맞춤설정을 충족하는 다양한 RAG 및 그라운딩 솔루션을 제공합니다.

Vertex AI Search: 즉시 사용 가능한 높은 품질, 확장성 및 세분화된 액세스 제어가 필요한 복잡한 기업 사용 사례에 이상적인 완전 관리형 검색 엔진 및 검색기 API입니다. 다양한 엔터프라이즈 데이터 소스에 대한 연결을 단순화하고 여러 소스에서 검색을 가능하게 합니다.

완전한 DIY RAG: Vertex AI는 완전한 제어를 원하는 개발자를 위해 개별 구성요소 API(예: Text Embedding API, Ranking API, Grounding on Vertex AI)를 제공하여 커스텀 RAG 파이프라인을 구축합니다. 이 접근 방식은 최대의 유연성을 제공하지만 상당한 개발 노력이 필요합니다. 매우 구체적인 사용자 정의가 필요하거나 기존 RAG 프레임워크와 통합하려는 경우 이를 사용하십시오.

Vertex AI RAG 엔진: 사용 편의성과 맞춤설정 간의 균형을 원하는 개발자에게 가장 적합합니다. 유연성을 희생하지 않고도 신속한 프로토타이핑 및 개발이 가능합니다.

RAG 엔진의 일반적인 산업 사용 사례:

금융 서비스: 맞춤형 투자 조언 & 위험 평가:

문제: 재무 고문은 맞춤형 투자 조언과 정확한 위험 평가를 제시하기 위해 고객 프로필, 시장 데이터, 규제 관련 기록물, 내부 조사 등 방대한 양의 정보를 빠르게 종합해야 합니다. 이 모든 정보를 수동으로 검토하는 일은 시간이 많이 걸리고 오류가 발생하기 쉽습니다.

RAG 엔진 솔루션: RAG 엔진은 관련 데이터 소스를 수집하고 색인을 생성할 수 있습니다. 그러면 재무 고문이 고객의 특정 프로필과 투자 목표를 사용하여 시스템에 쿼리할 수 있습니다. RAG 엔진은 권장 사항을 뒷받침하는 인용 등 관련 문서에서 도출된 간결한 증거 기반 응답을 제공합니다. 이는 재무 고문의 업무 효율성을 높이고 인적 오류 발생 위험을 줄이며 조언의 맞춤설정 수준을 향상시킵니다. 또한 이 시스템은 수집된 데이터에서 발견된 정보를 기반으로 잠재적인 이해 상충 또는 규제 위반 사항을 표시하여 미리 주의를 줄 수도 있습니다.

2. 헬스케어: 신약 개발 가속화 및 맞춤형 치료 계획:

문제: 신약 개발 및 맞춤형 의학 서비스는 임상 시험, 연구 논문, 환자 기록, 유전 정보 등으로 구성된 방대한 데이터 세트 분석에 크게 의존합니다. 잠재적인 약물 표적을 식별하거나 치료에 대한 환자의 반응을 예측하거나 또는 맞춤형 치료 계획을 만들기 위해 이 모든 데이터를 철저히 살펴보는 것은 매우 어렵습니다.

RAG 엔진 솔루션: RAG 엔진은 적절한 개인정보 보호 및 보안 조치를 통해 방대한 생물 의학 문헌과 환자 데이터를 수집하고 색인을 생성할 수 있습니다. 그러면 연구자들이 "유전자형이 Y인 환자에게 약물 X 투여 시 발생할 수 있는 부작용은 뭔가요?"와 같은 복잡한 질문을 던질 수 있습니다. RAG 엔진은 다양한 소스에서 관련 정보를 종합하여 연구자가 수동 검색에서 놓칠 수 있는 유용한 정보를 제공합니다. 임상의의 경우, RAG 엔진은 환자의 고유한 특성과 의료 기록을 기반으로 제안된 맞춤형 치료 계획 생성을 지원할 수 있습니다. 이때 관련 연구에서 얻은 증거가 제안된 치료 계획을 뒷받침합니다.

3. 법률: 강화된 실사 및 계약 검토:

문제: 법률 전문가는 실사 절차와 계약 협상, 소송 중에 문서를 검토하는 데 상당한 시간을 할애합니다. 관련 조항을 찾고 잠재적 위험을 식별하고 규정을 준수하는 데는 많은 시간이 소요되고 심도 있는 전문 지식이 필요합니다.

RAG 엔진 솔루션: RAG 엔진은 법률 문서, 판례법, 규제 정보를 수집하고 색인을 생성할 수 있습니다. 법률 전문가는 시스템을 쿼리하여 계약서 내에서 특정 조항을 찾고, 잠재적인 법률상 위험을 식별하며, 관련 판례를 조사할 수 있습니다. RAG 엔진은 불일치 사항, 잠재적 책임, 관련 판례법을 강조표시하여 검토 과정의 속도를 크게 높이고 정확성을 개선할 수 있습니다. 이는 더 빠른 사건 종결, 법률상 위험 감소, 법률 전문 지식의 보다 효율적인 사용으로 이어집니다.

Vertex AI RAG 엔진 시작하기

Google은 다음을 포함하여 시작하는 데 도움이 되는 충분한 리소스를 제공합니다.

노트북 시작하기:
- https://github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb

설명서: 종합 설명서에 RAG 엔진의 설정 및 사용 방법이 나와 있습니다.
- https://cloud.google.com/vertex-ai/generative-ai/docs/rag-overview

통합: Vertex AI Vector Search, Vertex AI Feature Store, Pinecone, Weaviate를 사용하는 예

평가 프레임워크: RAG 엔진을 사용하여 검색을 위한 초매개변수 조정을 평가하고 수행하는 방법을 알아보세요.
- https://github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/rag_engine_evaluation.ipynb

기반 생성 AI 구축

Vertex AI의 RAG 엔진과 접지 솔루션 제품군은 개발자가 더욱 안정적이고 사실적이며 통찰력 있는 생성 AI 애플리케이션을 구축할 수 있도록 지원합니다. 이러한 도구를 활용하면 LLM의 잠재력을 최대한 활용하고 환각과 제한된 지식의 문제를 극복하여 기업에서 생성 AI를 더 광범위하게 채택할 수 있는 길을 열 수 있습니다. 귀하의 요구 사항에 가장 적합한 솔루션을 선택하고 차세대 지능형 애플리케이션 구축을 시작하세요.