Vertex AI RAG Engine: uma ferramenta para desenvolvedores

JAN 15, 2025

A IA generativa e os grandes modelos de linguagem (LLMs) estão a transformar as indústrias, mas dois desafios principais podem impedir a adoção pelas empresas: alucinações (geração de informações incorretas ou sem sentido) e conhecimento limitado além dos seus dados de formação. A Geração Aumentada de Recuperação (RAG) e o aterramento oferecem soluções conectando LLMs a fontes de dados externas, permitindo-lhes acessar informações atualizadas e gerar respostas mais factuais e relevantes.

Esta postagem explora o Vertex AI RAG Engine e como ele capacita desenvolvedores de software e IA a criar aplicativos de IA generativos robustos e fundamentados.


O que é RAG e por que você precisa dele?

O RAG recupera informações relevantes de uma base de conhecimento e as alimenta em um LLM, permitindo gerar respostas mais precisas e informadas. Isto contrasta com confiar apenas no conhecimento pré-treinado do LLM, que pode estar desatualizado ou incompleto. O RAG é essencial para a construção de aplicações Gen AI de nível empresarial que exigem:

  • Precisão: Minimizar alucinações e garantir que as respostas sejam fundamentadas em fatos.

  • Informações atualizadas: acessando os dados e insights mais recentes.

  • Experiência no domínio: aproveitamento de bases de conhecimento especializadas para casos de uso específicos.


RAG vs Aterramento vs Pesquisa

  • RAG: uma técnica para recuperar e fornecer informações relevantes aos LLMs para gerar respostas. As informações podem incluir informações novas, tópico e contexto, ou verdades básicas.

  • Aterramento: Garanta a confiabilidade e confiabilidade do conteúdo gerado por IA, ancorando-o em fontes de informação verificadas. O aterramento pode usar RAG como técnica.

  • Pesquisa: uma abordagem para encontrar e fornecer rapidamente informações relevantes de uma fonte de dados com base em texto ou consultas multimodais alimentadas por modelos avançados de IA.


Apresentando o mecanismo Vertex AI RAG

O Vertex AI RAG Engine é um serviço de orquestração gerenciado que agiliza o complexo processo de recuperação de informações relevantes e de alimentá-las a um LLM. Isso permite que os desenvolvedores se concentrem na construção de seus aplicativos em vez de no gerenciamento da infraestrutura.

Diagram of Vertex RAG architecture

Principais vantagens do Vertex AI RAG Engine:

  • Facilidade de uso: comece rapidamente com uma API simples, permitindo prototipagem e experimentação rápidas.

  • Orquestração gerenciada: Lida com as complexidades de recuperação de dados e integração LLM, liberando os desenvolvedores do gerenciamento de infraestrutura.

  • Personalização e suporte de código aberto: escolha entre uma variedade de modelos de análise, agrupamento, anotação, incorporação, armazenamento vetorial e de código aberto ou personalize seus próprios componentes.

  • Componentes do Google de alta qualidade: aproveite a tecnologia de ponta do Google para um desempenho ideal.

  • Flexibilidade de integração: conecte-se a vários bancos de dados vetoriais, como Pinecone e Weaviate, ou use o Vertex AI Vector Search.


Vertex AI RAG: um espectro de soluções

O Google Cloud oferece um espectro de soluções de RAG e embasamento, atendendo a níveis variados de complexidade e personalização:

  • Vertex AI Search: um mecanismo de pesquisa e API de recuperação totalmente gerenciado, ideal para casos de uso corporativos complexos que exigem alta qualidade pronta para uso, escalabilidade e controles de acesso refinados. Ele simplifica a conexão com diversas fontes de dados corporativos e permite a pesquisa em diversas fontes.

  • RAG totalmente DIY: para desenvolvedores que buscam controle total, a Vertex AI fornece APIs de componentes individuais (por exemplo, API de incorporação de texto, API de classificação, Grounding on Vertex AI) para criar pipelines RAG personalizados. Esta abordagem oferece flexibilidade máxima, mas requer um esforço de desenvolvimento significativo. Use isto se precisar de personalizações muito específicas ou quiser integrar com estruturas RAG existentes.

  • Mecanismo Vertex AI RAG: o ponto ideal para desenvolvedores que buscam um equilíbrio entre facilidade de uso e personalização. Ele permite prototipagem e desenvolvimento rápidos sem sacrificar a flexibilidade.


Casos de uso setoriais comuns para o RAG Engine:

  1. Serviços Financeiros: Aconselhamento e Consultoria de Investimento Personalizados Avaliação de risco:

Problema: os consultores financeiros precisam sintetizar rapidamente grandes quantidades de informações, como perfis de clientes, dados de mercado, declarações regulamentares e pesquisas internas, para fornecer consultoria de investimentos personalizada e avaliações de risco precisas. Revisar manualmente todas essas informações é demorado e propenso a erros.

Solução RAG Engine: um mecanismo de RAG pode ingerir e indexar fontes de dados relevantes. Os consultores financeiros podem, então, consultar o sistema com o perfil e os objetivos de investimento específicos de um cliente. O mecanismo de RAG fornecerá uma resposta concisa e baseada em evidências a partir de documentos relevantes, incluindo citações para respaldar as recomendações. Isso melhora a eficiência do consultor, reduz o risco de erro humano e melhora a personalização da consultoria. O sistema também pode sinalizar possíveis conflitos de interesses ou violações regulamentares com base nas informações encontradas nos dados ingeridos.


2. Saúde: descoberta acelerada de medicamentos e; Planos de tratamento personalizados:

Problema: a descoberta de medicamentos e a medicina personalizada dependem muito da análise de grandes conjuntos de dados de estudos clínicos, artigos de pesquisa, históricos de pacientes e informações genéticas. Peneirar esses dados para identificar possíveis alvos de medicamentos, prever respostas de pacientes a tratamentos ou gerar planos de tratamento personalizados é incrivelmente desafiador.

Solução RAG Engine: com medidas adequadas de privacidade e segurança, um mecanismo de RAG pode ingerir e indexar a vasta literatura biomédica e os dados dos pacientes. Os pesquisadores podem, então, fazer consultas complexas, como "Quais são os possíveis efeitos colaterais do medicamento X em pacientes com o genótipo Y?". O mecanismo de RAG sintetizaria informações relevantes de várias fontes, fornecendo aos pesquisadores insights que eles poderiam negligenciar em uma pesquisa manual. Para os médicos, o mecanismo pode ajudar a gerar planos de tratamento personalizados sugeridos com base nas características únicas e no histórico médico de um paciente, respaldados por evidências de pesquisas relevantes.


3. Jurídico: Due Diligence aprimorada e revisão de contrato:

Problema: os profissionais jurídicos passam um tempo significativo revisando documentos durante processos de due diligence, negociações de contratos e litígios. Encontrar cláusulas relevantes, identificar riscos potenciais e garantir a conformidade com os regulamentos é demorado e requer um profundo conhecimento.

Solução RAG Engine: um mecanismo de RAG pode ingerir e indexar documentos legais, jurisprudência e informações regulamentares. Os profissionais jurídicos podem consultar o sistema para encontrar cláusulas específicas dentro dos contratos, identificar possíveis riscos legais e pesquisar precedentes relevantes. O mecanismo pode destacar inconsistências, potenciais responsabilidades e jurisprudência relevante, acelerando significativamente o processo de revisão e melhorando a acurácia. Isso leva a fechamentos de transações mais rápidos, riscos legais reduzidos e uso mais eficiente de conhecimentos jurídicos.


Primeiros passos com o Vertex AI RAG Engine

O Google fornece amplos recursos para ajudar você a começar, incluindo:


Crie IA generativa fundamentada

O mecanismo RAG da Vertex AI e o conjunto de soluções de aterramento capacitam os desenvolvedores a criar aplicativos de IA generativos mais confiáveis, factuais e perspicazes. Ao aproveitar essas ferramentas, você pode desbloquear todo o potencial dos LLMs e superar os desafios das alucinações e do conhecimento limitado, abrindo caminho para uma adoção empresarial mais ampla da IA ​​generativa. Escolha a solução que melhor atende às suas necessidades e comece a construir a próxima geração de aplicações inteligentes.