Gemini API로 프로덕션 환경에 AI 에이전트 배포

10월 30, 2024
Vishal Dharmadhikari Product Solutions Engineer
Paige Bailey AI Developer Experience Engineer
Adam Silverman COO, Agency AI

AI 에이전트의 개발과 배포는 흥미로운 영역이지만 프로덕션 환경에서 이런 복잡한 시스템을 관리하기 위해서는 강력한 관측 가능성이 필수입니다. 에이전트 모니터링, LLM 비용 추적, 벤치마킹 등을 위한 Python SDK인 AgentOps는, 특히 Gemini API의 성능 및 비용 효율성과 결합했을 때 개발자가 에이전트를 프로토타입에서 프로덕션 단계로 전개할 수 있도록 지원합니다.

A screenshot of the AgentOps AI platform displaying session data, including the session duration, cost, and prompts used, highlighting the LLM (Large Language Model) calls and events, the specific agent involved, and their role in the session.

Gemini의 장점

AgentOps를 담당하는 팀 Agency AI의 COO인 Adam Silverman은 AI 에이전트를 대규모로 배포하는 기업에 있어 결정적으로 중요한 요소는 비용이라고 설명합니다. "기업들이 LLM 호출 비용으로 한 달에 8만 달러를 지출하는 걸 봤습니다. Gemini 1.5를 사용하면 동일한 출력 결과를 얻는 데 몇 천 달러 정도밖에 들지 않았을 거예요."

Gemini의 강력한 언어 이해 및 생성 기능에 더불어 이렇게 좋은 비용 효율성 덕분에 Gemini는 정교한 AI 에이전트를 개발하는 개발자를 위한 이상적인 선택으로 자리 잡았습니다. "Gemini 1.5 Flash는 훨씬 더 저렴한 비용으로도 더 큰 모델에 비견할만한 품질을 제공하는 한편 놀라울 정도로 빠릅니다." Silverman이 덧붙입니다. 따라서 개발자는 과도한 비용을 걱정하지 않고 복잡한 다단계 에이전트 워크플로를 개발하는 데 집중할 수 있습니다.

"다른 LLM 공급자를 이용할 경우 개별 에이전트를 실행할 때마다 500달러 이상의 비용이 드는 걸 봤어요. Gemini(1.5 Fash 8B)를 사용해 동일한 조건으로 실행할 때 드는 비용은 50달러 미만입니다."
– Adam Silverman, Agency AI COO
A screen share of an AgentOps AI dashboard showing graphs and charts of analytics for session end states, failed sessions, session cost distribution, and events per session.

AI 에이전트 강화

AgentOps는 LLM 호출뿐만 아니라 모든 에이전트 상호작용에 대한 데이터를 캡처하여 멀티 에이전트 시스템의 작동 방식을 포괄적으로 보여줍니다. 이처럼 상세한 세부 내용은 엔지니어링팀과 준법감시팀에 필수적이며 디버깅, 최적화, 감사 추적을 위한 매우 중요한 인사이트를 제공합니다.

Gemini 모델과 AgentOps의 통합은 매우 간단한 작업으로, 보통 LiteLLM을 사용해 단 몇 분 만에 통합할 수 있습니다. 개발자는 Gemini APIcall에 대한 가시성을 빠르게 확보하고, 실시간으로 비용을 추적하며, 프로덕션 환경에서 에이전트의 신뢰성을 보장할 수 있습니다.


전망

AgentOps는 에이전트 개발자가 프로젝트를 확장할 수 있도록 지원하기 위해 최선을 다하고 있습니다. Agency AI는 기업이 합리적인 비용으로 확장 가능한 에이전트를 개발하는 과정의 복잡성을 헤쳐나갈 수 있도록 지원하며, AgentOps와 Gemini API를 결합하는 가치 제안을 더욱 공고히 합니다. "AgentOps는 가격에 민감한 더 많은 개발자가 에이전트를 개발하도록 안내합니다." Silverman이 강조합니다.

Gemini 사용을 고려 중인 개발자를 위한 Silverman의 조언은 분명합니다. "한번 사용해 보시면 탄복하실 겁니다."