Gemini Flash로 시각적 설명 처리에서 30% 비용 절감 달성한 OpusClip

11월 20, 2024
Vito Zhu OpusClip
Vishal Dharmadhikari Product Solutions Engineer

Gemini API는 개발자가 최신 Gemini 모델에 쉽게 접근할 수 있도록 하여 멀티모달 AI의 모든 잠재력을 활용할 수 있도록 지원합니다. 혁신적인 동영상 콘텐츠 제작 플랫폼인 OpusClip은 이러한 획기적인 능력을 보여주는 대표적인 예입니다. OpusClip은 시각, 청각 및 텍스트 데이터에 대한 Gemini의 향상된 이해력을 활용하여 크리에이터와 기업이 매력적인 동영상 콘텐츠를 생성하는 방식을 혁신하고 실제 애플리케이션에서 최첨단 AI가 가진 실질적인 이점을 보여줍니다.


OpusClip 내부: Gemini 1.5 Flash로 'ClipAnything'의 잠재력 극대화

OpusClip의 임무는 실제인 맞춤형 동영상 제작을 위한 자동 동영상 편집 플랫폼을 통해 누구든 전문 기술 없이도 동영상 콘텐츠를 제작할 수 있도록 지원하는 것입니다. 크리에이터, 마케터, 기업, 대형 미디어 회사를 포함한 7백만 이상의 두터운 사용자층을 보유한 이 플랫폼은 AI를 활용해 동영상에서 하이라이트 장면을 자동으로 추출합니다. 이를 통해 다양한 가로세로 비율에 맞춰 클립을 재구성하고 생동감 넘치는 자막과 B-Roll로 영상을 더 풍부하게 만들어 소셜 미디어에 공유할 수 있는 매력적인 콘텐츠를 만듭니다.

OpusClip은 Gemini 1.5 Flash를 사용하여 사용자가 자연어로 짧은 클립을 쉽게 생성할 수 있도록 지원합니다.

OpusClip이 달성한 혁신의 초석은 멀티모달 AI 클리핑 도구인 'ClipAnything' 기능입니다. 이 기능을 사용하면 포착하려는 순간을 자연어 프롬프트로 설명하기만 하면 클립을 생성할 수 있습니다. Gemini 1.5 Flash의 멀티모달 기능은 여기서 중요한 역할을 합니다. AI가 동영상 내의 비주얼, 행동, 감정, 오디오, 대화를 분석하여 이러한 프롬프트를 이해하고 해석할 수 있도록 하는 것입니다. "저희는 동영상에 대한 이해를 높이기 위한 자세한 시각적 설명을 제공하기 위해 Gemini 1.5 Flash를 활용합니다." OpusClip의 수석 연구원인 Vito Zhu의 설명입니다. 이러한 심층적 이해를 통해 OpusClip은 사용자 프롬프트를 기반으로 가장 관련성 높고 매력적인 순간을 식별할 수 있고, 이는 동영상 편집에 필요한 시간과 노력을 대폭 줄일 수 있습니다.


Gemini 1.5 Flash로 비용 절감 및 참여도 향상

Gemini 1.5 Flash가 통합되면서 OpusClip의 효율성과 유효성이 크게 향상되었습니다. 이 플랫폼을 사용한 결과 내보내기 비율은 그대로 유지하면서도 시각적 설명 처리 비용이 30% 절감되었습니다. 더 나아가, 프롬프트와 관련된 'ClipAnything' 기능 덕분에 사용자 참여도(클릭 수)가 30% 증가하고 내보내기 비율이 10% 증가했습니다. 이를 통해 Gemini 1.5 Flash 사용으로 인해 정확도와 관련성이 향상된다는 점이 입증되었습니다.

"Gemini 1.5 Flash 덕분에 개발이 간소화되어, 프롬프트 기반 기능의 출시 시간을 단축하고 매우 정확한 결과를 제공할 수 있었어요." Vito가 말합니다. 문서화가 잘 된 Gemini API SDK와 신뢰할 수 있는 지원으로 개발 경험이 더욱 향상되었습니다.

OpusClip은 프롬프트 관련 기능을 더욱 개선하고 확장하여 사용자를 위한 고급 사용자 정의 옵션을 탐색할 계획입니다. 또한 Gemini 1.5 Flash의 기능을 활용하여 개별 사용자의 관심사에 맞게 동영상 콘텐츠를 동적으로 조정함으로써 보다 맞춤화된 권장 사항을 구현하는 데 매우 열정적으로 임하고 있습니다.


Gemini API 시작하기: OpusClip의 탐색 여정에서 얻은 유용한 정보

Vito는 시각적 콘텐츠 분석 또는 모멘트 검색과 관련된 프로젝트를 개발하는 개발자에게 Gemini API로 개발하고 사용 사례에 적합한 모델을 찾으라고 권합니다. "저희의 경우 Gemini 1.5 Flash의 정확도 및 속도에서의 성능은 다른 솔루션보다 훨씬 뛰어납니다. 또한 제대로 설정해 주면 비용 효율적이기도 합니다." Vito는 Gemini 1.5 Flash가 프롬프트 조정에 매우 반응성이 높으므로 개발자에게 조기에 모니터링을 설정하고 데이터 세트를 기반으로 프롬프트를 미세 조정하라고 조언합니다.


Gemini API로 개발을 시작하려면 개발자 문서부터 살펴보세요.