OpusClip が Gemini Flash による視覚描写処理でコストを 30% 削減

11月 20, 2024
Vito Zhu OpusClip
Vishal Dharmadhikari Product Solutions Engineer

Gemini API を使うと、最新の Gemini モデルに簡単にアクセスできるので、デベロッパーがマルチモーダル AI の可能性を最大限に活用できます。イノベーションあふれる動画コンテンツ作成プラットフォームである OpusClip は、この革新的な機能の代表例です。Gemini は、視覚データ、オーディオ データ、テキストデータの高度な解釈が可能です。OpusClip はそれを活用して、クリエイターや企業が魅力的な動画コンテンツを生成する方法を変革しています。これは、最先端の AI を現実世界のアプリケーションに応用するメリットを実証するものです。


OpusClip の内側: Gemini 1.5 Flash で「ClipAnything」機能を実現する

OpusClip のミッションは、本物のパーソナライズされた動画制作向けの自動動画編集プラットフォームを通じて、誰もがプロのスキルなしで動画コンテンツを作成できるようにすることです。OpusClip のユーザーベースは、クリエイター、マーケティング担当者、企業、大手メディア企業など、700 万を超えています。このプラットフォームでは、AI を活用して動画から自動的にハイライトを抽出したり、さまざまなアスペクト比のクリップをリフレームしたり、アニメーションする字幕や B ロールで飾り付けを行ったりできるので、魅力的なコンテンツを作成してソーシャル メディアで共有できます。

Gemini 1.5 Flash を使ってユーザーが自然言語で短いクリップを簡単に生成できるようにしている OpusClip

OpusClip のイノベーションの根幹は、マルチモーダル AI クリッピング ツールである「ClipAnything」機能です。この機能では、ユーザーが切り取りたい場面を自然言語のプロンプトで指定するだけで、クリップを生成できます。ここで重要な役割を果たしているのが、Gemini 1.5 Flash のマルチモーダル機能です。AI がこのプロンプトを理解し、動画内のビジュアル、アクション、感情、オーディオ、会話を分析します。OpusClip のチーフ リサーチ サイエンティストである Vito Zhu 氏は、「動画の解釈機能を強化するため、Gemini 1.5 Flash を使って視覚的に細かく動画を分析しています」と説明しています。この深い理解のおかげで、OpusClip はユーザーのプロンプトにぴったり一致する魅力的な場面を特定できます。動画編集に必要な時間と労力を大幅に削減できるのはそのためです。


Gemini 1.5 Flash でコストを削減してエンゲージメントの向上を計る

Gemini 1.5 Flash との連携によって、OpusClip の効率と有効性が大幅に向上しました。このプラットフォームでは、同じエクスポート速度を維持しながら、視覚描写処理のコストを 30% 削減できました。さらに、プロンプトが関係している「ClipAnything」機能では、ユーザー エンゲージメント(クリック数)が 30%、エクスポート速度が 10% 増加しています。これは、Gemini 1.5 Flash の精度や妥当性が向上したことを示しています。

「Gemini 1.5 Flash によって開発を効率化できました。プロンプトベースの機能を市場に投入するまでの時間を短縮でき、非常に正確な結果を提供できました」と Zhu 氏は述べています。Gemini API SDK のドキュメントが充実しており、サポートの信頼性も高いため、開発エクスペリエンスはさらに向上しました。

OpusClip は、プロンプト関連の機能をさらに洗練させて拡張する予定で、ユーザー向けの高度なカスタマイズ オプションを模索しています。また、Gemini 1.5 Flash の機能を活用し、動画コンテンツを個々のユーザーの関心に動的に適応させることで、よりパーソナライズされたおすすめを実装したいと考えています。


Gemini API スタートガイド: OpusClip の取り組みからの知見

視覚コンテンツ分析やモーメント検索などのプロジェクトの開発に携わるデベロッパーに対して、Zhu 氏は Gemini API で開発すること、そしてユースケースに適したモデルを見つけることを推奨しています。「私たちにとって、Gemini 1.5 Flash の精度と速度は、他のソリューションを大きく凌駕するものでした。適切な設定を行えば、費用対効果が高くなります」。また、Gemini 1.5 Flash はプロンプトの調整に敏感に反応するので、早い段階でモニタリングを行い、データセットに基づいてプロンプトを微調整することを勧めています。


Gemini API を使って開発を始めたい方は、デベロッパー ドキュメントをご覧ください。