私たちの最先端の動画生成モデルである Veo 2 が、デベロッパー向けに一般提供され、アプリケーションに組み込めるようになりました。Google AI Studio で機能を試し、Gemini API の有料プランで開発を始めましょう。
Veo 2 は、テキスト、画像、またはその両方を動画に変換するという新しいフロンティアを象徴しています。テキストや画像のプロンプトで与えられたシンプルな命令や複雑な命令を解釈することに優れており、現実世界の物理現象を正確にシミュレートし、多様な視覚的スタイルや映画のようなスタイルを取り入れて 8 秒間の動画クリップを生成します。
Veo 2 を使うと、デベロッパーがアプリケーション内で、テキスト プロンプトと画像プロンプトの両方から、8 秒間の動画を直接生成できます。
Veo 2 の機能を試す最も簡単な方法は、Google AI Studio で直接使ってみることです。プロンプトを試したり、アスペクト比や時間などのパラメータを調整したりでき、生成された動画をすぐに見ることができます。
Google AI Studio を使って、Veo 2 の可能性を存分に体験しましょう。Veo 2 の機能を独自のアプリケーションやワークフローに直接組み込む準備ができた方は、Gemini API を使ってみてください。
import time
from google import genai
from google.genai import types
client = genai.Client()
operation = client.models.generate_videos(
model="veo-2.0-generate-001",
prompt="Panning wide shot of a calico kitten sleeping in the sunshine",
config=types.GenerateVideosConfig(
person_generation="allow_adult",
aspect_ratio="16:9",
),
)
while not operation.done:
time.sleep(20)
operation = client.operations.get(operation)
for n, generated_video in enumerate(operation.response.generated_videos):
client.files.download(file=generated_video.video)
generated_video.video.save(f"video{n}.mp4") # 動画を保存
Veo 2 ですばらしい動画を生成できるかどうかは、ビジョンを明確かつ効果的に伝えられるかどうかにかかっています。プロンプトは一連の指示であると考えましょう。細かく厳密なプロンプトほど、最終的な成果物は、皆さんが想像したものに近づきます。ここで重要になる要素が、明確さ、詳細さ、視覚キーワードです。例を挙げて詳しく説明しましょう。
明確さ: 曖昧な用語や一般的な説明は避けてください。
詳細さ: 提供する情報が多ければ多いほど、生成される動画の深みが増し、表現も細かくなります。
次のような要素を考慮するとよいでしょう。
いくつかの例を確認してみましょう。
たとえば、新しい香水瓶を紹介する動画を作りたいとしましょう。次のようにすると、詳細なプロンプトを作成できます。
これは、被写体 [ファセット クリスタルでできた瓶、ローズゴールド アクセント、大理石の上]、アクション [一滴の香水が側面を流れる]、ライティング [柔らかく広がった光]、カメラアングル [クローズアップ ショット]、スタイル [エレガント、贅沢] を詳細に説明しており、それがうまく機能しています。
例 2: 画像動画変換機能による精度向上
画像動画変換機能を使って、スタイルや美しさを維持したまま、既存の製品を紹介します。既存の画像をアップロードするか、Imagen で画像を作成します。
プロンプト:
香水瓶を紹介する豪華なプロモーション動画を作ってください。琥珀色の液体で満たされた透明なガラスの香水瓶のファセット キャップにピントを合わせ、画面いっぱいのクローズアップから始めて、ドリーで左にスライドします。細かい水滴がガラスについています。瓶は清潔な白い大理石のバスルームの台上に置かれています。柔らかい自然光が背景の窓から流れ込み、シーンを照らしています。ユーカリの葉と天然木の香りのディフューザー スティックが瓶の周りに繊細に配置されています。全体的な雰囲気は、エレガントかつフレッシュで洗練されています。
動画出力:
この原則を習得すれば、Veo 2 の可能性を最大限に引き出し、創造的なビジョンを現実にするプロンプトを作成できます。得られた結果をもとにプロンプトの改善を繰り返すことを忘れないでください。実験が重要です!
デベロッパーの皆さんは、すでに Veo 2 を活用して次世代のクリエイティブ ツールを開発しています。その一部を紹介することで、Veo 2 の革新性をお伝えしましょう。
AlphaWave は、AI を利用し、ファッション ブランドや小売ブランドのコンテンツ制作の規模拡大をサポートしています。その中核的なツールである AlphaFrame は、コンバージョンを重視した魅力的な製品販売やプロモーション用のコンテンツを短時間かつ費用対効果の高い方法で制作するという課題を解決するため、高パフォーマンスなマーケティング動画を自動で作成できるようにしています。
AlphaWave は、Veo 2 を活用し、シンプルなテキスト プロンプトや製品画像などの既存の静的アセットから、ブランドにぴったりの洗練された動画を数分で生成できるようにしています。クライアントは、さまざまな広告のバリエーションを短時間でテストしたり、静的カタログをダイナミック モーション コンテンツに変換したり、少ないリソースで高品質なブランド動画を制作したりできるようになり、最終的に俊敏性や競争力が向上します。
次の例は、AlphaWave が静的な Pixel の製品画像を受け取り、動的なマーケティング動画に変換したものです。
Trakto は、クリエイティブ オートメーション プラットフォームを使って、高品質なマーケティング アセットを大量に作成できるようにしています。AI を搭載した Trakto Director 機能により、シンプルなプロンプトから完全に編集可能なコマーシャルを生成できるので、動画制作がスピードアップします。
Gemini Flash がシーンの原稿を書き、Imagen がストーリー ボードのビジュアルを作成した後、Veo 2 で最終的な動画を生成します。Trakto にとって重要なのは Veo 2 です。アイデアを高品質で適応性のある動画コンテンツにすばやく変換するために必要なとなる、時間的な整合性、創造的な理解力、柔軟な形式、洗練された出力を提供し、コンセプトからキャンペーン対応アセットを生成する過程を大幅に合理化するからです。
Veo 2 を活用すれば、動画コンテンツの作成や統合に革命を起こすことができます。詳しい情報を確認し、開発を始めましょう。
皆さんが Veo 2 で作るものが楽しみです!