アイデアを現実に: Veo 2 動画生成をデベロッパー向けに提供開始

2025年4月15日
Olivier Lacombe Group Product Manager
Alisa Fortin Product Manager
Guillaume Vernade Gemini Developer Advocate AI Studio

Gemini API の Veo 2 が Google AI Studio に登場


私たちの最先端の動画生成モデルである Veo 2 が、デベロッパー向けに一般提供され、アプリケーションに組み込めるようになりました。Google AI Studio で機能を試し、Gemini API有料プランで開発を始めましょう。

Screenshot of Veo 2 in Google AI Studio

Veo 2 は、テキスト、画像、またはその両方を動画に変換するという新しいフロンティアを象徴しています。テキストや画像のプロンプトで与えられたシンプルな命令や複雑な命令を解釈することに優れており、現実世界の物理現象を正確にシミュレートし、多様な視覚的スタイルや映画のようなスタイルを取り入れて 8 秒間の動画クリップを生成します。


主な機能

Veo 2 を使うと、デベロッパーがアプリケーション内で、テキスト プロンプトと画像プロンプトの両方から、8 秒間の動画を直接生成できます。

  • テキスト動画変換(t2v): 詳しいテキストの説明をダイナミックな動画シーンに変換します。さまざまなスタイルを試し、高度なカメラ コントロールで独自のスタイルを生み出しましょう。

  • 画像動画変換(i2v): ライブラリの画像を使うか、Imagen などのモデルで独自の画像を生成し、Veo 2 で動きをつけます。スタイルやモーションを指定したい場合は、オプションでテキスト プロンプトを利用できます。


Veo 2 を使ってみる

Veo 2 の機能を試す最も簡単な方法は、Google AI Studio で直接使ってみることです。プロンプトを試したり、アスペクト比や時間などのパラメータを調整したりでき、生成された動画をすぐに見ることができます。

Google AI Studio を使って、Veo 2 の可能性を存分に体験しましょう。Veo 2 の機能を独自のアプリケーションやワークフローに直接組み込む準備ができた方は、Gemini API を使ってみてください。

import time
from google import genai
from google.genai import types
 
client = genai.Client()
 
operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt="Panning wide shot of a calico kitten sleeping in the sunshine",
    config=types.GenerateVideosConfig(
        person_generation="allow_adult",
        aspect_ratio="16:9",    
    ),
)
 
while not operation.done:
    time.sleep(20)
    operation = client.operations.get(operation)
 
for n, generated_video in enumerate(operation.response.generated_videos):
    client.files.download(file=generated_video.video)
    generated_video.video.save(f"video{n}.mp4")  # 動画を保存

効果的なプロンプトを作成する

Veo 2 ですばらしい動画を生成できるかどうかは、ビジョンを明確かつ効果的に伝えられるかどうかにかかっています。プロンプトは一連の指示であると考えましょう。細かく厳密なプロンプトほど、最終的な成果物は、皆さんが想像したものに近づきます。ここで重要になる要素が、明確さ、詳細さ、視覚キーワードです。例を挙げて詳しく説明しましょう。

明確さ: 曖昧な用語や一般的な説明は避けてください。

詳細さ: 提供する情報が多ければ多いほど、生成される動画の深みが増し、表現も細かくなります。

次のような要素を考慮するとよいでしょう。

  • 被写体: 動画で特に重視するものは何ですか?

  • アクション: シーンで何が起こっていますか?被写体は動いていますか?何かを扱っていますか?それとも静止していますか?

  • 設定: シーンの場所はどこですか?どのような環境ですか?

  • カメラのアングル / 動き: クローズアップやワイドショットですか?それともダイナミック トラッキング ショットですか?

  • ライティング: シーンはどのようにライティングされていますか?明るくて晴れていますか?それとも暗くて憂鬱な感じですか?

  • スタイル / ムード: 全体的な感覚や表現として、何を伝えたいですか?(例: エレガントさ、未来的、自然的)

いくつかの例を確認してみましょう。


例 1: Veo 2 プロンプト - 香水瓶

たとえば、新しい香水瓶を紹介する動画を作りたいとしましょう。次のようにすると、詳細なプロンプトを作成できます。

  • 基本的なプロンプト:香水瓶」(曖昧すぎて、予測不可能な結果になります)

  • 改良したプロンプト: 「大理石の上に置かれたガラスの香水瓶。」(改善はしたものの、まだ十分ではありません)

  • 効果的なプロンプト:磨かれた白い大理石の上に置かれた、モダンなファセット クリスタルでできたローズゴールド アクセントの香水瓶のクローズアップ ショット。上品な手が瓶の上部に優しく触れると、柔らかく広がった光が瓶の角を際立たせ、かすかに輝く。一滴の香水が側面をゆっくりと流れる。エレガントで贅沢な美しさ。

これは、被写体 [ファセット クリスタルでできた瓶、ローズゴールド アクセント、大理石の上]、アクション [一滴の香水が側面を流れる]、ライティング [柔らかく広がった光]、カメラアングル [クローズアップ ショット]、スタイル [エレガント、贅沢] を詳細に説明しており、それがうまく機能しています。


例 2: 画像動画変換機能による精度向上

画像動画変換機能を使って、スタイルや美しさを維持したまま、既存の製品を紹介します。既存の画像をアップロードするか、Imagen で画像を作成します。

Veo 2 - perfume bottle example image

プロンプト:

香水瓶を紹介する豪華なプロモーション動画を作ってください。琥珀色の液体で満たされた透明なガラスの香水瓶のファセット キャップにピントを合わせ、画面いっぱいのクローズアップから始めて、ドリーで左にスライドします。細かい水滴がガラスについています。瓶は清潔な白い大理石のバスルームの台上に置かれています。柔らかい自然光が背景の窓から流れ込み、シーンを照らしています。ユーカリの葉と天然木の香りのディフューザー スティックが瓶の周りに繊細に配置されています。全体的な雰囲気は、エレガントかつフレッシュで洗練されています。

動画出力:

この原則を習得すれば、Veo 2 の可能性を最大限に引き出し、創造的なビジョンを現実にするプロンプトを作成できます。得られた結果をもとにプロンプトの改善を繰り返すことを忘れないでください。実験が重要です!


Veo 2 の活用事例

デベロッパーの皆さんは、すでに Veo 2 を活用して次世代のクリエイティブ ツールを開発しています。その一部を紹介することで、Veo 2 の革新性をお伝えしましょう。


AlphaWave

AlphaWave は、AI を利用し、ファッション ブランドや小売ブランドのコンテンツ制作の規模拡大をサポートしています。その中核的なツールである AlphaFrame は、コンバージョンを重視した魅力的な製品販売やプロモーション用のコンテンツを短時間かつ費用対効果の高い方法で制作するという課題を解決するため、高パフォーマンスなマーケティング動画を自動で作成できるようにしています。

AlphaWave は、Veo 2 を活用し、シンプルなテキスト プロンプトや製品画像などの既存の静的アセットから、ブランドにぴったりの洗練された動画を数分で生成できるようにしています。クライアントは、さまざまな広告のバリエーションを短時間でテストしたり、静的カタログをダイナミック モーション コンテンツに変換したり、少ないリソースで高品質なブランド動画を制作したりできるようになり、最終的に俊敏性や競争力が向上します。

次の例は、AlphaWave が静的な Pixel の製品画像を受け取り、動的なマーケティング動画に変換したものです。

Trakto Studio

Trakto は、クリエイティブ オートメーション プラットフォームを使って、高品質なマーケティング アセットを大量に作成できるようにしています。AI を搭載した Trakto Director 機能により、シンプルなプロンプトから完全に編集可能なコマーシャルを生成できるので、動画制作がスピードアップします。

Trakto Director feature transforms simple prompts into complete, editable commercials.

Gemini Flash がシーンの原稿を書き、Imagen がストーリー ボードのビジュアルを作成した後、Veo 2 で最終的な動画を生成します。Trakto にとって重要なのは Veo 2 です。アイデアを高品質で適応性のある動画コンテンツにすばやく変換するために必要なとなる、時間的な整合性、創造的な理解力、柔軟な形式、洗練された出力を提供し、コンセプトからキャンペーン対応アセットを生成する過程を大幅に合理化するからです。

ぜひご利用ください!

Veo 2 を活用すれば、動画コンテンツの作成や統合に革命を起こすことができます。詳しい情報を確認し、開発を始めましょう。


皆さんが Veo 2 で作るものが楽しみです!