本日、Gemini API の有料プレビュー版で Veo 3.1 と Veo 3.1 Fast をリリースします。このアップデート版モデルでは多数の機能が改善されており、画像から動画を生成した出力の品質も向上されています。これらの新しいモデルは、Gemini API を通じて Google AI Studio と Vertex AI で利用できます。また Veo 3.1 は、Gemini アプリと Flow でもご利用いただけます。
大幅なアップグレードを経た Veo 3.1 と Veo 3.1 Fast を使うと、より魅力的なコンテンツを作成できます。自然な会話から同期サウンド効果まで、豊かなネイティブ音声を生成できるほか、映画スタイルの理解が深まったため、優れたナラティブ制御を行えるモデルです。画像動画変換機能の強化により、プロンプトに忠実に従いつつ、音声とビジュアルの品質向上や、複数のシーンにわたるキャラクターの整合性維持を達成できます。
Link to Youtube Video (visible only when JS is disabled)
モデルのアップデートだけでなく、参照画像を使用した動画生成のガイド、既存の Veo 動画の延長、最初のフレームと最後のフレーム間の遷移生成などの新機能も採用しています。
キャラクター、オブジェクト、シーンの参照画像を最大 3 枚指定することで、生成プロセスをガイドできるようになりました。これは、複数のショット間のキャラクターの整合性を維持したり、動画に特定のスタイルを適用したりするのに役立ちます。
Link to Youtube Video (visible only when JS is disabled)
from google import genai
from google.genai import types
client = genai.Client()
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
config=types.GenerateVideosConfig(
reference_images=[reference_image1, reference_image2],
),
)
詳細については、ドキュメントをご覧ください。
元の生成動画に制限されることなくストーリーを展開できるようになりました。シーン延長機能では、前に作成した動画につながる新しいクリップを生成することで、1 分以上に及ぶ長い動画を作成できます。新しい動画はそれぞれ、前のクリップの最後の 1 秒に基づいて生成されます。そのため視覚的な連続性が維持され、バックグラウンド音声付きの延長ショットの作成に最適な機能になります。
Link to Youtube Video (visible only when JS is disabled)
from google import genai
client = genai.Client()
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
video=video_to_extend
)
詳細については、ドキュメントをご覧ください。
2 つの異なる画像の橋渡しをする、滑らかで自然なシーンを作成できます。開始画像と終了画像を選択して、Veo 3.1 にその間の遷移を音声付きで生成するように指示できます。
Link to Youtube Video (visible only when JS is disabled)
from google import genai
from google.genai import types
client = genai.Client()
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
image=first_frame,
config=types.GenerateVideosConfig(
last_frame=last_frame,
),
)
詳細については、ドキュメントをご覧ください。
Veo 3.1 での開発例
生成 AI の映画スタジオ、Promise Studios は、同社の MUSE プラットフォーム内で Veo 3.1 を使用して、生成的ストーリーボード作成とプリビジュアライゼーションの機能を強化し、本番品質でディレクター主導のストーリーテリングを実現しています。
Latitude は、ユーザーが作成したストーリーに瞬時に命を吹き込むために、同社の生成ナラティブ エンジンで Veo 3.1 を実験しています。
Veo 3.1 とこれらの新機能は、Gemini API を通じて有料プレビュー版で利用できますので、以下をお試しください。
Veo 3.1 は Veo 3 と同じ価格です。こうした機能を使って皆さんが何を開発するか、とても楽しみにしています。