오늘 Gemini API에서 Veo 3.1 및 Veo 3.1 Fast를 유료 미리보기로 출시합니다. 이 업데이트된 모델은 이미지에서 동영상을 생성할 때 향상된 출력을 포함해 몇 가지 개선 사항을 제공합니다. 이 새로운 모델들은 Google AI Studio 및 Vertex AI의 Gemini API를 통해 사용할 수 있습니다. Veo 3.1은 Gemini 앱과 Flow에서도 사용할 수 있습니다.
Veo 3.1 및 Veo 3.1 Fast는 개발자가 중요 업그레이드를 통해 더 매력적인 콘텐츠를 만들 수 있도록 지원합니다. 이들 모델은 이제 자연스러운 대화에서부터 동기화된 사운드 효과까지 더 풍부한 네이티브 오디오를 생성하고 영화 스타일에 대한 이해도가 향상되어 더 나은 내러티브 제어 기능을 제공합니다. 향상된 이미지-동영상 변환 기능은 프롬프트 준수 정확도를 높이는 동시에 더 우수한 오디오 및 비주얼 품질을 제공하고 여러 장면에서 캐릭터의 일관성을 유지합니다.
Link to Youtube Video (visible only when JS is disabled)
모델 업데이트와 더불어, 참조 이미지를 활용한 동영상 생성 가이드, 기존 Veo 동영상 확장, 첫 프레임과 마지막 프레임 간 전환 생성 등 새로운 모델 기능도 선보입니다.
이제 캐릭터, 객체 또는 장면의 참조 이미지를 최대 3개까지 제공함으로써 생성 과정을 안내할 수 있습니다. 이는 여러 장면에서 캐릭터의 일관성을 유지하거나 동영상에 특정 스타일을 적용하는 데 유용합니다.
Link to Youtube Video (visible only when JS is disabled)
from google import genai
from google.genai import types
client = genai.Client()
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
config=types.GenerateVideosConfig(
reference_images=[reference_image1, reference_image2],
),
)
자세한 내용은 설명서를 참조하세요.
이제 스토리는 더 이상 처음 생성된 영상에만 제한되지 않습니다. 장면 확장 기능을 통해 이전 동영상과 이어지는 새 클립을 생성하여 1분이 넘는 더 긴 동영상을 만들 수 있습니다. 각각의 새 동영상은 이전 클립의 마지막 1초를 기반으로 생성됩니다. 이렇게 하면 시각적 연속성이 유지되므로 이 기능은 배경 오디오와 함께 장면을 확장하는 데 이상적입니다.
Link to Youtube Video (visible only when JS is disabled)
from google import genai
client = genai.Client()
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
video=video_to_extend
)
자세한 내용은 설명서를 참조하세요.
두 개의 서로 다른 이미지를 연결하는 매끄럽고 자연스러운 장면을 만듭니다. 시작 이미지와 끝 이미지를 제공하면 Veo 3.1이 두 이미지 사이에 자연스럽게 전환되는 장면을 생성하며, 여기에 어울리는 오디오도 함께 제공합니다.
Link to Youtube Video (visible only when JS is disabled)
from google import genai
from google.genai import types
client = genai.Client()
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
image=first_frame,
config=types.GenerateVideosConfig(
last_frame=last_frame,
),
)
자세한 내용은 설명서를 참조하세요.
사람들이 Veo 3.1로 만들고 있는 것
생성형 AI 영화 스튜디오인 Promise Studios는 자사의 MUSE 플랫폼 내에서 Veo 3.1을 활용해, 감독 중심의 스토리텔링을 위한 생성형 스토리보드와 사전 시각화 기능을 프로덕션 수준의 품질로 향상시킵니다.
Latitude는 자체 생성형 내러티브 엔진에서 Veo 3.1를 활용해 사용자가 만든 이야기를 즉시 생생한 동영상으로 구현하는 실험을 진행 중입니다.
Veo 3.1과 이러한 새로운 기능은 이제 Gemini API를 통해 유료 미리보기로 제공됩니다.
Veo 3.1은 Veo 3와 같은 가격으로 제공됩니다. 이러한 새로운 기능으로 무엇을 만드실지 무척 기대됩니다!