使用 Veo 3 构建内容,此模型现已在 Gemini API 中开放使用

2025年7月17日
Alisa Fortin Product Manager
Luciano Martins Tech Lead Manager & AI Engineer
Seth Odoom Product Manager

自即日起,开发者便可通过 Gemini API Vertex AI 付费预览 Veo 3。


2025 年 Google I/O 大会首次亮相以来,全球用户已使用 Veo 3 生成了数以千万计的优质视频,并催生了多个趣味视频新趋势。这是我们推出的首个融合高清真视频输出和原生音频的视频模型,目前支持文本到视频功能,图像到视频功能也即将问世。

Link to Youtube Video (visible only when JS is disabled)

开发者已在试用 Veo 3,阅读下文了解该模型如何帮助他们构思内容、快速迭代并提高效率。

  • Cartwheel 开发了一个系统,此系统可拍摄真人 2D 视频,然后根据精心设计的角色特征将其转化为全面生产就绪型 3D 动画。Cartwheel 运用 Veo 3 生成逼真流畅的真人动作,再将其转化为客户所需的 3D 动画。

  • Volley 运用 Veo 3 制作游戏内视频过场动画,推动游戏进展。借助 Veo 3,Volley 的设计师可实现快速迭代,并为即将推出的角色扮演游戏 Wit's End 打造最佳输出效果。


Veo 3 功能

Veo 3 旨在处理从电影叙事到动态角色动画的一系列视频生成任务。它不仅可以生成震撼的视觉效果,还可同步对话和音效等音频,为您带来更加身临其境的体验。

  • 同步声音:自然而然地生成对话、音效和音乐等丰富音频,并与视频完美同步,整个过程一气呵成。

  • 影院级画质:生成令人惊叹的高清视频,捕捉提示中细微的创意差别,从复杂纹理到微妙光影实现精准还原。

  • 逼真的物理效果:模拟实际物理特性,呈现逼真的动作效果,包括自然角色运动、精准水流动态和阴影投射等。

让我们来看几个示例。

Link to Youtube Video (visible only when JS is disabled)

脚注中的提示 1

Link to Youtube Video (visible only when JS is disabled)

脚注中的提示 2

您可以在 Google AI Studio 中,以 SDK 模板和交互入门应用形式,探索这些示例及更多 Veo 3 功能,以进行改编、复制和扩展内容。该入门应用及其示例代码为付费用户提供了一种便捷的方式,方便他们直接通过 Google AI Studio 中的 Gemini API,基于 Veo 3 等工具快速构建原型。

在 AI Studio“构建”界面的右上角点击“密钥”按钮,即可选择已启用收费功能的 Google Cloud 项目,进而在 AI Studio 应用中使用付费功能。详情请参见常见问题解答


在 Gemini API 中开始使用 Veo 3

Veo 3 的视频和音频输出价格为 0.75 美元/秒。此外,即将推出的 Veo 3 Fast 将提供更具成本效益的快速生成方案。

以下是用于生成视频的基本 Python 示例:

import time
from google import genai
from google.genai import types
 
client = genai.Client()
 
operation = client.models.generate_videos(
    model="veo-3.0-generate-preview",
    prompt="a close-up shot of a golden retriever playing in a field of sunflowers",
    config=types.GenerateVideosConfig(
        negative_prompt="barking, woofing",
    ),
)
 
# Waiting for the video(s) to be generated
while not operation.done:
    time.sleep(20)
    operation = client.operations.get(operation)
 
generated_video = operation.result.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("veo3_video.mp4")
Python

在 Gemini API 中使用 Veo 3 以负责任的方式构建内容

由 Veo 3 模型生成的所有视频均含 SynthID 数字水印。如要开始使用,请查看相关文档、实战宝典以及 Google AI Studio 中的 Veo 3 入门应用:

除通过 Google AI Studio 中的 Gemini API 开放使用外,Google AI 订阅者还可通过 Gemini 应用Flow 使用 Veo 3,企业客户则可通过 Vertex AI 进行使用。



提示

1: 毛绒角色定格动画:镜头聚焦在一个用毛毡和纱线编织的厨房中,厨房色彩鲜艳且温馨舒适。Nibbles 教授是一只胖乎乎、毛茸茸的仓鼠,戴着一副超大眼镜,它正在迷你灶台上紧张地搅拌着冒泡的炖锅,嘴里嘀咕着:“再加一点……食谱上要求的‘鲜味精华’”。中景镜头捕捉到他手忙脚乱的搅拌动作。突然,锅中发出一声“砰!”的巨响,随即传来一阵滑稽的“嘶嘶”声,一股五彩斑斓的绿色黏液如喷泉般爆发,瞬间覆盖了整个厨房。Nibbles 授尖叫道:“天哪!又来!”,于是它惊慌逃窜,留下了一串细小而惊恐的吱吱声。

2: 影片开场采用特写镜头,一个齿轮缓缓转动,表面折射出刺眼的光芒。镜头连续逐渐后拉,展示的仅仅是整个庞大机械心脏的一部分,半掩在锈色斑驳的荒漠之中。一个全景航拍镜头展现了这个机械巨物在贫瘠地貌中孤绝存在的场景。镜头缓慢下移,捕捉到蒸汽管道嘶鸣作响,有节奏的重击声在空旷的原野上回荡。画面随着每次强烈的心跳产生微颤。通过横移镜头发现,一个身着长袍的微小身影正在金属表面快步移动。镜头紧跟这样一个人物进行细致的跟踪拍摄,只见他们正在一丝不苟地开展维护工作,擦拭黄铜阀门以及旋紧巨型螺栓。一组复杂的运镜围绕整个建筑展开,展示不同的维护团队正在锈蚀外壳的不同险峻位置开展作业。最后一组镜头聚焦一个微小身影的精细操作,随后突然急速拉远,展现出机械心脏的全貌以及维护者的渺小,形成震撼对比。这些维护者正在照料一个延伸至画框之外、沉睡中的巨大生命体的心脏。