让创意转化为现实:开发者现可使用 Veo 2 视频生成功能

2025年4月15日
Olivier Lacombe Group Product Manager
Alisa Fortin Product Manager
Guillaume Vernade Gemini Developer Advocate AI Studio

Veo 2 支持 Gemini API,并且现已加入 Google AI Studio


我们很高兴地宣布,开发者现在可以将我们最先进的视频生成模型 Veo 2 集成到自己的应用中。您可以在 Google AI Studio 中试用其功能,然后凭借 Gemini API 中的付费会员等级开始构建。

Screenshot of Veo 2 in Google AI Studio

Veo 2 代表着将文本、图像或两者的组合转换为视频的前沿领域。它擅长从文本或图像提示中解读简单和复杂的指令,生成八秒钟的视频片段,精确地模拟现实世界的物理特性,并呈现多样化的视觉和电影风格。


核心能力

Veo 2 使开发者能够直接在其应用中基于文本和图像提示生成八秒钟的视频:

  • 文本到视频 (t2v):将详细的文本描述转换为动态视频场景。探索不同的风格,并通过丰富的镜头控件创建您自己的风格。

  • 图像到视频 (i2v):从自己库中的图像入手,或使用 Imagen 等模型生成自己的图像,然后使用 Veo 2 将其制作成动画。您可以使用可选的文本提示生成风格和动作。


Veo 2 入门指南

入门的最简单方法就是直接在 Google AI Studio 中尝试和探索 Veo 2 功能。您可以测试提示,调整宽高比和时长等参数,然后立即查看生成的视频结果。

使用 Google AI Studio 熟悉 Veo 2 的潜力。一旦您准备好将 Veo 2 的功能直接集成到自己的应用程序和工作流程中,您就可以利用 Gemini API。

import time
from google import genai
from google.genai import types
 
client = genai.Client()
 
operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt="Panning wide shot of a calico kitten sleeping in the sunshine",
    config=types.GenerateVideosConfig(
        person_generation="allow_adult",
        aspect_ratio="16:9",    
    ),
)
 
while not operation.done:
    time.sleep(20)
    operation = client.operations.get(operation)
 
for n, generated_video in enumerate(operation.response.generated_videos):
    client.files.download(file=generated_video.video)
    generated_video.video.save(f"video{n}.mp4")  # save the video

制作有效的提示

能否使用 Veo 2 生成令人惊叹的视频,取决于您清晰有效地传达愿景的能力。将您的提示视为一组说明:提示越详细、越精确,最终产品就越接近您的想象。提示的关键要素包括清晰度、细节和视觉关键字,下面我们用示例进行详细解释。

清晰度:避免使用含糊不清的术语和宽泛的描述。

细节:您提供的信息越多,生成的视频就越生动、越细致。

考虑纳入以下元素:

  • 主题:视频的主要焦点是什么?

  • 动作:场景中发生了什么?主体正在移动、与某物互动,还是静止不动?

  • 场景:视频所在的场景是哪里?环境是什么样的?

  • 镜头角度/运动:是特写镜头、宽镜头还是动态跟踪镜头?

  • 照明:场景照明如何?天气是晴朗明亮还是黑暗阴郁?

  • 风格/情绪:您想要传达的整体感觉或美学是什么?(例如,优雅、未来主义、自然主义)

让我们来看几个例子。


示例 1:Veo 2 提示 - 香水瓶

假设您想要打造一个展示新香水瓶的视频。您可以通过以下方式构建详细的提示:

  • 基本提示:香水瓶。”(太模糊,会产生不可预测的结果)

  • 改进提示:大理石表面上的玻璃香水瓶。”(更好,但仍然不充分)

  • 有效提示:“一款带有玫瑰金色调的现代多面水晶香水瓶的特写镜头,香水瓶放置于抛光的白色大理石上。柔和、漫射的光线凸显了瓶身的棱角,营造出微妙的微光。随着打理精致的手部轻轻触及香水瓶顶部,一滴香水慢慢地沿着侧面滚动。彰显优雅奢华的美学。

这样的描述通过细化主体 [多面水晶瓶、玫瑰金色调、大理石表面]、动作 [水滴侧面滚动]、照明 [柔和、漫射光]、相机角度 [特写镜头] 和风格 [优雅、奢华] 来发挥作用


示例 2:通过使用“图像到视频”功能呈现更精确的效果

使用“图像到视频”功能展示符合您风格和美感的现有产品。上传现有图像或使用 Imagen 创建图像:

Veo 2 - perfume bottle example image

提示:

制作奢华的宣传视频,展示香水瓶。从向左平移的特写镜头开始,重点放在装满琥珀色液体的透明玻璃香水瓶的多面瓶盖上。水滴不易察觉地附着在玻璃上。瓶子放置在干净的白色大理石卫生间台面上。柔和的自然光线从背景中的窗户洒入,照亮了场景。桉树叶和天然木质扩香棒巧妙地布置在香水瓶周围。整体氛围优雅、清新、精致。

视频输出:

掌握这些原则之后,您便可以出色地制作提示,释放 Veo 2 的全部潜力,并将您的创意愿景转化为现实。请记得根据您得到的结果迭代和细化您的提示,不断实验是关键所在!


查看 Veo 2 的实际应用

为了展示 Veo 2 的变革性潜力,让我们看看开发者正在如何利用它来构建下一代创意工具。


AlphaWave

AlphaWave 帮助时尚和零售品牌利用人工智能扩展其内容制作。他们的核心工具 AlphaFrame 可以自动创建效果出色的营销视频,克服种种挑战,快速、经济地为产品投放和促销制作引人入胜、以转化为中心的内容。

通过集成 Veo 2,AlphaWave现在可以基于简单的文本提示或现有的静态资产(如产品图像),在几分钟内生成与品牌形象一致的精美视频。这使他们的客户能够快速测试广告变体,将静态的产品目录转化为动态内容,并使资源有限的品牌能够实现高质量的视频制作,最终使他们更灵活、更具竞争力。

在下面的示例中,AlphaWave 拍摄了静态的 Pixel 产品图像并将其转换为动态营销视频。

Trakto Studio

Trakto 通过其创意自动化平台帮助团队扩大高质量营销资产创建的规模。为了加速视频制作,他们基于人工智能的 Trakto Director 功能会将简单的提示转换为完整、可编辑的广告。

Trakto Director feature transforms simple prompts into complete, editable commercials.

在 Gemini Flash 撰写场景脚本、Imagen 创建串连图板视觉效果后,Veo 2 便会生成最终视频。对 Trakto 来说,Veo 2 至关重要,它提供了该公司所需的时间一致性、创意理解、格式灵活性和精致的输出,从而快速将创意转化为高质量、适应性强的视频内容,大大简化了从概念到成熟宣传资产的开发路径。

立即开始构建免安装应用!

Veo 2 已准备好彻底改变您创建和集成视频内容的方式。深入了解并开始构建吧:

  • 探索 Gemini 实战宝典中的 Colab 笔记从代码示例入手,并寻找在 Gemini API 中使用 Veo 的一些实用示例和攻略

  • 阅读 API 文档查找详细的 API 参考文档和指南


我们万分期待您用 Veo 2 创造的作品!