我们很高兴地宣布,开发者现在可以将我们最先进的视频生成模型 Veo 2 集成到自己的应用中。您可以在 Google AI Studio 中试用其功能,然后凭借 Gemini API 中的付费会员等级开始构建。
Veo 2 代表着将文本、图像或两者的组合转换为视频的前沿领域。它擅长从文本或图像提示中解读简单和复杂的指令,生成八秒钟的视频片段,精确地模拟现实世界的物理特性,并呈现多样化的视觉和电影风格。
Veo 2 使开发者能够直接在其应用中基于文本和图像提示生成八秒钟的视频:
入门的最简单方法就是直接在 Google AI Studio 中尝试和探索 Veo 2 功能。您可以测试提示,调整宽高比和时长等参数,然后立即查看生成的视频结果。
使用 Google AI Studio 熟悉 Veo 2 的潜力。一旦您准备好将 Veo 2 的功能直接集成到自己的应用程序和工作流程中,您就可以利用 Gemini API。
import time
from google import genai
from google.genai import types
client = genai.Client()
operation = client.models.generate_videos(
model="veo-2.0-generate-001",
prompt="Panning wide shot of a calico kitten sleeping in the sunshine",
config=types.GenerateVideosConfig(
person_generation="allow_adult",
aspect_ratio="16:9",
),
)
while not operation.done:
time.sleep(20)
operation = client.operations.get(operation)
for n, generated_video in enumerate(operation.response.generated_videos):
client.files.download(file=generated_video.video)
generated_video.video.save(f"video{n}.mp4") # save the video
能否使用 Veo 2 生成令人惊叹的视频,取决于您清晰有效地传达愿景的能力。将您的提示视为一组说明:提示越详细、越精确,最终产品就越接近您的想象。提示的关键要素包括清晰度、细节和视觉关键字,下面我们用示例进行详细解释。
清晰度:避免使用含糊不清的术语和宽泛的描述。
细节:您提供的信息越多,生成的视频就越生动、越细致。
考虑纳入以下元素:
让我们来看几个例子。
假设您想要打造一个展示新香水瓶的视频。您可以通过以下方式构建详细的提示:
这样的描述通过细化主体 [多面水晶瓶、玫瑰金色调、大理石表面]、动作 [水滴侧面滚动]、照明 [柔和、漫射光]、相机角度 [特写镜头] 和风格 [优雅、奢华] 来发挥作用
示例 2:通过使用“图像到视频”功能呈现更精确的效果。
使用“图像到视频”功能展示符合您风格和美感的现有产品。上传现有图像或使用 Imagen 创建图像:
提示:
制作奢华的宣传视频,展示香水瓶。从向左平移的特写镜头开始,重点放在装满琥珀色液体的透明玻璃香水瓶的多面瓶盖上。水滴不易察觉地附着在玻璃上。瓶子放置在干净的白色大理石卫生间台面上。柔和的自然光线从背景中的窗户洒入,照亮了场景。桉树叶和天然木质扩香棒巧妙地布置在香水瓶周围。整体氛围优雅、清新、精致。
视频输出:
掌握这些原则之后,您便可以出色地制作提示,释放 Veo 2 的全部潜力,并将您的创意愿景转化为现实。请记得根据您得到的结果迭代和细化您的提示,不断实验是关键所在!
为了展示 Veo 2 的变革性潜力,让我们看看开发者正在如何利用它来构建下一代创意工具。
AlphaWave 帮助时尚和零售品牌利用人工智能扩展其内容制作。他们的核心工具 AlphaFrame 可以自动创建效果出色的营销视频,克服种种挑战,快速、经济地为产品投放和促销制作引人入胜、以转化为中心的内容。
通过集成 Veo 2,AlphaWave现在可以基于简单的文本提示或现有的静态资产(如产品图像),在几分钟内生成与品牌形象一致的精美视频。这使他们的客户能够快速测试广告变体,将静态的产品目录转化为动态内容,并使资源有限的品牌能够实现高质量的视频制作,最终使他们更灵活、更具竞争力。
在下面的示例中,AlphaWave 拍摄了静态的 Pixel 产品图像并将其转换为动态营销视频。
Trakto 通过其创意自动化平台帮助团队扩大高质量营销资产创建的规模。为了加速视频制作,他们基于人工智能的 Trakto Director 功能会将简单的提示转换为完整、可编辑的广告。
在 Gemini Flash 撰写场景脚本、Imagen 创建串连图板视觉效果后,Veo 2 便会生成最终视频。对 Trakto 来说,Veo 2 至关重要,它提供了该公司所需的时间一致性、创意理解、格式灵活性和精致的输出,从而快速将创意转化为高质量、适应性强的视频内容,大大简化了从概念到成熟宣传资产的开发路径。