- Google Developers Blog

2025年10月15日 / AI

隆重推出 Veo 3.1 和 Gemini API 中的全新创意功能

Google 即将发布 Veo 3.1 和 Veo 3.1 Fast，这些是经过更新的视频生成模型，可通过 Gemini API 使用，当前处于付费预览阶段。3.1 版本提供更丰富的原生音频、更好的叙事控制和更强的图像转视频功能。新功能包括使用参考图像指导生成、扩展现有的 Veo 视频以及在帧之间生成过渡。Promise Studios、Latitude 和 Whering 等公司已经在各种应用场景中使用 Veo 3.1。
2025年8月15日 / Google AI Studio

宣布在 Gemini API 中推出 Imagen 4 Fast 和正式版的 Imagen 4 系列

Google 宣布在 Gemini API 和 Google AI Studio 中推出正式版 Imagen 4，这一高级文本转图像模型显著改进了文本渲染性能。全新 Imagen 4 Fast 模型专为快速生成图像而设计，与 Imagen 4 和 Imagen 4 Ultra 同属一个系列，Imagen 4 和 Imagen 4 Ultra 还支持高达 2K 分辨率的图像生成。
2025年7月31日 / AI

Veo 3 快速且全新的图像转视频功能

Google 推出了 Veo 3 Fast，这是一款在速度和价格上都经过优化的模型。同时，Veo 3 和 Veo 3 Fast 都新增了图像转视频功能，使开发者能够高效地通过文本或静态图像创建高质量的视频内容。价格根据所选模型及是否包含音频而有所不同，目前该功能已上线 Gemini API。
2025年7月17日 / Gemini

使用 Veo 3 构建内容，此模型现已在 Gemini API 中开放使用

Veo 3 是 Google 推出的最新 AI 视频生成模型，现可通过 Gemini API 和 Google AI Studio 提供付费预览版。在 2025 年 Google I/O 大会上，我们公布了 Veo 3，它能生成视频和同步音频，并加入对话、背景声音，甚至动物叫声。此模型能够呈现逼真的视觉画面、自然的光线效果和物理特性，还能精准同步口型并实现屏幕动作与音效完美匹配。
2025年7月10日 / Gemini

宣布推出 GenAI Processors：构建强大而灵活的 Gemini 应用

GenAI Processors 是 Google DeepMind 推出的一个全新开源 Python 库，旨在为从输入处理到模型调用和输出处理之间的所有步骤提供一致的“Processor”接口，以实现无缝链接和并发执行，从而简化 AI 应用的开发，特别是那些用于处理多模态输入且需要实时响应的应用。
2025年6月24日 / Gemini

Imagen 4 现已上线 Gemini API 和 Google AI Studio

您现可通过 Gemini API 和 Google AI Studio 付费预览 Imagen 4，这是 Google 的先进文本转图像模型，可显著提高生成质量，尤其是在图像中的生成文本时。Imagen 4 系列模型包括用于一般任务的 Imagen 4 和具备极高提示遵循性的 Imagen 4 Ultra。该系列模型生成的所有图像均具有不可见的 SynthID 水印。
2025年6月24日 / Gemini

适用于机器人和具身智能的 Gemini 2.5

Gemini 2.5 Pro 和 Flash 正在通过增强编码、推理以及包括空间理解在内的多模态能力，推动机器人技术的变革。这些模型将用于理解语义场景、生成机器人控制代码，以及使用 Live API 构建交互式应用。同时，这些模型也高度重视安全性提升与社区应用。