- Google Developers Blog

2025年8月26日 / Gemini

隆重推出我们最先进的图像模型 Gemini 2.5 Flash Image

Gemini 2.5 Flash Image 是一款全新的图像生成与编辑先进模型，能够融合多张图像、保持角色一致性，并利用 Gemini 的世界知识，通过自然语言实现目标化转换。该模型现已通过 Gemini API、Google AI Studio 和 Vertex AI 提供使用。

2025年8月15日 / Google AI Studio

宣布在 Gemini API 中推出 Imagen 4 Fast 和正式版的 Imagen 4 系列

Google 宣布在 Gemini API 和 Google AI Studio 中推出正式版 Imagen 4，这一高级文本转图像模型显著改进了文本渲染性能。全新 Imagen 4 Fast 模型专为快速生成图像而设计，与 Imagen 4 和 Imagen 4 Ultra 同属一个系列，Imagen 4 和 Imagen 4 Ultra 还支持高达 2K 分辨率的图像生成。

Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API

2025年7月17日 / Gemini

使用 Veo 3 构建内容，此模型现已在 Gemini API 中开放使用

Veo 3 是 Google 推出的最新 AI 视频生成模型，现可通过 Gemini API 和 Google AI Studio 提供付费预览版。在 2025 年 Google I/O 大会上，我们公布了 Veo 3，它能生成视频和同步音频，并加入对话、背景声音，甚至动物叫声。此模型能够呈现逼真的视觉画面、自然的光线效果和物理特性，还能精准同步口型并实现屏幕动作与音效完美匹配。

Build with Veo 3, now available in the Gemini API and Google AI Studio

2025年7月14日 / Gemini

Gemini Embedding 现已在 Gemini API 中正式推出

Gemini Embedding 文本模型现已在 Gemini API 和 Vertex AI 中正式发布。自 3 月份推出实验性版本以来，这款功能强大的模型一直稳居 MTEB 多语言排行榜榜首，支持超过 100 种语言，最大输入令牌长度为 2048，每 100 万个输入令牌的价格为 0.15 美元。

Gemini Embedding now generally available in the Gemini API

2025年6月24日 / Gemini

适用于机器人和具身智能的 Gemini 2.5

Gemini 2.5 Pro 和 Flash 正在通过增强编码、推理以及包括空间理解在内的多模态能力，推动机器人技术的变革。这些模型将用于理解语义场景、生成机器人控制代码，以及使用 Live API 构建交互式应用。同时，这些模型也高度重视安全性提升与社区应用。

Gemini 2.5 for robotics and embodied intelligence

2025年6月24日 / Gemini

Imagen 4 现已上线 Gemini API 和 Google AI Studio

您现可通过 Gemini API 和 Google AI Studio 付费预览 Imagen 4，这是 Google 的先进文本转图像模型，可显著提高生成质量，尤其是在图像中的生成文本时。Imagen 4 系列模型包括用于一般任务的 Imagen 4 和具备极高提示遵循性的 Imagen 4 Ultra。该系列模型生成的所有图像均具有不可见的 SynthID 水印。