5 结果
2025年7月31日 / AI
Google 推出了 Veo 3 Fast,这是一款在速度和价格上都经过优化的模型。同时,Veo 3 和 Veo 3 Fast 都新增了图像转视频功能,使开发者能够高效地通过文本或静态图像创建高质量的视频内容。价格根据所选模型及是否包含音频而有所不同,目前该功能已上线 Gemini API。
2025年7月17日 / Gemini
Veo 3 是 Google 推出的最新 AI 视频生成模型,现可通过 Gemini API 和 Google AI Studio 提供付费预览版。在 2025 年 Google I/O 大会上,我们公布了 Veo 3,它能生成视频和同步音频,并加入对话、背景声音,甚至动物叫声。此模型能够呈现逼真的视觉画面、自然的光线效果和物理特性,还能精准同步口型并实现屏幕动作与音效完美匹配。
2025年7月10日 / Gemini
GenAI Processors 是 Google DeepMind 推出的一个全新开源 Python 库,旨在为从输入处理到模型调用和输出处理之间的所有步骤提供一致的“Processor”接口,以实现无缝链接和并发执行,从而简化 AI 应用的开发,特别是那些用于处理多模态输入且需要实时响应的应用。
2025年6月24日 / Gemini
您现可通过 Gemini API 和 Google AI Studio 付费预览 Imagen 4,这是 Google 的先进文本转图像模型,可显著提高生成质量,尤其是在图像中的生成文本时。Imagen 4 系列模型包括用于一般任务的 Imagen 4 和具备极高提示遵循性的 Imagen 4 Ultra。该系列模型生成的所有图像均具有不可见的 SynthID 水印。
2025年6月24日 / Gemini
Gemini 2.5 Pro 和 Flash 正在通过增强编码、推理以及包括空间理解在内的多模态能力,推动机器人技术的变革。这些模型将用于理解语义场景、生成机器人控制代码,以及使用 Live API 构建交互式应用。同时,这些模型也高度重视安全性提升与社区应用。