搜索

5 结果

清除过滤器
  • 2025年7月31日 / AI

    Veo 3 快速且全新的图像转视频功能

    Google 推出了 Veo 3 Fast,这是一款在速度和价格上都经过优化的模型。同时,Veo 3 和 Veo 3 Fast 都新增了图像转视频功能,使开发者能够高效地通过文本或静态图像创建高质量的视频内容。价格根据所选模型及是否包含音频而有所不同,目前该功能已上线 Gemini API。

    Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API
  • 2025年7月17日 / Gemini

    使用 Veo 3 构建内容,此模型现已在 Gemini API 中开放使用

    Veo 3 是 Google 推出的最新 AI 视频生成模型,现可通过 Gemini API 和 Google AI Studio 提供付费预览版。在 2025 年 Google I/O 大会上,我们公布了 Veo 3,它能生成视频和同步音频,并加入对话、背景声音,甚至动物叫声。此模型能够呈现逼真的视觉画面、自然的光线效果和物理特性,还能精准同步口型并实现屏幕动作与音效完美匹配。

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 2025年7月10日 / Gemini

    宣布推出 GenAI Processors:构建强大而灵活的 Gemini 应用

    GenAI Processors 是 Google DeepMind 推出的一个全新开源 Python 库,旨在为从输入处理到模型调用和输出处理之间的所有步骤提供一致的“Processor”接口,以实现无缝链接和并发执行,从而简化 AI 应用的开发,特别是那些用于处理多模态输入且需要实时响应的应用。

    Announcing GenAI Processors: Streamline your Gemini application development
  • 2025年6月24日 / Gemini

    Imagen 4 现已上线 Gemini API 和 Google AI Studio

    您现可通过 Gemini API 和 Google AI Studio 付费预览 Imagen 4,这是 Google 的先进文本转图像模型,可显著提高生成质量,尤其是在图像中的生成文本时。Imagen 4 系列模型包括用于一般任务的 Imagen 4 和具备极高提示遵循性的 Imagen 4 Ultra。该系列模型生成的所有图像均具有不可见的 SynthID 水印。

    Imagen 4 is now available on Gemini API and Google AI Studio
  • 2025年6月24日 / Gemini

    适用于机器人和具身智能的 Gemini 2.5

    Gemini 2.5 Pro 和 Flash 正在通过增强编码、推理以及包括空间理解在内的多模态能力,推动机器人技术的变革。这些模型将用于理解语义场景、生成机器人控制代码,以及使用 Live API 构建交互式应用。同时,这些模型也高度重视安全性提升与社区应用。

    Gemini 2.5 for robotics and embodied intelligence