21 结果
2025年8月26日 / Gemini
Gemini 2.5 Flash Image is a new state-of-the-art image generation and editing model that allows for blending multiple images, maintaining character consistency, and targeted transformations using natural language, leveraging Gemini's world knowledge, now available through the Gemini API, Google AI Studio, and Vertex AI.
2025年8月15日 / Google AI Studio
Google 宣布在 Gemini API 和 Google AI Studio 中推出正式版 Imagen 4,这一高级文本转图像模型显著改进了文本渲染性能。全新 Imagen 4 Fast 模型专为快速生成图像而设计,与 Imagen 4 和 Imagen 4 Ultra 同属一个系列,Imagen 4 和 Imagen 4 Ultra 还支持高达 2K 分辨率的图像生成。
2025年7月17日 / Gemini
Veo 3 是 Google 推出的最新 AI 视频生成模型,现可通过 Gemini API 和 Google AI Studio 提供付费预览版。在 2025 年 Google I/O 大会上,我们公布了 Veo 3,它能生成视频和同步音频,并加入对话、背景声音,甚至动物叫声。此模型能够呈现逼真的视觉画面、自然的光线效果和物理特性,还能精准同步口型并实现屏幕动作与音效完美匹配。
2025年7月14日 / Gemini
Gemini Embedding 文本模型现已在 Gemini API 和 Vertex AI 中正式发布。自 3 月份推出实验性版本以来,这款功能强大的模型一直稳居 MTEB 多语言排行榜榜首,支持超过 100 种语言,最大输入令牌长度为 2048,每 100 万个输入令牌的价格为 0.15 美元。
2025年6月24日 / Gemini
Gemini 2.5 Pro 和 Flash 正在通过增强编码、推理以及包括空间理解在内的多模态能力,推动机器人技术的变革。这些模型将用于理解语义场景、生成机器人控制代码,以及使用 Live API 构建交互式应用。同时,这些模型也高度重视安全性提升与社区应用。
2025年6月24日 / Gemini
您现可通过 Gemini API 和 Google AI Studio 付费预览 Imagen 4,这是 Google 的先进文本转图像模型,可显著提高生成质量,尤其是在图像中的生成文本时。Imagen 4 系列模型包括用于一般任务的 Imagen 4 和具备极高提示遵循性的 Imagen 4 Ultra。该系列模型生成的所有图像均具有不可见的 SynthID 水印。
2025年5月23日 / Gemini
推出 Gemini API 的新功能和模型,包括推理能力和效率获得提升的 Gemini 2.5 Flash Preview、支持多种语言和多个说话者的 Gemini 2.5 Pro 和 Flash 文本转语音,以及用于对话式 AI 的 Gemini 2.5 Flash 原生音频对话。
2025年5月21日 / Google AI Studio
Google AI Studio 已升级,旨在提升开发者体验,新增支持 Gemini 2.5 Pro 的原生代码生成能力、智能体工具和增强的多模态生成功能,并推出“构建”选项卡、Live API 等新功能,以及经过优化的工具,可助力构建更复杂的 AI 应用。
2025年5月9日 / Cloud
重温今年游戏开发者大会 (GDC) 的公告,探索 Gemma 和 Gemini 模型如何通过推出的 Gemma 3、Unity 插件及其在示例游戏中的应用程序,来帮助在游戏中构建 AI 体验以及在 Google Cloud 中使用生成式 AI 扩展游戏。
2025年5月9日 / DeepMind
Gemini 2.5 实现视频理解的重大飞跃,不仅在多项关键基准测试中表现出众,还能无缝结合使用视听信息、代码以及其他数据格式。