21 结果
2025年8月26日 / Gemini
Gemini 2.5 Flash Image 是一款全新的图像生成与编辑先进模型,能够融合多张图像、保持角色一致性,并利用 Gemini 的世界知识,通过自然语言实现目标化转换。该模型现已通过 Gemini API、Google AI Studio 和 Vertex AI 提供使用。
2025年8月15日 / Google AI Studio
Google 宣布在 Gemini API 和 Google AI Studio 中推出正式版 Imagen 4,这一高级文本转图像模型显著改进了文本渲染性能。全新 Imagen 4 Fast 模型专为快速生成图像而设计,与 Imagen 4 和 Imagen 4 Ultra 同属一个系列,Imagen 4 和 Imagen 4 Ultra 还支持高达 2K 分辨率的图像生成。
2025年7月17日 / Gemini
Veo 3 是 Google 推出的最新 AI 视频生成模型,现可通过 Gemini API 和 Google AI Studio 提供付费预览版。在 2025 年 Google I/O 大会上,我们公布了 Veo 3,它能生成视频和同步音频,并加入对话、背景声音,甚至动物叫声。此模型能够呈现逼真的视觉画面、自然的光线效果和物理特性,还能精准同步口型并实现屏幕动作与音效完美匹配。
2025年7月14日 / Gemini
Gemini Embedding 文本模型现已在 Gemini API 和 Vertex AI 中正式发布。自 3 月份推出实验性版本以来,这款功能强大的模型一直稳居 MTEB 多语言排行榜榜首,支持超过 100 种语言,最大输入令牌长度为 2048,每 100 万个输入令牌的价格为 0.15 美元。
2025年6月24日 / Gemini
Gemini 2.5 Pro 和 Flash 正在通过增强编码、推理以及包括空间理解在内的多模态能力,推动机器人技术的变革。这些模型将用于理解语义场景、生成机器人控制代码,以及使用 Live API 构建交互式应用。同时,这些模型也高度重视安全性提升与社区应用。
2025年6月24日 / Gemini
您现可通过 Gemini API 和 Google AI Studio 付费预览 Imagen 4,这是 Google 的先进文本转图像模型,可显著提高生成质量,尤其是在图像中的生成文本时。Imagen 4 系列模型包括用于一般任务的 Imagen 4 和具备极高提示遵循性的 Imagen 4 Ultra。该系列模型生成的所有图像均具有不可见的 SynthID 水印。
2025年5月23日 / Gemini
推出 Gemini API 的新功能和模型,包括推理能力和效率获得提升的 Gemini 2.5 Flash Preview、支持多种语言和多个说话者的 Gemini 2.5 Pro 和 Flash 文本转语音,以及用于对话式 AI 的 Gemini 2.5 Flash 原生音频对话。
2025年5月21日 / Google AI Studio
Google AI Studio 已升级,旨在提升开发者体验,新增支持 Gemini 2.5 Pro 的原生代码生成能力、智能体工具和增强的多模态生成功能,并推出“构建”选项卡、Live API 等新功能,以及经过优化的工具,可助力构建更复杂的 AI 应用。
2025年5月9日 / Cloud
重温今年游戏开发者大会 (GDC) 的公告,探索 Gemma 和 Gemini 模型如何通过推出的 Gemma 3、Unity 插件及其在示例游戏中的应用程序,来帮助在游戏中构建 AI 体验以及在 Google Cloud 中使用生成式 AI 扩展游戏。
2025年5月9日 / DeepMind
Gemini 2.5 实现视频理解的重大飞跃,不仅在多项关键基准测试中表现出众,还能无缝结合使用视听信息、代码以及其他数据格式。