42 结果
2025年7月17日 / Gemini
Veo 3, Google’s latest AI video generation model, is now available in paid preview via the Gemini API and Google AI Studio. Unveiled at Google I/O 2025, Veo 3 can generate both video and synchronized audio, including dialogue, background sounds, and even animal noises. This model delivers realistic visuals, natural lighting, and physics, with accurate lip syncing and sound that matches on-screen action.
2025年6月25日 / Gemini
模拟神经操作系统的研究原型能够实时生成界面,以适应用户与 Gemini 2.5 Flash-Lite 的互动,借助互动追踪实现情境感知,通过流式传输界面确保响应速度,并基于内存中的界面图实现状态保持。
2025年5月28日 / Gemini
“魔镜”项目利用 Gemini API(包括实时API、函数调用及 Grounding with Google Search 功能),打造出互动式动态体验,通过常见物体展现 Gemini 模型的强大能力:生成视觉内容、讲述故事并提供即时信息。
2025年5月23日 / Gemini
推出 Gemini API 的新功能和模型,包括推理能力和效率获得提升的 Gemini 2.5 Flash Preview、支持多种语言和多个说话者的 Gemini 2.5 Pro 和 Flash 文本转语音,以及用于对话式 AI 的 Gemini 2.5 Flash 原生音频对话。
2025年5月20日 / Gemma
Gemma 3n 是一款尖端的开源模型,专为设备端的快速多模态人工智能而设计,具有优化的性能、独特的二合一模型灵活性,以及增强的音频多模态理解能力,使开发人员能够构建实时交互式应用程序和复杂的以音频为中心的体验。
2025年5月20日 / AI Edge
Google AI Edge 迎来多项最新进展,包括全新 Gemma 3 模型、更广泛的模型支持,以及设备端 RAG 和函数调用等功能,旨在让设备端生成式 AI 的功能更上一层楼。
2025年5月9日 / Cloud
重温今年游戏开发者大会 (GDC) 的公告,探索 Gemma 和 Gemini 模型如何通过推出的 Gemma 3、Unity 插件及其在示例游戏中的应用程序,来帮助在游戏中构建 AI 体验以及在 Google Cloud 中使用生成式 AI 扩展游戏。
2025年5月8日 / Gemini
在 Gemini API 中推出隐式缓存扩展了现有的显式缓存 API,提供了一个“始终开启”的缓存系统。对于使用 Gemini 2.5 模型的开发者,该系统可自动节省成本,同时显式缓存 API 持续可用,以确保实现成本节省。
2025年4月30日 / Gemma
Gemma 3 的全新功能包括视觉语言能力,以及为提升内存效率和处理更长上下文而进行的架构改进,相较于之前的 Gemma 模型有了显著提升。
2025年4月29日 / Gemini
Little Language Lessons (小小语言课)是一个利用 Gemini 的 API 和云服务来生成内容、翻译并提供文本转语音功能的项目,其中包括词汇课程、俚语练习和用于语言学习的对象识别。