搜索

42 结果

清除过滤器
  • 2025年7月17日 / Gemini

    Build with Veo 3, now available in the Gemini API

    Veo 3, Google’s latest AI video generation model, is now available in paid preview via the Gemini API and Google AI Studio. Unveiled at Google I/O 2025, Veo 3 can generate both video and synchronized audio, including dialogue, background sounds, and even animal noises. This model delivers realistic visuals, natural lighting, and physics, with accurate lip syncing and sound that matches on-screen action.

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 2025年6月25日 / Gemini

    使用 Gemini 2.5 Flash-Lite 模拟神经操作系统

    模拟神经操作系统的研究原型能够实时生成界面,以适应用户与 Gemini 2.5 Flash-Lite 的互动,借助互动追踪实现情境感知,通过流式传输界面确保响应速度,并基于内存中的界面图实现状态保持。

    Behind the prototype: Simulating a neural operating system with Gemini
  • 2025年5月28日 / Gemini

    探索“魔镜 (Magic Mirror)”:采用 Gemini 模型的互动体验

    “魔镜”项目利用 Gemini API(包括实时API、函数调用及 Grounding with Google Search 功能),打造出互动式动态体验,通过常见物体展现 Gemini 模型的强大能力:生成视觉内容、讲述故事并提供即时信息。

    Exploring the Magic Mirror: an interactive experience powered by the Gemini models
  • 2025年5月23日 / Gemini

    I/O 大会宣布的 Gemini API 最新功能

    推出 Gemini API 的新功能和模型,包括推理能力和效率获得提升的 Gemini 2.5 Flash Preview、支持多种语言和多个说话者的 Gemini 2.5 Pro 和 Flash 文本转语音,以及用于对话式 AI 的 Gemini 2.5 Flash 原生音频对话。

    Gemini_API_metadata
  • 2025年5月20日 / Gemma

    发布 Gemma 3n 预览版:强大、高效、移动优先的人工智能

    Gemma 3n 是一款尖端的开源模型,专为设备端的快速多模态人工智能而设计,具有优化的性能、独特的二合一模型灵活性,以及增强的音频多模态理解能力,使开发人员能够构建实时交互式应用程序和复杂的以音频为中心的体验。

    Gemma 3n
  • 2025年5月20日 / AI Edge

    具有多模态、RAG 和函数调用功能的设备端小型语言模型

    Google AI Edge 迎来多项最新进展,包括全新 Gemma 3 模型、更广泛的模型支持,以及设备端 RAG 和函数调用等功能,旨在让设备端生成式 AI 的功能更上一层楼。

    Google AI Edge: Small Language Models with Multimodality, RAG, and Function Calling
  • 2025年5月9日 / Cloud

    面向游戏开发者的 Google AI

    重温今年游戏开发者大会 (GDC) 的公告,探索 Gemma 和 Gemini 模型如何通过推出的 Gemma 3、Unity 插件及其在示例游戏中的应用程序,来帮助在游戏中构建 AI 体验以及在 Google Cloud 中使用生成式 AI 扩展游戏。

    Google AI for Game Developers
  • 2025年5月8日 / Gemini

    Gemini 2.5 模型现在支持隐式缓存

    在 Gemini API 中推出隐式缓存扩展了现有的显式缓存 API,提供了一个“始终开启”的缓存系统。对于使用 Gemini 2.5 模型的开发者,该系统可自动节省成本,同时显式缓存 API 持续可用,以确保实现成本节省。

    Gemini 2.5 Models now support Implicit Caching
  • 2025年4月30日 / Gemma

    解析 Gemma:Gemma 3 的新功能

    Gemma 3 的全新功能包括视觉语言能力,以及为提升内存效率和处理更长上下文而进行的架构改进,相较于之前的 Gemma 模型有了显著提升。

    What's new in Gemma-3
  • 2025年4月29日 / Gemini

    如何打造我们的语言能力:Little Language Lessons 利用 Gemini 的多语言功能实现个性化的语言学习

    Little Language Lessons (小小语言课)是一个利用 Gemini 的 API 和云服务来生成内容、翻译并提供文本转语音功能的项目,其中包括词汇课程、俚语练习和用于语言学习的对象识别。

    How it's made: Little Language Lessons