42 结果
2025年9月5日 / Mobile
Google AI Edge 已将 Gemma 3n 的预览功能扩展至支持音频。用户现在可以在自己的手机上,通过 Google AI Edge Gallery 进行体验,该应用目前已在 Play 商店推出公开测试版。
2025年9月4日 / Gemma
Introducing EmbeddingGemma: a new embedding model designed for efficient on-device AI applications from Google. This open model is the highest-ranking text-only multilingual embedding model under 500M parameters on the MTEB benchmark, enabling powerful features like RAG and semantic search directly on mobile devices without an internet connection.
2025年8月15日 / Google AI Studio
Google 宣布在 Gemini API 和 Google AI Studio 中推出正式版 Imagen 4,这一高级文本转图像模型显著改进了文本渲染性能。全新 Imagen 4 Fast 模型专为快速生成图像而设计,与 Imagen 4 和 Imagen 4 Ultra 同属一个系列,Imagen 4 和 Imagen 4 Ultra 还支持高达 2K 分辨率的图像生成。
2025年7月31日 / AI
Google 推出了 Veo 3 Fast,这是一款在速度和价格上都经过优化的模型。同时,Veo 3 和 Veo 3 Fast 都新增了图像转视频功能,使开发者能够高效地通过文本或静态图像创建高质量的视频内容。价格根据所选模型及是否包含音频而有所不同,目前该功能已上线 Gemini API。
2025年7月24日 / Google Labs
Opal 是 Google Labs 新推出的实验工具,可帮助您使用自然语言将提示词变为动态的多步迷你应用,而无需编写代码。如此一来,用户便能够构建和部署具有强大功能的可分享 AI 应用,并与现有 Google 工具无缝集成。
2025年7月17日 / Gemini
Veo 3 是 Google 推出的最新 AI 视频生成模型,现可通过 Gemini API 和 Google AI Studio 提供付费预览版。在 2025 年 Google I/O 大会上,我们公布了 Veo 3,它能生成视频和同步音频,并加入对话、背景声音,甚至动物叫声。此模型能够呈现逼真的视觉画面、自然的光线效果和物理特性,还能精准同步口型并实现屏幕动作与音效完美匹配。
2025年7月14日 / Gemini
Gemini Embedding 文本模型现已在 Gemini API 和 Vertex AI 中正式发布。自 3 月份推出实验性版本以来,这款功能强大的模型一直稳居 MTEB 多语言排行榜榜首,支持超过 100 种语言,最大输入令牌长度为 2048,每 100 万个输入令牌的价格为 0.15 美元。
2025年7月10日 / Cloud
Firebase Studio 迎来多项更新,其中包括全新代理模式、对模型上下文协议 (MCP) 的基础支持,以及 Gemini CLI 集成。所有更新都旨在重新定义 AI 辅助开发,帮助开发者通过单一提示创建全栈应用,并将强大的 AI 功能直接集成至开发者的工作流中。
2025年7月9日 / Gemma
作为 Encoder-Decoder LLM 的新系列,T5Gemma 通过转换和调整基于 Gemma 2 框架的预训练 Decoder-only 模型开发而成,与其对应的 Decoder-only 模型相比,具有更出色的性能和效率,尤其适用于需要深度输入理解的任务,例如摘要和翻译。
2025年7月7日 / Gemini
Gemini API 新推出的批量模式专为高吞吐量、对延迟时间不敏感的 AI 负载而设计,通过执行调度和处理来简化大型作业,并使数据分析、批量内容创建和模型评估等任务更具成本效益和可扩展性,从而让开发者能高效地处理大量数据。