255 结果
2025年7月17日 / Gemini
Veo 3 是 Google 推出的最新 AI 视频生成模型,现可通过 Gemini API 和 Google AI Studio 提供付费预览版。在 2025 年 Google I/O 大会上,我们公布了 Veo 3,它能生成视频和同步音频,并加入对话、背景声音,甚至动物叫声。此模型能够呈现逼真的视觉画面、自然的光线效果和物理特性,还能精准同步口型并实现屏幕动作与音效完美匹配。
2025年7月16日 / AI
Vertex AI 现已为 Gemini API 正式推出 logprobs 功能。该功能通过展示模型所选 token 及其替代 token 的概率分数,深入揭示了模型的决策过程。本分步指南将详细介绍如何启用和解读此功能,并将其应用于强大的用例,例如:置信度分类、动态自动补全以及 RAG 的定量评估。
2025年7月16日 / Cloud
Marin 项目旨在通过使整个开发过程公开且可复现,将 AI 中“开放”的定义扩展至涵盖整个科研过程,而不仅仅局限于模型本身。这项工作由 JAX 框架及其 Levanter 工具提供支持,使得基础模型得以被深入检验、信任,并进一步构建,从而推动 AI 研究迈向更加透明的未来。
2025年7月16日 / Gemini
更新后的智能体开发套件 (ADK) 通过提供深度理解 ADK 框架且经济高效的 CLI 工具,显著简化和加速 AI 智能体构建流程。开发者可借助对话式指令快速完成功能型智能体的构思、生成、测试与优化,彻底消除阻碍因素,持续保持高效“心流”状态。
2025年7月14日 / Cloud
Apigee API Hub 和开发者门户是 Apigee 平台中不同但相互关联的部分,可帮助组织发现和管理适用于不同角色的 API,释放 API 潜力并加速创新。
2025年7月14日 / Gemini
Gemini Embedding 文本模型现已在 Gemini API 和 Vertex AI 中正式发布。自 3 月份推出实验性版本以来,这款功能强大的模型一直稳居 MTEB 多语言排行榜榜首,支持超过 100 种语言,最大输入令牌长度为 2048,每 100 万个输入令牌的价格为 0.15 美元。
2025年7月10日 / Gemini
GenAI Processors 是 Google DeepMind 推出的一个全新开源 Python 库,旨在为从输入处理到模型调用和输出处理之间的所有步骤提供一致的“Processor”接口,以实现无缝链接和并发执行,从而简化 AI 应用的开发,特别是那些用于处理多模态输入且需要实时响应的应用。
2025年7月10日 / Cloud
Firebase Studio 迎来多项更新,其中包括全新代理模式、对模型上下文协议 (MCP) 的基础支持,以及 Gemini CLI 集成。所有更新都旨在重新定义 AI 辅助开发,帮助开发者通过单一提示创建全栈应用,并将强大的 AI 功能直接集成至开发者的工作流中。
2025年7月9日 / Gemma
作为 Encoder-Decoder LLM 的新系列,T5Gemma 通过转换和调整基于 Gemma 2 框架的预训练 Decoder-only 模型开发而成,与其对应的 Decoder-only 模型相比,具有更出色的性能和效率,尤其适用于需要深度输入理解的任务,例如摘要和翻译。
2025年7月7日 / Gemini
Gemini API 新推出的批量模式专为高吞吐量、对延迟时间不敏感的 AI 负载而设计,通过执行调度和处理来简化大型作业,并使数据分析、批量内容创建和模型评估等任务更具成本效益和可扩展性,从而让开发者能高效地处理大量数据。