在今年的 Google I/O 大会上,我们将展示如何跨 Google 不同平台构建应用,并利用 Google DeepMind 的顶尖 AI 模型进行创新。以下是开发者主题演讲的重磅消息。
Link to Youtube Video (visible only when JS is disabled)
Google AI Studio 是评估模型和使用 Gemini API 开始构建的最快方法。
Google AI Studio 助您轻松使用 Gemini API 进行构建:我们已将 Gemini 2.5 Pro 集成至原生代码编辑器中,助您加速原型设计。该模型已与 GenAI SDK 紧密优化,因此您可以根据文本、图像或视频提示立即生成 Web 应用。您可以从简单的提示开始,也可以从案例展示中的“入门应用”中汲取灵感。
使用 Gemini API 构建代理体验:通过 Gemini API 与新型工具(如 URL Context)构建具备 Gemini 2.5 高级推理能力的智能体。URL Context 功能支持模型仅凭链接即可从网页中提取上下文信息。我们还宣布,Gemini SDK 将支持模型上下文协议 (MCP) 定义,让开发者能更轻松地利用开源工具。
Live API 中的 Gemini 2.5 Flash 原生音频:构建具备听与说能力的智能体应用,并支持对模型的音色、语调、语速及整体风格进行全方位调控(覆盖 24 种语言)。Gemini 2.5 Flash 原生音频显著提升了对话上下文连贯性理解能力,可自动过滤杂音或人声,实现更流畅自然的对话交互。
使用 Stitch 生成优质界面设计:一款全新的 AI 工具,用于生成 Web 应用程序的界面设计和相应的前端代码。您可以使用聊天功能以对话方式迭代您的设计,调整主题,并轻松将您的作品导出为 CSS/HTML 或 Figma 以继续使用。试用 Stitch 开展界面设计。
我们的异步代码代理 Jules 公开测试版现已发布:Jules 是一款并行异步编码代理,可直接与您的 GitHub 代码库协同使用。您可以让 Jules 执行诸如版本升级、编写测试、更新功能和修复错误等任务。Jules 会启动云虚拟机,在您的代码库中进行协调编辑,运行测试,并且当您确认代码无误后,即可从对应分支发起拉取请求。
了解我们如何让您更轻松地跨设备构建卓越体验。
利用生成式 AI 构建体验:生成式 AI 通过赋予应用智能化、个性化及代理能力来优化应用。我们发布了基于 Gemini Nano 的全新 ML Kit GenAI API,可用于处理常见设备端任务。我们展示了 AI 示例应用 Androidify,您可通过自拍创建专属 Android 机器人。探索 Androidify 的构建原理,并查阅开发者文档以开始使用。
构建适用于 5 亿台设备的出色自适应应用:移动 Android 应用是手机、可折叠设备、平板电脑和 ChromeOS 系统的基础。今年,我们将助您将其引入汽车和 Android XR 系统。您还可以利用 Material 3 Expressive 来让您的应用更加出色。
Android Studio 中的 Gemini - 助您工作的 AI 代理:Android Studio 中的 Gemini 是一款 AI 驱动的编码助手,可帮助开发者在开发生命周期的每个阶段提高效率。我们概述了 Journeys 和版本升级代理,前者是一种代理式体验,可帮助您编写和执行端到端测试;后者可帮助您更新依赖项。探索 Android Studio 中 Gemini 提供的代理体验,详细了解这些体验如何帮助您更快速地构建更出色的应用。
我们致力于让您更轻松地打造卓越的网页体验,包括优化界面设计与加速调试,以及开发 AI 驱动的新功能。
现在只需几行 CSS 和 HTML 代码,即可轻松构建轮播界面:使用 CSS 构建美观的轮播界面,使其在首次渲染时即可实现交互。Chrome 135 整合了多项全新 CSS 原语,可显著简化轮播界面及其他屏幕外界面的构建流程。开发者可基于熟悉的 CSS 概念,以更短时间打造出内容丰富、交互性强、流畅且更易于访问的轮播界面。
隆重推出全新实验性 Interest Invoker API:当访问者兴趣持续一小段时间时,可通过声明切换弹出窗口。结合 Anchor Positioning API 和 Popover API,无需 JavaScript 即可构建复杂、响应迅速且分层的界面元素,例如工具提示和悬停卡片。Interest Invoker API 源试用版现已推出。
Baseline 功能现已在您熟悉的工具中推出:VS Code 现在会在您构建时显示功能的 Baseline 状态,其他基于 VS Code 的 IDE 和 JetBrains 的 WebStorm 也即将支持 Baseline 功能。CSS 的 ESLint、HTML ESLint 和 Stylelint 现在也支持 Baseline 功能。RUMvision 将 Baseline 信息与真实用户数据相结合,让您能够策略性地为您的受众选择最佳的 Baseline 目标。此外,由于 Web 功能数据集现已实现 100% 映射,您现在可以访问所有主流浏览器上每个功能的 Baseline 状态。
Chrome 开发者工具中的 AI 支持您的调试工作流:已直接将 Gemini 集成到 Chrome 开发者工具,可助您提升开发工作流效率。在 AI 辅助功能的支持下,您现在可以在“元素”面板中直接将建议的更改应用于工作区中的文件。此外,重新设计的“性能面板”现在集成了强大的“Ask AI”功能,可基于上下文生成深度性能分析,帮助您优化 Web 应用的核心网页指标。
基于 Gemini Nano 的全新内置 AI API 现已推出(支持多模态功能): Gemini Nano 可增强隐私保护,缩减延迟并降低成本。从 Chrome 138 开始,面向 Chrome 扩展程序的 Summarizer API、Language Detector API、Translator API 和 Prompt API 均已推出稳定版。Writer 和 Rewriter API 已推出源试用版,而支持多模态功能的 Proofreader API 和 Prompt API 也已在 Canary 中推出。加入我们的早期预览版计划,共同塑造网络 AI 的未来。
使用 Firebase 创建原型、构建并运行用户喜爱的现代化 AI 驱动式全栈应用。Firebase Studio 是由 Gemini 2.5 提供支持的云端 AI 工作区,通过使用 Firebase Studio,您只需几分钟即可完成从构思到发布的过程,将您的创意转化为全栈应用。
Figma 设计方案现可在 Firebase Studio 中焕发活力:通过 builder.io 插件直接将 Figma 设计方案导入 Firebase Studio,然后使用 Firebase 中的 Gemini 添加特性和功能,无需编写任何代码。
Firebase Studio 现在会推荐后端:在未来几周内逐步推出,当您使用应用原型设计代理时,Firebase Studio 可以检测到后端需求。Firebase Studio 现在会推荐 Firebase Auth 和 Cloud Firestore,当您准备将应用发布到 Firebase 应用托管时,Firebase Studio 将为您配置这些服务。
Firebase AI Logic:您可以通过客户端应用直接集成 Google 的新一代 AI 模型,或通过 Genkit 在服务器端实现。在将 Firebase 中的 Vertex AI 发展为 Firebase AI Logic 的过程中,我们还将发布多项新功能,例如 Gemini Developer API 的客户端集成、混合推理、增强的可观测性,以及与 App Check 和 Remote Config 等 Firebase 产品的更深入集成。
虽然使用 Gemini 进行构建拥有无限可能,但有时训练与微调专属模型往往更具优势。因此,我们发布了 Gemma,这是我们的开放模型系列,旨在达到最先进的水平,并适用于各种设备。
Gemma 3n 现已推出早期预览版:得益于研发创新,该模型仅需 2GB RAM 即可运行。作为首款基于新一代先进移动端优先架构打造的模型,它还能为下一代 Gemini Nano 提供支持,旨在直接在便携设备上实现无与伦比的 AI 性能。
MedGemma 是我们功能最强大的多模态医学文本和图像理解开放模型:作为 Gemma 3 的变体,开发者不妨从 MedGemma 入手,对其展开微调和调整以构建专属医疗 AI 应用。这款模型的轻量化设计使其具备较高的推理效率,并且由于其开放性,开发者可以灵活地微调模型并在其偏好的环境中运行。MedGemma 现已作为“Health AI Developer Foundations(健康领域的 AI 开发者基础)”的一部分开放使用。
Colab 即将推出革新编码方式的“代理优先”体验:Colab 采用 Gemini 2.5 Flash,可帮助您完成复杂任务,例如微调模型。我们介绍了全新 AI 优先版 Colab 构建界面的过程,这可节省您大量的编码时间。
SignGemma 是一款手语理解模型,将于今年晚些时候加入 Gemma 系列:它是迄今为止将手语翻译成口语文本的功能最强大的模型(尤其擅长将美国手语翻译成英语),可帮助您开发新的途径,让聋哑/听障用户能够使用科技。欢迎访问 goo.gle/SignGemma 分享您的意见。
DolphinGemma 是世界上首个针对海豚的大型语言模型:通过与佐治亚理工学院和“Wild Dolphin Project”的研究人员合作,我们根据数十年的实地研究数据微调了 DolphinGemma,以帮助科学家更好地了解海豚交流的模式。
我们扩展了 Google 开发者计划的 AI 权益,包括 Gemini Code Assist Standard、新一代 AI 开发者年度积分以及 3 个月的 Google One AI 高级版服务。我们还宣布了全新的 Google Cloud 和 NVIDIA 社群,您可以在专属论坛中与两家公司的专家交流,并很快获得独家学习内容和积分。
主题演讲结束后,我们将于 5 月 20 日至 21 日直播 AI、Android、Web 和云领域的相关会议。此外,从 5 月 22 日起,您可以按需查看所有 Google I/O 大会的公告和更新,其中包括 100 多场会议、Codelab 等丰富内容。
请务必加入我们蓬勃发展的全球开发者社群,并在 LinkedIn 和 Instagram 上关注我们,届时我们将为世界各地的开发者带来 I/O 大会社交活动的相关信息。