开始使用 Gemini 2.0 Flash 和 Flash-Lite 进行构建

二月 25, 2025
Logan Kilpatrick Senior Product Manager Gemini API and Google AI Studio
Shrestha Basu Mallick Group Product Manager Gemini API

自 Gemini 2.0 Flash 模型系列推出以来,开发者正在不断发掘该高效模型系列的新用例。Gemini 2.0 Flash 可提供比 1.5 Flash 和 1.5 Pro 更强的性能,还简化了定价,可使 100 万 Token 的上下文窗口变得更实惠。

Gemini 2.0 Flash-Lite 已于今日在 Gemini API 中正式推出,可用于 Google AI Studio 中的生产用途,亦可供 Vertex AI 企业客户使用。2.0 Flash-Lite 在推理、多模态、数学和事实基准测试方面的性能均优于 1.5 Flash。对于需要较长上下文窗口的项目来说,2.0 Flash-Lite 是一种更具成本效益的解决方案,针对超过 128K Token 的提示简化了定价

开发者已利用 2.0 Flash 系列卓越的速度、效率和成本效益,构建了出色的应用。以下是一些示例:


1. 语音 AI

有效的对话式 AI(尤其是语音助手)需要兼具速度和准确性。更短的首 Token 延迟 (TTFT) 至关重要,不仅能为用户带来自然、响应迅速的感觉,还能加强 AI 通过调用函数来处理复杂指令和与其他系统交互的能力。

Daily 正在利用 Gemini 2.0 Flash-Lite 帮助开发者创建先进的语音 AI 体验。Daily 利用其不受特定供应商局限的 Pipecat 开源语音和多模态会话代理框架,创建了一个系统指令代码演示,以便以可靠方式检测语音邮件系统并根据具体情况定制消息。

在上述系统指令的助力下,Gemini 2.0 Flash-Lite 在检测语音邮件方面的性能明显优于当前的专业商业模型。

2. 数据分析

Dawn 借助 Gemini 2.0 Flash 来提供深刻而有意义的见解,进而彻底改变了工程团队在生产中监控 AI 产品的方式。工程团队可通过 Dawn 的“语义监控”流程即时搜索大量用户交互流,以便找到他们正在寻找的任何行为(例如用户表现出沮丧情绪、对话长度和用户反馈),并将其作为持续存在的问题或主题进行持续跟踪,从而识别生产中的异常和隐藏问题。

Gemini 2.0 Flash 简化了定价,可生成可靠的结构化输出,还扩展了上下文功能,这使得 Dawn 能够通过切换模型来大大缩短搜索时间(从几小时缩短到一分钟以内),进而将成本降低了 90% 以上,还提高了 eval 和生产监控的可靠性。

Gemini 2.0 Flash 使 Dawn 的语义监控变得更快、更可靠且更具成本效益。

3. 视频编辑

Mosaic 正在通过使用 Gemini 2.0 Flash 的新代理范式转变复杂、耗时的视频编辑任务。他们的解决方案整合了多模态编辑代理,这些代理可使用 Gemini 2.0 Flash 的长上下文功能,将单调的视频编辑任务从几小时缩短到几秒钟,这样您只需输入提示即可在长视频的任何部分剪辑出 YouTube 短片。

经过简化后,Gemini 2.0 Flash 的新定价为 0.10 美元/百万个输入 Token(Google AI Studio 中),这使大型上下文窗口价格降低了 33%,为 AI 驱动的视频编辑工作流开辟了全新可能性。

Gemini 2.0 Flash
Mosaic 的代理工作流使用 Gemini 2.0 Flash,以最近一期的版本说明为基础剪辑并编辑了一个 YouTube 短片。

开始使用 Gemini 2.0 Flash 和 2.0 Flash-Lite 进行构建

Gemini 2.0 Flash 系列模型为 Daily.coMosaicDawn 等开发者提供了强力支持,这让我们非常高兴。无论您是在开发语音助手、视频编辑工具还是全新项目,我们都希望 Gemini 2.0 Flash 系列能够提供您所需的性能和经济性。立即开始在 Google AI Studio 中构建项目吧。