在 Google AI Studio 中获取 API 密钥,并开始使用 Gemini API Cookbook
不到两个月前,我们在 Google AI Studio 中推出了新一代 Gemini 1.5 Pro 模型供开发者试用。让我们感到惊讶的是,社区已经能够使用我们开创性的 100 万个上下文窗口进行调试、创建和学习。
今天,我们在 180 多个国家/地区推出了公开预览版的 Gemini 1.5 Pro(可通过 Gemini API 访问),其中包含首次提供的原生音频(语音)理解功能以及用于轻松处理文件的文件 API。我们还将推出系统指令和 JSON 模式等新功能,让开发者能够更好地控制模型的输出。最后,我们将发布性能优于同类模型的新一代文本嵌入模型。请前往 Google AI Studio,以创建或访问您的 API 密钥,并开始构建。
我们正在扩展 Gemini 1.5 Pro 的输入模式,以便同时在 Gemini API 和 Google AI Studio 中包含音频(语音)理解功能。此外,Gemini 1.5 Pro 现在能够为在 Google AI Studio 中上传的视频提供图像(帧)和音频(语音)推理功能,并且我们期待尽快为此添加 API 支持。
今天,我们将讨论一些热门的开发者请求:
1. 系统指令:使用系统指令引导模型作出响应,此功能现已在 Google AI Studio 和 Gemini API 中提供。定义角色、格式、目标和规则,以针对特定用例引导模型的行为。
2. JSON 模式:指示模型仅输出 JSON 对象。此模式支持从文本或图像中提取结构化数据。您现在可以开始使用 cURL,对 Python SDK 的支持即将推出。
3. 函数调用改进:您现在可以选择模式来限制模型的输出,从而提高可靠性。选择文本、函数调用或仅选择函数本身。
从今天开始,开发者将能够通过 Gemini API 访问我们的新一代文本嵌入模型。在 MTEB 基准测试中,相较于现有模型,新模型 text-embedding-004(即 Vertex AI 中的 text-embedding-preview-0409)具有更强大的检索性能,并且在各种可比较的维度方面亦有更佳的表现。
这些只是将在未来几周推出的众多 Gemini API 和 Google AI Studio 改进中的第一批改进。我们将继续致力于让 Google AI Studio 和 Gemini API 成为使用 Gemini 进行构建的最简单方式。立即开始在 Google AI Studio 中使用 Gemini 1.5 Pro,在我们全新的 Gemini API Cookbook 中探索代码示例和快速入门指南,并在 Discord 上加入我们的社区频道。