上周,我们推出了 Gemini 1.5 Pro (0801) 的实验性更新版本,此版本在 LMSYS 文本和多模态查询排行榜上排名第一。我们对此模型的即时响应感到非常兴奋,因此我们提高了测试的极限。我们很快便会推出更多更新。
今天,我们宣布针对 AI Studio 和 Gemini API 推出一系列改进:
1.5 Flash 是我们最受欢迎的 Gemini 模型,适用于希望构建高容量、低延迟用例(如摘要、分类、多模态理解等)的开发者。为了使这款模型变得更加实惠,自 8 月 12 日起,对于令牌数不超过 12.8 万个的提示(令牌数为 > 12.8 万个及以下的级联),我们将输入价格降低 78%(即 0.075 美元/1 百万个令牌),将输出价格降低 71%(即 0.3 美元/1 百万个令牌)。借助价格下降和上下文缓存等工具,如果开发者使用 Gemini 1.5 Flash 的长上下文和多模态功能进行构建,则可以节省大量成本。
我们正在扩展 Gemini 1.5 Pro 和 Flash 模型的语言理解功能,以支持 100 多种语言。如此一来,全球的开发者现在都可以使用所选的语言输入提示和接收输出。这将通过 Gemini API 消除模型“语言”停止生成原因。
现在,默认情况下,数百万 Google Workspace 用户可以顺畅访问 Google AI Studio,而不必启用任何其他设置。帐户管理员仍然有权管理用户对 AI Studio 的访问权限。
现在,我们已经通过 Gemini API 和 Google AI Studio 向所有开发者推出了 Gemini 1.5 Flash 文本调整功能。利用调整功能,开发者能够为模型提供附加数据,从而自定义基本模型并提高任务处理性能。这不仅有助于减少提示的上下文大小,减少延迟,在某些情况下降低成本,同时还能提高模型处理任务的准确率。
我们的开发者文档是使用 Gemini API 进行构建的核心。我们最近发布了一系列改进功能,更新了内容、导航、外观和感觉,并发布了经过改进的 API 参考文档。
我们即将对文档进行更多改进,请您继续向我们提供反馈!
Gemini API 和 AI Studio 现在通过文本和视觉提供 PDF 理解支持。如果 PDF 包含图形、图像或其他非文本视觉内容,则模型将使用本机多模态功能来处理 PDF。您可以通过 Google AI Studio 或 Gemini API 进行试用。
过去几周,我们推出了许多 AI Studio 改进功能,包括改进键盘快捷键、允许将图像拖放到界面中、将加载时间缩短约 50%、添加提示建议等等!
就我们在 Gemini API 和 Google AI Studio 方面所做的所有工作而言,开发者是核心所在。因此,请继续进行构建并通过 Gemini API 开发者论坛与我们分享您的反馈。