在 Google AI Studio 中或使用 Gemini API 调整 Gemini Pro

三月 19, 2024
Cher Hu Product Manager Gemini API
Saravanan Ganesh Software Engineer Gemini API

本帖最初发布于 2023 年 10 月,今天,我们对内容进行了更新,分享如何在 Google AI Studio 中或使用 Gemini API 轻松调整 Gemini 模型。


去年,我们推出了 Gemini 1.0 Pro,这是一款经过优化的中等规模多模态模型,可扩展到各种任务。在今年推出的 1.5 Pro 中,我们展示了大型语言模型在使用 100 万上下文窗口时所能实现的强大可能。现在,为了让您能够快速、轻松地根据自身特定需求自定义正式版 Gemini 1.0 Pro 文本模型,我们在 Google AI Studio 和 Gemini API 中添加了 Gemini 调整功能。


什么是调整?

开发者在处理自定义用例时,所需输出质量往往比通过“少样本提示”(few-shot prompting)”方法获得的更高。“调整”(tuning) 在此技术上更进一步,通过让基础模型在大量针对特定于任务的示例上进行额外训练来提升效果。这些示例数量之多以至于无法全部容纳在提示中。


微调与参数高效调整

您可能听说过对模型进行传统的“微调”(fine-tuning)。这就是将预训练的模型通过在一个较小的任务特定标记数据集上进行训练,使模型来适应特定任务的过程。但由于当今的大型语言模型具有庞大的参数数量,对这些模型进行微调变得非常复杂:需要机器学习专业知识、大量的数据和计算资源。

Google AI Studio 中所采用的调整技术叫做“参数高效调整”(Parameter Efficient Tuning,简称 PET),与少样本提示相比,该技术能够在降低延迟的同时生成质量更高的自定义模型,并且无需传统微调所涉及的额外成本和复杂性。此外,PET 只需几百个数据点即可生成高质量的模型,减轻了开发者进行数据收集的负担。


为什么要进行调整?

调整使您能够使用自己的数据对 Gemini 模型进行自定义,使其在处理特定领域的任务时表现得更为出色,同时缩减提示的上下文规模和响应延迟。开发者可以针对多种用例运用调整技术,这些用例包括但不限于:

  • 分类:运行自然语言任务,例如在无需大量手动工作或使用其他工具的情况下,将数据分类为预定义类别。
  • 信息提取:从非结构化数据源中提取结构化信息,以支持产品中的下游任务。
  • 结构化输出生成:快速轻松地生成表格等结构化数据。
  • 模型评估:使用调整技术来创建评估模型,以评估其他模型的输出。


使用 Google AI Studio 快速入门

1. 创建调整的模型

在 Google AI Studio 中调整模型非常轻松。即便您不具备工程专业知识,也能轻松构建自定义模型。首先,在左侧的菜单栏中选择“新建调整模型”(New tuned model)。

moving image showing how to create a tuned model in Google AI Studio by opening 'New Tuned Model' from the menu

2. 选择数据进行调整

您可以从现有的结构化提示中调整模型,也可以从 Google 表格或 CSV 文件中导入数据。您只需使用最少 20 个示例即可开始调整,为了获得最佳性能,我们建议您提供至少包含 100 个示例的数据集。

moving image showing how to select data for tuning in Google AI Studio by importing data

3. 查看调整的模型

您可以在库中查看调整进度。当模型完成调整后,您可以单击模型以查看详细信息。接下来,您可以开始通过结构化或自由格式的提示来运行已调整的模型。

moving image showing how to view your tuned model in Google AI Studio by importing data

4. 随时运行调整的模型

您还可以通过创建新的结构化或自由格式提示,并从可用模型列表中选择已调整的模型,来访问新调整的模型。

moving image demonstrating what it looks like to run your tuned model in Google AI Studio after importing data

使用 Gemini API 进行调整

Google AI Studio 是开始进行 Gemini 模型调整的最快捷、最简单的方法。您也可以通过 Gemini API 访问此功能:在创建调整模型时在 API 请求中传递训练数据。如要了解更多入门信息,请点击此处


我们对调整技术为开发者带来的可能性感到十分激动,并且迫不及待想看到您利用这一功能构建出精彩作品。如果您有任何新想法或正在设想新用例,请在 X(原名 Twitter)Linkedin 上与我们分享。