隆重推出 Gemma 3 270M:超高效的紧凑型 AI 模型

2025年8月14日
Olivier Lacombe Group Product Manager Google DeepMind
Kathleen Kenealy Research Engineer

过去几个月对 Gemma 开放模型系列来说是激动人心的。我们推出了 Gemma 3Gemma 3 QAT,为单个云和桌面加速器提供最先进的性能。然后,我们宣布全面推出以移动设备优先的架构 Gemma 3n,将强大的实时多模态 AI 直接应用于边缘设备。我们的目标是为开发者提供使用 AI 进行构建的有用工具,而我们一直对大家携手创建的充满活力的 Gemmaverse 生态系统感到欣喜,上周的下载量已超过 2 亿次。

今天,我们在 Gemma 3 工具包中新增了一款高度专业化的工具:Gemma 3 270M。此模型是拥有 2.7 亿个参数的紧凑型模型,专为针对特定任务进行微调而设计,并且已内置强大的指令遵循和文本结构化功能。

Gemma 3 270M
Gemma 3 270M 为小尺寸模型带来强大的指令遵循功能。正如 IFEval 基准测试(测试模型遵循可验证指令的能力)所示,它为同尺寸模型确立了新的性能水平,使复杂的 AI 功能更容易用于设备端和研究应用。

Gemma 3 270M 的核心功能

  • 尺寸紧凑但功能强大的架构:我们的新模型总共有 2.7 亿个参数:其中 1.7 亿个是嵌入参数(因词汇量较大),另外 1 亿个参数用于我们的 Transformer 块。得益于 256k 令牌的大量词汇,该模型可以处理特定和罕见的令牌,使其成为可在特定领域和语言中进一步微调的强大基础模型。

  • 极高的能源效率:Gemma 3 270M 的一个关键优势是其低功耗。在 Pixel 9 Pro SoC 上进行的内部测试显示,由于采用了 INT4 量化技术,该模型在 25 次对话中仅消耗了 0.75% 的电量,使其成为我们最节能的 Gemma 模型。

  • 指令遵循:指令调整模型与预先训练的检查点一起发布。虽然此模型并非专为复杂的会话用例而设计,但却拥有强大功能,无需进行额外的设置即可遵循指令。

  • 可用于生产环境的量化:量化感知训练 (QAT) 检查点已正式推出,使您能够在 INT4 精度下运行模型,并将发生性能下降的可能性降到最低,这对于在资源受限的设备上部署模型至关重要。


合适的作业工具

在工程领域,衡量成功的标准在于效率,而不仅仅是原始算力。您不会用大锤来挂相框。同样的原则也适用于使用 AI 进行构建。

Gemma 3 270M 体现了“合适的作业工具”这一理念。这是一款性能卓越的基础模型,无需进行额外的设置即可遵循指令,而其真正的强大功能则需通过微调来实现。经过专业化设置后,模型能以惊人的准确率、速度和成本效益执行文本分类和数据提取等任务。从一款功能强大的紧凑型模型着手,您可以构建出精简、快速且运营成本大幅降低的生产系统。


真实世界的成功蓝图

这种方法已经在现实世界中取得了令人难以置信的成果。一个绝佳的例子是 Adaptive ML 与 SK Telecom 合作完成的项目。面对复杂、多语言的内容审核这一挑战,他们选择了走专业化路线。Adaptive ML 没有使用大型通用模型,而是对 Gemma 3 4B 模型进行了微调。结果令人惊叹:专业的 Gemma 模型在特定任务上的表现不仅达到,甚至超越了尺寸大得多的专有模型。

Gemma 3 270M 旨在让开发者更进一步地采用这种方法,从而以更高的效率处理明确的任务。该模型是打造小型专业模型的完美起点,因为每个模型都有各自擅长处理的任务类型。

但是,这种专业化的能力不仅适用于企业任务,还能实现强大的创意应用。例如,查看下面的“睡前故事生成器”Web 应用

Link to Youtube Video (visible only when JS is disabled)

Gemma 3 270M 用于使用 Transformers.js 为睡前故事生成器 Web 应用提供支持。模型的大小和性能适用于处理离线任务、基于 Web 的任务和创意任务。(图片来源:Hugging Face 团队的 Joshua (@xenovacom on X))

何时选择使用 Gemma 3 270M

Gemma 3 270M 继承了 Gemma 3 系列的高级架构和强大的预训练功能,为您的自定义应用奠定了坚实的基础。

下面是该模型成为理想选择的场景:

  • 您有大量明确的任务。非常适合情感分析、实体提取、查询路由、非结构化文本到结构化文本的转换、创意写作以及合规性检查等功能。

  • 您需要充分利用每一毫秒和每一微秒的时间。大幅降低或消除生产环境中的推理成本,并为用户提供更快的响应速度。经过微调的 270M 模型可以在轻量级、成本低廉的基础设施上运行,也可以直接在设备上运行。

  • 您需要快速迭代和部署。Gemma 3 270M 体积小巧,可进行快速微调实验,帮助您在数小时内(而不是数天)找到适合用例的理想配置。

  • 您需要确保用户隐私。由于该模型可以完全在设备上运行,因此您可以构建处理敏感信息的应用,而无需将数据发送到云端。

  • 您想拥有一系列能够处理各种任务的专业模型。构建并部署多个自定义模型,每个模型都针对不同的任务经过专业训练,同时不会超出您的预算。


微调入门

我们希望让您尽可能轻松地将 Gemma 3 270M 变成您自己的自定义解决方案。该模型采用与其他 Gemma 3 模型相同的架构,并配备了相关教程和工具,助您快速入门。您可以在 Gemma 文档中找到关于使用 Gemma 3 270M 进行全面微调的指南。

Gemmaverse 建立在创新的形式多种多样这一理念之上。借助 Gemma 3 270M,我们让开发者能够构建更智能、更快、更高效的 AI 解决方案。我们迫不及待想看到您创建的专业模型。