过去几个月对 Gemma 开放模型系列来说是激动人心的。我们推出了 Gemma 3 和 Gemma 3 QAT,为单个云和桌面加速器提供最先进的性能。然后,我们宣布全面推出以移动设备优先的架构 Gemma 3n,将强大的实时多模态 AI 直接应用于边缘设备。我们的目标是为开发者提供使用 AI 进行构建的有用工具,而我们一直对大家携手创建的充满活力的 Gemmaverse 生态系统感到欣喜,上周的下载量已超过 2 亿次。
今天,我们在 Gemma 3 工具包中新增了一款高度专业化的工具:Gemma 3 270M。此模型是拥有 2.7 亿个参数的紧凑型模型,专为针对特定任务进行微调而设计,并且已内置强大的指令遵循和文本结构化功能。
在工程领域,衡量成功的标准在于效率,而不仅仅是原始算力。您不会用大锤来挂相框。同样的原则也适用于使用 AI 进行构建。
Gemma 3 270M 体现了“合适的作业工具”这一理念。这是一款性能卓越的基础模型,无需进行额外的设置即可遵循指令,而其真正的强大功能则需通过微调来实现。经过专业化设置后,模型能以惊人的准确率、速度和成本效益执行文本分类和数据提取等任务。从一款功能强大的紧凑型模型着手,您可以构建出精简、快速且运营成本大幅降低的生产系统。
这种方法已经在现实世界中取得了令人难以置信的成果。一个绝佳的例子是 Adaptive ML 与 SK Telecom 合作完成的项目。面对复杂、多语言的内容审核这一挑战,他们选择了走专业化路线。Adaptive ML 没有使用大型通用模型,而是对 Gemma 3 4B 模型进行了微调。结果令人惊叹:专业的 Gemma 模型在特定任务上的表现不仅达到,甚至超越了尺寸大得多的专有模型。
Gemma 3 270M 旨在让开发者更进一步地采用这种方法,从而以更高的效率处理明确的任务。该模型是打造小型专业模型的完美起点,因为每个模型都有各自擅长处理的任务类型。
但是,这种专业化的能力不仅适用于企业任务,还能实现强大的创意应用。例如,查看下面的“睡前故事生成器”Web 应用:
Link to Youtube Video (visible only when JS is disabled)
Gemma 3 270M 继承了 Gemma 3 系列的高级架构和强大的预训练功能,为您的自定义应用奠定了坚实的基础。
下面是该模型成为理想选择的场景:
我们希望让您尽可能轻松地将 Gemma 3 270M 变成您自己的自定义解决方案。该模型采用与其他 Gemma 3 模型相同的架构,并配备了相关教程和工具,助您快速入门。您可以在 Gemma 文档中找到关于使用 Gemma 3 270M 进行全面微调的指南。
Gemmaverse 建立在创新的形式多种多样这一理念之上。借助 Gemma 3 270M,我们让开发者能够构建更智能、更快、更高效的 AI 解决方案。我们迫不及待想看到您创建的专业模型。