Gemma 3 270M の概要: 超高効率 AI のためのコンパクトモデル

2025年8月14日

Olivier Lacombe Group Product Manager Google DeepMind

Kathleen Kenealy Research Engineer

Kat Black

Ravin Kumar

Francesco Visin

Jiageng Zhang

ここ数か月は、オープンモデルの Gemma ファミリーにとってエキサイティングな期間となりました。Gemma 3 と Gemma 3 QAT を発表し、単一のクラウドアクセラレータとデスクトップアクセラレータとして最新鋭のパフォーマンスを実現しました。そして、強力なリアルタイムマルチモーダル AI をエッジデバイスに直接提供するモバイルファーストアーキテクチャとして、Gemma 3n のフルリリースを発表しました。私たちの目標は、デベロッパーが AI を活用してビルドするための便利なツールを提供することです。皆さんのご協力のもとに作成されている活気ある Gemmaverse では驚きの連続です。先週は、ダウンロード数の 2 億回超過をお祝いしました。

今回、Gemma 3 ツールキットに、高度に専門化された新しいツール「Gemma 3 270M」が追加されました。このツールは、タスク固有のファインチューニング用にゼロから設計されたコンパクトな 2 億 7,000 万パラメータモデルで、事前トレーニング済みの強力な指示実行機能とテキスト構造化機能を備えています。

Gemma 3 270M は、コンパクトなモデルながら強力な指示実行機能を提供します。IFEval ベンチマーク（検証可能な指示実行モデルの能力を評価するテスト）の結果に示されているように、このサイズクラスにおいて新たな性能水準を確立し、デバイス上や研究でのアプリケーションにおいて高度な AI 機能の利用を普及促進します。

Gemma 3 270M のコア機能

コンパクトで機能的なアーキテクチャ: この Google の新モデルは、合計 2 億 7,000 万個のパラメータを備えています。そのうち 1 億 7,000 万個は膨大な語彙サイズによる埋め込みパラメータで、残りの 1 億は Transformer ブロック用です。25 万 6,000 トークンという膨大な語彙のおかげで、このモデルは特定の希少トークンにも対応可能で、特定のドメインや言語に合わせてさらにファインチューニングできる強力なベースモデルとなっています。

極めて高いエネルギー効率: Gemma 3 270M の大きな利点はその低消費電力です。Google Pixel 9 Pro SoC での内部テストでは、INT4 量子化モデルの 25 回の会話でバッテリー消費量がわずか 0.75% に抑えられており、最も電力効率の高い Gemma モデルであることが示されています。

指示実行: 事前トレーニング済みのチェックポイントとともに、指示チューニング済みモデルがリリースされました。このモデルは複雑な会話のユースケース向けには設計されていませんが、一般的な指示に即座に従える強力なモデルです。

本番環境対応の量子化: 量子化認識トレーニング（QAT）済みのチェックポイントが利用可能で、パフォーマンスの低下を最小限に抑えながら INT4 精度でモデルを実行できます。これは、リソースに制約のあるデバイスへのデプロイに不可欠な機能です。

仕事に最適なツール

エンジニアリングでは、成功は単なる能力ではなく効率によって定義されます。額縁を吊るすのに大きなハンマーを使うことはありません。同じ原則が AI を活用したビルドにも当てはまります。

Gemma 3 270M は、この「仕事に最適なツール」という哲学を体現しています。最初から指示どおりに動作する高品質の基盤モデルであり、その真の力はファインチューニングによって引き出されます。一度特化させると、テキスト分類やデータ抽出などのタスクを驚異的な精度、スピード、費用対効果で実行できます。コンパクトで高性能なモデルから始めることで、無駄がなく高速で、運用コストを大幅に削減できる本番システムをビルドできます。

実世界での成功に向けた青写真

このアプローチの力は、すでに現実世界で素晴らしい成果を上げています。Adaptive ML と SK Telecom が共同で行った取り組みはその好例です。微妙なニュアンスが絡む多言語コンテンツの管理という課題に直面し、彼らはモデルを特化させることを選びました。Adaptive ML は大規模な汎用モデルを使用する代わりに、Gemma 3 4B モデルをファインチューニングしました。その結果は驚くべきものでした。特化型 Gemma モデルは、特定のタスクにおいてはるかに大規模な独自モデルの性能に匹敵するだけでなく、その性能を凌駕しました。

Gemma 3 270M は、デベロッパーがこのアプローチをさらに推進し、明確に定義されたタスクでより高い効率性を実現できるように設計されています。これは、各モデルを独自のタスクに精通させ、小規模で専門的なモデルフリートを構築するための最適な出発点となります。

しかし、この特化の力はエンタープライズタスクだけにとどまらず、強力なクリエイティブアプリケーションも実現します。例として、下の Bedtime Story Generator ウェブアプリをご覧ください。

Link to Youtube Video (visible only when JS is disabled)

Gemma 3 270M は、Transformers.js を使った Bedtime Story Generator ウェブアプリの基盤として利用されています。このモデルのサイズとパフォーマンスは、オフラインでのウェブベースのクリエイティブなタスクに最適です（クレジット: Joshua（X アカウント: @xenovacom）、Hugging Face チーム）。

Gemma 3 270M を選ぶべきシチュエーション

Gemma 3 270M は、Gemma 3 コレクションの高度なアーキテクチャと堅牢な事前トレーニングを継承しており、カスタムアプリケーションの強固な基盤を提供します。

次のような場合に最適です。

大量で明確に定義されたタスクを抱えている場合。感情分析、エンティティ抽出、クエリルーティング、非構造化テキストから構造化テキストへの変換処理、クリエイティブな文章作成、コンプライアンスチェックといった機能に最適です。

1 ミリ秒も 1 銭も無駄にできない場合。本番環境における推論費用を大幅に削減、あるいはゼロにし、ユーザーへのレスポンスを迅速化します。ファインチューニングされた 270M モデルは、軽量で低コストなインフラストラクチャやデバイス上で直接実行できます。

イテレーションとデプロイを迅速に行う必要がある場合。Gemma 3 270M はサイズがコンパクトなため、迅速なファインチューニングテストが可能で、ユースケースに最適な構成を数日ではなく数時間で発見できます。

ユーザーのプライバシーを確保する必要がある場合。このモデルは完全にデバイス上で実行可能なため、クラウドにデータを送信することなく機密情報を扱うアプリケーションをビルドできます。

専門的なタスクのモデルフリートが必要な場合。予算を超過することなく、それぞれ別のタスク向けに特化してトレーニングされた複数のカスタムモデルをビルドし、デプロイできます。

ファインチューニングを始める

Gemma 3 270M を独自のカスタムソリューションに変換するプロセスをできるだけ簡単なものにしたいと考えています。このモデルには他の Gemma 3 モデルと同じアーキテクチャが採用されており、すぐに使用開始できるレシピやツールが用意されています。Gemma ドキュメントの一部として、Gemma 3 270M を使用したフルファインチューニングガイドをご覧いただけます。

モデルをダウンロードする: Gemma 3 270M モデルは Hugging Face、Ollama、Kaggle、LM Studio、Docker から入手できます。事前トレーニング済みモデルと指示チューニング済みモデルの両方をリリースしています。

モデルを試す: Vertex AI または llama.cpp、Gemma.cpp、LiteRT、Keras、MLX などの一般的な推論ツールでモデルをお試しください。

ファインチューニングを開始する: Hugging Face、UnSloth、JAX など、お気に入りのツールを使用してファインチューニングできます。

ソリューションをデプロイする: ファインチューニングが完了したら、独自のローカル環境から Google Cloud Run まで、どこにでも特化モデルをデプロイできます。

Gemmaverse は「イノベーションはあらゆる規模で生じる」という理念に基づいています。Gemma 3 270M を活用することで、デベロッパーがよりスマートで高速、かつ効率的な AI ソリューションをビルドできるよう支援します。皆さんがこれから創出する特化モデルを楽しみにしています。

Gemma 3 270M の概要: 超高効率 AI のためのコンパクト モデル