ここ数か月は、オープンモデルの Gemma ファミリーにとってエキサイティングな期間となりました。Gemma 3 と Gemma 3 QAT を発表し、単一のクラウド アクセラレータとデスクトップ アクセラレータとして最新鋭のパフォーマンスを実現しました。そして、強力なリアルタイム マルチモーダル AI をエッジデバイスに直接提供するモバイルファースト アーキテクチャとして、Gemma 3n のフルリリースを発表しました。私たちの目標は、デベロッパーが AI を活用してビルドするための便利なツールを提供することです。皆さんのご協力のもとに作成されている活気ある Gemmaverse では驚きの連続です。先週は、ダウンロード数の 2 億回超過をお祝いしました。
今回、Gemma 3 ツールキットに、高度に専門化された新しいツール「Gemma 3 270M」が追加されました。このツールは、タスク固有のファインチューニング用にゼロから設計されたコンパクトな 2 億 7,000 万パラメータ モデルで、事前トレーニング済みの強力な指示実行機能とテキスト構造化機能を備えています。
エンジニアリングでは、成功は単なる能力ではなく効率によって定義されます。額縁を吊るすのに大きなハンマーを使うことはありません。同じ原則が AI を活用したビルドにも当てはまります。
Gemma 3 270M は、この「仕事に最適なツール」という哲学を体現しています。最初から指示どおりに動作する高品質の基盤モデルであり、その真の力はファインチューニングによって引き出されます。一度特化させると、テキスト分類やデータ抽出などのタスクを驚異的な精度、スピード、費用対効果で実行できます。コンパクトで高性能なモデルから始めることで、無駄がなく高速で、運用コストを大幅に削減できる本番システムをビルドできます。
このアプローチの力は、すでに現実世界で素晴らしい成果を上げています。Adaptive ML と SK Telecom が共同で行った取り組みはその好例です。微妙なニュアンスが絡む多言語コンテンツの管理という課題に直面し、彼らはモデルを特化させることを選びました。Adaptive ML は大規模な汎用モデルを使用する代わりに、Gemma 3 4B モデルをファインチューニングしました。その結果は驚くべきものでした。特化型 Gemma モデルは、特定のタスクにおいてはるかに大規模な独自モデルの性能に匹敵するだけでなく、その性能を凌駕しました。
Gemma 3 270M は、デベロッパーがこのアプローチをさらに推進し、明確に定義されたタスクでより高い効率性を実現できるように設計されています。これは、各モデルを独自のタスクに精通させ、小規模で専門的なモデルフリートを構築するための最適な出発点となります。
しかし、この特化の力はエンタープライズ タスクだけにとどまらず、強力なクリエイティブ アプリケーションも実現します。例として、下の Bedtime Story Generator ウェブアプリをご覧ください。
Link to Youtube Video (visible only when JS is disabled)
Gemma 3 270M は、Gemma 3 コレクションの高度なアーキテクチャと堅牢な事前トレーニングを継承しており、カスタム アプリケーションの強固な基盤を提供します。
次のような場合に最適です。
Gemma 3 270M を独自のカスタム ソリューションに変換するプロセスをできるだけ簡単なものにしたいと考えています。このモデルには他の Gemma 3 モデルと同じアーキテクチャが採用されており、すぐに使用開始できるレシピやツールが用意されています。Gemma ドキュメントの一部として、Gemma 3 270M を使用したフル ファインチューニング ガイドをご覧いただけます。
Gemmaverse は「イノベーションはあらゆる規模で生じる」という理念に基づいています。Gemma 3 270M を活用することで、デベロッパーがよりスマートで高速、かつ効率的な AI ソリューションをビルドできるよう支援します。皆さんがこれから創出する特化モデルを楽しみにしています。