小型化と安全性および透明性の向上: Gemma で責任ある AI を推進する

2024年7月31日

Neel Nanda Research Engineer

Tom Lieberum Research Engineer

Ludovic Peran Product Manager

Kathleen Kenealy Research Engineer

6 月にリリースした Gemma 2 は、クラス最高の新しいオープンモデルで、270 億（27B）および 90 億（9B）のパラメータサイズがあります。公開後、27B モデルはすぐに LMSYS Chatbot Arena のリーダーボードで最高ランクのオープンモデルに仲間入りし、実際の会話では 2 倍以上サイズの人気モデルを凌駕しています。

しかし、Gemma はパフォーマンスだけではありません。責任ある AI という土台の上に構築されており、安全性とアクセシビリティを優先しています。この取り組みをサポートするため、Gemma 2 ファミリーに 3 つの新たな機能を追加したことをお知らせします。

Gemma 2 2B - 人気の 20 億（2B）パラメータモデルのまったく新しいバージョンです。安全性が向上しており、パフォーマンスと効率性のバランスがとても優れています。

2. ShieldGemma - 一連のコンテンツ安全性分類モデルで、Gemma 2 をベースに作成されています。AI モデルの入出力をフィルタリングすることで、ユーザーの安全を保ちます。

3. Gemma Scope - 新しいモデル解釈ツールで、モデル内部の仕組みについてこれまでにない知見を提供します。

この機能追加により、リサーチャーやデベロッパーが作成するカスタマーエクスペリエンスの安全性が高まります。また、モデルについてこれまでにない知見を得て、自信と責任を持って強力な AI をデバイスにデプロイできるようになるので、新しいイノベーションの可能性が解き放たれます。

Gemma 2 2B: 次世代のパフォーマンスをオンデバイスで体験する

Gemma 2 ファミリーで待ち望まれていた Gemma 2 2B モデルを紹介できることをうれしく思います。この軽量モデルは、蒸留によって大型モデルから学習することで、サイズに見合わない結果を生み出します。実際、Gemma 2 2B は Chatbot Arena であらゆる GPT-3.5 モデルを上回っており、会話 AI としての優れた能力を実証しています。

Graph - LYMSYS Chatbot Arena leaderboard scores

LMSYS Chatbot Arena のリーダーボードスコア。2024 年 7 月 30 日のキャプチャ。 Gemma 2 2B スコア +/- 10。

Gemma 2 2B の特徴は以下のとおりです。

卓越したパフォーマンス: このサイズでクラス最高のパフォーマンスを持ち、同じカテゴリの他のオープンモデルよりも優れた性能を発揮します。

柔軟で費用対効果の高いデプロイ: Gemma 2 2B はさまざまなハードウェアで効率的に実行できます。エッジデバイスやノートパソコンで動作させることも、Vertex AI と Google Kubernetes Engine（GKE）を使って安定したクラウドにデプロイすることも可能です。さらに高速化したい方のために、NVIDIA TensorRT-LLM ライブラリに最適化され、NVIDIA NIM として利用できます。この最適化は、データセンター、クラウド、ローカルワークステーション、PC、エッジデバイスなど、さまざまなデプロイ環境を対象としており、NVIDIA RTX、NVIDIA GeForce RTX GPU、エッジ AI 用の NVIDIA Jetson モジュールを利用しています。さらに、Gemma 2 2B は Keras、JAX、Hugging Face、NVIDIA NeMo、Ollama、Gemma.cpp でシームレスに利用できるので、効率的に開発できます。近日中に MediaPipe にも対応する予定です。

オープンでアクセシブル: 商用に適した Gemma 利用規約の下で、研究にも商用にも利用できます。Google Colab の無料階層である T4 GPU でも実行できるほど小さいので、実験と開発がこれまで以上に簡単になります。

本日より、Kaggle、Hugging Face、Vertex AI Model Garden から、Gemma 2 のモデルの重みをダウンロードできます。Google AI Studio で機能を試すこともできます。

ShieldGemma: 最先端の安全性分類機能でユーザーを保護する

責任を持ってオープンモデルをデプロイし、AI から魅力的かつ安全でインクルーシブな出力を確実に得るには、デベロッパーとリサーチャーの多大な努力が必要です。このプロセスでデベロッパーを支援するために、ShieldGemma を導入します。ShieldGemma は、一連の最先端の安全性分類機能で、AI モデルの入出力の有害なコンテンツを検出して軽減するように設計されています。中でも、次の 4 つの主要被害領域をターゲットにしています。

ヘイトスピーチ

ハラスメント

性的に露骨な表現

危険なコンテンツ

Generative AI application model architecture

このオープン分類機能は、Responsible AI Toolkit による一連の既存の安全分類機能を補完するものです。Responsible AI Toolkit には、特定のポリシーに合わせた分類機能を有限個のデータポイントで構築する方法や、API を通して提供される Google Cloud の既存の分類機能が含まれています。

ShieldGemma は、安全で優れた AI アプリケーションの作成に次のような形で貢献します。

SOTA パフォーマンス: ShieldGemma は、Gemma 2 をベースに構築され、業界をリードする安全性分類機能を備えています。

柔軟なサイズ: 多様なニーズに対応するため、さまざまなサイズの ShieldGemma モデルが提供されます。2B モデルは、オンライン分類タスクに理想的ですが、9B および 27B バージョンは、遅延がそれほど懸念されないオフラインアプリケーションで、高いパフォーマンスを発揮します。どのサイズも NVIDIA の速度最適化を活用し、ハードウェア全体で効率的なパフォーマンスを実現しています。

オープンで協調的: ShieldGemma はオープンなので、AI コミュニティの透明性とコラボレーションが促進され、ML 業界の未来の安全基準に貢献します。

「AI の継続的な成熟に合わせて、業界全体による高パフォーマンスな安全性評価機能の開発への注力が必要になります。うれしいことに、Google がそれを行ってくれました。AI 安全ワーキンググループに継続的に関与してくれることを期待しています」～ ML Commons、エグゼクティブディレクター、Rebecca Weiss 氏

Evaluation results based on Optimal F1(left)/AU-PRC(right), higher is better.

Optimal F1（左）/ AU-PRC（右）による評価結果。高いほど良い。確率の計算には、𝛼=0 と T = 1 を使用。ShieldGemma（SG）プロンプトと SG レスポンスは自前のテストデータセットであり、OpenAI Mod / ToxicChat は外部ベンチマーク。外部データセットのベースラインモデルのパフォーマンスの出典は、Ghosh et al.（2024）および Inan et al.（2023）。

ShieldGemma の詳細やテクニカルレポートの全結果をご確認ください。包括的な Responsible Generative AI Toolkit を使って、安全性の高い AI アプリケーションの構築を始めましょう。

Gemma Scope: オープンスパースオートエンコーダーで AI の意思決定に関する知見を得る

リサーチャーやデベロッパーが Gemma Scope を使うと、Gemma 2 モデルの意思決定プロセスをこれまでにない形で見通せるようになります。Gemma Scope は強力な顕微鏡のように機能します。スパースオートエンコーダー（SAE）でモデルの特定のポイントにズームインすることで、内部動作を解釈しやすくします。

この SAE は特殊なニューラルネットワークで、Gemma 2 が処理する高密度で複雑な情報を解きほぐし、分析や解釈がしやすい形式に拡大します。リサーチャーは、この拡大した視野を調査することで、Gemma 2 がどのようにパターンを識別し、情報を処理し、最終的に予測を行うかについての貴重な知見を得ることができます。Gemma Scope のねらいは、AI 研究コミュニティが、理解しやすく、説明責任があり、信頼性の高い AI システムを構築する方法を見つけられるようにすることです。

Gemma Scope が画期的な点は、次のとおりです。

オープン SAE: Gemma 2 2B および 9B のすべての層をカバーする 400 以上の SAE を自由に利用できます。

インタラクティブなデモ: コードを記述せずに、Neuronpedia で SAE の機能を調べ、モデルの動作を分析できます。

使いやすいリポジトリ: SAE と Gemma 2 とのインターフェースのコードおよびサンプルがあります。

Gemma Scope の詳細は、Google DeepMind ブログ、テクニカルレポート、デベロッパー向けドキュメントをご覧ください。

責任ある AI で未来を築く

以上のリリースは、AI によりすべての人に利益をもたらす未来を構築するうえで必要となるツールとリソースを AI コミュニティに提供するという私たちの継続的な取り組みを表しています。私たちは、安全で有益な AI を開発するためには、オープンアクセス、透明性、そしてコラボレーションが不可欠であると考えています。