Lebih Kecil, Lebih Aman, Lebih Transparan: Mengembangkan AI yang Bertanggung Jawab dengan Gemma

JUL 31, 2024
Neel Nanda Research Engineer
Tom Lieberum Research Engineer
Ludovic Peran Product Manager
Kathleen Kenealy Research Engineer

Pada bulan Juni, kami merilis Gemma 2, model terbuka yang terbaru dan terbaik di kelasnya, dengan ukuran parameter 27 miliar (27B) dan 9 miliar (9B). Sejak debutnya, model 27B dengan cepat menjadi salah satu model terbuka dengan peringkat tertinggi di papan peringkat LMSYS Chatbot Arena, bahkan mengungguli model populer yang berukuran lebih dari dua kali lipat dalam percakapan yang sesungguhnya.

Namun, Gemma bukan sekadar performa. Gemma dibangun di atas fondasi AI yang bertanggung jawab, yang memprioritaskan keamanan dan aksesibilitas. Untuk mendukung komitmen ini, kami sangat gembira bisa mengumumkan tiga tambahan baru untuk keluarga Gemma 2:

  1. Gemma 2 2B – versi terbaru dari model parameter 2 miliar (2B) kami yang populer, yang menawarkan peningkatan keamanan bawaan dan keseimbangan performa yang kuat serta efisiensi.

2. ShieldGemma – rangkaian model pengklasifikasi konten keamanan, yang dibangun di atas Gemma 2, untuk memfilter input dan output model AI serta menjaga keamanan pengguna.

3. Gemma Scope – alat interpretabilitas model baru yang menawarkan insight tak tertandingi ke dalam cara kerja internal model kami.

Dengan tambahan ini, peneliti dan developer kini bisa menciptakan pengalaman pelanggan yang lebih aman, mendapatkan insight yang belum pernah ada sebelumnya mengenai model kami, dan dengan percaya diri men-deploy AI yang efektif secara bertanggung jawab, langsung di perangkat, sehingga membuka kemungkinan inovasi baru.


Gemma 2 2B: Rasakan Performa Generasi Berikutnya, Sekarang di Perangkat

Kami sangat senang bisa memperkenalkan Model Gemma 2 2B, tambahan yang sangat dinanti-nantikan untuk keluarga Gemma 2. Model ringan ini menghasilkan hasil yang sangat besar dengan belajar dari model yang lebih besar melalui distilasi. Faktanya, Gemma 2 2B melampaui semua model GPT-3.5 di Chatbot Arena, yang menunjukkan kemampuan AI percakapannya yang luar biasa.

Graph - LYMSYS Chatbot Arena leaderboard scores
Skor papan peringkat LMSYS Chatbot Arena yang diambil pada tanggal 30 Juli 2024. Skor Gemma 2 2B +/- 10.

Gemma 2 2B menawarkan:

  • Performa yang luar biasa: Menghadirkan performa terbaik di kelasnya untuk ukurannya, mengungguli model terbuka lain dalam kategorinya.

  • Deployment yang fleksibel dan hemat biaya: Jalankan Gemma 2 2B secara efisien di berbagai hardware—mulai dari perangkat edge dan laptop hingga deployment cloud yang tangguh dengan Vertex AI dan Google Kubernetes Engine (GKE). Untuk semakin meningkatkan kecepatannya, Gemma 2 2B dioptimalkan dengan library NVIDIA TensorRT-LLM dan tersedia sebagai NVIDIA NIM. Pengoptimalan ini menargetkan berbagai deployment, termasuk pusat data, cloud, workstation lokal, PC, dan perangkat edge — menggunakan GPU NVIDIA RTX, NVIDIA GeForce RTX, atau modul NVIDIA Jetson untuk edge AI. Selain itu, Gemma 2 2B terintegrasi secara mulus dengan Keras, JAX, Hugging Face, NVIDIA NeMo, Ollama, Gemma.cpp, dan dalam waktu dekat MediaPipe untuk pengembangan yang efisien.

Mulai hari ini, Anda bisa mendownload bobot model Gemma 2 dari Kaggle, Hugging Face, Vertex AI Model Garden. Anda juga dapat mencoba kemampuannya di Google AI Studio.


ShieldGemma: Melindungi Pengguna dengan Pengklasifikasi Keamanan Tercanggih

Men-deploy model terbuka secara bertanggung jawab untuk memastikan output AI yang menarik, aman, dan inklusif membutuhkan upaya yang signifikan dari developer serta peneliti. Untuk membantu developer dalam proses ini, kami memperkenalkan ShieldGemma, rangkaian pengklasifikasi keamanan tercanggih yang dirancang untuk mendeteksi dan memitigasi konten berbahaya pada input dan output model AI. ShieldGemma secara khusus menargetkan empat area utama yang berbahaya:

  • Ujaran kebencian

  • Pelecehan

  • Konten seksual yang vulgar

  • Konten berbahaya

Generative AI application model architecture

Pengklasifikasi terbuka ini melengkapi rangkaian pengklasifikasi keamanan di Responsible AI Toolkit, yang mencakup metodologi untuk membuat pengklasifikasi yang disesuaikan berdasarkan kebijakan tertentu dengan jumlah titik data yang terbatas, serta pengklasifikasi siap pakai di Google Cloud yang tersedia melalui API.


Berikut adalah cara ShieldGemma bisa membantu Anda membuat aplikasi AI yang lebih aman dan baik:

  • Performa SOTA: Dibangun di atas Gemma 2, ShieldGemma adalah pengklasifikasi keamanan terbaik dalam industri ini.

  • Ukuran yang fleksibel: ShieldGemma menawarkan berbagai ukuran model untuk memenuhi beragam kebutuhan. Model 2B sangat ideal untuk tugas klasifikasi online, sedangkan versi 9B dan 27B memberikan performa yang lebih tinggi untuk aplikasi offline dengan latensi yang tidak terlalu menjadi perhatian. Semua ukuran memanfaatkan pengoptimalan kecepatan NVIDIA untuk performa yang efisien di berbagai hardware.

  • Terbuka dan kolaboratif: Sifat terbuka ShieldGemma mendorong transparansi dan kolaborasi dalam komunitas AI, yang berkontribusi pada masa depan standar keamanan industri ML.


"Seiring dengan semakin matangnya AI, seluruh industri perlu berinvestasi untuk mengembangkan evaluator keamanan berkinerja tinggi. Kami bersyukur Google melakukan investasi ini, dan menantikan keterlibatan mereka yang berkelanjutan dalam Kelompok Kerja Keamanan AI kami." ~ Rebecca Weiss, Executive Director, ML Commons
Evaluation results based on Optimal F1(left)/AU-PRC(right), higher is better.
Hasil evaluasi berdasarkan Optimal F1 (kiri)/AU-PRC (kanan), lebih tinggi lebih baik. Kami menggunakan 𝛼=0 Dan T = 1 untuk menghitung probabilitas. ShieldGemma (SG) Prompt dan SG Response adalah set data pengujian kami dan OpenAI Mod/ToxicChat adalah tolok ukur eksternal. Performa model dasar pada set data eksternal bersumber dari Ghosh et al. (2024); Inan et al. (2023).

Pelajari lebih lanjut tentang ShieldGemma, lihat hasil lengkapnya dalam laporan teknis, dan mulailah membangun aplikasi AI yang lebih aman dengan Responsible Generative AI Toolkit kami yang komprehensif.


Gemma Scope: Menerangi Pengambilan Keputusan AI dengan Open Sparse Autoencoders

Gemma Scope menawarkan transparansi yang belum pernah ada sebelumnya kepada peneliti dan developer dalam proses pengambilan keputusan model Gemma 2 kami. Bertindak seperti mikroskop yang kuat, Gemma Scope menggunakan sparse autoencoders (SAE) untuk memperbesar titik tertentu di dalam model dan membuat cara kerjanya lebih mudah diinterpretasikan.

SAE ini adalah neural network khusus yang membantu kita mengurai informasi yang padat dan rumit yang diproses oleh Gemma 2, meluaskannya ke dalam bentuk yang lebih mudah dianalisis dan dipahami. Dengan mempelajari tampilan yang diperluas ini, para peneliti dapat memperoleh insight yang berharga tentang bagaimana Gemma 2 mengidentifikasi pola, memproses informasi, dan pada akhirnya membuat prediksi. Dengan Gemma Scope, kami bertujuan membantu komunitas peneliti AI menemukan cara membangun sistem AI yang lebih mudah dipahami, dapat dipertanggungjawabkan, dan andal.

Inilah yang membuat Gemma Scope menjadi terobosan baru:

  • Demo interaktif: Jelajahi fitur SAE dan analisis perilaku model tanpa harus menulis kode di Neuronpedia.

  • Repositori yang mudah digunakan: Kode dan contoh untuk berinteraksi dengan SAE dan Gemma 2.

Pelajari lebih lanjut tentang Gemma Scope di Blog Google DeepMind, laporan teknis, dan dokumentasi developer.


Masa Depan yang Dibangun dengan AI yang Bertanggung Jawab

Rilis ini menunjukkan komitmen berkelanjutan kami untuk menyediakan alat dan sumber daya yang dibutuhkan komunitas AI untuk membangun masa depan di mana AI bermanfaat bagi semua orang. Kami percaya bahwa akses terbuka, transparansi, dan kolaborasi sangatlah penting untuk mengembangkan AI yang aman dan memberikan manfaat.


Mulai Sekarang:

  • Jelajahi ShieldGemma dan bangun aplikasi AI yang lebih aman.

  • Coba Gemma Scope di Neuronpedia dan temukan cara kerja internal Gemma 2.

Bergabunglah bersama kami dalam perjalanan menarik menuju masa depan AI yang lebih bertanggung jawab dan bermanfaat!