Tahun lalu, kami merilis ShieldGemma, rangkaian model pengklasifikasi konten keamanan yang dibangun di atas Gemma 2 dan dirancang untuk mendeteksi konten berbahaya dalam input dan output teks model AI. Pada peluncuran Gemma 3 hari ini, kami sangat senang dapat membangun fondasi AI yang bertanggung jawab dengan mengumumkan ShieldGemma 2.
Link to Youtube Video (visible only when JS is disabled)
ShieldGemma 2, yang dibangun di atas Gemma 3, adalah model parameter 4 miliar (4B) yang memeriksa keamanan gambar sintetis dan natural Anda dibandingkan dengan kategori-kategori utama untuk membantu Anda membangun set data dan model yang kuat. Dengan tambahan pada rangkaian model Gemma ini, peneliti dan developer sekarang bisa dengan mudah meminimalkan risiko konten berbahaya pada model mereka di seluruh area utama yang membahayakan:
Kami merekomendasikan penggunaan ShieldGemma 2 sebagai filter input untuk model bahasa visi, atau sebagai filter output dari sistem pembuatan gambar. ShieldGemma bisa digunakan pada gambar sintetis dan natural.
Tak hanya teks, melatih dan memahami keamanan gambar dalam model multimodal menghadirkan tantangan baru, itulah sebabnya ShieldGemma 2 dibuat untuk merespons berbagai gaya gambar yang beragam dan bernuansa.
Untuk melatih model keamanan gambar yang tangguh, kami menyusun set data pelatihan gambar natural dan sintetis, serta Gemma 3 yang telah disesuaikan dengan instruksi untuk mendemonstrasikan performa yang kuat. Kami membandingkan kebijakan keamanan dengan tolok ukur berikut ini, dan akan merilis laporan teknis yang juga menyertakan tolok ukur pihak ketiga.
Menerapkan model terbuka secara bertanggung jawab bergantung pada upaya seluruh komunitas, dan kami berharap bisa mengeksplorasi cara agar ShieldGemma 2 dapat dikirimkan dalam ukuran yang lebih kecil, di area yang lebih berbahaya, dan diselaraskan dengan taksonomi ML Commons multimodal dalam waktu dekat.
Kami sangat senang dapat terus membangun AI multimodal yang aman dan bertanggung jawab!
Wenjun Zeng, Ryan Mullins, Dana Kurniawan, Yuchi Liu, Mani Malek, Yiwen Song, Dirichi Ike-Njoku, Hamid Palangi, Jindong Gu, Shravan Dheep, Karthik Narashimhan, Tamoghna Saha, Joon Baek, Rick Pereira, Cai Xu, Jingjing Zhou, Aparna Joshi, Will Hawkins