Pada bulan Desember lalu, kami meluncurkan PaliGemma 2, model visi-bahasa yang telah di-upgrade dalam rangkaian produk Gemma. Rilis ini menyertakan checkpoint yang telah dilatih sebelumnya dengan berbagai ukuran (parameter 3B, 10B, dan 28B) yang bisa secara mudah disesuaikan dengan berbagai tugas dan domain visi-bahasa, seperti segmentasi gambar, pemberian teks video pendek, menjawab pertanyaan ilmiah, dan tugas terkait teks dengan performa tinggi.
Sekarang, kami sangat antusias dapat mengumumkan peluncuran checkpoint PaliGemma 2 mix. PaliGemma 2 mix adalah model yang diatur untuk campuran tugas yang memungkinkan Anda secara langsung mengeksplorasi kemampuan model dan menggunakannya secara langsung untuk kasus penggunaan umum.
Jika Anda sudah menggunakan checkpoint PaliGemma mix asli, Anda bisa langsung melakukan upgrade ke PaliGemma 2 tanpa perlu melakukan perubahan apa pun. Model ini melakukan tugas yang berbeda tergantung pada bagaimana permintaannya. Anda bisa meninjau sintaksis tugas prompt yang berbeda dalam dokumentasi resmi dan mempelajari lebih lanjut tentang cara pengembangan PaliGemma 2 dalam laporan teknis kami.
Result:
Result:
Result:
Result:
Result:
Result: beach
Result: a cow standing on a beach next to a sign that says warning dangerous rip current.
Pengenalan Karakter Optik (OCR)
Result:
WARNING
DANGEROUS
RIP CURRENT
Result:
Result:
Result: A cow standing on a beach next to a warning sign.
Result:
WARNING DANGEROUS
RIP CURRENT
Siap menemukan potensi PaliGemma 2? Berikut ini adalah cara menjelajahi kemampuan model campuran:
Meskipun PaliGemma 2 mix memiliki performa yang kuat dalam berbagai tugas, Anda akan mendapatkan hasil terbaik dengan menyesuaikan PaliGemma 2 dalam tugas atau domain Anda sendiri. Untuk mempelajari cara melakukannya, pelajari dokumentasi komprehensif kami, lihat notebook contoh resmi kami untuk Keras dan JAX, atau gunakan contoh Hugging Face Transformers. Kami sangat menantikan kreasi yang akan Anda bangun dengan PaliGemma 2 mix!