Kami sangat senang bisa memperkenalkan EmbeddingGemma, model sematan terbuka baru yang memberikan performa terbaik di kelasnya untuk ukurannya. Dirancang khusus untuk AI di perangkat, desain 308 juta parameternya yang sangat efisien memungkinkan Anda membangun aplikasi menggunakan teknik seperti Retrieval Augmented Generation (RAG) dan penelusuran semantik yang berjalan secara langsung di hardware Anda. Model ini memberikan sematan pribadi berkualitas tinggi yang dapat digunakan di mana saja, bahkan tanpa koneksi internet.
Link to Youtube Video (visible only when JS is disabled)
EmbeddingGemma menghasilkan sematan, yang merupakan representasi numerik - dalam kasus ini, teks (seperti kalimat dan dokumen) - dengan mentransformasinya menjadi vektor angka untuk merepresentasikan makna dalam ruang berdimensi tinggi. Semakin baik sematannya, semakin baik pula representasi bahasa, dengan segala nuansa dan kompleksitasnya.
Ketika membangun pipeline RAG, Anda memiliki dua tahap utama: mengambil konteks yang relevan berdasarkan input pengguna dan menghasilkan jawaban berdasarkan konteks tersebut. Untuk melakukan pengambilan, Anda dapat menghasilkan sematan dari prompt pengguna dan menghitung kemiripannya dengan sematan dari semua dokumen di sistem Anda. Ini memungkinkan Anda untuk mendapatkan bagian yang paling relevan dengan kueri pengguna. Kemudian, bagian-bagian ini bisa diteruskan ke model generatif, seperti Gemma 3, bersama dengan kueri pengguna yang asli, untuk menghasilkan jawaban yang relevan secara kontekstual, seperti memahami bahwa Anda membutuhkan nomor tukang kayu untuk membantu memperbaiki papan lantai yang rusak.
Agar pipeline RAG ini efektif, kualitas langkah pengambilan awal sangatlah penting. Sematan yang buruk akan mengambil dokumen yang tidak relevan, sehingga menghasilkan jawaban yang tidak akurat atau tidak masuk akal. Di sinilah performa EmbeddingGemma bersinar, memberikan representasi berkualitas tinggi yang diperlukan untuk mendukung aplikasi di perangkat yang akurat dan andal.
EmbeddingGemma memberikan pemahaman teks terbaik untuk ukurannya, dengan performa yang sangat kuat pada pembuatan sematan multibahasa.
Lihat perbandingan EmbeddingGemma dengan model sematan populer lainnya:
Model parameter 308M terdiri dari sekitar 100M parameter model dan 200M parameter sematan. Model ini dirancang untuk performa dan konsumsi sumber daya minimal.
EmbeddingGemma memberdayakan developer untuk membangun aplikasi di perangkat yang fleksibel dan berfokus pada privasi. Ia menghasilkan sematan dokumen secara langsung pada hardware perangkat, membantu memastikan keamanan data pengguna yang sensitif. Model ini menggunakan tokenizer yang sama dengan Gemma 3n untuk pemrosesan teks, sehingga mengurangi jejak memori dalam aplikasi RAG. Buka kemampuan baru dengan EmbeddingGemma, seperti:
Dan jika contoh ini tidak mencakup semuanya, sesuaikan EmbeddingGemma untuk domain khusus, tugas, atau bahasa tertentu dengan notebook panduan memulai kami.
Tujuan kami adalah menyediakan alat terbaik untuk memenuhi kebutuhan Anda. Dengan peluncuran ini, Anda sekarang memiliki model sematan untuk aplikasi apa pun.
Kami memprioritaskan aksesibilitas EmbeddingGemma sejak hari pertama dan telah bermitra dengan developer untuk mengaktifkan dukungan di berbagai platform dan framework populer. Mulailah membangun hari ini dengan teknologi yang sama yang akan mendukung pengalaman di platform pihak pertama Google seperti Android dengan alat yang biasa Anda gunakan.