Kami sangat senang bisa mengumumkan bahwa model teks Gemini Embedding pertama kami (gemini-embedding-001
) sekarang tersedia secara umum untuk developer di Gemini API dan Vertex AI.
Model sematan ini secara konsisten menduduki posisi teratas di papan peringkat Massive Text Embedding Benchmark (MTEB) Multilingual sejak peluncuran eksperimental pada bulan Maret.
Melampaui model sematan teks kami sebelumnya dan penawaran eksternal dalam beragam tugas, mulai dari pengambilan hingga klasifikasi, gemini-embedding-001
memberikan pengalaman mutakhir terpadu di berbagai domain, termasuk sains, legal, keuangan, dan coding. Berikut adalah perbandingan Gemini Embedding dengan model eksklusif lain yang tersedia secara komersial:
Hasil yang lebih terperinci tersedia dalam laporan teknis kami*.
Model yang sangat serbaguna, Gemini Embedding mendukung lebih dari 100 bahasa dan memiliki panjang token input maksimum 2048.
Ia juga memanfaatkan teknik Matryoshka Representation Learning (MRL), yang memungkinkan developer mengurangi dimensi output dari nilai default 3072. Fleksibilitas ini memungkinkan Anda untuk mengoptimalkan performa dan biaya penyimpanan agar sesuai dengan kebutuhan spesifik Anda. Untuk hasil kualitas tertinggi, kami sarankan menggunakan dimensi output 3072, 1536, atau 768.
Kami menawarkan level gratis dan berbayar dalam Gemini API, sehingga Anda bisa bereksperimen dengan gemini-embedding-001
tanpa biaya, atau meningkatkannya dengan batas yang jauh lebih tinggi untuk kebutuhan produksi Anda.
Model Gemini Embedding dibanderol dengan harga $0,15 per 1 juta token input.
Developer kini bisa mengakses model Gemini Embedding (gemini-embedding-001
) melalui Gemini API, yang dapat Anda gunakan secara gratis melalui Google AI Studio.
Ini kompatibel dengan endpoint embed_content yang sudah ada.
from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)
Untuk memulai, lihat dokumentasi dan cookbook developer resmi:
Jika Anda menggunakan gemini-embedding-exp-03-07 eksperimental, Anda tidak perlu menyematkan kembali konten Anda, tetapi ia tidak didukung lagi oleh Gemini API pada tanggal 14 Agustus 2025. Model lama juga tidak digunakan lagi dalam beberapa bulan mendatang:
Kami sangat menyarankan untuk melakukan migrasi project Anda ke model terbaru kami sedini mungkin.
Kami tidak sabar ingin melihat bagaimana Gemini Embedding membuka kasus penggunaan baru yang sebelumnya tidak mungkin dilakukan. Selain itu, kami akan segera memberikan dukungan untuk Gemini Embedding di Batch API, yang memungkinkan pemrosesan data Anda secara asinkron dengan biaya yang lebih rendah.
Nantikan pengumuman mendatang mengenai model sematan dengan modalitas dan kemampuan yang lebih luas!
*Hasil tolok ukur MTEB dalam makalah yang dipublikasikan mencerminkan versi eksperimental Gemini Embedding, yang diluncurkan pada Maret 2025.