Gemini Embedding sekarang tersedia secara umum di Gemini API

14 JULI 2025

Min Choi Product Manager Google DeepMind

Janie Zhang

Kami sangat senang bisa mengumumkan bahwa model teks Gemini Embedding pertama kami (gemini-embedding-001) sekarang tersedia secara umum untuk developer di Gemini API dan Vertex AI.

Model sematan ini secara konsisten menduduki posisi teratas di papan peringkat Massive Text Embedding Benchmark (MTEB) Multilingual sejak peluncuran eksperimental pada bulan Maret.

Melampaui model sematan teks kami sebelumnya dan penawaran eksternal dalam beragam tugas, mulai dari pengambilan hingga klasifikasi, gemini-embedding-001 memberikan pengalaman mutakhir terpadu di berbagai domain, termasuk sains, legal, keuangan, dan coding. Berikut adalah perbandingan Gemini Embedding dengan model eksklusif lain yang tersedia secara komersial:

*Model Google lama adalah kombinasi skor tertinggi dari 3 model Gemini API dan VertexAI: text-embedding-004, text-embedding-005, dan text-multilingual-embedding-002

Hasil yang lebih terperinci tersedia dalam laporan teknis kami*.

Detail model

Model yang sangat serbaguna, Gemini Embedding mendukung lebih dari 100 bahasa dan memiliki panjang token input maksimum 2048.

Ia juga memanfaatkan teknik Matryoshka Representation Learning (MRL), yang memungkinkan developer mengurangi dimensi output dari nilai default 3072. Fleksibilitas ini memungkinkan Anda untuk mengoptimalkan performa dan biaya penyimpanan agar sesuai dengan kebutuhan spesifik Anda. Untuk hasil kualitas tertinggi, kami sarankan menggunakan dimensi output 3072, 1536, atau 768.

Batas tarif dan harga

Kami menawarkan level gratis dan berbayar dalam Gemini API, sehingga Anda bisa bereksperimen dengan gemini-embedding-001 tanpa biaya, atau meningkatkannya dengan batas yang jauh lebih tinggi untuk kebutuhan produksi Anda.

Model Gemini Embedding dibanderol dengan harga $0,15 per 1 juta token input.

Mulai membangun dengan Gemini Embedding

Developer kini bisa mengakses model Gemini Embedding (gemini-embedding-001) melalui Gemini API, yang dapat Anda gunakan secara gratis melalui Google AI Studio.

Ini kompatibel dengan endpoint embed_content yang sudah ada.

from google import genai
 
client = genai.Client()
 
result = client.models.embed_content(
        model="gemini-embedding-001",
        contents="What is the meaning of life?"
)
 
print(result.embeddings)

Python

Untuk memulai, lihat dokumentasi dan cookbook developer resmi:

Dokumentasi sematan

Notebook panduan memulai

Jika Anda menggunakan gemini-embedding-exp-03-07 eksperimental, Anda tidak perlu menyematkan kembali konten Anda, tetapi ia tidak didukung lagi oleh Gemini API pada tanggal 14 Agustus 2025. Model lama juga tidak digunakan lagi dalam beberapa bulan mendatang:

embedding-001 pada tanggal 14 Agustus 2025 dan

text-embedding-004 pada tanggal 14 Januari 2026

Kami sangat menyarankan untuk melakukan migrasi project Anda ke model terbaru kami sedini mungkin.

Kami tidak sabar ingin melihat bagaimana Gemini Embedding membuka kasus penggunaan baru yang sebelumnya tidak mungkin dilakukan. Selain itu, kami akan segera memberikan dukungan untuk Gemini Embedding di Batch API, yang memungkinkan pemrosesan data Anda secara asinkron dengan biaya yang lebih rendah.

Nantikan pengumuman mendatang mengenai model sematan dengan modalitas dan kemampuan yang lebih luas!

*_{Hasil tolok ukur MTEB dalam makalah yang dipublikasikan mencerminkan versi eksperimental Gemini Embedding, yang diluncurkan pada Maret 2025.}

Postingan Terkait

Gemini AI Problem-Solving Solutions

What's new in Gemini Code Assist

21 AGU 2025

Gemini AI Announcements

Alat konteks URL untuk Gemini API sekarang tersedia secara umum

18 AGU 2025

Google AI Studio AI Announcements

Pengumuman Imagen 4 Fast dan ketersediaan umum keluarga Imagen 4 di Gemini API

15 AGU 2025