Hari ini kami dengan antusias membagikan berbagai update untuk seluruh keluarga model Gemini 2.5:
Model Gemini 2.5 adalah model pemikiran yang mampu melakukan penalaran sebelum merespons, sehingga menghasilkan performa yang lebih tinggi dan akurasi yang lebih baik. Setiap model memiliki kontrol atas anggaran pemikirannya, memungkinkan developer menentukan kapan dan sejauh mana model akan “berpikir” sebelum menghasilkan respons.
Hari ini, kami memperkenalkan 2.5 Flash-Lite dalam versi pratinjau dengan latensi dan biaya terendah dalam keluarga model 2.5. Model ini dirancang sebagai upgrade hemat biaya dari model Flash 1.5 dan 2.0 sebelumnya. Model ini juga menawarkan performa yang lebih baik di sebagian besar evaluasi, dan waktu yang lebih rendah untuk token pertama sekaligus meraih token yang lebih tinggi per detik dekode. Model ini sangat bagus untuk tugas dengan throughput tinggi seperti klasifikasi atau peringkasan dalam skala besar.
Gemini 2.5 Flash-Lite adalah model penalaran, yang memungkinkan kontrol anggaran pemikiran yang dinamis dengan parameter API. Karena Flash-Lite dioptimalkan untuk biaya dan kecepatan, “pemikiran” dimatikan secara default, tidak seperti model kami yang lain. 2.5 Flash-Lite juga mendukung semua alat native kami seperti Grounding dengan Google Penelusuran, Eksekusi Kode, dan Konteks URL sebagai tambahan untuk panggilan fungsi.
Selama setahun terakhir, tim peneliti kami terus mendorong batas pareto dengan seri model Flash kami. Ketika 2.5 Flash pertama kali diumumkan, kami belum menyelesaikan kemampuan untuk 2.5 Flash-Lite. Kami juga meluncurkan dengan “harga pemikiran” dan “harga tanpa pemikiran”, yang menyebabkan developer kebingungan.
Dengan diluncurkannya versi stabil Gemini 2.5 Flash (yang merupakan versi pratinjau model 05-20 yang sama dengan yang kami sediakan di Google I/O), dan performa 2.5 Flash yang luar biasa, kami memperbarui harga 2.5 Flash:
Meskipun kami berusaha keras untuk mempertahankan harga yang konsisten antara versi pratinjau dan rilis stabil untuk meminimalkan gangguan, ini merupakan penyesuaian khusus yang mencerminkan nilai Flash yang luar biasa, tetap menawarkan biaya-per-kecerdasan terbaik yang tersedia.
Dan dengan Gemini 2.5 Flash-Lite, kami sekarang memiliki opsi biaya yang lebih rendah (dengan atau tanpa pemikiran) untuk kasus penggunaan yang sensitif terhadap biaya dan latensi yang memerlukan kecerdasan model yang lebih sedikit.
Jika Anda menggunakan Gemini 2.5 Flash versi Pratinjau 04-17, harga versi pratinjau saat ini akan tetap berlaku hingga rencana penghentiannya pada tanggal 15 Juli 2025, pada saat itu, endpoint model akan dimatikan. Anda bisa bertransisi ke model “gemini-2.5-flash” yang tersedia secara umum, atau beralih ke versi Pratinjau 2.5 Flash-Lite sebagai opsi dengan biaya yang lebih rendah.
Pertumbuhan dan permintaan terhadap Gemini 2.5 Pro terus menjadi yang paling pesat dibandingkan model kami sebelumnya. Untuk memungkinkan lebih banyak pelanggan membangun solusi produksi menggunakan model ini, kami menetapkan versi 06-05 sebagai versi stabil dari model ini, dengan titik harga batas pareto yang tetap sama seperti sebelumnya.
Kami berharap bahwa kasus-kasus ketika Anda membutuhkan kecerdasan tertinggi dan kemampuan terbaik adalah momen di mana Anda akan melihat Pro bersinar, seperti tugas coding dan agentik. Gemini 2.5 Pro adalah jantung dari banyak alat developer yang paling disukai.
Jika Anda menggunakan 2.5 Pro Pratinjau 05-06, model ini akan tetap tersedia hingga 19 Juni 2025 dan kemudian akan dimatikan. Jika Anda menggunakan 2.5 Pro Pratinjau 06-05, Anda cukup mengupdate string model Anda ke “gemini-2.5-pro”.
Kami sangat menantikan lebih banyak domain yang merasakan manfaat dari kecerdasan 2.5 Pro, dan berharap dapat segera berbagi lebih banyak informasi mengenai penskalaan di luar Pro.