Terus menghadirkan model terbaru kami kepada Anda, dengan rilis Gemini 2.5 Flash dan Flash-Lite yang disempurnakan

25 SEP. 2025
Shrestha Basu Mallick Product Google DeepMind
Sid Lall Product Google DeepMind
Zach Gleicher Product Google DeepMind
Kate Olszewska Product Google DeepMind

Hari ini, kami merilis versi terbaru Gemini 2.5 Flash dan 2.5 Flash-Lite, tersedia di Google AI Studio dan Vertex AI, yang bertujuan untuk terus memberikan kualitas yang lebih baik sekaligus meningkatkan efisiensi.

Intelligence vs End-to-End response time
Peningkatan kualitas dan kecepatan untuk model pratinjau Gemini 2.5 Flash dan 2.5 Flash-Lite dibandingkan model stabil saat ini
Output token efficiency
Pengurangan 50% token output (karena biaya) untuk Gemini 2.5 Flash-Lite dan pengurangan 24% untuk Gemini 2.5 Flash

Gemini 2.5 Flash-Lite terupdate

Versi terbaru Gemini 2.5 Flash-Lite dilatih dan dibangun berdasarkan tiga tema utama:

  • Lebih baik dalam mengikuti petunjuk: Model ini secara signifikan lebih unggul dalam mengikuti petunjuk dan prompt sistem yang kompleks.

  • Pengurangan banyaknya pembacaan: Model kini menghasilkan jawaban yang lebih ringkas, sebuah faktor utama dalam mengurangi biaya token dan latensi untuk aplikasi dengan throughput tinggi (lihat bagan di atas).

  • Kemampuan multimodal & terjemahan yang lebih kuat: Update ini memberikan fitur transkripsi audio yang lebih akurat, pemahaman gambar yang lebih baik, dan peningkatan kualitas terjemahan.


Anda bisa mulai menguji versi ini sekarang juga dengan menggunakan string model berikut ini: gemini-2.5-flash-lite-preview-09-2025.


Gemini 2.5 Flash terupdate

Model 2.5 Flash terbaru ini hadir dengan peningkatan pada dua area utama yang secara konsisten kami dengar masukannya:

  • Penggunaan alat agentik yang lebih baik: Kami telah meningkatkan cara model ini menggunakan alat, sehingga menghasilkan performa yang lebih unggul dalam aplikasi yang lebih kompleks, agentik, dan multi-langkah. Model ini menunjukkan peningkatan nyata pada tolok ukur agentik utama, termasuk peningkatan 5% pada SWE-Bench Verified, dibandingkan rilis terakhir kami (48,9% → 54%).

  • Lebih efisien: Dengan mengaktifkan pemikiran, sekarang model ini secara signifikan lebih hemat biaya—menghasilkan output dengan kualitas lebih tinggi sembari menggunakan lebih sedikit token, mengurangi latensi dan biaya (lihat bagan di atas).

Kami sudah melihat masukan positif dari penguji awal. Seperti yang dikatakan Yichao ‘Peak’ Ji, Co-Founder & Chief Scientist di Manus, agen AI otonom: "Model Gemini 2.5 Flash baru menawarkan perpaduan yang luar biasa antara kecepatan dan kecerdasan. Evaluasi kami pada tolok ukur internal mengungkapkan lompatan performa sebesar 15% untuk tugas agentik jangka panjang. Efisiensi biayanya yang luar biasa memungkinkan Manus meningkatkan skala ke level yang belum pernah terjadi sebelumnya—memajukan misi kami untuk Memperluas Jangkauan Manusia."

Anda bisa mulai menguji versi pratinjau ini sekarang juga dengan menggunakan string model berikut ini: gemini-2.5-flash-preview-09-2025.


Mulai membangun dengan Gemini

Selama setahun terakhir, kami telah mempelajari bahwa mengirimkan versi pratinjau model kami memungkinkan Anda menguji peningkatan dan inovasi terbaru, memberikan masukan, dan membangun pengalaman siap produksi dengan kemampuan terbaik Gemini. Rilis hari ini tidak dimaksudkan untuk beralih ke versi stabil baru, tetapi akan membantu kami merancang rilis stabil di masa mendatang, dan memungkinkan kami untuk terus melakukan iterasi serta menghadirkan produk terbaik dari Gemini untuk Anda.

Untuk semakin memudahkan akses ke model terbaru kami sekaligus mengurangi kebutuhan untuk melacak nama string model yang panjang, kami juga memperkenalkan alias -latest untuk setiap keluarga model. Alias ini selalu menunjuk ke versi model terbaru kami, sehingga Anda bisa bereksperimen dengan fitur baru tanpa harus mengupdate kode untuk setiap rilis. Anda dapat mengakses pratinjau baru menggunakan:

  • gemini-flash-latest

  • gemini-flash-lite-latest


Untuk memastikan Anda memiliki waktu untuk menguji model baru, kami akan selalu memberikan pemberitahuan 2 minggu (melalui email) sebelum kami melakukan update atau tidak lagi menggunakan versi tertentu di belakang -latest. Ini hanyalah alias model sehingga batas kecepatan, biaya, dan fitur yang tersedia mungkin berbeda antar rilis.

Untuk aplikasi yang membutuhkan kestabilan lebih, lanjutkan menggunakan gemini-2.5-flash dan gemini-2.5-flash-lite.

Kami terus mendorong batas tertinggi kemampuan Gemini dan rilis ini hanyalah langkah lain menuju ke sana. Kami akan membagikan lebih banyak informasi dalam waktu dekat, tetapi sementara itu, selamat membangun!