Gemini 2.5 Flash-Lite sekarang sudah stabil dan tersedia secara umum

22 JULI 2025
Logan Kilpatrick Group Product Manager
Zach Gleicher Product Manager

Hari ini, kami merilis versi stabil Gemini 2.5 Flash-Lite, model tercepat dan termurah ($0,10 input per 1 juta, $0,40 output per 1 juta) dalam keluarga model Gemini 2.5. Kami menciptakan 2.5 Flash-Lite untuk mendorong batas kecerdasan per dolar, dengan kemampuan penalaran native yang dapat diaktifkan secara opsional untuk kasus penggunaan yang lebih berat. Dibangun berdasarkan momentum 2.5 Pro dan 2.5 Flash, model ini melengkapi rangkaian model 2.5 kami yang siap digunakan dalam skala produksi.


Model 2.5 kami yang paling hemat biaya dan tercepat

Comparative table showing capabilities of Gemini 2.5 Flash-Lite, 2.5 Flash, and 2.5 Pro

Gemini 2.5 Flash-Lite memberikan keseimbangan antara performa dan biaya, tanpa mengorbankan kualitas, khususnya untuk tugas yang sensitif terhadap latensi, seperti penerjemahan dan klasifikasi.

Inilah yang membuatnya menonjol:

  • Kecepatan terbaik di kelasnya: Gemini 2.5 Flash-Lite memiliki latensi yang lebih rendah daripada 2.0 Flash-Lite dan 2.0 Flash pada sejumlah besar sampel prompt.

  • Efisiensi biaya: Ini adalah model 2.5 kami yang paling murah, dengan harga token input $0,10 / 1 juta dan token output $0,40, memungkinkan Anda menangani permintaan dalam jumlah besar dengan harga terjangkau. Kami juga menurunkan harga input audio sebesar 40% dari peluncuran pratinjau.

  • Cerdas dan ringan: Model ini menunjukkan kualitas yang lebih tinggi secara keseluruhan daripada 2.0 Flash-Lite di berbagai tolok ukur, termasuk coding, matematika, sains, penalaran, dan pemahaman multimodal.

  • Fitur lengkap: Ketika Anda membangun dengan 2.5 Flash-Lite, Anda mendapatkan akses ke jendela konteks 1 juta token, anggaran pemikiran yang dapat dikontrol, dan dukungan untuk alat native, seperti Grounding dengan Google Penelusuran, Eksekusi Kode, dan Konteks URL.


Gemini 2.5 Flash-Lite beraksi

Sejak peluncuran 2.5 Flash-Lite, kami telah melihat sejumlah deployment yang sangat sukses, berikut adalah beberapa favorit kami:

  • Satlyt sedang membangun platform komputasi ruang angkasa terdesentralisasi yang akan mentransformasi pemrosesan dan pemanfaatan data satelit untuk peringkasan telemetri di orbit secara real-time, manajemen tugas secara otonom, dan penguraian komunikasi antar satelit. Kecepatan 2.5 Flash-Lite memungkinkan pengurangan latensi sebesar 45% untuk diagnostik onboard yang penting dan penurunan konsumsi daya sebesar 30% dibandingkan model dasar.

  • HeyGen menggunakan AI untuk membuat avatar pada konten video dan memanfaatkan Gemini 2.5 Flash-Lite untuk mengotomatiskan perencanaan video, menganalisis serta mengoptimalkan konten, dan menerjemahkan video ke dalam lebih dari 180 bahasa. Ini memungkinkan mereka untuk memberikan pengalaman global yang dipersonalisasi bagi penggunanya.

  • DocsHound mengubah demo produk menjadi dokumentasi dengan menggunakan Gemini 2.5 Flash-Lite untuk memproses video panjang dan mengekstrak ribuan screenshot dengan latensi rendah. Hal ini mentransformasi rekaman menjadi dokumentasi yang komprehensif dan data pelatihan untuk agen AI jauh lebih cepat daripada metode tradisional.

  • Evertune membantu merek memahami bagaimana mereka direpresentasikan di model AI. Gemini 2.5 Flash-Lite adalah pengubah permainan bagi mereka, yang secara dramatis mempercepat analisis dan pembuatan laporan. Performanya yang cepat memungkinkan mereka memindai dan menyintesis output model dalam jumlah besar secara cepat untuk memberikan insight yang dinamis dan tepat waktu kepada klien.


Anda bisa mulai menggunakan 2.5 Flash-Lite dengan menetapkan “gemini-2.5-flash-lite” dalam kode Anda. Jika Anda menggunakan versi pratinjau, Anda dapat beralih ke “gemini-2.5-flash-lite” karena keduanya menggunakan model dasar yang sama. Kami berencana untuk menghapus alias versi pratinjau Flash-Lite pada tanggal 25 Agustus.


Siap untuk mulai membangun? Cobalah versi stabil Gemini 2.5 Flash-Lite sekarang juga di Google AI Studio dan Vertex AI.