Memperkenalkan Gemini 2.5 Flash Image, model gambar termutakhir kami

26 AGU 2025
Alisa Fortin Product Manager
Guillaume Vernade Gemini Developer Advocate
Kat Kampf Product Manager
Ammaar Reshi Product and Design Lead AI Studio

Hari ini, kami sangat antusias untuk memperkenalkan Gemini 2.5 Flash Image (alias nano-banana), model pembuatan dan pengeditan gambar termutakhir kami. Update ini memungkinkan Anda untuk menggabungkan beberapa gambar menjadi satu gambar, menjaga konsistensi karakter untuk mendukung alur cerita yang lebih kaya, membuat transformasi tertarget menggunakan bahasa alami, dan menggunakan pengetahuan dunia Gemini untuk membuat serta mengedit gambar.

Ketika kami pertama kali meluncurkan pembuatan gambar native di Gemini 2.0 Flash pada awal tahun ini, kami mendengar bahwa Anda menyukai latensi rendah, efektivitas biaya, serta kemudahan penggunaan. Namun, Anda juga memberi masukan bahwa kualitas gambar perlu ditingkatkan dan kontrol kreatif harus lebih kuat.

Model ini telah tersedia melalui Gemini API dan Google AI Studio untuk developer, serta Vertex AI untuk perusahaan. Harga Gemini 2.5 Flash Image adalah 30,00 USD per 1 juta token output dengan setiap gambar bernilai 1290 token output (0,039 USD per gambar). Semua modalitas lain, baik input maupun output, mengikuti harga Gemini 2.5 Flash.

Cara kerja Gemini 2.5 Flash Image

Agar proses pembuatan dengan Gemini 2.5 Flash Image menjadi lebih mudah, kami telah melakukan update yang signifikan pada “mode pembuatan” Google AI Studio (dengan lebih banyak update yang akan tersedia). Pada contoh di bawah ini, Anda tidak hanya dapat dengan cepat menguji kemampuan model dengan aplikasi yang didukung AI kustom, tetapi juga dapat melakukan remix atau mewujudkan ide hanya dengan satu prompt. Ketika siap untuk membagikan aplikasi yang telah dibuat, Anda dapat men-deploy langsung dari Google AI Studio atau menyimpan kode ke GitHub.

Coba prompt seperti "Buatkan saya aplikasi pengeditan gambar yang memungkinkan pengguna mengupload gambar dan menerapkan berbagai filter" atau pilih salah satu template preset dan remix, semuanya gratis!


Menjaga konsistensi karakter

Tantangan mendasar dalam pembuatan gambar adalah menjaga tampilan karakter atau objek saat digunakan di beberapa prompt dan pengeditan. Anda kini dapat menghadirkan karakter yang sama ke dalam lingkungan yang berbeda, menampilkan satu produk dari berbagai sudut dengan latar belakang baru, atau membuat aset merek yang konsisten, sambil tetap mempertahankan subjek.

Kami membuat aplikasi template di Google AI Studio (yang dapat Anda sesuaikan dan program dengan mudah) untuk menunjukkan kemampuan model dalam menjaga konsistensi karakter.

(urutan dipersingkat)

Selain menjaga konsistensi karakter, model tersebut juga sangat baik dalam mengikuti template visual. Kami telah melihat developer menjelajahi area seperti kartu listingan real estat, badge karyawan yang seragam, atau mockup produk dinamis untuk seluruh katalog, semuanya dari satu template desain.

gemini-2-5-image-editing-character-consistency

Pengeditan gambar berbasis prompt

Gemini 2.5 Flash Image memungkinkan transformasi tertarget dan pengeditan lokal yang akurat dengan bahasa alami. Misalnya, model dapat mengaburkan latar belakang gambar, menghilangkan noda pada kaus, menghapus seseorang sepenuhnya dari foto, mengubah pose subjek, menambahkan warna pada foto hitam putih, atau apa pun yang dapat Anda bayangkan hanya dengan prompt sederhana.

Untuk menunjukkan cara kerja kemampuan ini, kami membuat aplikasi template pengeditan foto di AI Studio dengan kontrol berbasis UI dan prompt.

gemini-2-5-flash-prompt-based-image-editing

Pengetahuan dunia native

Secara historis, model pembuatan gambar unggul dalam hal gambar dengan estetika tinggi, tetapi tidak memiliki pemahaman semantik yang mendalam tentang dunia nyata. Dengan Gemini 2.5 Flash Image, model tersebut mendapatkan manfaat dari pengetahuan dunia Gemini, yang mengungkap berbagai kasus penggunaan baru.

Untuk menunjukkan hal tersebut, kami membuat aplikasi template di Google AI Studio yang mengubah kanvas sederhana menjadi tutor pendidikan interaktif. Aplikasi ini menunjukkan kemampuan model untuk membaca dan memahami diagram yang digambar tangan, membantu dengan pertanyaan di dunia nyata, serta mengikuti petunjuk pengeditan yang kompleks dalam satu langkah.

(Contoh prompt dan hasil model)

Fusi multigambar

Gemini 2.5 Flash Image dapat memahami dan menggabungkan beberapa gambar input. Anda dapat memasukkan objek ke dalam sebuah adegan, menata ulang ruangan dengan skema warna atau tekstur, serta menggabungkan gambar dengan satu prompt.

Untuk menampilkan fusi multigambar, kami membuat aplikasi template di Google AI Studio yang memungkinkan Anda menarik produk ke dalam adegan baru guna membuat gambar gabungan fotorealistik baru dengan cepat.

(Urutan dipersingkat)

Mulai membuat

Lihat dokumen developer kami untuk mulai membuat dengan Gemini 2.5 Flash Image. Model tersebut saat ini tersedia dalam mode pratinjau melalui Gemini API dan Google AI Studio, tetapi akan stabil dalam beberapa minggu mendatang. Semua aplikasi demo yang kami soroti di sini diprogram di Google AI Studio, sehingga dapat dilakukan remix dan disesuaikan hanya dengan prompt.

OpenRouter.ai telah bermitra dengan kami guna membantu menghadirkan Gemini 2.5 Flash Image untuk lebih dari 3 juta developernya di mana saja saat ini. Model ini adalah model pertama di OpenRouter, dari lebih dari 480 model yang tersedia saat ini, yang dapat menghasilkan gambar.

Kami juga senang dapat bermitra dengan fal.ai, platform developer terkemuka untuk media generatif, guna menyediakan Gemini 2.5 Flash Image bagi komunitas developer yang lebih luas.

Semua gambar yang dibuat atau diedit dengan Gemini 2.5 Flash Image akan menyertakan tanda air digital SynthID yang tidak terlihat, sehingga dapat diidentifikasi sebagai buatan atau editan AI.

from google import genai
from PIL import Image
from io import BytesIO
 
client = genai.Client()
 
prompt = "Create a picture of my cat eating a nano-banana in a fancy restaurant under the gemini constellation"
 
image = Image.open('/path/to/image.png')
 
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt, image],
)
 
for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))   
    image.save("generated_image.png")
Python

Kami secara aktif berupaya meningkatkan rendering teks yang panjang, konsistensi karakter yang lebih andal, dan representasi faktual seperti detail halus dalam gambar. Mohon untuk terus mengirimkan masukan di forum developer kami atau di X.

Kami tidak sabar ingin segera melihat kreasi Anda dengan Gemini 2.5 Flash Image!