Model pembuatan dan pengeditan gambar termutakhir kami yang telah memukau dunia, Gemini 2.5 Flash Image 🍌, kini tersedia secara umum, siap untuk lingkungan produksi, dan dilengkapi dengan fitur baru, seperti rentang rasio aspek yang lebih luas serta kemampuan untuk menentukan output hanya-gambar.
Gemini 2.5 Flash Image memungkinkan pengguna menggabungkan beberapa gambar secara mulus, mempertahankan karakter yang konsisten untuk narasi yang lebih kaya, melakukan pengeditan tertarget dengan bahasa natural, dan memanfaatkan pengetahuan dunia yang ekstensif dari Gemini untuk pembuatan dan modifikasi gambar. Model ini bisa diakses melalui Gemini API di Google AI Studio dan Vertex AI untuk penggunaan perusahaan.
Untuk memperluas kemungkinan kreatif lebih lanjut, model kini mendukung 10 rasio aspek yang berbeda. Hal ini memudahkan pembuatan konten dalam berbagai format, mulai dari lanskap sinematik hingga postingan media sosial vertikal.
Rasio yang didukung meliputi:
Cartwheel memanfaatkan AI untuk melampaui "pengalaman pengguna yang mirip mesin slot" pada banyak generator gambar, memberikan artis kontrol langsung untuk mewujudkan visi kreatif mereka. Setelah berbulan-bulan membangun fitur “Pose Mode” dan menemukan bahwa model lain gagal memberikan hasil yang diinginkan, tim menemukan solusi dalam Gemini 2.5 Flash Image. Dengan menggabungkan alat pemodelan 3D Cartwheel dengan Gemini 2.5 Flash Image, mereka telah menciptakan sistem pembuatan gambar baru dan kuat yang menawarkan kontrol karakter dan konsistensi yang tak tertandingi.
“Model lain tidak bisa merender karakter dari sudut kamera sembarang atau mempertahankan kesesuaian dengan pose tanpa mengorbankan “pengetahuan dunia”. Model Gemini 2.5 Flash Image baru adalah model pertama yang bisa menyediakan keduanya.” - Andrew Carr, Co-founder Cartwheel
Link to Youtube Video (visible only when JS is disabled)
Volley, pembuat Wit's End, game dungeon crawler berbasis AI, menggunakan Gemini 2.5 Flash Image untuk menghasilkan dan mengedit visual dalam sesi—potret karakter, gambar adegan dinamis, komposisi multi-karakter, dan pengeditan iteratif yang cepat dari chat atau suara.
“Model ini menunjukkan kepatuhan aturan termutakhir terhadap panduan estetika sembari mempertahankan latensi di bawah <10 detik, membuka peluang untuk berbagai aplikasi real-time, misalnya memungkinkan pemain memilih gaya dan menyempurnakan output dalam loop multi-giliran.” - James Wilsterman, CTO di Volley
Link to Youtube Video (visible only when JS is disabled)
Sungguh luar biasa melihat kreativitas komunitas beraksi selama hackathon belum lama ini dengan Kaggle dan Cerebral Valley, yang menampilkan ratusan karya yang memperlihatkan kemampuan model dalam berbagai bidang, seperti pendidikan STEM, materi pemasaran, dan augmented reality real-time.
Developer bisa mulai membangun dengan Gemini 2.5 Flash Image hari ini. Lihat dokumen developer dan cookbook untuk panduan mengenai berbagai fitur baru, termasuk rasio aspek yang diperluas dan kemampuan untuk menentukan output hanya-gambar. Model ini tersedia melalui Gemini API dan untuk pengujian di Google AI Studio.
Membangun dengan Gemini 2.5 Flash Image sangatlah mudah dengan “mode build” dari Google AI Studio. Secara instan membuat dan melakukan remix aplikasi khusus berbasis AI dari satu prompt, seperti “Buatkan saya aplikasi pengeditan gambar dengan filter.” Jika sudah siap, terapkan kreasi Anda langsung dari AI Studio atau simpan kodenya ke GitHub—semuanya gratis. Cobalah dan lakukan remix beberapa contoh aplikasi kami:
Gemini 2.5 Flash Image memiliki harga $0,039 per gambar, dengan tarif $30,00 per 1 juta token output. Harga untuk modalitas input dan output lainnya sesuai dengan harga standar Gemini 2.5 Flash.
Berikut ini adalah kode contoh untuk membantu Anda memulai:
from google import genai
from google.genai import types
from PIL import Image
client = genai.Client()
prompt = "Create a photograph of the subject in this image as if they were living in the 1980s. The photograph should capture the distinct fashion, hairstyles, and overall atmosphere of that time period."
image = Image.open('/path/to/image.png')
response = client.models.generate_content(
model="gemini-2.5-flash-image",
contents=[prompt, image],
config=types.GenerateContentConfig(
response_modalities=["IMAGE"],
image_config=types.ImageConfig(
aspect_ratio="16:9",
)
)
)
for part in response.parts:
if part.inline_data is not None:
generated_image = part.as_image()
generated_image.show()
Kami terus terkesima dengan kreativitas komunitas developer. Kami tak sabar ingin segera melihat kreasi Anda yang berikutnya!