Developer sekarang bisa mengakses Imagen 3, model pembuatan gambar termutakhir dari Google, melalui Gemini API. Pada tahap awal, model ini akan dapat diakses oleh pengguna berbayar, dengan peluncuran untuk pengguna gratis dalam waktu dekat.
Imagen 3 unggul dalam menghasilkan gambar yang memikat secara visual serta bebas artefak dalam berbagai variasi gaya, dari gambar hiperrealistik hingga lanskap impresionistik, komposisi abstrak hingga karakter anime. Peningkatan prompt following memudahkan konversi ide hebat menjadi gambar berkualitas tinggi. Secara keseluruhan, Imagen 3 menghasilkan performa termutakhir pada beragam tolok ukur. Imagen 3 mencapai hal ini dengan harga $0,03 per gambar pada Gemini API, dengan kontrol atas rasio aspek, jumlah opsi untuk membuat, dan lainnya.
Untuk membantu memerangi misinformasi dan misatribusi, semua gambar yang dibuat oleh Imagen 3 menyertakan tanda air SynthID digital yang tidak terlihat, yang mengidentifikasinya sebagai gambar yang dibuat oleh AI.
Galeri di bawah ini menyoroti kemampuan Imagen 3 dalam berbagai gaya.
Cuplikan kode Python ini menunjukkan cara membuat gambar dengan Imagen 3 menggunakan Gemini API.
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(
model='imagen-3.0-generate-002',
prompt='a portrait of a sheepadoodle wearing cape',
config=types.GenerateImagesConfig(
number_of_images=1,
)
)
for generated_image in response.generated_images:
image = Image.open(BytesIO(generated_image.image.image_bytes))
image.show()
Gambar yang dihasilkan
Anda bisa menjelajahi lebih banyak saran prompting dan gaya gambar dalam dokumen developer Gemini API, dengan detail lebih lanjut tentang skor, metodologi, dan peningkatan performa dalam Lampiran D laporan teknis terbaru kami.
Kami sangat senang dapat mengambil langkah pertama dalam memperluas ketersediaan model media generatif kami ke dalam Gemini API dan berencana untuk membuatnya lebih banyak tersedia dalam waktu dekat sehingga developer bisa menjembatani media generatif dan model bahasa secara bersamaan.