Imagen 3 hadir di Gemini API

FEB 06, 2025
Ivan Solovyev Product Manager

Developer sekarang bisa mengakses Imagen 3, model pembuatan gambar termutakhir dari Google, melalui Gemini API. Pada tahap awal, model ini akan dapat diakses oleh pengguna berbayar, dengan peluncuran untuk pengguna gratis dalam waktu dekat.

Imagen 3 unggul dalam menghasilkan gambar yang memikat secara visual serta bebas artefak dalam berbagai variasi gaya, dari gambar hiperrealistik hingga lanskap impresionistik, komposisi abstrak hingga karakter anime. Peningkatan prompt following memudahkan konversi ide hebat menjadi gambar berkualitas tinggi. Secara keseluruhan, Imagen 3 menghasilkan performa termutakhir pada beragam tolok ukur. Imagen 3 mencapai hal ini dengan harga $0,03 per gambar pada Gemini API, dengan kontrol atas rasio aspek, jumlah opsi untuk membuat, dan lainnya.

Untuk membantu memerangi misinformasi dan misatribusi, semua gambar yang dibuat oleh Imagen 3 menyertakan tanda air SynthID digital yang tidak terlihat, yang mengidentifikasinya sebagai gambar yang dibuat oleh AI.


Melihat Imagen 3 Beraksi

Galeri di bawah ini menyoroti kemampuan Imagen 3 dalam berbagai gaya.

Imagen 3 generated image of a group of people looking happy, natural light, 8k
Prompt: Sekelompok orang yang terlihat gembira, cahaya natural, 8k
Imagen 3 generated Hyperrealistic portrait of a person dressed in 1920s flapper fashion, vintage style, black and white photograph, elegant pose, 8k
Prompt: Potret hiperrealistik seseorang yang mengenakan busana flapper tahun 1920-an, gaya vintage, foto hitam putih, pose elegan, 8k
Imagen 3 generated image of a close-up of a vintage watch with realistic and detailed mechanism
Prompt: Bayangkan sebuah foto jarak dekat jam tangan antik. Hasilkan penggambaran yang realistis dengan mekanisme mendetail
Imagen 3 generated image of an impressionistic landscape painting of a sunset over a field of sunflowers, vibrant colors, thick brushstrokes, inspired by Monet
Prompt: Lukisan lanskap impresionistik matahari terbenam di atas padang bunga matahari, warna cerah, sapuan kuas tebal, terinspirasi oleh Monet
Imagen 3 generated image of A surreal dreamscape featuring a giant tortoise with a lush forest growing on its back, floating through a starry sky, glowing mushrooms, bioluminescent plants, ethereal atmosphere
Prompt: Pemandangan mimpi surealis yang menampilkan kura-kura raksasa dengan hutan rimbun yang tumbuh di punggungnya, melayang melintasi langit bertabur bintang, jamur yang bercahaya, tanaman bioluminescent, atmosfer yang halus
Imagen 3 generated lifestyle image of freshly roasted coffee beans spilling out of a burlap sack onto a rustic wooden table next to a up of coffee with 'Awaken Your Senses' written on the cup in cursive
Prompt: Gambar gaya hidup biji kopi yang baru dipanggang tumpah dari karung goni ke atas meja kayu tradisional, uap mengepul dari secangkir kopi di dekatnya, 'Awaken Your Senses' tertulis di cangkir dengan format kursif, atmosfer hangat dan mengundang, sinar matahari pagi, fotografi produk
Imagen 3 generated hyperrealistic portrait of a woman with piercing blue eyes, laughing, freckles, dramatic lighting, detailed skin texture, 8k
Prompt: Potret wanita yang sangat realistis dengan mata biru yang tajam, tertawa, berbintik-bintik, pencahayaan dramatis, tekstur kulit mendetail, 8k
Imagen 3 generated panoramic view of a majestic mountain range at dawn
Prompt: Pemandangan panorama pegunungan yang megah saat fajar menyingsing.
Imagen 3 generated scene from a game where the player needs to find a specific object by looking into drawers in a messy desk
Prompt: Tampilkan adegan dari permainan ketika pemain harus menemukan objek tertentu dengan melihat ke dalam laci di meja yang berantakan.
Imagen 3 generated painted cityscape in the style of Van Gogh
Prompt: Lanskap kota yang dilukis dalam gaya Van Gogh, dengan sapuan kuas yang meliuk-liuk dan warna-warna cerah.

Memulai Imagen 3 di Gemini API

Cuplikan kode Python ini menunjukkan cara membuat gambar dengan Imagen 3 menggunakan Gemini API.

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
 
client = genai.Client(api_key='GEMINI_API_KEY')
 
response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='a portrait of a sheepadoodle wearing cape',
    config=types.GenerateImagesConfig(
        number_of_images=1,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

Gambar yang dihasilkan

Imagen 3 generated portrait of a sheepadoodle wearing a cape

Anda bisa menjelajahi lebih banyak saran prompting dan gaya gambar dalam dokumen developer Gemini API, dengan detail lebih lanjut tentang skor, metodologi, dan peningkatan performa dalam Lampiran D laporan teknis terbaru kami.

Kami sangat senang dapat mengambil langkah pertama dalam memperluas ketersediaan model media generatif kami ke dalam Gemini API dan berencana untuk membuatnya lebih banyak tersedia dalam waktu dekat sehingga developer bisa menjembatani media generatif dan model bahasa secara bersamaan.