22 hasil
31 JULI 2025 / AI
Google memperkenalkan Veo 3 Fast, sebuah model yang dioptimalkan untuk kecepatan dan harga, bersama dengan kemampuan gambar-ke-video baru untuk Veo 3 dan Veo 3 Fast, yang memungkinkan developer membuat konten video berkualitas tinggi secara efisien dari teks atau gambar diam, dengan harga yang bervariasi berdasarkan model dan audio yang disertakan, sekarang tersedia di Gemini API.
30 JULI 2025 / Gemini
LangExtract adalah library Python open source baru berteknologi model Gemini untuk mengekstraksi informasi terstruktur dari teks tidak terstruktur, menawarkan landasan sumber yang tepat, output terstruktur yang andal melalui pembuatan terkontrol, ekstraksi konteks panjang yang dioptimalkan, visualisasi interaktif, serta dukungan backend LLM yang fleksibel.
17 JULI 2025 / Gemini
Veo 3, model pembuatan video AI terbaru dari Google, kini tersedia dalam pratinjau berbayar melalui Gemini API dan Google AI Studio. Diperkenalkan pada Google I/O 2025, Veo 3 bisa menghasilkan video dan audio tersinkronisasi, termasuk dialog, suara latar belakang, dan bahkan suara binatang. Model ini menghadirkan visual yang realistis, pencahayaan alami, dan fisik, dengan sinkronisasi bibir yang akurat dan suara yang sesuai dengan tindakan di layar.
16 JULI 2025 / AI
Fitur `logprobs` telah secara resmi diperkenalkan di Gemini API dalam Vertex AI, memberikan insight tentang pengambilan keputusan model dengan menunjukkan skor probabilitas untuk token terpilih dan alternatif. Panduan langkah demi langkah ini akan memandu Anda mengenai cara mengaktifkan dan menginterpretasikan fitur ini serta menerapkannya pada kasus penggunaan yang kuat, seperti klasifikasi keyakinan, pelengkapan otomatis dinamis, dan evaluasi RAG kuantitatif.
14 JULI 2025 / Gemini
Model teks Gemini Embedding sekarang tersedia secara umum di Gemini API dan Vertex AI. Model serbaguna ini secara konsisten menduduki peringkat #1 di papan peringkat MTEB Multilingual sejak peluncuran eksperimentalnya pada bulan Maret, mendukung lebih dari 100 bahasa, memiliki panjang token input maksimum 2048, dan dibanderol dengan harga $0,15 per 1 juta token input.
10 JULI 2025 / Gemini
GenAI Processors adalah library Python open source baru dari Google DeepMind yang dirancang untuk menyederhanakan pengembangan aplikasi AI, terutama yang menangani input multimodal dan membutuhkan respons real-time, dengan menyediakan antarmuka “Processor” yang konsisten untuk semua langkah mulai dari penanganan input hingga panggilan model dan pemrosesan output, untuk rantai dan eksekusi serentak yang lancar.
7 JULI 2025 / Gemini
Mode batch baru dalam API Gemini didesain untuk beban kerja AI dengan throughput tinggi dan tidak kritis terhadap latensi, menyederhanakan tugas besar dengan menangani penjadwalan dan pemrosesan, dan membuat tugas seperti analisis data, kreasi konten massal, dan evaluasi model menjadi lebih hemat biaya dan skalabel, sehingga developer dapat memproses data bervolume besar secara efisien.
24 JUNI 2025 / Gemini
Gemini 2.5 Pro dan Flash mentransformasi robotika dengan meningkatkan kemampuan coding, penalaran, dan multimodal, termasuk pemahaman spasial. Model-model ini digunakan untuk pemahaman adegan semantik, pembuatan kode untuk kontrol robot, dan membangun aplikasi interaktif dengan Live API, dengan penekanan kuat pada peningkatan keselamatan dan aplikasi komunitas.
24 JUNI 2025 / Gemini
Imagen 4, model teks-ke-gambar canggih dari Google, sekarang tersedia dalam pratinjau berbayar melalui Gemini API dan Google AI Studio, menawarkan peningkatan kualitas yang signifikan, khususnya untuk pembuatan teks di dalam gambar. Keluarga Imagen 4 mencakup Imagen 4 untuk tugas umum dan Imagen 4 Ultra yang dirancang untuk kepatuhan tinggi terhadap prompt, dengan seluruh gambar yang dihasilkan dilengkapi tanda air SynthID yang tidak terlihat.
28 MEI 2025 / Gemini
Project Magic Mirror memanfaatkan Gemini API, termasuk Live API, Function Calling, dan Grounding dengan menggunakan Google Penelusuran, untuk menciptakan pengalaman interaktif dan dinamis, menunjukkan kemampuan model Gemini dalam menghasilkan visual, merangkai cerita, dan menyediakan informasi real-time melalui objek yang familier.