24 hasil
18 AGU 2025 / Gemini
Alat Konteks URL Gemini API sekarang tersedia secara umum, memungkinkan developer mendasari prompt dengan konten web, bukan upload manual. Rilis ini memperluas dukungan untuk PDF dan gambar.
15 AGU 2025 / Google AI Studio
Google mengumumkan ketersediaan umum Imagen 4, model teks-ke-gambar tercanggihnya, di Gemini API dan Google AI Studio, yang menghadirkan peningkatan signifikan dalam rendering teks. Model baru Imagen 4 Fast, didesain untuk menghasilkan gambar secara cepat dan singkat, kini tersedia bersama Imagen 4 dan Imagen 4 Ultra, dengan Imagen 4 dan Imagen 4 Ultra juga mendukung pembuatan gambar beresolusi hingga 2K.
31 JULI 2025 / AI
Google memperkenalkan Veo 3 Fast, sebuah model yang dioptimalkan untuk kecepatan dan harga, bersama dengan kemampuan gambar-ke-video baru untuk Veo 3 dan Veo 3 Fast, yang memungkinkan developer membuat konten video berkualitas tinggi secara efisien dari teks atau gambar diam, dengan harga yang bervariasi berdasarkan model dan audio yang disertakan, sekarang tersedia di Gemini API.
30 JULI 2025 / Gemini
LangExtract adalah library Python open source baru berteknologi model Gemini untuk mengekstraksi informasi terstruktur dari teks tidak terstruktur, menawarkan landasan sumber yang tepat, output terstruktur yang andal melalui pembuatan terkontrol, ekstraksi konteks panjang yang dioptimalkan, visualisasi interaktif, serta dukungan backend LLM yang fleksibel.
17 JULI 2025 / Gemini
Veo 3, model pembuatan video AI terbaru dari Google, kini tersedia dalam pratinjau berbayar melalui Gemini API dan Google AI Studio. Diperkenalkan pada Google I/O 2025, Veo 3 bisa menghasilkan video dan audio tersinkronisasi, termasuk dialog, suara latar belakang, dan bahkan suara binatang. Model ini menghadirkan visual yang realistis, pencahayaan alami, dan fisik, dengan sinkronisasi bibir yang akurat dan suara yang sesuai dengan tindakan di layar.
16 JULI 2025 / AI
Fitur `logprobs` telah secara resmi diperkenalkan di Gemini API dalam Vertex AI, memberikan insight tentang pengambilan keputusan model dengan menunjukkan skor probabilitas untuk token terpilih dan alternatif. Panduan langkah demi langkah ini akan memandu Anda mengenai cara mengaktifkan dan menginterpretasikan fitur ini serta menerapkannya pada kasus penggunaan yang kuat, seperti klasifikasi keyakinan, pelengkapan otomatis dinamis, dan evaluasi RAG kuantitatif.
14 JULI 2025 / Gemini
Model teks Gemini Embedding sekarang tersedia secara umum di Gemini API dan Vertex AI. Model serbaguna ini secara konsisten menduduki peringkat #1 di papan peringkat MTEB Multilingual sejak peluncuran eksperimentalnya pada bulan Maret, mendukung lebih dari 100 bahasa, memiliki panjang token input maksimum 2048, dan dibanderol dengan harga $0,15 per 1 juta token input.
10 JULI 2025 / Gemini
GenAI Processors adalah library Python open source baru dari Google DeepMind yang dirancang untuk menyederhanakan pengembangan aplikasi AI, terutama yang menangani input multimodal dan membutuhkan respons real-time, dengan menyediakan antarmuka “Processor” yang konsisten untuk semua langkah mulai dari penanganan input hingga panggilan model dan pemrosesan output, untuk rantai dan eksekusi serentak yang lancar.
7 JULI 2025 / Gemini
Mode batch baru dalam API Gemini didesain untuk beban kerja AI dengan throughput tinggi dan tidak kritis terhadap latensi, menyederhanakan tugas besar dengan menangani penjadwalan dan pemrosesan, dan membuat tugas seperti analisis data, kreasi konten massal, dan evaluasi model menjadi lebih hemat biaya dan skalabel, sehingga developer dapat memproses data bervolume besar secara efisien.
24 JUNI 2025 / Gemini
Gemini 2.5 Pro dan Flash mentransformasi robotika dengan meningkatkan kemampuan coding, penalaran, dan multimodal, termasuk pemahaman spasial. Model-model ini digunakan untuk pemahaman adegan semantik, pembuatan kode untuk kontrol robot, dan membangun aplikasi interaktif dengan Live API, dengan penekanan kuat pada peningkatan keselamatan dan aplikasi komunitas.