151 hasil
17 JULI 2025 / Gemini
Veo 3, Google’s latest AI video generation model, is now available in paid preview via the Gemini API and Google AI Studio. Unveiled at Google I/O 2025, Veo 3 can generate both video and synchronized audio, including dialogue, background sounds, and even animal noises. This model delivers realistic visuals, natural lighting, and physics, with accurate lip syncing and sound that matches on-screen action.
16 JULI 2025 / Gemini
The updated Agent Development Kit (ADK) simplifies and accelerates the process of building AI agents by providing the CLI with a deep, cost-effective understanding of the ADK framework, allowing developers to quickly ideate, generate, test, and improve functional agents through conversational prompts, eliminating friction and keeping them in a productive "flow" state.
14 JULI 2025 / Gemini
The Gemini Embedding text model is now generally available in the Gemini API and Vertex AI. This versatile model has consistently ranked #1 on the MTEB Multilingual leaderboard since its experimental launch in March, supports over 100 languages, has a 2048 maximum input token length, and is priced at $0.15 per 1M input tokens.
10 JULI 2025 / Cloud
Update dalam Firebase Studio mencakup mode Agent baru, dukungan dasar untuk Model Context Protocol (MCP), dan integrasi Gemini CLI, semuanya dirancang untuk mendefinisikan ulang pengembangan berbasis AI yang memungkinkan developer membuat aplikasi full-stack dari satu prompt dan mengintegrasikan kemampuan AI yang canggih secara langsung ke dalam alur kerjanya.
9 JULI 2025 / Gemma
T5Gemma adalah keluarga baru model LLM berbasis encoder-decoder yang dikembangkan melalui konversi dan adaptasi model hanya-decoder terlatih yang dibangun di atas framework Gemma 2. Model ini menawarkan performa dan efisiensi yang lebih unggul dibandingkan model hanya-decoder, khususnya untuk tugas yang membutuhkan pemahaman input yang mendalam, seperti peringkasan dan penerjemahan.
7 JULI 2025 / Gemini
Mode batch baru dalam API Gemini didesain untuk beban kerja AI dengan throughput tinggi dan tidak kritis terhadap latensi, menyederhanakan tugas besar dengan menangani penjadwalan dan pemrosesan, dan membuat tugas seperti analisis data, kreasi konten massal, dan evaluasi model menjadi lebih hemat biaya dan skalabel, sehingga developer dapat memproses data bervolume besar secara efisien.
26 JUNI 2025 / Gemma
Model Gemma 3n telah sepenuhnya dirilis, melanjutkan kesuksesan model Gemma sebelumnya dan menghadirkan kemampuan multimodal canggih langsung di perangkat edge dengan performa luar biasa. Jelajahi inovasi Gemma 3n, termasuk arsitektur yang mengutamakan seluler, teknologi MatFormer, Per-Layer Embeddings, KV Cache Sharing, dan audio serta enkoder visi MobileNet-V5 yang baru, dan pelajari bagaimana developer bisa mulai membangun dengan Gemma 3n sekarang juga.
26 JUNI 2025 / AI
Google telah merilis library klien Python terbaru untuk Data Commons – sebuah grafik pengetahuan open source yang menyatukan data statistik publik, dan meningkatkan kemampuan developer data untuk memanfaatkan Data Commons dengan menawarkan fitur yang lebih baik, dukungan untuk instance khusus, dan akses yang lebih mudah ke beragam variabel statistik – yang dikembangkan dengan kontribusi dari The ONE Campaign.
24 JUNI 2025 / Gemini
Google Colab pertama berbasis AI yang baru meningkatkan produktivitas dengan peningkatan yang didukung sejumlah fitur, seperti kueri iteratif untuk coding percakapan, Data Science Agent generasi berikutnya untuk alur kerja otonom, dan transformasi kode yang mudah. Pengguna awal melaporkan peningkatan produktivitas yang dramatis, percepatan project ML, proses debug kode yang lebih cepat, dan dengan mudah membuat visualisasi berkualitas tinggi.
24 JUNI 2025 / Gemini
Imagen 4, model teks-ke-gambar canggih dari Google, sekarang tersedia dalam pratinjau berbayar melalui Gemini API dan Google AI Studio, menawarkan peningkatan kualitas yang signifikan, khususnya untuk pembuatan teks di dalam gambar. Keluarga Imagen 4 mencakup Imagen 4 untuk tugas umum dan Imagen 4 Ultra yang dirancang untuk kepatuhan tinggi terhadap prompt, dengan seluruh gambar yang dihasilkan dilengkapi tanda air SynthID yang tidak terlihat.