245 hasil
17 JULI 2025 / Gemini
Veo 3, Google’s latest AI video generation model, is now available in paid preview via the Gemini API and Google AI Studio. Unveiled at Google I/O 2025, Veo 3 can generate both video and synchronized audio, including dialogue, background sounds, and even animal noises. This model delivers realistic visuals, natural lighting, and physics, with accurate lip syncing and sound that matches on-screen action.
16 JULI 2025 / AI
The `logprobs` feature has been officially introduced in the Gemini API on Vertex AI, provides insight into the model's decision-making by showing probability scores for chosen and alternative tokens. This step-by-step guide will walk you through how to enable and interpret this feature and apply it to powerful use cases such as confident classification, dynamic autocomplete, and quantitative RAG evaluation.
16 JULI 2025 / Cloud
The Marin project aims to expand the definition of 'open' in AI to include the entire scientific process, not just the model itself, by making the complete development journey accessible and reproducible. This effort, powered by the JAX framework and its Levanter tool, allows for deep scrutiny, trust in, and building upon foundation models, fostering a more transparent future for AI research.
16 JULI 2025 / Gemini
The updated Agent Development Kit (ADK) simplifies and accelerates the process of building AI agents by providing the CLI with a deep, cost-effective understanding of the ADK framework, allowing developers to quickly ideate, generate, test, and improve functional agents through conversational prompts, eliminating friction and keeping them in a productive "flow" state.
14 JULI 2025 / Cloud
The Apigee API hub and Developer Portals are distinct but interconnected parts of the Apigee platform that help organizations discover and manage APIs for different personas, unlocking API potential and accelerating innovation.
14 JULI 2025 / Gemini
The Gemini Embedding text model is now generally available in the Gemini API and Vertex AI. This versatile model has consistently ranked #1 on the MTEB Multilingual leaderboard since its experimental launch in March, supports over 100 languages, has a 2048 maximum input token length, and is priced at $0.15 per 1M input tokens.
10 JULI 2025 / Gemini
GenAI Processors adalah library Python open source baru dari Google DeepMind yang dirancang untuk menyederhanakan pengembangan aplikasi AI, terutama yang menangani input multimodal dan membutuhkan respons real-time, dengan menyediakan antarmuka “Processor” yang konsisten untuk semua langkah mulai dari penanganan input hingga panggilan model dan pemrosesan output, untuk rantai dan eksekusi serentak yang lancar.
10 JULI 2025 / Cloud
Update dalam Firebase Studio mencakup mode Agent baru, dukungan dasar untuk Model Context Protocol (MCP), dan integrasi Gemini CLI, semuanya dirancang untuk mendefinisikan ulang pengembangan berbasis AI yang memungkinkan developer membuat aplikasi full-stack dari satu prompt dan mengintegrasikan kemampuan AI yang canggih secara langsung ke dalam alur kerjanya.
9 JULI 2025 / Gemma
T5Gemma adalah keluarga baru model LLM berbasis encoder-decoder yang dikembangkan melalui konversi dan adaptasi model hanya-decoder terlatih yang dibangun di atas framework Gemma 2. Model ini menawarkan performa dan efisiensi yang lebih unggul dibandingkan model hanya-decoder, khususnya untuk tugas yang membutuhkan pemahaman input yang mendalam, seperti peringkasan dan penerjemahan.
7 JULI 2025 / Gemini
Mode batch baru dalam API Gemini didesain untuk beban kerja AI dengan throughput tinggi dan tidak kritis terhadap latensi, menyederhanakan tugas besar dengan menangani penjadwalan dan pemrosesan, dan membuat tugas seperti analisis data, kreasi konten massal, dan evaluasi model menjadi lebih hemat biaya dan skalabel, sehingga developer dapat memproses data bervolume besar secara efisien.