Penelusuran

43 hasil

Hapus filter
  • 15 OKT. 2025 / AI

    Memperkenalkan Veo 3.1 dan kemampuan kreatif baru di Gemini API

    Google merilis Veo 3.1 dan Veo 3.1 Fast, model pembuatan video terbaru, dalam pratinjau berbayar melalui Gemini API. Versi ini menawarkan audio asli yang lebih kaya, kontrol naratif yang lebih besar, dan kemampuan gambar-ke-video yang ditingkatkan. Fitur baru termasuk panduan pembuatan dengan gambar referensi, memperluas video Veo yang sudah ada, dan membuat transisi antar bingkai. Perusahaan seperti Promise Studios, Latitude, dan Whering telah menggunakan Veo 3.1 untuk berbagai aplikasi.

    Veo3.1_16x9_meta
  • 5 SEP. 2025 / Mobile

    Google AI Edge Gallery: Kini dengan Audio dan di Google Play

    Google AI Edge telah memperluas pratinjau Gemma 3n untuk menyertakan dukungan audio. Pengguna bisa mencobanya langsung di ponsel mereka sendiri menggunakan Google AI Edge Gallery, yang sekarang tersedia dalam versi Open Beta di Play Store.

    google-ai-edge-gallery
  • 4 SEP. 2025 / Gemma

    Memperkenalkan EmbeddingGemma: Model Terbuka Terbaik di Kelasnya untuk Sematan di Perangkat

    Memperkenalkan EmbeddingGemma: model sematan baru yang dirancang untuk aplikasi AI yang efisien di perangkat dari Google. Model terbuka ini merupakan model sematan multibahasa khusus teks dengan peringkat tertinggi di bawah parameter 500M pada tolok ukur MTEB, memungkinkan fitur kuat seperti RAG dan penelusuran semantik secara langsung di perangkat seluler tanpa koneksi internet.

    EmbeddingGemma_Metadata
  • 15 AGU 2025 / Google AI Studio

    Pengumuman Imagen 4 Fast dan ketersediaan umum keluarga Imagen 4 di Gemini API

    Google mengumumkan ketersediaan umum Imagen 4, model teks-ke-gambar tercanggihnya, di Gemini API dan Google AI Studio, yang menghadirkan peningkatan signifikan dalam rendering teks. Model baru Imagen 4 Fast, didesain untuk menghasilkan gambar secara cepat dan singkat, kini tersedia bersama Imagen 4 dan Imagen 4 Ultra, dengan Imagen 4 dan Imagen 4 Ultra juga mendukung pembuatan gambar beresolusi hingga 2K.

    Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API
  • 31 JULI 2025 / AI

    Veo 3 Fast dan kemampuan gambar-ke-video yang baru

    Google memperkenalkan Veo 3 Fast, sebuah model yang dioptimalkan untuk kecepatan dan harga, bersama dengan kemampuan gambar-ke-video baru untuk Veo 3 dan Veo 3 Fast, yang memungkinkan developer membuat konten video berkualitas tinggi secara efisien dari teks atau gambar diam, dengan harga yang bervariasi berdasarkan model dan audio yang disertakan, sekarang tersedia di Gemini API.

    Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API
  • 24 JULI 2025 / Google Labs

    Memperkenalkan Opal: deskripsikan, buat, dan bagikan aplikasi mini AI Anda

    Opal adalah alat eksperimental baru dari Google Labs untuk membantu Anda menulis prompt menjadi aplikasi mini multi-langkah yang dinamis menggunakan bahasa natural, tanpa perlu menulis kode. Alat ini memungkinkan pengguna untuk membangun dan menerapkan aplikasi AI yang dapat dibagikan, lengkap dengan fitur yang canggih serta integrasi mulus dengan alat Google yang sudah ada.

    Opal Metadata card
  • 17 JULI 2025 / Gemini

    Dibangun dengan Veo 3, sekarang tersedia di Gemini API

    Veo 3, model pembuatan video AI terbaru dari Google, kini tersedia dalam pratinjau berbayar melalui Gemini API dan Google AI Studio. Diperkenalkan pada Google I/O 2025, Veo 3 bisa menghasilkan video dan audio tersinkronisasi, termasuk dialog, suara latar belakang, dan bahkan suara binatang. Model ini menghadirkan visual yang realistis, pencahayaan alami, dan fisik, dengan sinkronisasi bibir yang akurat dan suara yang sesuai dengan tindakan di layar.

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 14 JULI 2025 / Gemini

    Gemini Embedding sekarang tersedia secara umum di Gemini API

    Model teks Gemini Embedding sekarang tersedia secara umum di Gemini API dan Vertex AI. Model serbaguna ini secara konsisten menduduki peringkat #1 di papan peringkat MTEB Multilingual sejak peluncuran eksperimentalnya pada bulan Maret, mendukung lebih dari 100 bahasa, memiliki panjang token input maksimum 2048, dan dibanderol dengan harga $0,15 per 1 juta token input.

    Gemini Embedding now generally available in the Gemini API
  • 10 JULI 2025 / Cloud

    Memajukan pengembangan AI agentik dengan Firebase Studio

    Update dalam Firebase Studio mencakup mode Agent baru, dukungan dasar untuk Model Context Protocol (MCP), dan integrasi Gemini CLI, semuanya dirancang untuk mendefinisikan ulang pengembangan berbasis AI yang memungkinkan developer membuat aplikasi full-stack dari satu prompt dan mengintegrasikan kemampuan AI yang canggih secara langsung ke dalam alur kerjanya.

    Advancing agentic AI development with Firebase Studio
  • 9 JULI 2025 / Gemma

    T5Gemma: Koleksi model Gemma baru berbasis encoder-decoder

    T5Gemma adalah keluarga baru model LLM berbasis encoder-decoder yang dikembangkan melalui konversi dan adaptasi model hanya-decoder terlatih yang dibangun di atas framework Gemma 2. Model ini menawarkan performa dan efisiensi yang lebih unggul dibandingkan model hanya-decoder, khususnya untuk tugas yang membutuhkan pemahaman input yang mendalam, seperti peringkasan dan penerjemahan.

    T5Gemma: A New Collection of Encoder-Decoder Gemma Models