Live API melengkapi developer dengan alat penting untuk membuat aplikasi dan agen cerdas yang mampu memproses streaming audio, video, dan teks dengan latensi yang sangat rendah. Kecepatan ini sangatlah penting untuk menciptakan pengalaman yang benar-benar interaktif, membuka pintu bagi solusi dukungan pelanggan, platform edukasi, dan layanan pemantauan real-time.
Link to Youtube Video (visible only when JS is disabled)
Baru-baru ini kami mengumumkan peluncuran pratinjau Live API untuk model Gemini – sebuah langkah maju signifikan yang memungkinkan developer membangun aplikasi real-time yang kuat dan skalabel. Cobalah fitur terbaru sekarang juga menggunakan Gemini API di Google AI Studio dan Vertex AI.
Sejak peluncuran eksperimental kami pada bulan Desember, kami mendengarkan masukan Anda dengan saksama dan telah memasukkan fitur serta kemampuan baru untuk membuat Live API siap produksi. Temukan detail selengkapnya dalam dokumentasi Live API:
session_resumption
) untuk terhubung kembali dan melanjutkan dari posisi terakhir sesi Anda.GoAway
yang menunjukkan kapan koneksi akan ditutup, memungkinkan penanganan secara mulus sebelum pemutusan dilakukan.activityStart
, activityEnd
) untuk kontrol giliran manual.speechConfig
.usageMetadata
pesan server, dikelompokkan berdasarkan modalitas dan fase respons/prompt.Untuk menginspirasi project Anda yang berikutnya, kami akan menampilkan developer yang sudah memanfaatkan kekuatan Live API dalam aplikasi mereka:
Daily mengintegrasikan dukungan Live API ke dalam Pipecat Open Source SDK untuk Web, Android, iOS, dan C++.
Dengan menggunakan kekuatan Live API, Pipecat Daily menciptakan game tebak kata berbasis suara – Word Wrangler. Uji kemampuan deskripsi Anda dalam game tebak kata klasik berteknologi AI ini dan lihat bagaimana Anda bisa membuatnya sendiri!
LiveKit mengintegrasikan dukungan Live API ke dalam LiveKit Agents. Framework untuk membangun agen AI suara ini menyediakan platform open source sepenuhnya untuk membuat aplikasi agentik sisi server.
"Sebelum Live API, tidak ada LLM lain yang menawarkan antarmuka developer yang dapat secara langsung menyerap video streaming.”
– Russell d’Sa, CEO
Lihat demo ketika mereka membuat kopilot AI yang bisa menjelajahi internet bersama Anda sembari berbagi pemikiran tentang hal-hal yang bisa dilihatnya secara real-time.
Hey Bubba adalah aplikasi AI agentik berbasis suara yang secara khusus dikembangkan untuk pengemudi truk. Memanfaatkan Live API, aplikasi ini memungkinkan komunikasi suara multi-bahasa yang mulus, sehingga pengemudi dapat mengoperasikannya handsfree. Fungsionalitas utamanya meliputi:
Live API mendukung interaksi pengemudi (memanfaatkan panggilan fungsi dan caching konteks untuk kueri, seperti penjemputan di masa mendatang) dan kemampuan Bubba berinteraksi selama panggilan telepon untuk melakukan negosiasi dan pemesanan. Ini menjadikan Hey Bubba sebagai alat AI yang komprehensif untuk sektor pekerjaan terbesar dan paling beragam di AS.
Link to Youtube Video (visible only when JS is disabled)
Live API siap mendukung aplikasi suara real time Anda yang berikutnya, untuk memulai:
Selamat membangun!