Menjelajahi Magic Mirror: pengalaman interaktif yang didukung model Gemini

28 MEI 2025

Paul Ruiz Senior Developer Relations Engineer

Bayangkan menatap cermin dan melihat bukan hanya bayangan Anda, tetapi juga pintu gerbang menuju informasi, kreativitas, dan sentuhan ajaib. Inilah yang diwujudkan oleh project Magic Mirror yang didukung oleh Gemini. Tidak hanya sekadar tampilan sederhana, project ini menampilkan kemampuan interaktif Gemini API dan JavaScript GenAI SDK yang luar biasa, mentransformasi objek yang familier menjadi antarmuka chat baru.

Link to Youtube Video (visible only when JS is disabled)

Project ini menciptakan pengalaman interaktif menggunakan beberapa fitur Gemini API:

1: Percakapan Real-Time yang Mengalir dengan Live API

Fondasi interaktivitas cermin ajaib adalah Live API. Ini memungkinkan interaksi suara real-time yang berkelanjutan. Anda berbicara, dan cermin tidak hanya mendengarkan satu perintah saja, ia terlibat dalam percakapan yang mengalir dengan memproses ucapan saat Anda berbicara, memungkinkan dialog bolak-balik yang lebih natural baik dalam teks maupun audio.

Selain itu, Live API dapat mengenali saat Anda berbicara selama pemutaran dan menafsirkan interupsi tersebut untuk menyesuaikan narasi dan percakapan berdasarkan input Anda, sehingga memungkinkan percakapan audio yang dinamis bersamaan dengan teks.

Link to Youtube Video (visible only when JS is disabled)

2: Pendongeng yang memesona

Selain dapat melakukan percakapan melalui Live API, magic mirror juga dapat disesuaikan untuk mengarang cerita, semuanya berkat kemampuan generasi lanjutan model Gemini dengan menyediakan petunjuk sistem khusus dan mengupdate konfigurasi ucapan selama inisialisasi untuk menyertakan dialek atau aksen yang berbeda, suara, dan berbagai atribut lainnya.

Link to Youtube Video (visible only when JS is disabled)

3: Informasi instan: grounding dengan menggunakan Google Penelusuran

Meskipun percakapan dan cerita memang menarik, terkadang Anda ingin mengetahui dunia di sekitar Anda secara langsung saat itu terjadi. Project magic mirror ini memanfaatkan kemampuan model untuk berintegrasi dengan Grounding menggunakan Google Penelusuran, memberikan informasi terkini serta berdasar.

Link to Youtube Video (visible only when JS is disabled)

4: Keajaiban visual: pembuatan gambar berdasarkan perintah

Menggunakan Function Calling dengan Gemini API, magic mirror dapat menghasilkan visual berdasarkan deskripsi Anda, menambah kedalaman cerita dan memperdalam pengalaman berinteraksi dengan model Gemini. Model Gemini menentukan bahwa permintaan Anda memerlukan pembuatan gambar dan memanggil fungsi yang telah ditentukan sebelumnya berdasarkan karakteristik yang dinyatakan, meneruskan perintah terperinci yang berasal dari kata yang Anda ucapkan.

Link to Youtube Video (visible only when JS is disabled)

Keajaiban di balik tirai

Meskipun pengalaman pengguna dimaksudkan untuk menyembunyikan detail teknis, tetapi sejumlah fitur canggih dari model Gemini bekerja bersama untuk menciptakan pengalaman ajaib ini:

Live API: Mesin untuk streaming audio dan percakapan dua arah secara real-time.

Function Calling: Memampukan model Gemini untuk berinteraksi dengan alat dan layanan eksternal yang tersedia untuk publik (seperti pembuatan gambar atau tindakan khusus) berdasarkan percakapan.

Grounding dengan menggunakan Google Penelusuran: Memastikan akses ke informasi faktual secara real-time.

Petunjuk sistem: Membentuk nada suara dan gaya percakapan AI.

Konfigurasi ucapan: Menyesuaikan suara dan bahasa respons AI.

Kontrol modalitas: Memungkinkan Gemini API merespons dalam teks, audio, atau menyiapkan output lainnya.

Melampaui refleksi: masa depan adalah interaktif

Magic Mirror berbasis Gemini ini bukan hanya sekadar inovasi baru; ini adalah demonstrasi yang kuat tentang bagaimana AI canggih bisa diintegrasikan ke dalam lingkungan fisik kita untuk menciptakan interaksi yang bermanfaat, menarik, dan bahkan memesona. Fleksibilitas Gemini API membuka pintu bagi banyak aplikasi lain, mulai dari asisten yang sangat dipersonalisasi hingga alat pendidikan yang dinamis dan platform hiburan yang imersif.

Anda bisa melihat keseluruhan kode project ini di GitHub, serta tutorial teknis lengkap di Hackster.io.

Kami mendorong Anda untuk membayangkan semua kemungkinan yang ada. Apa yang dapat dilakukan oleh cermin ajaib Anda?

Pastikan membagikan ide dan kreasi berbasis Gemini Anda kepada kami di X dan LinkedIn.

Postingan Terkait

Gemini Google AI Studio AI Announcements

Memperkenalkan Gemini 2.5 Flash Image, model gambar termutakhir kami

26 AGU 2025

AI Cloud How-To Guides Announcements

Announcing User Simulation in ADK Evaluation

7 NOV. 2025

AI Cloud How-To Guides Announcements

Announcing the Agent Development Kit for Go: Build Powerful AI Agents with Your Favorite Languages

7 NOV. 2025

Gemini AI Announcements

Melampaui batas terminal: Gemini CLI hadir ke Zed

27 AGU 2025