Kami memberikan kekuatan kepada developer untuk membangun masa depan AI dengan model tercanggih, alat cerdas untuk menulis kode dengan lebih cepat, dan integrasi tanpa batas di berbagai platform dan perangkat. Sejak Desember lalu saat kami meluncurkan Gemini 1.0, jutaan developer telah menggunakan Google AI Studio dan Vertex AI untuk membangun dengan Gemini dalam 109 bahasa.
Hari ini, kami mengumumkan Gemini 2.0 Flash Eksperimental untuk menghadirkan aplikasi yang lebih imersif dan interaktif, serta agen coding baru yang akan meningkatkan alur kerja dengan mengambil tindakan atas nama developer.
Dibangun berdasarkan kesuksesan Gemini 1.5 Flash, Flash 2.0 dua kali lebih cepat daripada 1.5 Pro sekaligus mencapai performa yang lebih kuat, menyertakan output multimodal baru, dan dilengkapi dengan penggunaan alat native. Kami juga memperkenalkan Multimodal Live API untuk membangun aplikasi dinamis dengan streaming audio dan video secara real time.
Mulai hari ini, developer bisa menguji dan mengeksplorasi Gemini 2.0 Flash melalui Gemini API di Google AI Studio dan Vertex AI selama fase eksperimental, dengan ketersediaan umum akan hadir pada awal tahun depan.
Dengan Gemini 2.0 Flash, developer memiliki akses ke:
Gemini 2.0 Flash lebih bertenaga daripada 1.5 Pro sembari tetap memberikan kecepatan dan efisiensi yang diharapkan developer dari Flash. Ia juga dilengkapi dengan fitur multimodal, teks, kode, video, pemahaman spasial, dan performa penalaran yang lebih baik pada tolok ukur utama. Pemahaman spasial yang lebih baik memungkinkan pembuatan kotak pembatas yang lebih akurat pada objek kecil dalam gambar acak, serta identifikasi objek dan takarir yang lebih baik. Pelajari lebih lanjut dalam video pemahaman spasial atau baca dokumentasi Gemini API.
Link to Youtube Video (visible only when JS is disabled)
Developer nantinya bisa menggunakan Gemini 2.0 Flash untuk membuat respons terintegrasi yang dapat menyertakan teks, audio, dan gambar — semuanya melalui satu panggilan API. Modalitas output baru ini tersedia untuk penguji awal, dengan peluncuran yang lebih luas diharapkan tersedia tahun depan. Tanda air yang tidak terlihat SynthID akan diaktifkan di semua output gambar dan audio, sehingga membantu mengurangi misinformasi dan kesalahan atribusi.
Link to Youtube Video (visible only when JS is disabled)
Gemini 2.0 telah dilatih untuk menggunakan alat–kemampuan dasar untuk membangun pengalaman agen. Ia bisa secara native memanggil alat, seperti Google Penelusuran dan eksekusi kode di samping fungsi pihak ketiga khusus melalui panggilan fungsi. Menggunakan Google Penelusuran secara native sebagai alat akan menghasilkan jawaban yang lebih faktual dan komprehensif serta meningkatkan traffic ke penerbit. Beberapa penelusuran dapat dijalankan secara paralel sehingga bisa meningkatkan pengambilan informasi dengan menemukan fakta yang lebih relevan dari beberapa sumber secara bersamaan dan menggabungkannya untuk mendapatkan akurasi. Pelajari lebih lanjut dalam video penggunaan alat native atau mulai membangun dari notebook.
Link to Youtube Video (visible only when JS is disabled)
Developer sekarang bisa membangun aplikasi multimodal secara real time dengan input streaming audio dan video dari kamera atau layar. Pola percakapan natural seperti interupsi dan deteksi aktivitas suara juga didukung. API ini mendukung integrasi beberapa alat secara bersamaan untuk menuntaskan kasus penggunaan yang kompleks dengan satu panggilan API. Lihat selengkapnya dalam video live streaming multimodal, coba konsol web, atau kode starter (Python).
Link to Youtube Video (visible only when JS is disabled)
Kami sangat senang melihat startup membuat kemajuan yang mengesankan dengan Gemini 2.0 Flash, pembuatan prototipe pengalaman baru, seperti taman bermain visual tldraw, pembuatan karakter virtual dan narasi audio Viggle, penerjemahan multibahasa kontekstual Toonsutra, dan Rooms' yang menambahkan audio real time.
Untuk mempercepat pembangunan, kami telah merilis pengalaman tiga aplikasi starter di Google AI Studio bersama dengan kode open source untuk pemahaman spasial, analisis video, dan eksplorasi Google Maps agar Anda bisa mulai membangun dengan Gemini 2.0 Flash.
Karena bantuan kode AI berkembang pesat dari penelusuran kode sederhana menjadi asisten berteknologi AI yang tersemat dalam alur kerja developer, kami ingin membagikan inovasi terbaru yang akan menggunakan Gemini 2.0: agen coding yang bisa menjalankan tugas untuk Anda.
Dalam penelitian terbaru, kami bisa menggunakan 2.0 Flash yang dilengkapi dengan alat eksekusi kode untuk mencapai 51,8% pada SWE-bench Verified, yang menguji performa agen pada tugas rekayasa software di dunia nyata. Kecepatan inferensi termutakhir 2.0 Flash memungkinkan agen mengambil sampel ratusan solusi potensial, memilih yang terbaik berdasarkan tes unit yang ada dan penilaian Gemini sendiri. Kami sedang dalam proses mengubah penelitian ini menjadi produk developer baru.
Bayangkan tim Anda baru saja menyelesaikan bug bash, dan sekarang Anda sedang menatap begitu banyak bug. Mulai sekarang, Anda bisa mengurangi beban tugas coding Python dan Javascript ke Jules, agen kode berteknologi AI eksperimental yang akan menggunakan Gemini 2.0. Bekerja secara asinkron dan terintegrasi dengan alur kerja GitHub Anda, Jules menangani perbaikan bug dan tugas lain yang menghabiskan banyak waktu sementara Anda fokus pada hal-hal penting yang sebenarnya ingin Anda bangun. Jules membuat rencana multilangkah yang komprehensif untuk mengatasi masalah, memodifikasi banyak file secara efisien, dan bahkan menyiapkan permintaan pull untuk mengirimkan perbaikan secara langsung ke GitHub.
Ini masih awal, tetapi dari pengalaman internal kami menggunakan Jules, ini memberikan keuntungan bagi developer:
Kami menyediakan Jules untuk sekelompok penguji tepercaya hari ini, dan kami akan menyediakannya untuk developer lain yang berminat pada awal tahun 2025. Daftar untuk mendapatkan informasi terbaru tentang Jules di labs.google.com/jules.
Di I/O tahun ini, kami meluncurkan Data Science Agent eksperimental di labs.google/code yang memungkinkan siapa pun mengupload set data dan mendapatkan insight dalam hitungan menit, semuanya berbasis notebook Colab saat ini. Kami sangat senang menerima masukan positif dari komunitas developer dan melihat dampaknya. Sebagai contoh, dengan bantuan Data Science Agent, seorang ilmuwan di Lawrence Berkeley National Laboratory yang bekerja pada proyek emisi metana lahan basah tropis global memperkirakan waktu analisis dan pemrosesan mereka berkurang dari satu minggu menjadi lima menit.
Colab telah mulai mengintegrasikan kemampuan agen yang sama menggunakan Gemini 2.0. Cukup jelaskan tujuan analisis Anda dalam bahasa yang sederhana, dan lihatlah notebook Anda terbentuk secara otomatis, membantu mempercepat kemampuan Anda untuk melakukan penelitian dan analisis data. Developer bisa mendapatkan akses awal ke fitur baru ini dengan bergabung dalam program penguji tepercaya sebelum fitur ini diluncurkan secara luas kepada pengguna Colab pada paruh pertama tahun 2025.
Model Gemini 2.0 kami bisa membantu Anda untuk membangun aplikasi AI yang lebih mumpuni dengan lebih cepat dan mudah, sehingga Anda dapat fokus memberikan pengalaman yang luar biasa kepada pengguna. Kami akan menghadirkan Gemini 2.0 ke platform kami, seperti Android Studio, Chrome DevTools, dan Firebase dalam beberapa bulan ke depan. Developer bisa mendaftar untuk menggunakan Gemini 2.0 Flash di Gemini Code Assist, untuk kemampuan bantuan coding yang lebih baik di IDE populer seperti Visual Studio Code, IntelliJ, PyCharm, dan lainnya. Kunjungi ai.google.dev untuk memulai dan ikuti Google AI untuk Developer untuk mendapatkan update di masa mendatang.