Gemini 1.5: Model generasi berikutnya, sekarang tersedia untuk Pratinjau Pribadi di Google AI Studio

FEB 15, 2024
Jaclyn Konzelmann Google Labs
Wiktor Gworek Google Labs

Minggu lalu, kami telah merilis Gemini 1.0 Ultra di Gemini Advanced. Anda bisa mencobanya sekarang dengan mendaftar langganan Gemini Advanced. Model 1.0 Ultra, yang dapat diakses melalui Gemini API, telah menarik banyak minat dan terus meluncur ke developer dan mitra terpilih di Google AI Studio.

Hari ini, kami sangat senang bisa memperkenalkan model Gemini 1.5 generasi berikutnya, yang menggunakan pendekatan Mixture-of-Experts (MoE) untuk meningkatkan efisiensi. Model ini merutekan permintaan Anda ke sekelompok neural network "ahli" yang lebih kecil sehingga responsnya lebih cepat dan berkualitas.

Developer bisa mendaftar untuk mendapatkan Pratinjau Pribadi Gemini 1.5 Pro, model multimodal berukuran sedang yang dioptimalkan untuk penskalaan di berbagai macam tugas. Model ini memiliki fitur jendela konteks eksperimental 1 juta token baru, dan dapat dicoba di Google AI Studio. Google AI Studio adalah cara tercepat untuk membangun dengan model Gemini dan memungkinkan developer secara mudah mengintegrasikan Gemini API dalam aplikasi mereka. Tersedia dalam 38 bahasa di lebih dari 180 negara dan wilayah.

1.000.000 token: Membuka kasus penggunaan baru untuk developer

Sebelumnya, jendela konteks terbesar di dunia untuk model bahasa besar yang tersedia untuk umum adalah 200.000 token. Kami berhasil meningkatkannya secara signifikan — menjalankan hingga 1 juta token secara konsisten, mencapai jendela konteks terpanjang dari semua model dasar berskala besar. Gemini 1.5 Pro akan hadir dengan jendela konteks 128.000 token secara default, tetapi Pratinjau Pribadi hari ini akan memiliki akses ke jendela konteks eksperimental 1 juta token.

Kami sangat antusias dengan berbagai kemungkinan baru yang dapat dilakukan dengan jendela konteks yang lebih besar. Anda bisa langsung mengupload PDF berukuran besar, repositori kode, bahkan video panjang sebagai prompt di Google AI Studio. Gemini 1.5 Pro kemudian akan melakukan penalaran seluruh modalitas dan teks output.

1) Upload beberapa file dan ajukan pertanyaan
Kami telah menambahkan kemampuan bagi developer untuk mengupload beberapa file, seperti PDF, dan mengajukan pertanyaan di Google AI Studio. Jendela konteks yang lebih besar memungkinkan model menerima lebih banyak informasi — membuat output lebih konsisten, relevan, dan berguna. Dengan jendela konteks 1 juta token ini, kami dapat memuat lebih dari 700.000 kata sekaligus.

Gemini 1.5 Pro bisa menemukan dan melakukan penalaran dari kutipan tertentu dalam transkrip PDF Apollo 11. [Video dipercepat untuk tujuan demo]

2) Kueri seluruh repositori kode

Jendela konteks yang besar juga memungkinkan analisis mendalam terhadap seluruh codebase, membantu model Gemini memahami hubungan, pola, dan pemahaman kode yang kompleks. Developer bisa mengupload codebase baru langsung dari komputer mereka atau melalui Google Drive, dan menggunakan model ini untuk melakukan penyesuaian secara cepat dan mendapatkan pemahaman tentang kode tersebut.

Gemini 1.5 Pro bisa membantu developer meningkatkan produktivitas saat mempelajari codebase baru. [Video dipercepat untuk tujuan demo]

3) Tambahkan video berdurasi penuh

Gemini 1.5 Pro juga bisa melakukan penalaran hingga 1 jam video. Saat Anda melampirkan video, Google AI Studio memecahnya menjadi ribuan bingkai (tanpa audio), kemudian Anda bisa melakukan tugas penalaran dan pemecahan masalah yang sangat canggih karena model Gemini bersifat multimodal.

Gemini 1.5 Pro bisa melakukan tugas penalaran dan pemecahan masalah pada video dan input visual lainnya. [Video dipercepat untuk tujuan demo]

Lebih banyak cara bagi developer untuk membangun dengan model Gemini

Selain menghadirkan inovasi model terbaru, kami juga memudahkan Anda untuk membangun dengan Gemini:

  • Penyesuaian yang mudah. Berikan serangkaian contoh, dan Anda bisa menyesuaikan Gemini untuk kebutuhan khusus dalam hitungan menit dari dalam Google AI Studio. Fitur ini diluncurkan dalam beberapa hari mendatang. 
  • Platform developer baru. Integrasikan Gemini API untuk membangun fitur baru berteknologi AI sekarang juga dengan Firebase Extensions baru, dalam ruang kerja pengembangan Anda di Project IDX, atau dengan Google AI Dart SDK yang baru saja dirilis. 
  • Harga yang lebih murah untuk Gemini 1.0 Pro. Kami juga mengupdate model 1.0 Pro, yang menawarkan keseimbangan yang baik antara biaya dan performa untuk banyak tugas AI. Versi stabil saat ini memiliki harga 50% lebih murah untuk input teks dan 25% lebih murah untuk output daripada yang diumumkan sebelumnya. Paket bayar sesuai penggunaan untuk AI Studio mendatang akan segera hadir.

Sejak Desember, semua developer dari berbagai skala telah membangun dengan model Gemini, dan kami sangat antusias bisa mengubah penelitian termutakhir menjadi produk developer awal di Google AI Studio. Mungkin terdapat beberapa latensi dalam versi pratinjau ini karena sifat eksperimental dari fitur jendela konteks yang besar, tetapi kami sangat antusias dapat memulai peluncuran secara bertahap sembari terus menyesuaikan model ini dan mendapatkan masukan dari Anda. Kami harap Anda menikmati bereksperimen dengan fitur ini sejak awal, seperti halnya kami.