Jendela konteks 2M Gemini 1.5 Pro, kemampuan eksekusi kode, dan Gemma 2 tersedia sekarang

JUN 27, 2024
Logan Kilpatrick Senior Product Manager Gemini API and Google AI Studio
Shrestha Basu Mallick Group Product Manager Gemini API
Ronen Kofman Group Product Manager Gemini API

Hari ini, kami memberikan akses kepada developer ke 2 juta jendela konteks untuk Gemini 1.5 Pro, kemampuan eksekusi kode di Gemini API, dan menambahkan Gemma 2 di Google AI Studio.


Konteks panjang dan caching konteks

Di I/O, kami mengumumkan jendela konteks terpanjang yang pernah ada, 2 juta token di Gemini 1.5 Pro di balik daftar tunggu. Hari ini, kami membuka akses ke jendela konteks 2 juta token di Gemini 1.5 Pro untuk semua developer.

Seiring dengan bertambahnya jendela konteks, begitu pula dengan potensi biaya input. Untuk membantu developer mengurangi biaya bagi tugas yang menggunakan token yang sama di beberapa perintah, kami meluncurkan caching konteks di Gemini API untuk Gemini 1.5 Pro dan 1.5 Flash.


Eksekusi kode

LLM secara historis mengalami kesulitan dengan masalah matematika atau penalaran data. Membuat dan mengeksekusi kode yang dapat menelaah masalah seperti itu akan membantu akurasi. Untuk membuka kemampuan ini bagi developer, kami mengaktifkan eksekusi kode untuk Gemini 1.5 Pro dan 1.5 Flash. Setelah diaktifkan, fitur eksekusi kode bisa digunakan secara dinamis oleh model untuk membuat dan menjalankan kode Python serta belajar secara iteratif dari hasilnya hingga mencapai hasil akhir yang diinginkan. Sandbox eksekusi tidak terhubung ke internet, dilengkapi dengan beberapa library numerik, dan developer hanya ditagih berdasarkan token output dari model.

Ini adalah langkah pertama kami dengan eksekusi kode sebagai kemampuan model dan tersedia hari ini melalui Gemini API dan Google AI Studio di bawah “advanced settings”.


Gemma 2 di Google AI Studio

Kami ingin membuat AI dapat diakses oleh semua developer, baik ketika Anda ingin mengintegrasikan model Gemini melalui kunci API atau menggunakan model terbuka seperti Gemma 2. Untuk membantu developer merasakan langsung model Gemma 2, kami menyediakannya di Google AI Studio untuk eksperimen.


Gemini 1.5 Flash dalam produksi

Gemini 1.5 Flash dibuat untuk memenuhi banyaknya permintaan developer akan kecepatan dan keterjangkauan. Kami sangat gembira dengan cara developer berinovasi dengan Gemini 1.5 Flash dan menggunakan model ini dalam produksi:

  • Envision memberdayakan orang-orang penyandang tunanetra atau memiliki penglihatan lemah untuk lebih memahami lingkungan sekitar mereka melalui aplikasi atau smart glass dan mengajukan pertanyaan-pertanyaan spesifik. Dengan memanfaatkan kecepatan Gemini 1.5 Flash, pengguna Envision bisa mendapatkan deskripsi lingkungan sekitar secara real time, yang sangat penting bagi pengalaman mereka dalam menjelajahi dunia.

  • Plural, sebuah platform pemantauan dan analisis kebijakan otomatis, menggunakan Gemini 1.5 Flash untuk meringkas dan menelaah dokumen legislasi yang kompleks untuk LSM dan warga negara yang tertarik dengan kebijakan, sehingga mereka bisa memberikan dampak terhadap pengesahan rancangan undang-undang.

  • Dot, sebuah AI yang dirancang untuk tumbuh bersama pengguna dan semakin dipersonalisasi seiring berjalannya waktu, memanfaatkan Gemini 1.5 Flash untuk sejumlah tugas kompresi informasi yang menjadi kunci sistem memori jangka panjang agentic mereka. Untuk Dot, 1.5 Flash memiliki performa yang serupa dengan model yang lebih mahal dengan biaya di bawah sepersepuluhnya untuk tugas-tugas, seperti peringkasan, pemfilteran & pemeringkatan ulang.

Sejalan dengan pengumuman kami sebelumnya bulan lalu, kami bekerja keras agar pengaturan untuk Gemini 1.5 Flash tersedia bagi semua developer, untuk memungkinkan kasus penggunaan baru, ketangguhan produksi tambahan, dan keandalan yang lebih tinggi. Pengaturan teks di 1.5 Flash sekarang siap untuk diuji coba dan akan diluncurkan secara bertahap kepada developer mulai hari ini. Semua developer akan dapat mengakses pengaturan Gemini 1.5 Flash melalui Gemini API dan Google AI Studio pada pertengahan Juli.


Kami sangat senang melihat cara Anda menggunakan fitur-fitur baru ini, Anda bisa bergabung dalam diskusi di forum developer kami. Jika Anda adalah developer perusahaan, lihat bagaimana kami menjadikan Vertex AI sebagai platform genAI yang paling siap untuk perusahaan.