Gemini 1.5 Pro dan 1.5 Flash GA, dukungan penyetelan 1.5 Flash, batas kecepatan yang lebih tinggi, dan lebih banyak update API

MEI 30, 2024
Logan Kilpatrick Senior Product Manager Gemini API and Google AI Studio
Shrestha Basu Mallick Group Product Manager Gemini API

Editor’s note: The post has been updated to reflect that 1.5 Flash tuning support has been delayed a few weeks and will not launch on June 17.

Dengan memanfaatkan momentum dari Google I/O, kami mengumumkan sejumlah update penting untuk Gemini API dan Google AI Studio, antara lain:

  • Rilis stabil Gemini 1.5 Flash dan 1.5 Pro serta penagihan

  • Batas kecepatan yang lebih tinggi pada Gemini 1.5 Flash

  • Penyetelan Gemini 1.5 Flash

  • Mode skema JSON

  • Dukungan seluler dan mode terang di Google AI Studio

Kami sangat antusias menantikan kreasi yang akan Anda buat dengan model baru ini dan berkomitmen untuk terus mengembangkan pengalaman developer kelas dunia. Anda bisa memulai Gemini 1.5 Flash dan 1.5 Pro tanpa biaya di Google AI Studio.


Update Gemini 1.5 Flash

Gemini 1.5 Flash dibuat khusus sebagai model tercepat dan paling ekonomis untuk tugas-tugas bervolume tinggi, dalam skala besar, untuk menjawab masukan dari developer yang menginginkan latensi dan biaya yang lebih rendah. Hari ini, kami meningkatkan batas kecepatan untuk 1.5 Flash menjadi 1000 permintaan per menit (RPM) dan menghapus batas permintaan per hari. Batas kecepatan 1.5 Pro tidak berubah untuk saat ini, tetapi jika Anda membutuhkan batas yang lebih tinggi untuk meningkatkan skalanya atau memiliki masukan, silakan hubungi kami.

Customizing models can help you reach the performance threshold needed to take AI models into production. To support that, we will also be rolling out tuning support for Gemini 1.5 Flash in the coming weeks. Tuning will be supported in both Google AI Studio and the Gemini API directly. Currently, tuning jobs are free of charge, and using a tuned model does not incur any additional per-token costs. You can learn more about tuning in the Gemini API docs.


Penagihan Gemini API

Selain tingkatan gratis, mulai hari ini, developer bisa membuka batas kecepatan API yang lebih tinggi dengan mengaktifkan akun penagihan di Google AI Studio.

Menyiapkan penagihan di Google AI Studio

Anda bisa mempelajari lebih lanjut tentang harga model Gemini 1.5 di ai.google.dev/pricing. Jika Anda mengalami masalah dalam menyiapkan penagihan, beri tahu kami di forum developer. Untuk developer yang ingin meningkatkan skala dengan fitur tingkat-enterprise, model yang sama tersedia melalui Vertex AI, platform AI siap pakai untuk enterprise.


Mode skema JSON

Kami meluncurkan mode JSON di Gemini API dan Google AI Studio pada awal tahun ini untuk memberikan lebih banyak kontrol atas output model. Mulai hari ini, Anda bisa menentukan skema JSON yang diinginkan agar direspons oleh model, yang membuka banyak kasus penggunaan baru ketika Anda membutuhkan model untuk mengikuti batasan output tertentu, seperti mengikuti struktur yang sudah ditentukan sebelumnya atau hanya mengeluarkan teks tertentu. Anda dapat membaca lebih lanjut tentang mode skema JSON dalam dokumen Gemini API.


Mode terang dan dukungan seluler

Untuk memberikan fleksibilitas yang lebih besar kepada developer di AI Studio, kini Anda bisa memilih mode UI yang Anda sukai (terang vs gelap) atau menggunakan pengaturan default sistem di panel setelan. Kami juga meluncurkan peningkatan seluler pertama kami untuk Google AI Studio sehingga Anda dapat dengan cepat menguji prompt multi-modal di mana pun.


Sembari kami terus meningkatkan pengalaman developer, silakan bagikan masukan Anda di Forum Developer. Selamat membangun!