Data Science Agent di Colab: Masa depan analisis data dengan Gemini

MAR 03, 2025
Jane Fine Senior Product Manager
Mahi Kolla Associate Product Manager
Ilai Soloducho Senior Technical Program Manager

Google Colab adalah lingkungan Jupyter Notebook yang di-hosting di cloud secara gratis, di sini Anda bisa menulis dan menjalankan kode Python secara langsung dalam browser Anda. Ia menyediakan akses gratis ke GPU dan TPU Google Cloud, yang merupakan terobosan baru untuk menjalankan model AI dan menyederhanakan kolaborasi project.

Pada bulan Desember, kami membagikan mengenai bagaimana Data Science Agent di Colab membuat notebook untuk penguji tepercaya menggunakan Gemini, menyingkirkan tugas penyiapan yang merepotkan seperti mengimpor library, memuat data, dan menulis kode boilerplate. Penguji tepercaya sangat antusias dengan Data Science Agent, melaporkan bahwa mereka bisa merampingkan alur kerja dan mengungkap insight lebih cepat dari sebelumnya.

Hari ini, kami sangat senang bisa menghadirkan Data Science Agent untuk pengguna Colab yang berusia 18+ dan di negara serta bahasa tertentu. Ini memperluas kemitraan universitas kami untuk membantu lab penelitian menghemat waktu analisis dan pemrosesan data dengan membuat notebook Colab yang lengkap dan berfungsi dari deskripsi bahasa natural yang sederhana.


Berikut adalah cara kerja Data Science Agent:

  1. Mulai dari awal: Buka notebook Colab kosong.

2. Tambahkan data Anda: Upload file data Anda.

3. Jelaskan tujuan Anda: Jelaskan jenis analisis atau prototipe yang ingin Anda bangun di panel samping Gemini (mis., “Visualisasikan tren”, “Bangun dan optimalkan model prediksi”, “Isi nilai yang hilang”, “Pilih teknik statistik terbaik”).

4. Lihat Data Science Agent mulai bekerja: Duduk dan lihat saat kode yang diperlukan, library impor, dan analisis dibuat di notebook Colab yang berfungsi.

Data Science Agent mengotomatiskan analisis, mulai dari memahami data hingga memberikan insight dalam notebook Colab yang berfungsi (Urutan dipersingkat. Hasil untuk tujuan ilustrasi. Data Science Agent mungkin membuat kesalahan).

Manfaat Data Science Agent

  • Notebook Colab yang sepenuhnya berfungsi: Bukan hanya cuplikan kode, tetapi juga notebook yang lengkap dan dapat dieksekusi.

  • Solusi yang dapat dimodifikasi: Sesuaikan dan perluas kode yang dihasilkan secara mudah agar sesuai dengan kebutuhan khusus Anda.

  • Hasil yang dapat dibagikan: Berkolaborasi dengan rekan satu tim menggunakan fitur berbagi Colab standar.

  • Hemat waktu: Fokus untuk mendapatkan insight dari data Anda alih-alih berkutat dengan penyiapan dan kode boilerplate.

Data Science Agent kami juga menduduki peringkat ke-4 dalam DABStep: Tolok Ukur Agen Data untuk Penalaran Multi-langkah di HuggingFace, mengungguli agen ReAct yang berbasis GPT 4.0, Deepseek, Claude 3.5 Haiku, Llama 3.3 70B.


Memulai Data Science Agent

Cobalah dengan mengupload beberapa data dan menguraikan tujuan analisis data dari panel samping Gemini. Anda bisa menjelajahi set data di Kaggle atau Data Commons, tetapi inilah beberapa contoh data dan prompt yang dapat dicoba:

  • Spesies Iris: coba tanyakan “Kalkulasi dan visualisasikan korelasi Pearson, Spearman, dan Kendall dalam data ini”

  • Klasifikasi Kaca: coba tanyakan “Latih pengklasifikasi hutan acak pada set data ini”


Kami harap ini bisa mentransformasi alur kerja analisis data Anda. Kami tidak sabar mendengarkan pendapat Anda, silakan bergabung dengan komunitas Discord Google Labs dan saluran #data-science-agent untuk terhubung.