Mari telusuri sorotan dan pencapaian komunitas Google Machine Learning yang sangat banyak selama kuartal kedua tahun 2023. Kami sangat antusias dan berterima kasih atas semua aktivitas yang dilakukan jaringan komunitas ML global. Berikut adalah sorotan utamanya!
Lebih dari 35 komunitas di seluruh dunia telah menyelenggarakan Kampanye ML yang didistribusikan oleh tim Program Developer ML selama paruh pertama tahun ini. Terima kasih atas upaya pelatihan Anda untuk seluruh komunitas ML!
Segmentasi Gambar menggunakan Composable Fully-Convolutional Networks oleh ML GDE Suvaditya Mukherjee (India) adalah contoh Keras.io yang menjelaskan cara mengimplementasikan jaringan konvolusional penuh dengan backend VGG-16 dan cara menggunakannya untuk melakukan segmentasi gambar. Presentasinya, KerasCV untuk Kaum Muda dan Aktif (slide | video) di TFUG Malaysia dan TFUG Kolkata merupakan pengenalan terhadap KerasCV. Dia membahas bagaimana komponen computer vision dasar bekerja, mengapa Keras adalah alat yang penting, dan bagaimana KerasCV dibangun di atas ekosistem TFX dan Keras yang sudah mapan.
[Cerita ML] Perjalanan Keras Saya oleh ML GDE Aritra Roy Gosthipaty (India) meringkas ceritanya tentang bagaimana ia masuk ke dalam deep learning menggunakan Keras. Dia menyertakan petunjuk tentang bagaimana seseorang dapat masuk ke dalam komunitas open source. Selain itu, buku catatan Kaggle miliknya, [0.11] keras starter: unet + tf data pipeline adalah panduan awal untuk Vesuvius Challenge. Dia dan Subvaditya juga membagikan Implementasi Keras dari Temporal Latent Bottleneck Networks, yang diusulkan dalam makalah.
KerasFuse oleh ML GDE Ayse Ayyuce Demirbas (Portugal) adalah library Python yang menggabungkan kekuatan TensorFlow dan Keras dengan berbagai teknik computer vision untuk tugas analisis gambar medis. Library ini menyediakan kumpulan modul dan fungsi untuk memfasilitasi pengembangan model deep learning dalam TensorFlow & Keras untuk tugas-tugas, seperti segmentasi gambar, klasifikasi, dan lainnya.
TensorFlow di Google I/O 23: Pratinjau Fitur dan Alat Baru oleh TFUG Ibadan menjelajahi pratinjau fitur dan alat terbaru di TensorFlow. Mereka membahas berbagai topik termasuk Dtensor, KerasCV & KerasNLP, API kuantisasi TF, dan JAX2TF.
StableDiffusion - Aplikasi implementasi Textual-Inversion oleh ML GDE Dimitre Oliveira (Brasil) adalah contoh cara mengimplementasikan kode dari penelitian dan menyempurnakannya menggunakan proses Textual Inversion. Proses ini juga menyediakan kasus penggunaan yang relevan untuk alat dan framework penting, seperti HuggingFace, Gradio, TensorFlow, dan KerasCV.
Dalam Memahami Penurunan Gradien dan Membangun Pengklasifikasi Gambar di TF Dari Awal, ML GDE Tanmay Bakshi (Kanada) berbicara tentang cara mengembangkan intuisi yang kuat untuk dasar-dasar yang mendukung teknologi ML, dan benar-benar membangun sistem klasifikasi gambar riil untuk anjing dan kucing, dari awal di TF.Keras.
Implementasi TensorFlow dan Keras pada makalah CVPR 2023 oleh Usha Rengaraju (India) adalah implementasi makalah penelitian BiFormer: Vision Transformer dengan Bi-Level Routing Attention.
Deteksi Senyum dengan Python, OpenCV, dan Deep Learning oleh Rouizi Yacine adalah tutorial yang menjelaskan cara menggunakan deep learning untuk membangun detektor senyum yang lebih andal dengan menggunakan TensorFlow, Keras, dan OpenCV.
ML Olympiad for Students oleh GDSC UNINTER ditujukan bagi siswa dan calon praktisi ML yang ingin meningkatkan kemampuan ML mereka. Kompetisi ini terdiri dari tantangan untuk memprediksi aplikasi visa kerja Amerika Serikat. Lebih dari 320 peserta mendaftar untuk acara pembukaan, 700+ penayangan di YouTube, 66 tim berkompetisi, dan pemenangnya mendapatkan skor F1 71%.
ICR | EDA & Baseline oleh ML GDE Ertuğrul Demir (Turki) adalah notebook pemula bagi pendatang baru yang tertarik dengan kompetisi kode unggulan terbaru di Kaggle.Notebook ini mendapatkan 200+ suara positif dan 490+ fork.
Bersaing Lebih Efektif di Kaggle menggunakan Bobot dan Bias oleh TFUG Hajipur adalah pertemuan untuk mengeksplorasi teknik-teknik menggunakan Bobot dan Bias untuk meningkatkan performa model dalam kompetisi Kaggle. Usha Rengaraju (India) bergabung sebagai pembicara dan menyampaikan insight-nya tentang Kaggle dan strategi untuk memenangkan kompetisi. Ia membagikan tips dan trik serta mendemonstrasikan cara membuat akun W&B serta cara mengintegrasikannya dengan Google Colab dan Kaggle.
Pengenalan Tindakan Berbasis Kerangka: Upaya yang gagal oleh ML GDE Ayush Thakur (India) adalah postingan diskusi tentang dokumentasi pembelajarannya pada saat berkompetisi di kompetisi Kaggle, Google - Isolated Sign Language Recognition. Ia membagikan repositori, log pelatihan, dan ide-ide yang ia gunakan dalam kompetisi tersebut. Selain itu, artikelnya Layer Padat Keras: Bagaimana Cara Menggunakannya dengan Benar) mengeksplorasi layer padat di Keras dan bagaimana cara kerjanya.
Menambahkan Machine Learning ke Aplikasi Android Anda oleh ML GDE Pankaj Rai (India) di Tech Talks for Educators adalah sesi tentang ML di perangkat dan cara menambahkan kapabilitas ML ke aplikasi Android, seperti deteksi objek dan deteksi gestur. Dia menjelaskan kapabilitas ML Kit, MediaPipe, TF Lite dan bagaimana cara menggunakan alat-alat ini. Lebih dari 700 orang mendaftarkan diri untuk mengikuti ceramahnya.
Dalam MediaPipe with a bit of Bard pada I/O Extended Singapore 2023, ML GDE Martin Andrews (Singapura) membagikan bagaimana MediaPipe cocok dengan ekosistem, dan menunjukkan 4 demonstrasi fungsi MediaPipe yang berbeda: klasifikasi audio, pengenalan wajah, segmentasi interaktif, dan klasifikasi teks.
Menambahkan ML ke aplikasi kami dengan Google ML Kit dan MediaPipe oleh ML GDE Juan Guillermo Gomez Torres (Bolivia) memperkenalkan ML Kit & MediaPipe, dan manfaat ML di perangkat. Pada Startup Academy México (Google for Startups), ia membagikan cara meningkatkan nilai bagi klien dengan ML dan MediaPipe.
Pengenalan Google PaLM 2 API oleh ML GDE Hannes Hapke (Amerika Serikat) memperkenalkan cara menggunakan PaLM2 dan merangkum keuntungan utama dari API tersebut. Artikelnya yang lain Peran Engineering ML pada era GPT-4 & PaLM 2, menjelaskan peran para ahli ML dalam menemukan keseimbangan dan keselarasan yang tepat di antara para pemangku kepentingan untuk melihat peluang dan tantangan yang ditimbulkan oleh teknologi yang sedang berkembang ini secara optimal. Ia melakukan presentasi dengan judul yang sama di North America Connect 2023 dan acara GDG Portland.
ChatBard: Aplikasi Pusat Layanan Pelanggan Cerdas oleh ML GDE Ruqiya Bin Safi (Arab Saudi) adalah aplikasi pusat layanan pelanggan cerdas yang didukung oleh AI generatif dan LLM menggunakan API PaLM2.
Bard sekarang bisa membuat kode dan memasukkan kode itu ke Colab untuk Anda oleh ML GDE Sam Witteveen (Singapura) yang menunjukkan bagaimana Bard membuat kode. Ia menjalankan saluran Youtube yang mengeksplorasi ML dan AI, dengan playlist, seperti AI Generatif, Tinjauan Makalah, LLM, dan LangChain.
Google Bard Bisa Menulis Kode oleh ML GDE Bhavesh Bhatt (India) menunjukkan kemampuan coding Bard, cara membuat game 2048 dengan Bard, dan cara menambahkan beberapa fitur dasar ke dalam game. Ia juga mengupload video tentang LangChain dalam playlist dan memperkenalkan kursus baru Google Cloud tentang AI Generatif dalam video ini.
Mekanisme Perhatian dan Transformer oleh GDG Cloud Saudi berbicara tentang Perhatian dan Transformer dalam NLP dan ML GDE Ruqiya Bin Safi (Arab Saudi) berpartisipasi sebagai pembicara. Acara lainnya, Praktik langsung dengan API PaLM2 untuk membuat aplikasi smart (Jeddah) mengeksplorasi tentang LLM, PaLM2, dan Bard, cara menggunakan API PaLM2, dan cara membuat aplikasi pintar menggunakan API PaLM2.
Praktik langsung dengan AI Generatif: Google I/O Extended [Virtual] oleh ML GDE Henry Ruiz (Amerika Serikat) dan Web GDE Rabimba Karanjai (Amerika Serikat) adalah lokakarya tentang AI generatif yang menunjukkan demo langsung tentang cara memulai menggunakan alat, seperti PaLM API, Hugging Face Transformers, dan framework LangChain.
AI Generatif dengan Google PaLM dan MakerSuite oleh ML GDE Kuan Hoong (Malaysia) di Google I/O Extended George Town 2023 adalah pembicaraan tentang LLM dengan Google PaLM dan MakerSuite. Acara yang dipandu oleh GDG George Town ini juga mencakup topik-topik ML, seperti LLM, responsible AI, dan MLOps.
Pengenalan Gen AI dengan PaLM API dan MakerSuite oleh TFUG São Paulo ditujukan bagi orang-orang yang ingin mempelajari AI generatif dan bagaimana alat Google bisa membantu pengadopsian dan penciptaan nilai. Mereka membahas bagaimana cara memulai pembuatan prototipe ide Gen AI dengan MakerSuite dan cara mengakses fitur-fitur canggih PaLM2 dan PaLM API. Grup ini juga menjadi host untuk acara Membuka Kotak Pandora: Memahami makalah yang merevolusi dunia NLP (video) dan ML GDE Pedro Gengo (Brasil) dan ML GDE Vinicius Caridá (Brasil) membagikan rahasia di balik LLM yang terkenal dan model Gen AI lainnya. Para anggota grup bersama-sama mempelajari makalah Perhatian Adalah Yang Anda Butuhkan dan mempelajari potensi penuh yang ditawarkan teknologi ini.
Model bahasa yang dapat dituturkan, dilihat, digerakkan, dan dipahami PaLM oleh GDG Cloud Taipei adalah untuk mereka yang ingin memahami konsep dan penerapan PaLM. ML GED Jerry Wu (Taiwan) membagikan karakteristik utama PaLM, fungsi, dan lainnya.
Menyalurkan Dengan TF dan GKE: Stable Diffusion oleh ML GDE Chansung Park (Korea) dan ML GDE Sayak Paul (India) membahas tentang bagaimana TF Serving dan Kubernetes Engine bisa menyalurkan sebuah sistem dengan deployment online. Mereka menguraikan Stable Diffusion ke dalam komponen-komponen utama dan bagaimana mereka mempengaruhi pertimbangan deployment yang berikutnya. Kemudian mereka juga membahas hal-hal yang berkaitan dengan deployment, seperti deployment TF Serving dan konfigurasi cluster k8s.
Integrasi TFX + W&B oleh ML GDE Chansung Park (Korea) menunjukkan bagaimana KerasTuner bisa digunakan dengan fitur pelacakan eksperimen W&B dalam komponen TFX Tuner. Ia mengembangkan komponen TFX khusus untuk mendorong model yang sudah terlatih penuh ke toko Artifact W&B dan memublikasikan aplikasi yang bekerja di Hugging Face Space dengan versi model terkini. Selain itu, pembicaraannya yang berjudul, ML Infra dan Framework Tingkat Tinggi di Google Cloud Platform, membahas tentang MLOps, mengapa itu sulit, mengapa cloud + TFX adalah permulaan yang bagus, dan bagaimana TFX diintegrasikan secara mulus dengan Vertex AI dan Dataflow. Ia membagikan beberapa contoh kasus penggunaan dari project sebelumnya yang telah dia dikerjakan bersama dengan ML GDE Sayak Paul (India) dalam 2 tahun terakhir.
MLOps Terbuka dan Kolaboratif oleh ML GDE Sayak Paul (India) berbicara tentang mengapa keterbukaan dan kolaborasi adalah dua aspek penting dari MLOps. Ia memberikan ringkasan tentang Hugging Face Hub dan bagaimana itu terintegrasi secara baik dengan TFX untuk mendorong keterbukaan dan kolaborasi dalam alur kerja MLOps.
Tinjauan makalah: Laporan Teknis PaLM 2 oleh ML GDE Grigory Sapunov (Inggris) melihat detail PaLM2 dan makalahnya. Dia membagikan tinjauan makalah yang terkait dengan Google dan DeepMind melalui saluran sosialnya dan berikut adalah beberapa di antaranya: Evaluasi model untuk risiko ekstrem (makalah), Algoritma pengurutan yang lebih cepat ditemukan menggunakan deep reinforcement learning (makalah), Pencarian daya dapat dilakukan secara probabilistik dan prediktif untuk agen terlatih (makalah).
Mempelajari JAX pada 2023: Bagian 3 — Panduan Langkah demi Langkah untuk Melatih Model Machine Learning Pertama Anda dengan JAX oleh ML GDE Aritra Roy Gosthipaty (India) dan ML GDE Ritwik Raha (India) menunjukkan bagaimana JAX dapat melatih model regresi linier dan nonlinier serta penggunaan library PyTrees untuk melatih model perceptron multilayer. Selain itu, pada May 2023 Meetup yang diselenggarakan oleh TFUG Mumbai, mereka memberikan ceramah berjudul Menguraikan Deteksi Objek End to End dengan Transformers dan membahas arsitektur mode serta berbagai komponen yang menyebabkan munculnya DETR.
Melatih versi penerapan model GPT pada TPU dengan 20 langkah oleh ML GDE Jerry Wu (Taiwan) membagikan cara menggunakan JAX dan TPU untuk melatih dan menyimpulkan data pertanyaan-jawaban dalam bahasa Mandarin.
Multimodal Transformers - Custom LLMs, ViTs & BLIPs oleh TFUG Singapura yang melihat model, sistem, dan teknik yang baru saja keluar terkait dengan tugas multimodal. ML GDE Sam Witteveen (Singapura) mempelajari berbagai model dan sistem multimodal serta bagaimana Anda bisa membuat model sendiri dengan PaLM2 Model. Pada bulan Juni, grup ini mengundang Blaise Agüera y Arcas (VP and Fellow di Tim Riset Google) dan membagikan project Cerebra dan penelitian yang sedang dilakukan di Google DeepMind, termasuk pengembangan terkini dan masa depan dalam AI generatif serta tren yang sedang berlangsung.
Melatih model rekomendasi dengan sematan dinamis oleh ML GDE Thushan Ganegedara (Australia) yang menjelaskan cara membangun model pemberi rekomendasi film dengan memanfaatkan TensorFlow Recommenders (TFRS) dan TensorFlow Recommenders Addons (TFRA). Fokus utamanya adalah menunjukkan bagaimana sematan dinamis yang tersedia dalam library TFRA bisa digunakan untuk memperbesar dan memperkecil ukuran tabel sematan secara dinamis dalam pengaturan rekomendasi.
Bagaimana saya membangun detektor deepfake paling efisien di dunia seharga $100 oleh ML GDE Mathis Hammel (Prancis) adalah perbincangan yang mengeksplorasi sebuah metode untuk mendeteksi gambar yang dibuat melalui ThisPersonDoesNotExist.com dan bahkan cara untuk mengetahui kapan foto tersebut dibuat. Selain itu, thread Twitter-nya, Investigasi OSINT di LinkedIn, menyelidiki jaringan perusahaan palsu di LinkedIn. Dia menggunakan alat buatannya sendiri berdasarkan model TensorFlow dan menghostingnya di Google Cloud. Penjelasan teknis tentang neural network generatif juga disertakan. Lebih dari 701 ribu orang melihat thread ini dan mendapatkan lebih dari 1.200 RT dan 3.100 Suka.
Pembelajaran few-shot: Membuat deteksi objek secara real-time menggunakan TensorFlow dan Python oleh ML GDE Hugo Zanini (Brasil) menunjukkan cara mengambil gambar objek menggunakan webcam, memberi label pada gambar, dan melatih model pembelajaran few-shot untuk berjalan secara real time. Selain itu, artikelnya, Deteksi Objek YOLOv7 Khusus dengan TensorFlow.js menjelaskan bagaimana dia melatih model YOLOv7 khusus untuk menjalankannya langsung di browser secara real time dan offline dengan TensorFlow.js.
The Lord of the Words: Kembalinya eksperimen dengan DVC (slide) oleh ML GDE Gema Parreno Piqueras (Spanyol) adalah perbincangan yang menjelaskan Transformers dalam skenario neural machine learning, dan bagaimana menggunakan Tensorflow dan DVC. Dalam project tersebut, ia menggunakan katalog terjemahan Datasets Tensorflow untuk memuat data dari berbagai bahasa, dan library Transformers TensorFlow untuk melatih beberapa model.
Mempercepat model TensorFlow Anda dengan XLA (slide) dan Mengirimkan model TensorFlow yang lebih cepat dengan XLA oleh ML GDE Sayak Paul (India) yang membagikan cara mempercepat model TensorFlow dengan XLA di Cloud Community Days Kolkata 2023 dan Cloud Community Days Pune 2023.
Pengaturan NVIDIA Merlin dan Tensorflow untuk Model Rekomendasi oleh ML GDE Rubens Zimbres (Brasil) memaparkan tinjauan algoritma rekomendasi serta algoritma Two Towers, dan pengaturan NVIDIA Merlin di lokasi dan di Vertex AI.
Pipeline AutoML untuk data tabular pada VertexAI di Go oleh ML GDE Paolo Galeone (Italia) mempelajari pengembangan dan deployment model tabular menggunakan VertexAI dan AutoML dengan Go, menampilkan kode Go asli dan membagikan insight yang diperoleh melalui uji coba trial & error dan riset Google yang ekstensif untuk mengatasi keterbatasan dokumentasi.
Di balik gambar: menelusuri informasi dalam video menggunakan AI (slide) oleh ML GDE Pedro Gengo (Brasil) dan ML GDE Vinicius Caridá (Brasil) menunjukkan cara membuat mesin telusur sehingga Anda bisa menelusuri informasi dalam video. Mereka mempresentasikan sebuah arsitektur di mana mereka mentranskrip audio dan memberi teks pada bingkai, mengubah teks ini menjadi sematan, dan menyimpannya dalam DB vektor agar dapat melakukan penelusuran berdasarkan permintaan pengguna.
Resep rahasia untuk menciptakan pengalaman ML yang luar biasa bagi developer oleh ML GDE Gant Laborde (Amerika Serikat) adalah podcast yang membagikan momen “aha” miliknya, pengalamannya selama 20 tahun di dunia ML, dan rahasia untuk menciptakan pengalaman yang menyenangkan dan berkesan bagi developer.
Apa yang ada di dalam Generative AI Studio Google? oleh ML GDE Gad Benram (Portugal) yang membagikan pratinjau fitur baru dan berbagai hal yang menanti Anda. Selain itu, dalam artikel Cara mempromosikan Vertex AI di tahun 2023, ia membagikan enam poin promo penjualan yang mudah dan lugas untuk perwakilan Google Cloud tentang cara meyakinkan pelanggan bahwa Vertex AI adalah platform yang tepat.
Dalam sesi Cara Membangun Pengalaman Augmented Reality AI percakapan dengan Sachin Kumar, ML GDE Sachin Kumar (Qatar) berbicara tentang cara membangun aplikasi AR yang menggabungkan berbagai teknologi, seperti Google Cloud AI, Unity, dan lainnya. Sesi ini membahas proses langkah demi langkah dalam membangun aplikasi dari awal.
Machine Learning di Google Cloud Platform oleh ML GDE Nitin Tiwari (India) adalah pendampingan yang bertujuan untuk memberikan pemahaman mendalam kepada siswa tentang proses yang terlibat dalam pelatihan model ML dan penerapannya menggunakan GCP. Dalam Membangun solusi ML yang andal dengan TensorFlow dan GCP, ia membagikan cara tentang memanfaatkan kemampuan GCP dan TensorFlow untuk solusi ML dan menerapkan model ML khusus.
Data ke AI di Google Cloud: Auto ML, Gen AI, dan lainnya oleh TFUG Prayagraj yang mengedukasi siswa tentang cara memanfaatkan teknologi AI canggih Google Cloud, termasuk AutoML dan AI generatif.