머신러닝 커뮤니티: 2023년 2분기 하이라이트와 업적

7월 25, 2023
Hee Jung DevRel Community Manager
Soonson Kwon DevRel Program Manager

2023년 2분기에 방대한 Google Machine Learning 커뮤니티의 업적과 하이라이트를 살펴보겠습니다. 전 세계의 ML 커뮤니티 네트워크의 모든 활동에 뜨거운 호응과 감사의 마음을 전하며 하이라이트는 다음과 같습니다.

ML 학습 캠페인 요약

전 세계 35개 이상의 커뮤니티에서 ML Developer Programs 팀이 올 상반기에 시행한 ML 캠페인을 주최했습니다. ML 커뮤니티 전체를 위한 교육에 힘써 주셔서 감사합니다!

커뮤니티 하이라이트

Keras

kaggle1

ML GDE Suvaditya Mukherjee(인도)의 Composable Fully-Convolutional Network를 사용한 이미지 세분화는 VGG-16 백엔드로 완전 콘볼루션 네트워크를 구현하는 방법과 이미지 세분화 수행에 이 네트워크를 사용하는 방법을 설명하는 Kears.io의 예입니다. TFUG MalaysiaTFUG Kolkata에서 Suvaditya가 진행한 프레젠테이션인 KerasCV for the Young and Restless(슬라이드 | 동영상)는 KerasCV를 소개하는 내용이었습니다. 그는 기본적인 컴퓨터 비전 구성요소의 작동 방식, Keras가 중요한 도구인 이유 및 KerasCV를 확립된 TFX와 Keras 생태계를 기반으로 구축한 방식에 대해 논의합니다.

ML GDE Aritra Roy Gosthipaty(인도)가 발표한 [ML Story] My Keras Chronicles에서는 Keras와 함께 딥 러닝을 시작하게 된 자신의 스토리를 간략히 소개했습니다. 오픈소스 커뮤니티에 참여할 수 있는 몇 개 항목의 방법도 포함했습니다. 또한 자신의 Kaggle 노트북인 [0.11] keras starter: unet + tf data pipelineVesuvius Challenge의 시작 가이드입니다. 그와 Subvaditya는 논문에서 제안한 Temporal Latent Bottleneck Network의 Keras 구현을 공유하기도 했습니다.

ML GDE Ayse Ayyuce Demirbas(포르투갈)의 KerasFuse는 TensorFlow와 Keras의 강력한 기능을 의료용 이미지 분석 작업을 위한 다양한 컴퓨터 비전 기법과 결합한 Python 라이브러리입니다. 이미지 세분화, 분류 등의 작업을 위해 TensorFlow & Keras의 딥 러닝 모델 개발을 용이하게 해주는 모듈 및 기능 컬렉션을 제공합니다.

TFUG IbadanTensorFlow at Google I/O 23: A Preview of the New Features and Tools에서는 TensorFlow의 최신 기능 및 도구 미리보기를 살펴보았습니다. Dtensor, KerasCV & KerasNLP, TF quantization API, JAX2TF 등 다양한 주제를 다루었습니다.

kaggle2

ML GDE Dimitre Oliveira(브라질)의 StableDiffusion - Textual-Inversion 구현 앱은 연구를 통해 코드를 구현하고 Textual Inversion 프로세스를 사용하여 미세 튜닝하는 방법을 보여주는 예입니다. 또한 HuggingFace, Gradio, TensorFlow serving, KerasCV 등 중요한 도구와 프레임워크의 관련 사용 사례도 제공합니다.

ML GDE Tanmay Bakshi(캐나다)는 Understanding Gradient Descent and Building an Image Classifier in TF From Scratch라는 제목으로 진행한 프레젠테이션에서 ML 기술을 뒷받침하는 기본 사항에 대한 확고한 직관을 개발하는 방법에 대해 이야기하고 실제로 TF.Keras에서 개와 고양이에 대한 실제 이미지 분류 시스템을 처음부터 만드는 과정을 시연했습니다.

Usha Rengaraju(인도)의 TensorFlow and Keras Implementation of the CVPR 2023 paperBiFormer: Vision Transformer with Bi-Level Routing Attention의 연구 논문을 구현한 것입니다.

Rouizi Yacine의 Smile Detection with Python, OpenCV, and Deep Learning은 딥 러닝으로 TensorFlow, Keras, OpenCV를 사용하여 보다 강력한 웃음 감지기를 만드는 방법을 설명하는 튜토리얼입니다.

Kaggle

kaggle3

GDSC UNINTERML Olympiad for Students는 ML 기술을 향상하려는 포부를 품은 ML 실무자와 학생을 대상으로 진행되었습니다. 미국 취업 비자 신청을 예측하는 도전 과제로 구성되었습니다. 320여 명의 참석자가 개막 행사에 등록했으며, YouTube 조회수가 700회 이상이고, 66개 팀이 경쟁을 벌였으며, 우승자는 71%의 F1 점수를 받았습니다.

ML GDE Ertuğrul Demir(터키)의 ICR | EDA & Baseline은 Kaggle의 최신 추천 코드 경연에 관심이 있는 새로운 참가자를 위한 스타터 노트북입니다. 200개 이상의 찬성 투표와 490개 이상의 포크를 획득했습니다.

kaggle4

TFUG HajipurCompete More Effectively on Kaggle using Weights and Biases는 Kaggle 경진 대회에서 가중치와 바이어스를 사용하여 모델 성능을 개선하는 기법을 탐구하는 모임이었습니다. Usha Rengaraju(인도)가 발표자로 참여하여 Kaggle과 대회 우승 전략에 대한 유용한 정보를 제공했습니다. 그녀는 도움말과 유용한 정보를 공유하고 W&B 계정을 설정하는 방법과 Google Colab 및 Kaggle과 통합하는 방법을 데모를 통해 보여주었습니다.

ML GDE Ayush Thakur(인도)의 Skeleton Based Action Recognition: A failed attempt는 Kaggle 경진 대회 Google - Isolated Sign Language Recognition에서 경쟁하는 과정에서 배운 내용을 문서화하는 방법에 대한 토론 게시물입니다. 그는 자신의 저장소, 학습 로그, 대회에서 과제에 접근한 아이디어를 공유했습니다. 또한 Keras Dense Layer: How to Use It Correctly라는 제목으로 자신이 작성한 기사에서 Keras의 고밀도 레이어가 무엇이며 실제로 어떻게 작동하는지 살펴보았습니다.

온디바이스 ML

kaggle5

Tech Talks for Educators에서 ML GDE Pankaj Rai(인도)가 진행한 Add Machine Learning to your Android App은 온디바이스 ML과 객체 감지 및 동작 감지와 같은 ML 기능을 Android 앱에 추가하는 방법에 관한 세션이었습니다. Pankaj는 ML Kit, MediaPipe, TF Lite의 기능과 이러한 도구를 사용하는 방법을 설명했습니다. 700여 명이 그의 발표 세션에 등록했습니다.

I/O Extended Singapore 2023에서 진행한 MediaPipe with a bit of Bard에서 ML GDE Martin Andrews(싱가포르)는 MediaPipe가 생태계에 어떻게 통합하는지 공유하고 오디오 분류, 얼굴 랜드마크, 대화형 세분화 및 텍스트 분류의 4가지 서로 다른 MediaPipe 기능 데모를 보여주었습니다.

ML GDE Juan Guillermo Gomez Torres(볼리비아)가 진행한 Adding ML to our apps with Google ML Kit and MediaPipe에서는 ML Kit 및 MediaPipe와 온디바이스 ML의 이점을 소개했습니다. Startup Academy México(Google for Startups)에서 그는 ML 및 MediaPipe로 클라이언트를 위한 가치를 높이는 방법을 공유했습니다.

LLM

ML GDE Hannes Hapke(미국)의 Introduction to Google's PaLM 2 API에서 PaLM2 사용 방법을 소개하고 주요 장점을 요약했습니다. Hannes의 또 다른 기사 The role of ML Engineering in the time of GPT-4 & PaLM 2에서는 이 새로운 기술로 발생하는 기회와 도전을 최적으로 탐색하기 위해 이해관계자들 사이에서 적절한 균형과 조율 지점을 찾는 ML 전문가의 역할을 설명합니다. 그는 North America Connect 2023GDG Portland 이벤트에서 같은 제목으로 프레젠테이션을 했습니다.

kaggle6

ML GDE Ruqiya Bin Safi(사우디아라비아)의 ChatBard: An Intelligent Customer Service Center App은 PaLM2 API를 사용하는 생성형 AI와 LLM을 기반으로 하는 지능형 고객 서비스 센터 앱입니다.

ML GDE Sam Witteveen(싱가포르)의 Bard can now code and put that code in Colab for you에서는 Bard가 코드를 만드는 방법을 보여주었습니다. Sam은 Generative AI, Paper Reviews, LLMs, LangChain 등의 재생목록을 포함하여 ML과 AI를 탐색하는 Youtube 채널을 운영합니다.

ML GDE Bhavesh Bhatt(인도)의 Google’s Bard Can Write Code에서는 Bard의 코딩 기능, Bard로 2048 게임을 만드는 방법, 게임에 몇 가지 기본적인 기능을 추가하는 방법을 보여줍니다. 또한 재생목록에 LangChain에 대한 동영상을 업로드하고 이 동영상에서 생성형 AI에 대한 Google Cloud의 새로운 과정을 소개했습니다.

kaggle7

GDG Cloud SaudiAttention Mechanisms and Transformers에서는 NLP의 Attention과 Transformer에 대한 이야기를 나누었는데 ML GDE Ruqiya Bin Safi(사우디아라비아)가 발표자로 참여했습니다. 또 다른 이벤트인 Hands-on with the PaLM2 API to create smart apps(Jeddah)에서는 LLM, PaLM2 및 Bard가 무엇이며 PaLM2 API를 사용하는 방법과 PaLM2 API를 사용하여 스마트 앱을 만드는 방법을 살펴보았습니다.

ML GDE Henry Ruiz(미국)와 Web GDE Rabimba Karanjai(미국)의 Hands-on with Generative AI: Google I/O Extended [Virtual]은 PaLM API, Hugging Face Transformer, LangChain 프레임워크 등의 도구를 사용하기 시작하는 방법에 대한 실습 데모를 보여주는 생성형 AI에 대한 워크숍이었습니다.

Google I/O Extended George Town 2023에서 진행된 ML GDE Kuan Hoong(말레이시아)의 Generative AI with Google PaLM and MakerSuite는 Google PaLM 및 MakerSuite를 사용한 LLM에 대한 발표었습니다. GDG George Town에서 주최한 이 이벤트에서는 LLM, 책임감 있는 AI, MLOps 등의 ML 주제도 다루었습니다.

kaggle8

TFUG São PauloIntro to Gen AI with PaLM API and MakerSuite는 생성형 AI를 배우고 Google 도구가 채택 및 가치 창출에 어떻게 도움이 되는지 알아보려는 참가자들을 위해 준비되었습니다. MakerSuite로 생성형 AI 아이디어를 프로토타입으로 만드는 방법과 PaLM2 및 PaLM API의 고급 기능에 액세스하는 방법을 다루었습니다. 이 그룹은 Opening Pandora's box: Understanding the paper that revolutionized the field of NLP(동영상)도 주최했고 ML GDE Pedro Gengo(브라질)와 ML GDE Vinicius Caridá(브라질)가 유명한 LLM과 기타 생성형 AI 모델 이면의 비밀을 공유하기도 했습니다. 그룹 구성원들이 Attention Is All You Need 논문을 함께 연구하고 기술로 실현할 수 있는 최대의 잠재력을 배웠습니다.

GDG Cloud TaipeiLanguage models which PaLM can speak, see, move, and understand는 PaLM의 개념과 응용을 이해하려는 참가자들을 마련된 세션이었습니다. ML GED Jerry Wu(대만)가 PaLM의 주요 특징, 기능 등을 공유했습니다.

kaggle9

ML GDE 박찬성(한국)과 ML GDE Sayak Paul(인도)의 Serving With TF and GKE: Stable Diffusion에서는 TF Serving과 Kubernetes Engine으로 온라인 배포를 통해 시스템을 제공하는 방법을 논의했습니다. Stable Diffusion을 주요 구성요소로 분류하고 이후 배포 고려 사항에 어떤 영향을 미치는지 설명했습니다. 그런 다음 TF Serving 배포와 k8s 클러스터 구성과 같은 배포 관련 사항도 다루었습니다.

ML GDE 박찬성(한국)의 TFX + W&B Integration에서는 TFX Tuner 구성요소 내에서 KerasTuner를 W&B의 실험 추적 기능과 함께 사용하는 방법을 보여줍니다. 그는 W&B Artifact 스토어에 완전히 학습된 모델을 푸시하고 Hugging Face Space에서 현재 버전의 모델로 작업 애플리케이션을 게시하는 사용자 설정 TFX 구성요소를 개발했습니다. 또한 ML Infra and High Level Framework in Google Cloud Platform이라는 제목의 발표에서는 MLOps가 무엇인지, 왜 어려운지, 왜 cloud + TFX가 좋은 출발점인지 그리고 TFX가 Vertex AI 및 Dataflow와 어떻게 원활하게 통합되는지 설명했습니다. 그는 지난 2년 동안 자신과 ML GDE Sayak Paul(인도) 이 수행한 과거 프로젝트의 사용 사례를 공유해 주었습니다.

ML GDE Sayak Paul(인도)의 Open and Collaborative MLOps는 개방성과 협업이 MLOps의 두 가지 중요한 측면인 이유에 대한 발표였습니다. 그는 Hugging Face Hub의 개요와 이것이 TFX와 잘 통합되어 MLOps 워크플로에서 개방성과 협업을 촉진하는 방법에 대해 설명했습니다.

ML 연구

ML GDE Grigory Sapunov(영국)의 Paper review: PaLM 2 Technical Report에서는 PaLM2의 세부 사항과 논문을 살펴보았습니다. 그는 자신의 소셜 채널을 통해 Google 및 DeepMind와 관련된 논문 리뷰를 공유하는데 그중 몇 가지만 소개하면 Model evaluation for extreme risks(논문), Faster sorting algorithms discovered using deep reinforcement learning(논문), Power-seeking can be probable and predictive for trained agents(논문) 등이 있습니다.

ML GDE Aritra Roy Gosthipaty(인도)와 ML GDE Ritwik Raha(인도)의 Learning JAX in 2023: Part 3 — A Step-by-Step Guide to Training Your First Machine Learning Model with JAX에서는 JAX가 선형 및 비선형 회귀 모델을 학습시키는 방법과 PyTrees 라이브러리를 사용하여 다중 레이어 퍼셉트론 모델을 학습시키는 방법을 보여주었습니다. 또한 TFUG Mumbai에서 주최한 May 2023 Meetup에서는 Decoding End to End Object Detection with Transformers라는 제목으로 발표했으며, 모드의 아키텍처와 DETR의 시작으로 이어진 다양한 구성요소를 다루었습니다.

ML GDE Jerry Wu(대만)의 20 steps to train a deployed version of the GPT model on TPU에서는 JAX와 TPU를 사용하여 중국어 질문-답변 데이터를 학습시키고 유추하는 방법을 공유했습니다.

kaggle10

TFUG SingaporeMultimodal Transformers - Custom LLMs, ViTs & BLIPs에서는 최근에 다중 모달 작업과 관련하여 어떤 모델, 시스템, 기법이 나왔는지 살펴봤습니다. ML GDE Sam Witteveen(싱가포르)이 다양한 다중 모달 모델 및 시스템과 PaLM2 모델로 자신만의 모델을 만드는 방법을 살펴봤습니다. 6월에는 이 그룹에서 Blaise Agüera y Arcas(Google 연구팀 부사장 겸 펠로우)를 초대하고 생성형 AI의 현재와 미래의 발전 및 새로운 트렌드를 포함하여 Google DeepMind에서 진행 중인 연구와 Cerebra 프로젝트를 공유했습니다.

TensorFlow

ML GDE Thushan Ganegedara(호주)의 Training a recommendation model with dynamic embeddings에서는 TFR(TensorFlow Recommenders)과 TFRA(TensorFlow Recommenders Addons)를 활용하여 영화 추천자 모델을 개발하는 방법을 설명합니다. TFRA 라이브러리에서 제공하는 동적 임베딩을 사용하여 권장 설정에서 임베딩 테이블의 크기를 동적으로 늘리고 줄이는 방법을 보여주는 데 주로 집중했습니다.

kaggle11

ML GDE Mathis Hammel(프랑스)의 How I built the most efficient deepfake detector in the world for $100는 ThisPersonDoesNotExist.com을 통해 생성된 이미지를 감지하는 방법과 사진이 생성된 정확한 시간을 파악하는 방법까지도 살펴보는 발표였습니다. 또한 그의 트위터 대화목록 OSINT Investigation on LinkedIn에서는 LinkedIn의 가짜 회사들의 네트워크를 조사했습니다. 그는 TensorFlow 모델을 기반으로 한 직접 만든 간단한 도구를 사용하고 Google Cloud에서 호스팅했습니다. 생성형 신경망에 대한 기술적 설명도 포함했습니다. 701,000여 명이 이 대화목록을 보았고 1,200개 이상의 RT와 3,100개 이상의 좋아요를 받았습니다.

kaggle12

ML GDE Hugo Zanini(브라질)의 Few-shot learning: Creating a real-time object detection using TensorFlow and Python에서는 웹캠을 사용하여 물체의 사진을 찍고, 이미지에 레이블을 지정하고, 실시간으로 실행할 퓨샷 학습 모델을 학습시키는 방법을 보여줍니다. 또한 Hugo의 기사 Custom YOLOv7 Object Detection with TensorFlow.js에서는 브라우저에서 TensorFlow.js를 사용하여 실시간 및 오프라인으로 직접 실행하도록 사용자 설정 YOLOv7 모델을 학습시킨 방법을 설명합니다.

image10.png

ML GDE Gema Parreno Piqueras(스페인)의 The Lord of the Words: The Return of the experiments with DVC(슬라이드)는 신경망 머신러닝 시나리오의 Transformers와 Tensorflow 및 DVC 사용 방법을 설명하는 발표였습니다. 이 프로젝트에서 그녀는 Tensorflow Datasets 변환 카탈로그를 사용하여 다양한 언어의 데이터를 로드하고 TensorFlow Transformers 라이브러리를 사용하여 여러 모델을 학습시켰습니다.

ML GDE Sayak Paul(인도)의 Accelerate your TensorFlow models with XLA(슬라이드)와 Ship faster TensorFlow models with XLA에서는 Cloud Community Days Kolkata 2023과 Cloud Community Days Pune 2023에서 발표한 XLA로 TensorFlow 모델을 가속화하는 방법을 공유했습니다.

ML GDE Rubens Zimbres(브라질)의 Setup of NVIDIA Merlin and Tensorflow for Recommendation Models에서는 추천 알고리즘과 Two Towers 알고리즘에 대해 검토한 내용과 온프레미스 환경과 Vertex AI에 NVIDIA Merlin을 설정하는 방법을 제시했습니다.

클라우드

ML GDE Paolo Galeone(이탈리아)의 AutoML pipeline for tabular data on VertexAI in Go에서는 실제 Go 코드를 보여주고 시행 착오와 광범위한 Google 연구를 통해 얻은 유용한 정보를 공유하여 문서의 한계를 극복하기 위해 VertexAI 및 AutoML with Go를 사용하여 테이블 형식 모델의 개발과 배포를 심층적으로 탐구했습니다.

kaggle14

ML GDE Pedro Gengo(브라질)와 ML GDE Vinicius Caridá(브라질)의 Beyond images: searching information in videos using AI(슬라이드)에서는 동영상에서 정보를 검색할 수 있는 검색엔진을 만드는 방법을 보여주었습니다. 그들은 오디오를 스크립트로 작성하고, 프레임에 캡션을 적용하고, 이 텍스트를 임베딩으로 변환하고, 사용자 쿼리가 있을 경우 검색할 수 있도록 벡터 DB에 임베딩을 저장하는 아키텍처를 발표했습니다.

ML GDE Gant Laborde(미국)의 The secret sauce to creating amazing ML experiences for developers는 Gant가 깨달음을 얻은 순간, ML 분야에서 20년간 쌓은 경험, 개발자를 위한 즐겁고 의미 있는 경험을 하는 비결을 공유하는 팟캐스트였습니다.

ML GDE Gad Benram(포르투갈)의 What's inside Google’s Generative AI Studio?에서는 새로운 기능 미리보기와 이를 통해 기대할 수 있는 점을 공유했습니다. 또한 How to pitch Vertex AI in 2023에서 그는 고객에게 Vertex AI가 올바른 플랫폼임을 설득하는 방법에 관해 Google Cloud 담당자를 위한 간단하고 진솔한 6가지 세일즈 피치 포인트를 공유했습니다.

ML GDE Sachin Kumar(카타르)는 How to build a conversational AI Augmented Reality Experience with Sachin Kumar에서 Google Cloud AI, Unity 등의 여러 기술을 결합한 AR 앱을 개발하는 방법에 대해 이야기했습니다. 이 세션에서는 앱을 처음부터 새로 만드는 단계별 프로세스를 살펴보았습니다.

kaggle15

ML GDE Nitin Tiwari(인도)의 Machine Learning on Google Cloud Platform은 학생들이 ML 모델을 학습시키고 GCP로 이를 배포하는 프로세스에 대해 심층적으로 이해할 수 있도록 하기 위한 멘토링이었습니다. 그는 Building robust ML solutions with TensorFlow and GCP에서 ML 솔루션용 GCP 및 TensorFlow의 기능을 활용하고 사용자 설정 ML 모델을 배포하는 방법을 공유했습니다.

TFUG PrayagrajData to AI on Google cloud: Auto ML, Gen AI, and more에서는 AutoML과 생성형 AI를 포함한 Google Cloud의 첨단 AI 기술을 활용하는 방법을 학생들에게 교육했습니다.