2024년 10월 18일, Google은 웹브라우저의 클라이언트 측에서 머신러닝 모델을 개발하고 사용하는 전 세계 최고의 인재가 한자리에 모이는 제1회 Web AI Summit을 개최했습니다. 이번 행사는 초기 페이지 로드 후 이러한 모든 솔루션이 클라이언트 기기에서 완전히 오프라인으로 작동하여 사용자가 짧은 지연 시간 추론, 더욱 저렴한 비용, 개인정보 보호의 이점을 누릴 수 있음을 의미합니다.
이벤트 참석자 명단에는 Chrome, MediaPipe 등 Google 팀 발표자뿐만 아니라 Intel, Hugging Face, Microsoft, LangChain 등 해당 분야에서 활발하게 활동하는 3P 담당자도 포함되었습니다. 포장 소비재 감지부터 의료 솔루션까지, 폭넓고 다양한 업종과 주제를 포괄하는 이번 행사는 Web AI의 영향력이 어디까지 미칠지 잘 보여주었습니다.
자세한 내용을 보려면 계속 읽거나 YouTube 재생목록을 확인해 최신 정보를 바로 따라잡고 직접 강연을 시청해 보세요!
온종일 진행된 이 역사적 이벤트에 22개 국가, 59개 도시, 179개 Google 지사에서 온 1,100여 명이 등록해 빈틈없이 자리를 메웠습니다. 모두가 강연에 열중하는 모습은 정말 대단했습니다.
소프트웨어 엔지니어, 비즈니스 의사 결정권자, 경영진 등 각계각층의 사람들이 참석해 기술 전문 지식과 전략적 계획 사이에서 생산적인 시너지를 창출했습니다.
Google에서 다양한 분야의 전문가들이 강연자로 나서 귀중한 인사이트를 공유했습니다. 덕분에 Javascript 개발자들은 고객의 요구에 부응하는 데 있어 업계 표준이 되고 있는 정교하고 복잡한 AI 기반 기능에 대한 지식을 얻을 수 있습니다. 편한 시간에 커피 한 잔과 함께 아래의 모든 강연을 확인하고 시청해 보세요.
Jason Mayes - Web AI 책임자, Google
Jim Bankoski - Google Chrome의 엔지니어링 부사장
2024년 Web AI의 현황과 Web AI Summit을 만든 이유에 대한 개요. 머신러닝 온디바이스로 실현 가능한 사항뿐 아니라 그 방향성까지, 기본적인 내용을 담은 이 강연을 먼저 들은 후 이 시리즈의 다른 강연을 시청하세요. 모든 사람에게 적합한 이 강연은 현재 이미 Web AI를 사용 중인 업계의 사례와 더불어 생성형 AI, LLM, 확산 모델, WebGPU, WebAssembly, 새롭게 등장하는 API(예: WebNN) 등의 주제를 다룹니다.
Joshua Lochner - Hugging Face의 ML 엔지니어(Transformers.js)
개발자가 이전에 없던 웹 애플리케이션을 개발할 수 있도록 지원하는 흥미진진한 새 JavaScript 라이브러리인 Transformers.js에 대해 알아보세요. Transformers.js는 Hugging Face의 Python 트랜스포머 라이브러리와 기능적으로 동일하도록 설계되었으며 다양한 작업 및 모달리티 세트 전반에서 120여 가지 아키텍처를 지원합니다. 사용자는 1,000개 이상의 사전 학습된 모델 중에서 원하는 모델을 선택하거나 브라우저에서 로컬로 실행되도록 직접 변환하여 개인정보 보호, 짧은 지연 시간, 확장 가능한 머신러닝을 제공할 수 있습니다. 최근에 WebGPU 지원이 추가되어 브라우저에서 직접 최신 GPU 기능을 활용함으로써 모델을 고성능으로 실행할 수 있습니다.
Rob Kochman - Google의 그룹 제품 관리자(Chrome)
Rafael Cintron - Microsoft의 책임 소프트웨어 설계 엔지니어
최근 WebAssembly, WebGPU 등 첨단 웹 기술은 브라우저에 실제로 AI 기능을 도입했습니다. 제안된 WebNN(Web Neural Network) API는 그 모멘텀을 활용하여 AI 가속기 하드웨어(NPU)가 장착된 기기를 포함해 AI 워크로드가 웹 표준을 기반으로 한 다양한 기기에서 더 빠르고 효율적으로 실행될 수 있도록 하는 것을 목표로 합니다. 이 세션에서는 WebNN에 대한 간략한 개요로 시작해, API 모양, 기기 지원, 프레임워크 지원, 브라우저 구현 등 최근 개발 사항에 대해 설명합니다. 커뮤니티의 의견 수집을 위해 노력하는 한편 앞으로의 계획에 대해서도 설명합니다.
Moh Haghighat - Intel의 펠로우
Intel은 CPU, GPU, NPU와 같은 클라이언트 AI 실행 엔진 전반에서 온디바이스 웹 ML 가속화를 위한 새로운 통합 W3C 웹 표준 API인 WebNN을 선보였습니다. 현재 Chrome 및 Edge 브라우저의 개발자 프리뷰에서 인기 ML 프레임워크(예: ONNX Runtime Web)에 통합된 WebNN은 '네이티브에 가까운' 성능과 전력 특성을 제공합니다. 웹에 새로운 수준의 경험을 선사하는 흥미로운 WebNN 데모와 채택 미리보기를 보여드리겠습니다.
Yu Lee - 미국 뉴욕대학교 ML5.js 상주 연구원
Aidan Nelson - 뉴욕대학교의 ML5.js 객원 교수
이 강연은 아티스트, 크리에이티브 코더, 학생으로 구성된 광범위한 청중이 머신러닝에 접근할 수 있도록 하겠다는 목표하에 TensorFlow.js를 기반으로 개발된 오픈소스 라이브러리인 ml5.js에 초점을 맞춥니다. 이 프로젝트는 뉴욕대학교의 ITP 프로그램에서 이루어진 협업 연구를 통해 진행되었는데, 코딩의 접근성과 포용성 향상에 중점을 둔 p5.js 프로젝트와 Processing에서 영감을 얻었습니다. ml5.js는 이 사명을 머신러닝 영역으로 확장하여 머신러닝의 기술적 복잡성과 초보자 및 아티스트의 창의성 사이에 존재하는 격차를 해소하는 것을 목표로 합니다.
Charlie Ruan - 미국 카네기 멜런 대학교 학생 연구원
이 강연에서는 고성능 인브라우저 LLM 추론 엔진인 WebLLM에 대해 알아보았습니다. WebLLM을 사용하면 빠르고(WebGPU를 통한 네이티브 GPU 가속), 비공개이며(100% 클라이언트 측 계산), 편리한(환경 설정 불필요) AI 사용 웹 앱을 개발할 수 있습니다. 개발자 편의성을 고려해 WebLLM은 표준화된 통합을 위한 OpenAI-API 스타일의 인터페이스를 갖추고 있고, 채팅 애플리케이션 및 효율적으로 구조화된 JSON 생성을 지원합니다. 또한 웹/서비스 워커가 UI 흐름에서 백엔드 실행을 분리할 수 있도록 내장된 지원 기능을 제공합니다. 이 강연에서는 WebLLM의 주요 특징과 전반적인 아키텍처, 개발자가 아키텍처로 AI 사용 웹 애플리케이션을 개발하는 방법에 대해 탐색합니다.
Jacob Lee - LangChain 창립 엔지니어
WebLLM, Transformers.js, Chrome AI 등 프로젝트에서의 흥미진진하고 새로운 발전에 힘입어 로컬 LLM은 브라우저를 통해 그 어느 때보다도 모든 사용자에게 더 가까이 다가갈 수 있게 되었습니다. 웹 개발의 지평을 확장할 수 있는 엄청난 잠재력을 지니고 있지만, 이러한 소형 모델은 최첨단 호스팅 모델보다 제한적이며 디자인과 프롬프트 작성에 있어 더 신중한 고려를 요합니다.
이 강연은 이러한 제약 조건을 해결하는 데 중점을 두었습니다. 이를 위해 스테이트풀(Stateful) LLM 앱을 오케스트레이션하기 위한 새로운 프레임워크인 LangGraph.js에서 제공하는 강력한 툴킷을 사용하여 소형 모델을 최대한 활용하는 실용적인 앱을 구현하는 기법에 대해 알아보았습니다.
Ruofei Du - Google의 쌍방향 지각 및 그래픽 책임자
Visual Blocks for ML은 신속한 AI 및 멀티미디어 프로토타입 제작을 지원하는 시각적 프로그래밍 플랫폼입니다. 이 강연에서는 간단한 드래그 앤 드롭 작업을 사용하여 대화형 AI 파이프라인을 만들고 대화형 데이터 증강을 수행하며 라이브 데이터로 파이프라인을 테스트하는 방법을 시연합니다. 또한 대화형 그래픽, 대형 언어 모델 체인, 컴퓨터 비전, 다중 모달 솔루션에서 다양한 애플리케이션을 보여주는 여러 커뮤니티 기여 파이프라인과 사용자 설정 노드를 집중 조명합니다. 마지막으로, 모든 Web AI 실무자가 자신의 ML 파이프라인과 사용자 설정 노드에 기여하여 공유 플랫폼의 질을 더 높이고 혁신적인 사용 사례에 영감을 주도록 독려합니다.
Charlie Gerard - CrowdStrike의 선임 연구 엔지니어
최근 AI의 발전은 주로 대규모 언어 모델과 새로운 콘텐츠 제작 및 소비 방식에 초점을 맞추고 있습니다. 그러나 AI는 인터페이스와 상호작용하는 방식을 재고할 기회도 제공합니다. 웹 개발자는 신체 추적 또는 오디오 분류에 초점을 맞춘 JavaScript와 모델을 사용하여 보다 혁신적인 웹 경험을 만들기 위해 대체 상호작용을 실험할 수 있는 특별한 기회를 갖습니다.
Kenji Baheux - Google의 Chrome 제품 관리자
저희가 기본 제공 AI를 위해 Chrome에서 지금까지 해온 작업과 알게 된 내용, 그리고 다음 단계에 대해 공유합니다. Prompt API를 보는 방법과 상위 수준 작업 API의 상태(예: 요약, 쓰기/다시 쓰기, 초기 미리보기 프로그램에서 배운 내용), 또한 앞으로의 방향에 대해 이야기하겠습니다.
Hugo Zanini - Nubank의 기술 프로젝트 책임자
이 강연에서는 세계 10대 소비재(CPG) 기업 중 하나가 어떻게 Web AI를 활용하여 브라질에서 매장 내 판매 마케팅 전략을 확장했는지, 또한 그것이 어떻게 업계의 다른 기업에도 도움이 된 오픈소스 프로젝트로 발전했는지 보여주었습니다.
Thomas Steiner - Google의 Chrome 개발자 관계 엔지니어
이 강연에서 Thomas는 개발자 관계팀이 Chrome 기본 제공 API의 최초 시험 사용자 역할을 맡으면서 배운 몇 가지 사항을 정리해서 전달했습니다. Thomas는 AI 기반 동의어 찾기 앱을 예로 사용하여 프롬프트 조정부터 안정적으로 출력 구문 분석하기와 최대 성능을 위한 앱 최적화까지, 다양한 측면에 초점을 맞춘 Prompt API를 사용하는 방법을 보여줍니다.
히로타 유리코 - Google의 파트너 솔루션 엔지니어
하라 카즈나리 - CyberAgent의 개발자 전문가
이 라이트닝 토크에서는 AI 사용뿐만 아니라 사용자 경험 향상을 위한 클라이언트 측 AI의 실용적인 힘을 보여줍니다. 이 강연에서는 Google I/O 2024에 소개된 실제 사례 연구를 심층적으로 살펴보고, 일본 최고의 블로그 서비스 중 하나를 강력히 지원하는 CyberAgent가 클라이언트 측 AI의 마법을 활용하여 사용자가 손쉽게 블로그 타이틀을 생성할 수 있도록 지원하기 위해 어떤 계획을 마련해두고 있는지 소개했습니다. 이 강연에 참석해 CyberAgent가 혁신적인 사용 사례 설계와 사용자 중심 접근 방식을 통해 클라이언트 측 AI의 잠재력을 극대화한 방법을 알아보세요.
David Li - Google의 Chrome 제품 관리자
이 강연에서는 AI 및 Chrome 확장 프로그램의 잠재력을 소개합니다. Chrome 확장 프로그램을 사용하면 브라우저를 제어하고 웹 콘텐츠를 관찰하며 나만의 UI를 추가할 수 있습니다. AI와 Chrome 확장 프로그램을 결합하면 웹 탐색 경험을 매우 유용하고 보다 생산적으로 만들 수 있습니다. 이 강연에서는 WebStore에서 확장 프로그램이 오늘날 AI를 어떻게 사용하고 있는지와 가장 큰 잠재력이 실현되는 부분은 어디인지에 대해 개괄적으로 설명합니다.
Evgeny Peshkov - GEENEE의 CTO
Web AI가 모든 화면에 획기적인 가상 사용 체험 광고를 도입하여 어떻게 맞춤 설정된 유료 미디어에 혁명을 일으키고 있는지 알아보세요.
Tyler Mullen - Google의 MediaPipe 스태프 소프트웨어 엔지니어
AI 파이프라인을 만들어 이를 브라우저에 도입하는 작업에 대한 MediaPipe의 크로스 플랫폼 접근 방식에 대해 알아보세요. Google에서 사용하는 방법의 장점 몇 가지를 집중 조명하고 Google이 지원하는 주요 제품(예: Google Meet) 일부에 대해서도 이야기합니다. 다음으로는 최신 기술 발전과 개발자 API에 대해 설명합니다. 여기에는 전통적인 머신러닝 작업(예: 이미지 세분화)은 물론이고 생성형 AI 작업(예: LLM 추론)을 위한 솔루션이 포함됩니다. 마지막으로, 흥미진진한 데모를 통해 미래를 살짝 엿볼 기회도 제공됩니다!
Chris Slee - Include Health의 CTO
가상 물리 치료 서비스 공급자인 IncludeHealth는 WebAI의 힘을 활용하여 물류 및 경제적 장벽을 무너뜨려 환자가 언제 어디서나 어떤 기기에서든 개인에게 맞춤 설정된 신중한 치료를 받을 수 있도록 합니다.
Richard Stotz - Google의 Core ML 소프트웨어 엔지니어
ML 및 AI용 무료 Google 스프레드시트 부가기능인 Simple ML for Sheets를 어떻게 개발했는지 살펴보세요. Simple ML for Sheets는 WebAssembly, Javascript 및 Chrome의 새로운 기본 제공 AI를 기반으로 하는 온디바이스 머신러닝을 사용하여 모든 사용자를 위해 고급 머신러닝 작업의 잠재력을 활용합니다. 이 강연에서는 Simple ML for Sheets를 성공적으로 출시하는 데 사용한 도구와 개발자가 웹에서 성공적인 ML 모델을 개발하는 데 팀의 오픈소스 라이브러리가 어떻게 도움이 되는지 집중 조명합니다.
이번 이벤트를 조직하고 운영하는 과정에 참여한 수많은 사람의 도움이 없었다면 이번 행사는 불가능했을 것입니다. 이벤트 개최에 힘써 주신 3명의 이벤트 크리에이터, Jason Mayes, Jenna Zheng, Marcus Chang에게 감사드립니다. 물론 앞서 소개한 모든 발표자와 이벤트 당일 도움을 주신 모든 관계자 및 현장 요원에게도 큰 감사를 드립니다. 또한 이벤트 후 즐겁게 시청할 수 있도록 이벤트를 매끄럽게 녹화해 주신 AV 팀에도 감사드립니다.
이번에 참석하지 못하셨다면 위의 동영상을 시청하세요. 꼭 공개 Web AI 뉴스레터를 구독하고 다음에 열릴 이벤트에 대한 정보를 얻으세요!