Resumo do Web AI Summit 2024: IA no lado do cliente para desenvolvedores

NOV 11, 2024
Jason Mayes Web AI Lead

A primeira conferência do Google para desenvolvedores que usam a IA no lado do cliente


Em 18 de outubro de 2024, o Google realizou o primeiro Web AI Summit, reunindo grandes especialistas do mundo todo que trabalham com modelos de aprendizado de máquina no lado do cliente em navegadores da Web. Isso significa que, após o carregamento da página inicial, todas essas soluções podem funcionar totalmente off-line no dispositivo cliente, permitindo que os usuários se beneficiem de inferência com baixa latência, custos reduzidos e privacidade.

Nosso time incluiu apresentadores das equipes do Google, como do Chrome e MediaPipe, e também representantes de terceiros ativos nessa área, como Intel, Hugging Face, Microsoft e LangChain, entre outros. As palestras englobaram uma ampla gama de setores e áreas, desde a detecção de bens de consumo embalados até soluções para a saúde, mostrando o grande potencial da IA da Web.

Continue lendo para saber mais ou veja a playlist do YouTube para se atualizar e assistir às palestras!

Machine Learning Panel

Destaques do primeiro Web AI Summit

Mais de 1.100 pessoas inscritas de 22 países, 59 cidades e 179 escritórios do Google juntaram-se a nós nesse evento histórico, que teve casa cheia ao longo de todo o dia. Foi fantástico ver o engajamento de todos os participantes nas palestras.

Nosso público incluiu engenheiros de software, tomadores de decisões de negócios e líderes executivos, criando uma sinergia produtiva entre conhecimento técnico e planejamento estratégico.


Palestrantes e sessões do Web AI Summit

Nossos palestrantes especialistas compartilharam insights valiosos para transmitir aos desenvolvedores de JavaScript conhecimentos sobre recursos sofisticados e complexos habilitados por IA que estão se tornando o padrão do setor para atender às demandas dos clientes. Confira todas as palestras abaixo quando desejar.

image3

Recepção dos participantes no Web AI Summit 2024

Jason Mayes, Líder de IA da Web do Google

Jim Bankoski, VP de engenharia do Chrome do Google

Uma visão geral do status atual da IA da Web em 2024 e os motivos da criação do Web AI Summit. Veja o que é possível fazer com o aprendizado de máquina no dispositivo e conheça as tendências futuras para obter uma compreensão geral antes de assistir às outras palestras desta série. Esta palestra é indicada para todos os participantes e abrange áreas como IA generativa, LLMs, modelos de difusão, WebGPU, WebAssembly e APIs emergentes, como WebNN, além de exemplos do setor que já estão usando a IA da Web.


Transformers.js: aprendizado de máquina de última geração para a Web

Joshua Lochner, Engenheiro de ML (Transformers.js) da Hugging Face

Saiba mais sobre o Transformers.js, uma nova e incrível biblioteca JavaScript que capacita os desenvolvedores a criarem aplicativos da Web inéditos. Ele foi projetado para ser funcionalmente equivalente à biblioteca Transformers do Python da Hugging Face e dá suporte a mais de 120 arquiteturas em um conjunto diversificado de tarefas e modalidades. Os usuários podem escolher entre mais de 1.000 modelos pré-treinados ou converter os seus próprios para execução local no navegador, oferecendo o aprendizado de máquina escalonável, de baixa latência e com preservação da privacidade. A mais recente adição de suporte à WebGPU permite a execução de modelos de alto desempenho com o uso de recursos modernos de GPU diretamente no navegador.


API Web Neural Network (WebNN): presente e futuro

Rob Kochman, Gerente de produtos do grupo (Chrome) do Google

Rafael Cintron, Engenheiro principal de design de software da Microsoft

Tecnologias da Web avançadas, como WebAssembly e WebGPU, trouxeram recentemente recursos reais de IA para o navegador. O objetivo da API Web Neural Network (WebNN) é aproveitar esse momento, permitindo que as cargas de trabalho de IA sejam executadas com mais rapidez e eficiência em uma variedade de dispositivos, incluindo dispositivos com hardware acelerador de IA (NPUs), todos baseados em padrões da Web. Esta sessão começa com uma breve visão geral da WebNN e, em seguida, descreve os desenvolvimentos recentes, incluindo forma da API, suporte a dispositivos, suporte a frameworks e implementações de navegador. Também descrevemos os planos para o futuro enquanto, trabalhamos para obter o feedback da comunidade.


IA da Web em PCs com IA

Moh Haghighat, Fellow da Intel

A Intel apresentou o WebNN, uma API da Web W3C padrão unificada e emergente para aceleração de ML na Web no dispositivo em vários mecanismos de execução de IA no cliente: CPU, GPU e NPU. Atualmente como uma prévia para desenvolvedores nos navegadores Chrome e Edge e integrada a frameworks populares de ML (como o ONNX Runtime Web), o WebNN tem características de desempenho e potência "quase nativas". Tivemos prévias de adoção e demonstrações do WebNN interessantes, que trazem um novo nível de experiências para a Web.


ml5.js: aprendizado de máquina simplificado para a Web

Yu Lee, Pesquisadora residente de ML5.js da NYU

Aidan Nelson, Professor convidado de ML5.js da NYU

O foco desta palestra é o ml5.js, uma biblioteca de código aberto criada com base no TensorFlow.js com o objetivo de tornar o aprendizado de máquina acessível para um público amplo de artistas, programadores de criativos e estudantes. Esse projeto foi criado como um esforço colaborativo no programa ITP da NYU, inspirando-se no Processing e no foco do projeto p5.js de tornar a programação acessível e inclusiva. O ml5.js visa expandir essa missão para o domínio do aprendizado de máquina, preenchendo a lacuna entre a complexidade técnica do aprendizado de máquina e a criatividade de iniciantes e artistas.


WebLLM: um mecanismo de inferência de LLM de alto desempenho no navegador

Charlie Ruan, Estudante pesquisador da CMU

Esta palestra tem como tema o WebLLM, um mecanismo de inferência de LLM de alto desempenho no navegador. O WebLLM permite a criação de apps da Web habilitados para IA que são rápidos (aceleração de GPU nativa via WebGPU), privados (100% de computação no lado do cliente) e convenientes (sem configuração de ambiente). Para desenvolvedores, o WebLLM apresenta uma interface no estilo da API da OpenAI para integração padronizada, dá suporte a aplicativos de chat e à geração JSON estruturada eficiente, além de oferecer suporte integrado para Web/Service Workers a fim de separar execuções de back-end do fluxo de IU. Nesta palestra, exploramos os principais recursos do WebLLM, a arquitetura geral e como os desenvolvedores podem usá-lo para criar aplicativos da Web habilitados para IA.


O estado não é tudo, mas ajuda: como criar apps de LLM melhores no navegador

Jacob Lee, Engenheiro fundador da LangChain

Novos avanços interessantes, de projetos como WebLLM, Transformers.js e Chrome AI, aproximaram, mais do que nunca os LLMs locais de qualquer pessoa que tenha um navegador. Isso tem um imenso potencial para expandir as fronteiras do desenvolvimento da Web, mas esses pequenos modelos são mais limitados do que os modelos hospedados de última geração e exigem considerações mais cuidadosas quanto ao design e à elaboração de prompts.

O foco dessa palestra é abordar essas limitações, apresentando técnicas para implementar apps práticos que aproveitem ao máximo os pequenos modelos usando o avançado kit de ferramentas fornecido pelo LangGraph.js, um novo framework para orquestração de apps de LLM com estado.


Visual Blocks: prototipagem visual de pipelines de IA

Ruofei Du, Líder de gráficos e percepção interativos do Google

O Visual Blocks for ML é uma plataforma de programação visual que permite a prototipagem rápida de multimídia e IA. Nesta palestra, demonstramos como criar pipelines de IA interativos, realizar o aumento interativo de dados e testar pipelines com dados em tempo real usando ações simples de arrastar e soltar. Também destacamos uma variedade de pipelines e nós personalizados com contribuições da comunidade, demonstrando diversas aplicações em gráficos interativos, cadeias de modelos de linguagem grandes, visão computacional e soluções multimodais. Por fim, encorajamos todos os profissionais de IA da Web a contribuir com seus próprios pipelines de ML e nós personalizados, enriquecendo ainda mais a plataforma compartilhada e inspirando casos de uso inovadores.


Análise de interações alternativas em JavaScript

Charlie Gerard, Engenheira de pesquisa sênior da CrowdStrike

Os últimos avanços em IA concentraram-se principalmente nos modelos de linguagem grandes e em novas formas de criar e consumir conteúdo. No entanto, a IA também oferece a oportunidade de repensar a maneira como interagimos com as interfaces. Com o uso do JavaScript e de modelos com foco em rastreamento corporal ou classificação de áudio, os desenvolvedores da Web têm uma oportunidade única de experimentar interações alternativas para criar experiências da Web mais inovadoras.


Visão geral da IA integrada do Chrome

Kenji Baheux, Gerente de produtos do Chrome do Google

Compartilhamos o que estamos fazendo no Chrome em relação à IA integrada, o que aprendemos e quais serão os próximos passos. Falamos sobre como vemos a API Prompt, nosso status quanto a APIs de tarefas de alto nível, como resumo e gravação/reescrita, além de abordar os aprendizados do programa de pré-lançamento antecipado e o que faremos daqui para frente.


IA da Web em ação: como o TensorFlow.js impulsionou o que você vê nas prateleiras dos supermercados

Hugo Zanini, Líder de projetos técnicos do Nubank

Esta palestra mostra como uma das 10 maiores empresas de bens de consumo embalados (CPG) do mundo usou a IA da Web para expandir sua estratégia de marketing comercial em lojas no Brasil e como ela evoluiu para um projeto de código aberto que tem sido benéfico para outras empresas do setor.


Lições aprendidas como cliente zero de APIs integradas do Chrome

Thomas Steiner, Engenheiro de relações com desenvolvedores do Chrome do Google

Nesta palestra, Thomas resume algumas das lições aprendidas pela área de Relações com desenvolvedores como cliente zero de APIs integradas do Chrome. Com um exemplo de um app de busca de sinônimos habilitado por IA, ele mostra como trabalhar com a API Prompt, concentrando-se em aspectos como ajuste de prompts, análise da saída de maneira confiável e otimização do app para garantir o máximo desempenho.


O futuro da IA já chegou: estudos de casos reais de adoção da IA no lado do cliente em apps da Web

Yuriko Hirota, Engenheira de soluções de parceiros do Google

Kazunari Hara, Especialista em desenvolvedores da CyberAgent

Esta palestra relâmpago revela o poder prático da IA no lado do cliente, visando não apenas ao uso da IA, mas também à melhoria das experiências dos usuários. Na palestra, é feita uma análise detalhada de um estudo de caso do mundo real apresentado no Google I/O 2024, que mostra como a CyberAgent, a potência por trás de um dos principais serviços de blogs do Japão, planeja aproveitar a magia da IA no lado do cliente para capacitar os usuários com a geração de títulos de blogs sem esforço. Junte-se a nós para saber como a CyberAgent ampliou o potencial da IA no lado do cliente por meio de um design de caso de uso inovador e de uma abordagem centrada no usuário.


Por que as extensões da Web são excelentes para a IA?

David Li, Gerente de produtos do Chrome do Google

Nesta palestra, mostramos o potencial da IA e das extensões do Chrome. As extensões do Chrome permitem que você controle o navegador, observe o conteúdo da Web e adicione sua própria IU. Quando combinadas, a IA e as extensões do Chrome podem tornar a experiência de navegação realmente útil e mais produtiva. Esta palestra apresenta uma visão geral de como as extensões na WebStore estão usando a IA hoje e onde vemos o maior potencial.


Além do banner: o poder da IA da Web para personalizar mídias pagas

Cory Grenier, CEO da GEENEE

Evgeny Peshkov, CTO da GEENEE

Saiba como a IA da Web está revolucionando as mídias pagas personalizadas ao incluir anúncios experimentais virtuais inovadores em todas as telas.


MediaPipe Web: levando a tecnologia de IA multiplataforma para o navegador

Tyler Mullen, Engenheiro de software da equipe do MediaPipe do Google

Saiba mais sobre a abordagem multiplataforma do MediaPipe para criar pipelines de IA e levá-los para o navegador. Destacamos alguns dos benefícios de nosso método e falamos sobre alguns dos principais produtos que ajudamos a promover (como o Google Meet). Depois, apresentamos os avanços tecnológicos e as APIs de desenvolvedor mais recentes. Essas ofertas incluem soluções para tarefas tradicionais de aprendizado de máquina, como segmentação de imagens, bem como tarefas de IA generativa, como inferência de LLM. Por fim, falamos sobre o futuro com algumas demonstrações muito interessantes!


Transformação do acesso à saúde por meio da IA da Web

Chris Slee, CTO da IncludeHealth


A IncludeHealth, um provedor de fisioterapia virtual, aproveita o poder da IA da Web para eliminar barreiras logísticas e econômicas, permitindo que os pacientes recebam atendimento personalizado e monitorado em qualquer lugar, a qualquer hora e em qualquer dispositivo.


Treinamento de ML na Web: criação do Aprendizado de Máquina Sem Código para o Planilhas Google

Richard Stotz, Engenheiro de software de Core ML do Google


Saiba como criamos o Aprendizado de Máquina Sem Código para o Planilhas Google, um complemento gratuito do Planilhas Google para ML e IA. Ele usa o aprendizado de máquina no dispositivo habilitado por WebAssembly, JavaScript e a nova IA integrada do Chrome para possibilitar a execução de tarefas avançadas de aprendizado de máquina para todos os usuários. Esta palestra destaca as ferramentas que usamos para disponibilizar o Aprendizado de Máquina Sem Código para o Planilhas Google no mercado e como as bibliotecas de código aberto de nossa equipe ajudam os desenvolvedores a terem sucesso com o ML na Web.


Nossos sinceros agradecimentos!

Esse evento não seria possível sem as inúmeras pessoas envolvidas em sua criação e realização. Gostaríamos de agradecer a Jason Mayes, Jenna Zheng e Marcus Chang pela organização do evento. Nossos agradecimentos aos apresentadores listados acima, a nossos ajudantes e assistentes e a nossas equipes de AV, que garantiram a gravação do evento para que você pudesse assistir com tranquilidade depois.


Quer participar do próximo Web AI Summit?

Se você perdeu o evento desta vez, acompanhe os vídeos acima e não deixe de fazer sua inscrição em nossa newsletter pública de IA da Web para receber informações sobre as novidades!