Em 18 de outubro de 2024, o Google realizou o primeiro Web AI Summit, reunindo grandes especialistas do mundo todo que trabalham com modelos de aprendizado de máquina no lado do cliente em navegadores da Web. Isso significa que, após o carregamento da página inicial, todas essas soluções podem funcionar totalmente off-line no dispositivo cliente, permitindo que os usuários se beneficiem de inferência com baixa latência, custos reduzidos e privacidade.
Nosso time incluiu apresentadores das equipes do Google, como do Chrome e MediaPipe, e também representantes de terceiros ativos nessa área, como Intel, Hugging Face, Microsoft e LangChain, entre outros. As palestras englobaram uma ampla gama de setores e áreas, desde a detecção de bens de consumo embalados até soluções para a saúde, mostrando o grande potencial da IA da Web.
Continue lendo para saber mais ou veja a playlist do YouTube para se atualizar e assistir às palestras!
Mais de 1.100 pessoas inscritas de 22 países, 59 cidades e 179 escritórios do Google juntaram-se a nós nesse evento histórico, que teve casa cheia ao longo de todo o dia. Foi fantástico ver o engajamento de todos os participantes nas palestras.
Nosso público incluiu engenheiros de software, tomadores de decisões de negócios e líderes executivos, criando uma sinergia produtiva entre conhecimento técnico e planejamento estratégico.
Nossos palestrantes especialistas compartilharam insights valiosos para transmitir aos desenvolvedores de JavaScript conhecimentos sobre recursos sofisticados e complexos habilitados por IA que estão se tornando o padrão do setor para atender às demandas dos clientes. Confira todas as palestras abaixo quando desejar.
Jason Mayes, Líder de IA da Web do Google
Jim Bankoski, VP de engenharia do Chrome do Google
Uma visão geral do status atual da IA da Web em 2024 e os motivos da criação do Web AI Summit. Veja o que é possível fazer com o aprendizado de máquina no dispositivo e conheça as tendências futuras para obter uma compreensão geral antes de assistir às outras palestras desta série. Esta palestra é indicada para todos os participantes e abrange áreas como IA generativa, LLMs, modelos de difusão, WebGPU, WebAssembly e APIs emergentes, como WebNN, além de exemplos do setor que já estão usando a IA da Web.
Joshua Lochner, Engenheiro de ML (Transformers.js) da Hugging Face
Saiba mais sobre o Transformers.js, uma nova e incrível biblioteca JavaScript que capacita os desenvolvedores a criarem aplicativos da Web inéditos. Ele foi projetado para ser funcionalmente equivalente à biblioteca Transformers do Python da Hugging Face e dá suporte a mais de 120 arquiteturas em um conjunto diversificado de tarefas e modalidades. Os usuários podem escolher entre mais de 1.000 modelos pré-treinados ou converter os seus próprios para execução local no navegador, oferecendo o aprendizado de máquina escalonável, de baixa latência e com preservação da privacidade. A mais recente adição de suporte à WebGPU permite a execução de modelos de alto desempenho com o uso de recursos modernos de GPU diretamente no navegador.
Rob Kochman, Gerente de produtos do grupo (Chrome) do Google
Rafael Cintron, Engenheiro principal de design de software da Microsoft
Tecnologias da Web avançadas, como WebAssembly e WebGPU, trouxeram recentemente recursos reais de IA para o navegador. O objetivo da API Web Neural Network (WebNN) é aproveitar esse momento, permitindo que as cargas de trabalho de IA sejam executadas com mais rapidez e eficiência em uma variedade de dispositivos, incluindo dispositivos com hardware acelerador de IA (NPUs), todos baseados em padrões da Web. Esta sessão começa com uma breve visão geral da WebNN e, em seguida, descreve os desenvolvimentos recentes, incluindo forma da API, suporte a dispositivos, suporte a frameworks e implementações de navegador. Também descrevemos os planos para o futuro enquanto, trabalhamos para obter o feedback da comunidade.
Moh Haghighat, Fellow da Intel
A Intel apresentou o WebNN, uma API da Web W3C padrão unificada e emergente para aceleração de ML na Web no dispositivo em vários mecanismos de execução de IA no cliente: CPU, GPU e NPU. Atualmente como uma prévia para desenvolvedores nos navegadores Chrome e Edge e integrada a frameworks populares de ML (como o ONNX Runtime Web), o WebNN tem características de desempenho e potência "quase nativas". Tivemos prévias de adoção e demonstrações do WebNN interessantes, que trazem um novo nível de experiências para a Web.
Yu Lee, Pesquisadora residente de ML5.js da NYU
Aidan Nelson, Professor convidado de ML5.js da NYU
O foco desta palestra é o ml5.js, uma biblioteca de código aberto criada com base no TensorFlow.js com o objetivo de tornar o aprendizado de máquina acessível para um público amplo de artistas, programadores de criativos e estudantes. Esse projeto foi criado como um esforço colaborativo no programa ITP da NYU, inspirando-se no Processing e no foco do projeto p5.js de tornar a programação acessível e inclusiva. O ml5.js visa expandir essa missão para o domínio do aprendizado de máquina, preenchendo a lacuna entre a complexidade técnica do aprendizado de máquina e a criatividade de iniciantes e artistas.
Charlie Ruan, Estudante pesquisador da CMU
Esta palestra tem como tema o WebLLM, um mecanismo de inferência de LLM de alto desempenho no navegador. O WebLLM permite a criação de apps da Web habilitados para IA que são rápidos (aceleração de GPU nativa via WebGPU), privados (100% de computação no lado do cliente) e convenientes (sem configuração de ambiente). Para desenvolvedores, o WebLLM apresenta uma interface no estilo da API da OpenAI para integração padronizada, dá suporte a aplicativos de chat e à geração JSON estruturada eficiente, além de oferecer suporte integrado para Web/Service Workers a fim de separar execuções de back-end do fluxo de IU. Nesta palestra, exploramos os principais recursos do WebLLM, a arquitetura geral e como os desenvolvedores podem usá-lo para criar aplicativos da Web habilitados para IA.
Jacob Lee, Engenheiro fundador da LangChain
Novos avanços interessantes, de projetos como WebLLM, Transformers.js e Chrome AI, aproximaram, mais do que nunca os LLMs locais de qualquer pessoa que tenha um navegador. Isso tem um imenso potencial para expandir as fronteiras do desenvolvimento da Web, mas esses pequenos modelos são mais limitados do que os modelos hospedados de última geração e exigem considerações mais cuidadosas quanto ao design e à elaboração de prompts.
O foco dessa palestra é abordar essas limitações, apresentando técnicas para implementar apps práticos que aproveitem ao máximo os pequenos modelos usando o avançado kit de ferramentas fornecido pelo LangGraph.js, um novo framework para orquestração de apps de LLM com estado.
Ruofei Du, Líder de gráficos e percepção interativos do Google
O Visual Blocks for ML é uma plataforma de programação visual que permite a prototipagem rápida de multimídia e IA. Nesta palestra, demonstramos como criar pipelines de IA interativos, realizar o aumento interativo de dados e testar pipelines com dados em tempo real usando ações simples de arrastar e soltar. Também destacamos uma variedade de pipelines e nós personalizados com contribuições da comunidade, demonstrando diversas aplicações em gráficos interativos, cadeias de modelos de linguagem grandes, visão computacional e soluções multimodais. Por fim, encorajamos todos os profissionais de IA da Web a contribuir com seus próprios pipelines de ML e nós personalizados, enriquecendo ainda mais a plataforma compartilhada e inspirando casos de uso inovadores.
Charlie Gerard, Engenheira de pesquisa sênior da CrowdStrike
Os últimos avanços em IA concentraram-se principalmente nos modelos de linguagem grandes e em novas formas de criar e consumir conteúdo. No entanto, a IA também oferece a oportunidade de repensar a maneira como interagimos com as interfaces. Com o uso do JavaScript e de modelos com foco em rastreamento corporal ou classificação de áudio, os desenvolvedores da Web têm uma oportunidade única de experimentar interações alternativas para criar experiências da Web mais inovadoras.
Kenji Baheux, Gerente de produtos do Chrome do Google
Compartilhamos o que estamos fazendo no Chrome em relação à IA integrada, o que aprendemos e quais serão os próximos passos. Falamos sobre como vemos a API Prompt, nosso status quanto a APIs de tarefas de alto nível, como resumo e gravação/reescrita, além de abordar os aprendizados do programa de pré-lançamento antecipado e o que faremos daqui para frente.
Hugo Zanini, Líder de projetos técnicos do Nubank
Esta palestra mostra como uma das 10 maiores empresas de bens de consumo embalados (CPG) do mundo usou a IA da Web para expandir sua estratégia de marketing comercial em lojas no Brasil e como ela evoluiu para um projeto de código aberto que tem sido benéfico para outras empresas do setor.
Thomas Steiner, Engenheiro de relações com desenvolvedores do Chrome do Google
Nesta palestra, Thomas resume algumas das lições aprendidas pela área de Relações com desenvolvedores como cliente zero de APIs integradas do Chrome. Com um exemplo de um app de busca de sinônimos habilitado por IA, ele mostra como trabalhar com a API Prompt, concentrando-se em aspectos como ajuste de prompts, análise da saída de maneira confiável e otimização do app para garantir o máximo desempenho.
Yuriko Hirota, Engenheira de soluções de parceiros do Google
Kazunari Hara, Especialista em desenvolvedores da CyberAgent
Esta palestra relâmpago revela o poder prático da IA no lado do cliente, visando não apenas ao uso da IA, mas também à melhoria das experiências dos usuários. Na palestra, é feita uma análise detalhada de um estudo de caso do mundo real apresentado no Google I/O 2024, que mostra como a CyberAgent, a potência por trás de um dos principais serviços de blogs do Japão, planeja aproveitar a magia da IA no lado do cliente para capacitar os usuários com a geração de títulos de blogs sem esforço. Junte-se a nós para saber como a CyberAgent ampliou o potencial da IA no lado do cliente por meio de um design de caso de uso inovador e de uma abordagem centrada no usuário.
David Li, Gerente de produtos do Chrome do Google
Nesta palestra, mostramos o potencial da IA e das extensões do Chrome. As extensões do Chrome permitem que você controle o navegador, observe o conteúdo da Web e adicione sua própria IU. Quando combinadas, a IA e as extensões do Chrome podem tornar a experiência de navegação realmente útil e mais produtiva. Esta palestra apresenta uma visão geral de como as extensões na WebStore estão usando a IA hoje e onde vemos o maior potencial.
Evgeny Peshkov, CTO da GEENEE
Saiba como a IA da Web está revolucionando as mídias pagas personalizadas ao incluir anúncios experimentais virtuais inovadores em todas as telas.
Tyler Mullen, Engenheiro de software da equipe do MediaPipe do Google
Saiba mais sobre a abordagem multiplataforma do MediaPipe para criar pipelines de IA e levá-los para o navegador. Destacamos alguns dos benefícios de nosso método e falamos sobre alguns dos principais produtos que ajudamos a promover (como o Google Meet). Depois, apresentamos os avanços tecnológicos e as APIs de desenvolvedor mais recentes. Essas ofertas incluem soluções para tarefas tradicionais de aprendizado de máquina, como segmentação de imagens, bem como tarefas de IA generativa, como inferência de LLM. Por fim, falamos sobre o futuro com algumas demonstrações muito interessantes!
Chris Slee, CTO da IncludeHealth
A IncludeHealth, um provedor de fisioterapia virtual, aproveita o poder da IA da Web para eliminar barreiras logísticas e econômicas, permitindo que os pacientes recebam atendimento personalizado e monitorado em qualquer lugar, a qualquer hora e em qualquer dispositivo.
Richard Stotz, Engenheiro de software de Core ML do Google
Saiba como criamos o Aprendizado de Máquina Sem Código para o Planilhas Google, um complemento gratuito do Planilhas Google para ML e IA. Ele usa o aprendizado de máquina no dispositivo habilitado por WebAssembly, JavaScript e a nova IA integrada do Chrome para possibilitar a execução de tarefas avançadas de aprendizado de máquina para todos os usuários. Esta palestra destaca as ferramentas que usamos para disponibilizar o Aprendizado de Máquina Sem Código para o Planilhas Google no mercado e como as bibliotecas de código aberto de nossa equipe ajudam os desenvolvedores a terem sucesso com o ML na Web.
Esse evento não seria possível sem as inúmeras pessoas envolvidas em sua criação e realização. Gostaríamos de agradecer a Jason Mayes, Jenna Zheng e Marcus Chang pela organização do evento. Nossos agradecimentos aos apresentadores listados acima, a nossos ajudantes e assistentes e a nossas equipes de AV, que garantiram a gravação do evento para que você pudesse assistir com tranquilidade depois.
Se você perdeu o evento desta vez, acompanhe os vídeos acima e não deixe de fazer sua inscrição em nossa newsletter pública de IA da Web para receber informações sobre as novidades!