No Google I/O, fizemos o pré-lançamento do Gemma 3n com entradas de texto e imagem e lançamos o app Google AI Edge Gallery no Github. O Google AI Edge Gallery é nosso playground interativo de código aberto projetado para inspirar e capacitar os desenvolvedores ao fornecer exemplos práticos, métricas de desempenho transparentes e links diretos para a documentação necessária para começar a criar experiências habilitadas por modelos de IA no dispositivo. A resposta foi incrível, com meio milhão de downloads do APK em dois meses, o que demonstra o entusiasmo da comunidade por uma IA generativa poderosa e privada no dispositivo.
Hoje, temos o prazer de anunciar que demos mais dois passos importantes: a adição da modalidade de áudio à pilha do Google AI Edge e a inclusão do Google AI Edge Gallery na Google Play Store.
Além de texto e visão, a pilha do Google AI Edge agora tem suporte a áudio. Nosso primeiro modelo com esse recurso é o Gemma 3n, acessível por meio da API MediaPipe LLM Inference para Android e para a Web. A compreensão de áudio desbloqueia novos recursos poderosos no dispositivo, incluindo:
Nesta versão inicial, a API MediaPipe LLM Inference dá suporte à inferência de áudio em lote para clipes com até 30 segundos. O suporte a streaming de áudio é o próximo passo em nosso roteiro.
Para permitir que você experimente essa nova modalidade em primeira mão, adicionamos um novo recurso "Audio Scribe" ao Google AI Edge Gallery. Com ele, você pode fazer upload de um clipe de áudio ou usar o microfone do dispositivo para gravar um áudio e assistir enquanto o Gemma 3n o transcreve diretamente no telefone, sem necessidade de conexão com a Internet.
Para tornar essas demonstrações poderosas mais acessíveis do que nunca, o Google AI Edge Gallery agora está disponível na versão Beta aberta na Google Play Store. O código continuará sendo aberto no Github, oferecendo o melhor dos dois mundos: a maneira mais fácil de experimentar as demonstrações por meio da Play Store e o código-fonte completo para explorar no GitHub.
Isso é só o começo. Nossa meta é tornar o Google AI Edge Gallery a vitrine mais inspiradora e útil para a IA no dispositivo. Nos próximos meses, planejamos:
Faça o download do app na Play Store ou confira o projeto de código aberto no Github. Mal podemos esperar para ver o que você vai criar!
Agradecimentos (em ordem alfabética)
Alice Zheng, Chunlei Niu, Cormac Brick, Deepak Nagaraj Halliyavar, Fengwu Yao, Grant Jensen, Ho Ko, Ireneu Pla, Ivan Grishchenko, Jae Yoo, Jae Yoo, Jianing Wei, Jing Jin, Joe Zou, Juhyun Lee, Karthik Raveendran, Kris Wright, Lin Chen, Lu Wang, Marissa Ikonomidis, Mark Sherwood, Matsvei Zhdanovich, Matthias Grundmann, Na Li, Ram Iyengar, Raman Sarokin, Rishika Sinha, Ronghui Zhu, Sachin Kotwani, Sebastian Schmidt, Suleman Shahid, Terry (Woncheol) Heo, Vladimir Kirilyuk, Wai Hon Law, Weiyi Wang, Yasir Modak, Yite Lu, Youchuan Hu, Yu-hui Chen, Zi Yuan