Menor, mais seguro e mais transparente: aprimorando a IA responsável com o Gemma

JUL 31, 2024
Neel Nanda Research Engineer
Tom Lieberum Research Engineer
Ludovic Peran Product Manager
Kathleen Kenealy Research Engineer

Em junho, lançamos o Gemma 2, nossos novos modelos abertos, os melhores da categoria, em tamanhos de parâmetro de 27 bilhões (27B) e 9 bilhões (9B). Desde o lançamento, o modelo 27B rapidamente tornou-se um dos modelos abertos mais bem avaliados no placar LMSYS Chatbot Arena, superando até mesmo os modelos populares com mais do que o dobro de seu tamanho em conversas reais.

Mas o Gemma tem mais do que simples desempenho. Ele foi criado sobre uma base de IA responsável, priorizando a segurança e a acessibilidade. E, para respaldar esse compromisso, temos o prazer de anunciar três novas adições à família Gemma 2:

  1. Gemma 2 2B – uma nova versão de nosso popular modelo de parâmetro de 2 bilhões (2B), com avanços de segurança integrados e um poderoso equilíbrio entre desempenho e eficiência.

2. ShieldGemma – um pacote de modelos de classificadores de conteúdo de segurança, criado com base no Gemma 2, para filtrar as entradas e saídas de modelos de IA e manter a segurança dos usuários.

3. Gemma Scope – uma nova ferramenta de interpretabilidade de modelos que oferece insights inigualáveis do funcionamento interno de nossos modelos.

Com essas adições, pesquisadores e desenvolvedores agora podem criar experiências mais seguras para os clientes, obter insights sem precedentes sobre nossos modelos e implantar uma IA avançada com confiança e responsabilidade, diretamente no dispositivo, criando novas possibilidades de inovação.


Gemma 2 2B: desempenho de última geração, agora no dispositivo

É com grande prazer que apresentamos o modelo Gemma 2 2B, uma adição muito esperada à família Gemma 2. Esse modelo leve produz resultados excepcionais aprendendo com modelos maiores por meio da destilação. Na verdade, o Gemma 2 2B supera todos os modelos GPT-3.5 no Chatbot Arena, demonstrando suas excepcionais habilidades de IA conversacional.

Graph - LYMSYS Chatbot Arena leaderboard scores
Pontuações do placar LMSYS Chatbot Arena capturadas em 30 de julho de 2024. Pontuação do Gemma 2 2B +/- 10.

O Gemma 2 2B oferece:

  • Desempenho excepcional: ele tem o melhor desempenho para seu tamanho, superando outros modelos abertos em sua categoria.

  • Implantação flexível e econômica: o Gemma 2 2B pode ser executado com eficiência em uma ampla variedade de tipos de hardware, desde dispositivos de borda e laptops até implantações robustas na nuvem com o Vertex AI e o Google Kubernetes Engine (GKE). Para aumentar ainda mais sua velocidade, ele é otimizado com a biblioteca NVIDIA TensorRT-LLM e está disponível como um NIM do NVIDIA. Essa otimização é direcionada a várias implantações, incluindo data centers, nuvem, estações de trabalho locais, PCs e dispositivos de borda, usando GPUs NVIDIA RTX e NVIDIA GeForce RTX ou módulos NVIDIA Jetson para IA de borda. Além disso, o Gemma 2 2B é totalmente integrado ao Keras, JAX, Hugging Face, NVIDIA NeMo, Ollama, Gemma.cpp e, em breve, ao MediaPipe para simplificar o desenvolvimento.

A partir de hoje, é possível fazer o download dos pesos de modelo do Gemma 2 no Kaggle, no Hugging Face e no Vertex AI Model Garden. Você também pode testar os recursos no Google AI Studio.


ShieldGemma: proteção dos usuários com classificadores de segurança de última geração

Implantar modelos abertos de maneira responsável para garantir saídas de IA inclusivas, seguras e atraentes é algo que requer bastante esforço dos desenvolvedores e pesquisadores. Para ajudar os desenvolvedores nesse processo, estamos introduzindo o ShieldGemma, uma série de classificadores de segurança de última geração projetados para detectar e mitigar conteúdo nocivo em entradas e saídas de modelos de IA. O ShieldGemma tem como objetivo específico quatro áreas principais de danos:

  • Discurso de ódio

  • Assédio

  • Conteúdo sexualmente explícito

  • Conteúdo perigoso

Generative AI application model architecture

Esses classificadores abertos complementam nosso pacote existente de classificadores de segurança no kit de ferramentas de IA responsável, que inclui uma metodologia para criar classificadores adaptados a uma política específica com um número limitado de pontos de dados, bem como classificadores do Google Cloud prontos para uso, disponibilizados via API.


Veja como o ShieldGemma pode ajudar na criação de aplicativos de IA melhores e mais seguros:

  • Desempenho de SOTA: criado com base no Gemma 2, o ShieldGemma é uma série de classificadores de segurança líderes do setor.

  • Tamanhos flexíveis: o ShieldGemma oferece vários tamanhos de modelo para atender a diversas necessidades. O modelo 2B é ideal para tarefas de classificação on-line, enquanto as versões 9B e 27B fornecem um desempenho maior para aplicativos off-line, nos quais a latência é menos preocupante. Todos os tamanhos usam as otimizações de velocidade da NVIDIA para garantir um desempenho eficiente em qualquer hardware.

  • Abertura e colaboração: a natureza aberta do ShieldGemma incentiva a transparência e a colaboração dentro da comunidade de IA, contribuindo para o futuro dos padrões de segurança da indústria de ML.


"À medida que a IA continuar amadurecendo, todo o setor precisará investir no desenvolvimento de avaliadores de segurança de alto desempenho. É muito bom saber que o Google está fazendo esse investimento, e esperamos pelo envolvimento contínuo deles em nosso grupo de trabalho de segurança de IA." ~ Rebecca Weiss, diretoria executiva, ML Commons
Evaluation results based on Optimal F1(left)/AU-PRC(right), higher is better.
Resultados da avaliação com base no Optimal F1 (esquerda)/AU-PRC (direita); quanto mais alto, melhor. Usamos 𝛼=0 e T = 1 para calcular as probabilidades. SG Prompt e SG Response são nossos conjuntos de dados de teste, e OpenAI Mod/ToxicChat são comparativos de mercado externos. O desempenho dos modelos de linha de base em conjuntos de dados externos baseia-se em Ghosh et al. (2024); Inan et al. (2023).

Saiba mais sobre o ShieldGemma, veja os resultados completos no relatório técnico e comece a criar aplicativos de IA mais seguros com nosso abrangente kit de ferramentas de IA generativa responsável.


Gemma Scope: auxílio para a tomada de decisões de IA com codificadores automáticos esparsos abertos

O Gemma Scope oferece aos pesquisadores e desenvolvedores uma transparência sem precedentes nos processos de tomada de decisões de nossos modelos Gemma 2. Ao atuar como um microscópio avançado, o Gemma Scope usa codificadores automáticos esparsos (SAEs, na sigla em inglês) para ampliar pontos específicos dentro do modelo e tornar seu funcionamento interno mais interpretável.

Esses SAEs são redes neurais especializadas que nos ajudam a descompactar as informações densas e complexas processadas pelo Gemma 2, expandindo-as em um formato mais fácil de analisar e entender. Ao estudar essas visualizações expandidas, os pesquisadores podem obter insights importantes sobre como o Gemma 2 identifica padrões, processa informações e, por fim, faz previsões. Nosso objetivo com o Gemma Scope é ajudar a comunidade de pesquisa em IA a descobrir como criar sistemas de IA mais compreensíveis, responsáveis e confiáveis.

Isto é o que torna o Gemma Scope altamente inovador:

  • Demonstrações interativas: explore os recursos de SAE e analise o comportamento do modelo no Neuronpedia, sem a necessidade de escrever códigos.

Saiba mais sobre o Gemma Scope no blog do Google DeepMind, no relatório técnico e na documentação do desenvolvedor.


Um futuro construído com base na IA responsável

Esses lançamentos representam nosso compromisso contínuo de fornecer à comunidade de IA as ferramentas e os recursos necessários para construir um futuro no qual a IA beneficie a todos. Acreditamos que o acesso aberto, a transparência e a colaboração são essenciais para o desenvolvimento de uma IA segura e benéfica.


Dê os primeiros passos mesmo:

  • Explore o ShieldGemma e crie aplicativos de IA mais seguros.

  • Experimente o Gemma Scope no Neuronpedia e conheça o funcionamento interno do Gemma 2.

Junte-se a nós nesta emocionante jornada rumo a um futuro mais responsável e benéfico para a IA!