El año pasado, lanzamos ShieldGemma, un paquete de modelos de clasificadores de contenido de seguridad basados en Gemma 2 y diseñados para detectar contenido dañino en las entradas y salidas de texto de los modelos de IA. Hoy presentamos Gemma 3 y nos entusiasma seguir consolidando nuestra base de IA responsable con el anuncio de ShieldGemma 2.
Link to Youtube Video (visible only when JS is disabled)
ShieldGemma 2, basado en Gemma 3, es un modelo de 4,000 millones de parámetros que verifica la seguridad de tus imágenes sintéticas y naturales con categorías clave para ayudarte a crear conjuntos de datos y modelos sólidos. Con esta incorporación a la familia de modelos Gemma, los investigadores y desarrolladores ahora pueden minimizar fácilmente el riesgo de diferentes tipos de contenido dañino en sus modelos:
Recomendamos utilizar ShieldGemma 2 como filtro de entrada para los modelos de lenguaje-visión o como filtro de salida de los sistemas de generación de imágenes. ShieldGemma se puede utilizar tanto en imágenes sintéticas como naturales.
El procesamiento de contenido más allá de texto, el entrenamiento y la comprensión de la seguridad de las imágenes en modelos multimodales plantean nuevos desafíos, por lo que ShieldGemma 2 se creó para responder a una amplia variedad de estilos de imágenes diversos y matizados.
Para entrenar un modelo sólido de seguridad de imágenes, seleccionamos conjuntos de datos de entrenamiento de imágenes naturales y sintéticas, y ajustamos las instrucciones de Gemma 3 para demostrar un buen rendimiento. Comparamos las políticas de seguridad con los siguientes puntos de referencia y publicaremos un informe técnico que también incorpora puntos de referencia de terceros.
La implementación de modelos de código abierto de manera responsable depende de un esfuerzo de toda la comunidad, y esperamos explorar cómo ShieldGemma 2 se puede entregar en tamaños más pequeños, en más áreas de daño y alineado con la taxonomía multimodal de ML Commons en el futuro cercano.
Nos entusiasma seguir creando una IA multimodal segura y responsable.
Wenjun Zeng, Ryan Mullins, Dana Kurniawan, Yuchi Liu, Mani Malek, Yiwen Song, Dirichi Ike-Njoku, Hamid Palangi, Jindong Gu, Shravan Dheep, Karthik Narashimhan, Tamoghna Saha, Joon Baek, Rick Pereira, Cai Xu, Jingjing Zhou, Aparna Joshi y Will Hawkins