En junio, lanzamos Gemma 2, nuestros nuevos modelos abiertos mejores de su clase, en tamaños de parámetros de 27.000 millones (27B) y 9000 millones (9B). Desde su debut, el modelo 27B se convirtió rápidamente en uno de los modelos abiertos mejor clasificados en la tabla de LMSYS Chatbot Arena, en la que incluso supera a los modelos populares de más del doble de su tamaño en cuanto a conversaciones reales.
Pero Gemma no solo tiene un excelente rendimiento. Se basa en una IA responsable y da prioridad a la seguridad y accesibilidad. Para respaldar este compromiso, nos complace anunciar tres nuevas incorporaciones a la familia de Gemma 2:
2. ShieldGemma: un paquete de modelos de clasificadores de contenido de seguridad, basados en Gemma 2, para filtrar las entradas y salidas de los modelos de IA, y mantener la seguridad del usuario.
3. Gemma Scope: una nueva herramienta de interpretación de modelos que ofrece estadísticas incomparables del funcionamiento interno de nuestros modelos.
Con estas incorporaciones, los investigadores y desarrolladores ahora pueden crear experiencias más seguras para los clientes, obtener información sin precedentes sobre nuestros modelos e implementar con confianza una poderosa IA de manera responsable, directamente en el dispositivo, lo que permite aprovechar nuevas posibilidades de innovación.
Nos complace presentar el modelo Gemma 2 2B, una incorporación muy esperada a la familia de Gemma 2. Este modelo ligero produce resultados descomunales, ya que aprende de modelos más grandes a través de la destilación. De hecho, Gemma 2 2B supera a todos los modelos de GPT-3.5 en Chatbot Arena, lo que demuestra sus habilidades excepcionales de IA conversacional.
Gemma 2 2B tiene las siguientes características:
Desde hoy, puedes descargar los pesos del modelo Gemma 2 desde Kaggle, Hugging Face y Vertex AI Model Garden. También puedes probar sus capacidades en Google AI Studio.
Implementar modelos abiertos de manera responsable para garantizar resultados de IA atractivos, seguros e inclusivos requiere un esfuerzo importante de los desarrolladores e investigadores. Para ayudarlos en este proceso, presentamos ShieldGemma, una serie de clasificadores de seguridad de última generación diseñados para detectar y mitigar el contenido dañino en las entradas y salidas de los modelos de IA. ShieldGemma se diseñó específicamente para cuatro áreas de daño claves:
Estos clasificadores abiertos complementan nuestro paquete actual de clasificadores de seguridad del conjunto de herramientas de IA responsable, que incluye una metodología para crear clasificadores adaptados a una política específica con un número limitado de puntos de datos, además de los clasificadores actuales de Google Cloud disponibles a través de la API.
Aquí te mostramos cómo ShieldGemma puede ayudarte a crear aplicaciones de IA más eficientes y seguras:
“A medida que la IA continúe madurando, toda la industria tendrá que invertir en el desarrollo de evaluadores de seguridad de alto rendimiento. Nos complace que Google haga esta inversión y esperamos que continúe participando en nuestro Grupo de trabajo de seguridad de IA”. ~ Rebecca Weiss, directora ejecutiva, ML Commons
Para obtener más información sobre ShieldGemma, consulta los resultados completos en el informe técnico y comienza a crear apps de IA más seguras con nuestro conjunto integral de herramientas de IA generativa responsable.
Gemma Scope ofrece a los investigadores y desarrolladores una transparencia sin precedentes en los procesos de toma de decisiones de nuestros modelos Gemma 2. Gemma Scope, que funciona como un poderoso microscopio, utiliza codificadores automáticos dispersos (SAE) para acercar puntos específicos dentro del modelo y hacer que su funcionamiento interno sea más interpretable.
Estos SAE son redes neuronales especializadas que nos ayudan a desempaquetar la información densa y compleja que procesa Gemma 2, y expandirla a una forma que es más fácil de analizar y comprender. Al estudiar estas vistas ampliadas, los investigadores pueden obtener insights valiosos sobre cómo Gemma 2 identifica patrones, procesa información y, en última instancia, hace predicciones. Con Gemma Scope, nuestro objetivo es ayudar a la comunidad de investigación de IA a descubrir cómo creamos sistemas de IA más comprensibles, responsables y confiables.
Estas son las razones por las que Gemma Scope es una herramienta pionera:
Obtén más información sobre Gemma Scope en el blog de Google DeepMind, el informe técnico y la documentación para desarrolladores.
Estos lanzamientos representan nuestro compromiso continuo de proporcionar a la comunidad de IA las herramientas y los recursos necesarios para construir un futuro en el que la IA beneficie a todas las personas. Creemos que el acceso abierto, la transparencia y la colaboración son esenciales para desarrollar una IA segura y beneficiosa.
¡Acompáñanos en este emocionante viaje hacia un futuro con una IA más responsable y beneficiosa!