더 작고, 더 안전하고, 더 투명하게: Gemma를 통한 책임감 있는 AI 발전

7월 31, 2024
Neel Nanda Research Engineer
Tom Lieberum Research Engineer
Ludovic Peran Product Manager
Kathleen Kenealy Research Engineer

Google은 6월에 매개변수 규모가 270억 개(27B)와 90억 개(9B)에 달하는 새로운 동급 최강의 개방형 모델 Gemma 2를 출시했습니다. 27B 모델은 처음 선보인 이후 금세 LMSYS Chatbot Arena 리더보드에서 최고 순위의 개방형 모델이 되었으며 실제 대화에서는 두 배가 넘는 크기의 인기 모델을 능가하는 성능을 보여주었습니다.

하지만 Gemma의 특별함은 뛰어난 성능뿐만이 아닙니다. Gemma는 안전성과 접근성을 최우선으로 하는 책임감 있는 AI를 토대로 개발되었습니다. 이러한 노력을 지원하고자 Gemma 2 제품군에 새로 추가되는 세 가지 모델을 발표하게 되어 기쁩니다.

  1. Gemma 2 2B – Google의 인기 있는 매개변수 20억 개(2B) 규모 모델의 새로운 버전으로, 내장된 안전 기능이 더욱 향상되었으며 성능과 효율성이 강력하게 균형을 이룬 모델입니다.

2. ShieldGemma – Gemma 2를 기반으로 개발된 안전 콘텐츠 분류기 모델 묶음으로, AI 모델의 입력과 출력을 필터링하고 사용자를 안전하게 보호합니다.

3. Gemma Scope – 모델의 내부 작동에 대해 비할 데 없이 유용한 정보를 제공하는 새로운 모델 해석 도구입니다.

이러한 추가 모델을 통해 연구자와 개발자는 이제 더 안전한 고객 경험을 창출하고, 모델에 대해 전례 없이 유용한 정보를 얻고, 책임감과 자신감을 갖고 기기에서 바로 강력한 AI를 배포하여 혁신을 위한 새로운 가능성을 열 수 있습니다.


Gemma 2 2B: 이제 온디바이스로 차세대 성능을 경험하세요

Gemma 2 제품군에 추가될 것으로 큰 기대를 모았던 Gemma 2 2B 모델을 소개하게 되어 기쁩니다. 이 경량 모델은 증류를 통해 더 큰 모델에서 학습함으로써 특대형 결과를 생성합니다. 실제로 Gemma 2 2B는 Chatbot Arena의 모든 GPT-3.5 모델을 능가하며 탁월한 대화형 AI 능력을 보여줍니다.

Graph - LYMSYS Chatbot Arena leaderboard scores
2024년 7월 30일에 캡처한 LMSYS Chatbot Arena 리더보드 점수.\ r Gemma 2 2B 점수 +/- 10.

Gemma 2 2B는 다음을 제공합니다.

  • 탁월한 성능: 규모 면에서 동급 최강의 성능을 제공하여 해당 카테고리의 다른 개방형 모델보다 뛰어난 성능을 자랑합니다.

  • 유연하고 비용 효율적인 배포: 에지 기기와 노트북부터 Vertex AI와 GKE(Google Kubernetes Engine)를 통한 강력한 클라우드 배포까지, 폭넓고 다양한 하드웨어에서 Gemma 2 2B를 효율적으로 실행해 보세요. 속도를 더 향상시키기 위해 NVIDIA TensorRT-LLM 라이브러리로 최적화되었으며 NVIDIA NIM으로 사용할 수 있습니다. 이 최적화는 에지 AI를 위해 NVIDIA RTX, NVIDIA GeForce RTX GPU 또는 NVIDIA Jetson 모듈을 사용하는 데이터 센터, 클라우드, 로컬 워크스테이션, PC, 에지 기기를 포함한 다양한 배포를 대상으로 합니다. 또한 Gemma 2 2B는 Keras, JAX, Hugging Face, NVIDIA NeMo, Ollama, Gemma.cpp 그리고 곧 MediaPipe와 원활하게 통합되어 간소한 개발을 지원합니다.

오늘부터 Kaggle, Hugging Face, Vertex AI Model Garden에서 Gemma 2의 모델 가중치를 다운로드할 수 있습니다. Google AI Studio에서도 기능을 사용해 볼 수 있습니다.


ShieldGemma: 최첨단 안전 분류기로 사용자 보호

매력적이고 안전하며 포용적인 AI 출력을 보장할 수 있도록 개방형 모델을 책임감 있게 배포하기 위해서는 개발자와 연구자의 많은 노력이 필요합니다. 이 과정에서 개발자를 돕고자, AI 모델 입력 및 출력에서 유해 콘텐츠를 감지하고 완화하도록 설계된 일련의 최첨단 안전 분류기인 ShieldGemma를 소개합니다. ShieldGemma는 구체적으로 다음 4가지 주요 유해 영역을 대상으로 합니다.

  • 혐오 발언

  • 괴롭힘

  • 노골적인 성적 콘텐츠

  • 위험한 콘텐츠

Generative AI application model architecture

이러한 개방형 분류기는 책임감 있는 AI 툴킷의 기존 안전 분류기 묶음을 보완합니다. 여기에는 API를 통해 제공되는 기존 Google Cloud 상용 분류기뿐 아니라 제한된 수의 데이터 요소로 특정 정책에 적합한 분류기를 개발하는 방법론도 포함됩니다.


다음은 ShieldGemma가 더 안전하고 더 나은 AI 애플리케이션을 만드는 데 도움이 되는 방법입니다.

  • SOTA 성능: Gemma 2를 기반으로 개발된 ShieldGemma는 업계 최고의 안전 분류기입니다.

  • 유연한 크기: ShieldGemma는 다양한 니즈에 맞는 다양한 모델 크기를 제공합니다. 2B 모델은 온라인 분류 작업에 이상적인 반면, 9B 및 27B 버전은 지연 시간 문제가 덜한 오프라인 애플리케이션에 더 높은 성능을 제공합니다. 모든 크기는 하드웨어 전반에 걸쳐 효율적인 성능을 위해 NVIDIA 속도 최적화를 활용합니다.

  • 개방성과 협업: ShieldGemma는 본질적으로 개방적이므로 AI 커뮤니티 내에서 투명성과 협업을 촉진하여 ML 산업 안전 표준의 미래에 이바지합니다.


"AI가 계속 성숙함에 따라, 업계 전체가 고성능 안전 평가기 개발에 투자해야 할 것입니다. Google이 이러한 투자를 진행하게 되어 기쁘게 생각하며, 앞으로도 Google의 AI 안전 실무 그룹에 계속 참여하기를 기대합니다." ~ Rebecca Weiss, ML Commons 전무 이사
Evaluation results based on Optimal F1(left)/AU-PRC(right), higher is better.
Optimal F1(왼쪽)/AU-PRC(오른쪽)에 근거한 평가 결과로, 수치가 높을수록 더 좋습니다. 확률 계산을 위해 𝛼=0 및 T = 1을 사용합니다. ShieldGemma (SG) Prompt와 SG Response는 Google의 테스트 데이터 세트이며 OpenAI Mod/ToxicChat은 외부 업계 기준치입니다. 외부 데이터 세트에 대한 기준선 모델의 성능은 Ghosh et al.(2024); Inan et al.(2023)에서 가져온 성능 데이터입니다.

ShieldGemma에 대해 자세히 알아보고 기술 보고서에서 전체 결과를 확인한 후, 종합적인 Responsible Generative AI Toolkit으로 보다 안전한 AI 애플리케이션 개발을 시작하세요.


Gemma Scope: 개방형 희소 오토인코더로 AI 의사 결정 조명

Gemma Scope는 연구자와 개발자에게 Gemma 2 모델의 의사 결정 과정에 대해 전례 없는 투명성을 제공합니다. 강력한 현미경처럼 작동하는 Gemma Scope는 희소 오토인코더(SAE)를 사용하여 모델 내의 특정 지점을 확대하여 내부 작동 상황을 더 쉽게 해석할 수 있게 해줍니다.

이러한 SAE는 Gemma 2가 처리하는 난해하고 복잡한 정보를 풀어 더 쉽게 분석 및 이해할 수 있는 형태로 확장하는 데 도움이 되는 특수 신경망입니다. 연구자들은 이처럼 확장된 뷰를 연구함으로써 Gemma 2가 패턴을 식별하고, 정보를 처리하며, 궁극적으로는 예측 결과를 내놓는 방식에 대한 귀한 통찰을 얻을 수 있습니다. 저희는 Gemma Scope를 통해 AI 연구 커뮤니티가 보다 이해하기 쉽고, 책임감 있고, 신뢰할 수 있는 AI 시스템을 개발하는 방법을 찾을 수 있도록 돕고자 합니다.

Gemma Scope의 혁신적인 특징은 다음과 같습니다.

  • 대화형 데모: Neuronpedia에서 코드를 작성하지 않고도 SAE 기능 탐색 및 모델 동작 분석 가능.

  • 사용하기 쉬운 저장소: SAE 및 Gemma 2와의 인터페이스를 위한 코드와 예제.

Google DeepMind 블로그, 기술 보고서, 개발자 문서에서 Gemma Scope에 대해 자세히 알아보세요.


책임감 있는 AI를 기반으로 한 미래

이 릴리스들은 AI가 모든 사람에게 도움이 되는 미래를 만들어가는 데 필요한 도구와 리소스를 AI 커뮤니티에 제공하기 위한 Google의 지속적인 노력을 나타냅니다. 개방적인 액세스, 투명성, 협업은 안전하고 유익한 AI 개발에 필수라고 생각합니다.


지금 시작하세요

  • ShieldGemma를 살펴보고 더 안전한 AI 애플리케이션을 개발하세요.

  • Neuronpedia에서 Gemma Scope를 사용해 보고 Gemma 2의 내부 작동 방식을 알아보세요.

보다 책임감 있고 유익한 AI의 미래를 향한 흥미진진한 여정에 동참하세요!