지난 12월, Gemma 제품군에서 업그레이드된 비전 언어 모델 PaliGemma 2가 출시되었습니다. 이 릴리스에는 이미지 세분화, 짧은 동영상 캡션, 과학적 질문 답변, 고성능 텍스트 관련 작업처럼 광범위한 비전 언어 작업과 도메인에서 쉽게 미세 조정할 수 있는 다양한 크기(30억, 100억, 280억 개 매개변수)의 사전 학습된 체크포인트가 포함되었습니다.
PaliGemma 2 mix 체크포인트를 선보이게 되어 기쁩니다. PaliGemma 2 mix는 모델 기능을 직접 탐색하도록 하고 일반적인 사용 사례에서 사용할 수 있는 다양한 작업에 맞게 조정된 모델입니다.
원래 PaliGemma mix 체크포인트를 이미 사용하고 있었다면 따로 변경할 필요 없이 PaliGemma 2로 직접 업그레이드할 수 있습니다. 모델은 프롬프트 방식에 따라 다른 작업을 수행합니다. 공식 설명서에서 다른 프롬프트 작업 구문을 검토하고 기술 보고서에서 PaliGemma 2가 어떻게 개발되었는지 자세히 알아볼 수 있습니다.
결과:
결과:
결과:
결과:
결과:
결과: beach
결과: a cow standing on a beach next to a sign that says warning dangerous rip current.
광학 문자 인식(OCR)
결과:
WARNING
DANGEROUS
RIP CURRENT
결과:
결과:
결과: A cow standing on a beach next to a warning sign.
결과:
WARNING DANGEROUS
RIP CURRENT
PaliGemma 2의 잠재력을 발견할 준비가 되셨나요? 다음은 mix 모델 기능을 탐색하는 방법입니다.
PaliGemma 2 mix는 여러 작업에서 강력한 성능을 발휘하지만, 자신의 작업 또는 도메인에서 PaliGemma 2를 미세 조정하면 최상의 결과를 얻을 수 있습니다. 이를 수행하는 방법을 알아보려면 종합 설명서를 살펴보거나 Keras 및 JAX의 공식 예제 노트북을 확인하거나 Hugging Face 트랜스포머 예제를 사용하세요. 여러분이 이를 활용해 무엇을 만드실지 정말 기대됩니다!