Em dezembro passado, lançamos o PaliGemma 2, um modelo de visão-linguagem atualizado da família Gemma. O lançamento incluiu pontos de verificação pré-treinados de diferentes tamanhos (parâmetros 3B, 10B e 28B) que podem ser facilmente ajustados em uma ampla variedade de tarefas e domínios de visão-linguagem, como segmentação de imagens, legendagem de vídeos curtos, respostas a perguntas científicas e tarefas relacionadas a texto com alto desempenho.
Agora, temos o prazer de anunciar o lançamento dos pontos de verificação do PaliGemma 2 mix. Os modelos PaliGemma 2 mix são ajustados para uma variedade de tarefas que permitem explorar diretamente os recursos de modelos e utilizá-los imediatamente em casos de uso comuns.
Se você já estava usando os pontos de verificação do PaliGemma mix originais, poderá fazer upgrade diretamente para o PaliGemma 2 sem precisar fazer nenhuma alteração. O modelo executa tarefas diferentes, dependendo da forma como o prompt é elaborado. Você pode verificar a sintaxe diferenciada de tarefas de prompt na documentação oficial e saber mais sobre como o PaliGemma 2 foi desenvolvido em nosso relatório técnico.
Resultado:
Resultado:
Resultado:
Resultado:
Resultado:
Resultado: beach
(praia)
Resultado: a cow standing on a beach next to a sign that says warning dangerous rip current.
(uma vaca em uma praia perto de uma placa com um aviso de correnteza perigosa)
Reconhecimento óptico de caracteres (OCR)
Resultado:
WARNING
DANGEROUS
RIP CURRENT
Resultado:
Resultado:
Resultado: A cow standing on a beach next to a warning sign.
(uma vaca em uma praia perto de uma placa de aviso)
Resultado:
WARNING DANGEROUS
RIP CURRENT
Tudo pronto para descobrir o potencial do PaliGemma 2? Veja como você pode explorar os recursos do modelo mix:
Embora o PaliGemma 2 mix apresente alto desempenho em várias tarefas, você obterá os melhores resultados ajustando o PaliGemma 2 em sua própria tarefa ou seu próprio domínio. Para saber como fazer isso, explore nossa documentação abrangente, confira nossos notebooks de exemplo oficiais para Keras e JAX ou use o exemplo do Hugging Face Transformers. Mal podemos esperar para ver o que você vai criar!