Crear una IA personalizada y avanzada que pueda “ver” solía implicar un esfuerzo complejo que requería muchos recursos. La historia cambió. En mayo pasado, lanzamos PaliGemma, el primer modelo de lenguaje-visión de la familia Gemma, con el que dimos un paso importante para hacer que la IA visual líder en su clase sea más accesible. Hoy, nos complace presentar PaliGemma 2, la próxima evolución en modelos de lenguaje-visión sintonizables.
PaliGemma 2 se basa en los modelos Gemma 2 de alto rendimiento, pero suma el poder de la visión y hace que sea más fácil que nunca realizar ajustes para obtener un rendimiento excepcional. Con PaliGemma 2, estos modelos pueden ver, comprender e interactuar con la información visual, lo que abre un mundo de nuevas posibilidades.
Quienes utilizan actualmente PaliGemma verán que actualizar a PaliGemma 2 es muy fácil. La nueva familia de modelos se diseñó como un reemplazo directo que ofrece una variedad de tamaños de modelos con ganancias de rendimiento inmediatas en la mayoría de las tareas sin modificaciones importantes en el código. Además, su flexibilidad hace que el ajuste para tareas y conjuntos de datos específicos sea sencillo, lo que permite adaptar sus capacidades a tus necesidades precisas.
Obtén más información sobre cómo funciona PaliGemma 2, incluso cuándo usar más parámetros y resoluciones más grandes, en nuestro informe técnico.
Desde su lanzamiento, la familia Gemma se convirtió rápidamente en un ecosistema vibrante, el Gemmaverse, que incluye decenas de miles de modelos y aplicaciones. Este rápido crecimiento es un testimonio del ingenio de la comunidad. Las primeras innovaciones que utilizan PaliGemma, como los avances de ColPali en la recuperación visual de documentos, las técnicas de ajuste de RoboFlow y el progreso en el seguimiento de objetos en tiempo real, demuestran el potencial de expansión de Gemmaverse.
¿Todo listo para explorar el potencial de PaliGemma 2? Aquí te mostramos cómo hacerlo:
Tenemos muchas ganas de ver lo que creas con PaliGemma 2. Únete a la vibrante comunidad de Gemma, comparte tus proyectos en el Gemmaverse y continuemos explorando juntos el potencial ilimitado de la IA. Tus comentarios y contribuciones son invaluables para dar forma al futuro de estos modelos e impulsar la innovación en el campo.