En Google, creemos en el poder de la colaboración y la investigación abierta para impulsar la innovación, y estamos agradecidos de ver la aceptación de Gemma por parte de la comunidad, con millones de descargas a los pocos meses de su lanzamiento.
Esta respuesta entusiasta fue increíblemente inspiradora, ya que los desarrolladores han creado una amplia gama de proyectos como Navarasa, una variante multilingüe para los idiomas índicos, y Octopus v2, un modelo de acción en el dispositivo. Los desarrolladores están mostrando el potencial de Gemma para crear soluciones de IA accesibles y de impacto.
Este espíritu de exploración y creatividad también impulsó nuestro desarrollo de CodeGemma, con sus potentes capacidades de finalización y generación de código, y RecurrentGemma, que ofrece posibilidades eficaces de inferencia e investigación.
Link to Youtube Video (visible only when JS is disabled)
Gemma es una familia de modelos abiertos ligeros con tecnología de punta compilados con la misma tecnología e investigación que se usó para crear los modelos de Gemini. Hoy, nos complace ampliar mucho más la familia Gemma con la presentación de PaliGemma, un potente modelo de lenguaje de visión (VLM) abierto, y un adelanto del futuro cercano con el anuncio de Gemma 2. Además, estamos promoviendo nuestro compromiso con la IA responsable con actualizaciones de nuestro kit de herramientas de IA generativa responsable, que ofrece a los desarrolladores herramientas nuevas y mejoradas para evaluar la seguridad del modelo y filtrar el contenido dañino.
PaliGemma es un potente VLM abierto inspirado en PaLI-3. Basado en componentes abiertos que incluyen el modelo de visión SigLIP y el modelo de lenguaje Gemma, PaliGemma está diseñado para un rendimiento ajustado líder en su clase en una amplia gama de tareas de lenguaje de visión. Esto incluye subtítulos de imágenes y videos cortos, respuestas a preguntas visuales, comprensión del texto en las imágenes, detección de objetos y segmentación de objetos.
Ofrecemos puntos de control entrenados previamente y ajustados en múltiples resoluciones, así como puntos de control específicamente adaptados a una combinación de tareas para una exploración inmediata.
Para facilitar la exploración e investigación abiertas, PaliGemma está disponible a través de varias plataformas y recursos. Empieza a explorar hoy mismo con opciones gratuitas como los cuadernos de Kaggle y Colab. Los investigadores académicos que buscan ampliar los límites de la investigación del lenguaje de visión también pueden solicitar créditos de Google Cloud para respaldar su trabajo.
Comienza a usar PaliGemma hoy mismo. Puedes encontrar PaliGemma en GitHub, modelos de Hugging Face, Kaggle, Vertex AI Model Garden y ai.nvidia.com (acelerado con TensoRT‑LLM) con una fácil integración a través de JAX y Hugging Face Transformers. (Próximamente, tendremos la integración de Keras) También puedes interactuar con el modelo a través de este Hugging Face Space.
Estamos encantados de anunciar la llegada inminente de Gemma 2, la nueva generación de modelos Gemma. Gemma 2 estará disponible en nuevos tamaños para una amplia gama de casos de uso de desarrolladores de IA y presenta una nueva arquitectura diseñada para un rendimiento y una eficiencia innovadores, que ofrece ventajas como:
¡No te pierdas el lanzamiento oficial de Gemma 2 en las próximas semanas!
Por esta razón, ampliamos nuestro Kit de herramientas de IA generativa responsable para ayudar a los desarrolladores a realizar evaluaciones de modelos más sólidas lanzando LLM Comparator en código abierto. LLM Comparator es una nueva herramienta interactiva y visual para realizar evaluaciones paralelas efectivas para evaluar la calidad y la seguridad de las respuestas del modelo. Para ver a LLM Comparator en acción, explora nuestra demostración, que muestra una comparación entre Gemma 1.1 y Gemma 1.0.
Esperamos que esta herramienta avance aún más en la misión del kit de herramientas de ayudar a los desarrolladores a crear aplicaciones de IA que no solo sean innovadoras, sino también seguras y responsables.
A medida que continuamos expandiendo la familia de modelos abiertos Gemma, seguimos dedicados a fomentar un entorno colaborativo donde la tecnología de IA de vanguardia y el desarrollo responsable vayan de la mano. Esperamos con entusiasmo ver lo que compilas con estas nuevas herramientas y cómo, juntos, podemos dar forma al futuro de la IA.