Buscar

4 resultados

Borrar filtros
  • 16 DE JULIO DE 2025 / Cloud

    Modelo fundacional de Marin de Stanford: el primer modelo totalmente abierto desarrollado con JAX

    El proyecto Marin tiene como objetivo ampliar la definición de "abierto" en IA para incluir todo el proceso científico, no solo el modelo en sí, haciendo que el proceso de desarrollo completo sea accesible y reproducible. Esta iniciativa, impulsada por el framework JAX y su herramienta Levanter, permite realizar un profundo escrutinio, confiar y compilar sobre modelos básicos, fomentando un futuro más transparente para la investigación en IA.

    Stanford Marin project in JAX
  • 9 DE JULIO DE 2025 / Gemma

    T5Gemma: una nueva colección de modelos Gemma codificadores-decodificadores

    T5Gemma es una nueva familia de LLM de codificador-decodificador desarrollados mediante la conversión y adaptación de modelos preentrenados de solo decodificador basados en el marco Gemma 2, que ofrecen un rendimiento y una eficiencia superiores en comparación con sus contrapartes de solo decodificador, en particular para tareas que requieren una profunda comprensión de entrada, como resúmenes y traducción.

    T5Gemma: A New Collection of Encoder-Decoder Gemma Models
  • 24 DE JUNIO DE 2025 / Kaggle

    Uso de KerasHub para lograr flujos de trabajo de aprendizaje automático sencillos de extremo a extremo con Hugging Face

    KerasHub permite a los usuarios mezclar y combinar arquitecturas y pesos de modelos en diferentes marcos de trabajo de aprendizaje automático, de modo que los puntos de control de fuentes como Hugging Face Hub (incluidos los creados con PyTorch) se puedan cargar en los modelos de Keras para usar con JAX, PyTorch o TensorFlow. Gracias a esta flexibilidad, puedes aprovechar una amplia gama de modelos ajustados por los miembros de la comunidad, al tiempo que mantienes un control total sobre el marco de trabajo de backend elegido.

    How to load model weights from SafeTensors into KerasHub for multi-framework machine learning
  • 19 DE FEBRERO DE 2025 / Gemma

    Presentamos PaliGemma 2 Mix: un modelo de lenguaje-visión para varias tareas

    Ya está disponible PaliGemma 2 Mix, un modelo de lenguaje-visión mejorado que ofrece funciones como captura de imagen, OCR y detección de objetos en diversos tamaños.

    Paligemma 2 Mix