Publicaciones de Quentin Khan

1 resultados

Borrar filtros
  • 13 DE AGOSTO DE 2024 / Mobile

    Agilización de la inferencia de LLM en el perímetro con TFLite

    Se actualizó XNNPack, el motor de inferencia de CPU de TensorFlow Lite predeterminado, con el objetivo de mejorar el rendimiento y la administración de la memoria, permitir la colaboración entre procesos y simplificar la API para los usuarios.

    TF-Wagtail-Feature