Publicaciones de Quentin Khan

1 resultados

Borrar filtros
  • AUG 13, 2024 / Mobile

    Agilización de la inferencia de LLM en el perímetro con TFLite

    Se actualizó XNNPack, el motor de inferencia de CPU de TensorFlow Lite predeterminado, con el objetivo de mejorar el rendimiento y la administración de la memoria, permitir la colaboración entre procesos y simplificar la API para los usuarios.

    TF-Wagtail-Feature