Publicaciones de Danny McCormick

1 resultados

Borrar filtros
  • NOV 13, 2024 / Gemma

    Inferencia con Gemma con Dataflow y vLLM

    El procesamiento por lotes continuo de vLLM y el administrador de modelos de Dataflow optimizan el servicio de LLM y simplifican el proceso de implementación, brindando una poderosa combinación para que los desarrolladores creen canales de inferencia de LLM de alto rendimiento de manera más eficiente.

    Gemma-Dataflow-ML-vLLM