Postagens de Danny McCormick

1 resultados

Apagar filtros
  • NOV 13, 2024 / Gemma

    Inferência com o Gemma usando Dataflow e vLLM

    O lote contínuo do vLLM e o gerenciador de modelos do Dataflow otimizam o atendimento do LLM e simplificam o processo de implantação, oferecendo uma combinação poderosa para que os desenvolvedores criem pipelines de inferência de LLM de alto desempenho com mais eficiência.

    Gemma-Dataflow-ML-vLLM