vllm/serving at 6ccc0bfffbcf1b7e927cc3dcf4159fc74ff94d40 - vllm - Luminance Code Repo

20231088/vllm

History

AguirreNicolas 24f60a54f4

[Docker] Adding number of nvcc_threads during build as envar (#1893 )

2023-12-07 11:00:32 -08:00

..

deploying_with_docker.rst

[Docker] Adding number of nvcc_threads during build as envar (#1893 )

2023-12-07 11:00:32 -08:00

deploying_with_triton.rst

Add documentation to Triton server tutorial (#983 )

2023-09-20 10:32:40 -07:00

distributed_serving.rst

[Doc] Documentation for distributed inference (#261 )

2023-06-26 11:34:23 -07:00

metrics.rst

Add Production Metrics in Prometheus format (#1890 )

2023-12-02 16:37:44 -08:00

run_on_sky.rst

[Doc] Add doc for running vLLM on the cloud (#426 )

2023-07-16 13:37:14 -07:00

serving_with_langchain.rst

docs: add instruction for langchain (#1162 )

2023-11-30 10:57:44 -08:00