vllm/usage at e5d7ed0c5374d38e75a8ef0243cc348f0f6f9185 - vllm - Luminance Code Repo

20231088/vllm

History

Sachin Varghese 2f1e8e8f54

Update default max_num_batch_tokens for chunked prefill (#11694 )

2025-01-03 00:25:53 +00:00

..

compatibility_matrix.md

[Doc] Improve GitHub links (#11491 )

2024-12-25 14:49:26 -08:00

disagg_prefill.md

[Docs] Convert rST to MyST (Markdown) (#11145 )

2024-12-23 22:35:38 +00:00

engine_args.md

[Docs] Convert rST to MyST (Markdown) (#11145 )

2024-12-23 22:35:38 +00:00

env_vars.md

[Docs] Convert rST to MyST (Markdown) (#11145 )

2024-12-23 22:35:38 +00:00

faq.md

[Docs] Convert rST to MyST (Markdown) (#11145 )

2024-12-23 22:35:38 +00:00

lora.md

[Doc] Improve GitHub links (#11491 )

2024-12-25 14:49:26 -08:00

multimodal_inputs.md

[Doc] Add video example to openai client for multimodal (#11521 )

2024-12-26 17:31:29 +00:00

performance.md

Update default max_num_batch_tokens for chunked prefill (#11694 )

2025-01-03 00:25:53 +00:00

spec_decode.md

[Doc] Improve GitHub links (#11491 )

2024-12-25 14:49:26 -08:00

structured_outputs.md

[Doc] Add xgrammar in doc (#11549 )

2024-12-27 13:05:10 +00:00

tool_calling.md

[Model] IBM Granite 3.1 (#11307 )

2024-12-19 11:27:24 +08:00

usage_stats.md

[Doc] Improve GitHub links (#11491 )

2024-12-25 14:49:26 -08:00