[Bugfix] Fix guidance backend for Qwen models (#16210)

Signed-off-by: Benjamin Chislett <benjamin.chislett@centml.ai>
2025-04-07 18:15:43 -04:00 · 2025-04-07 18:15:43 -04:00 · 3147586ebd
commit 3147586ebd
parent ed636d99ca
1 changed files with 2 additions and 1 deletions
--- a/vllm/v1/structured_output/backend_guidance.py
+++ b/vllm/v1/structured_output/backend_guidance.py
@ -46,7 +46,8 @@ class GuidanceBackend(StructuredOutputBackend):
            in vllm_config.decoding_config.guided_decoding_backend)
        tokenizer = tokenizer_group.get_lora_tokenizer(None)
-        self.ll_tokenizer = llguidance_hf.from_tokenizer(tokenizer, None)
+        self.ll_tokenizer = llguidance_hf.from_tokenizer(
            tokenizer, self.vocab_size)
    def compile_grammar(self, request_type: StructuredOutputOptions,
                        grammar_spec: str) -> StructuredOutputGrammar: