[Bugfix] Revert max_prompt_len validation for decoder-only models. (#16741)

Signed-off-by: David Heineman <david@davidheineman.com>
2025-04-16 21:33:15 -07:00 · 2025-04-16 21:33:15 -07:00 · 607029e515
commit 607029e515
parent cb072ce93b
2 changed files with 2 additions and 2 deletions
--- a/vllm/engine/llm_engine.py
+++ b/vllm/engine/llm_engine.py
@ -2062,7 +2062,7 @@ class LLMEngine:
                raise ValueError(f"The {prompt_type} prompt cannot be empty")

        max_prompt_len = self.model_config.max_model_len
-        if len(prompt_ids) >= max_prompt_len:
+        if len(prompt_ids) > max_prompt_len:
            if prompt_type == "encoder" and model_config.is_multimodal_model:
                mm_registry = self.input_preprocessor.mm_registry
                mm_processor = mm_registry.create_processor(
--- a/vllm/v1/engine/processor.py
+++ b/vllm/v1/engine/processor.py
@ -354,7 +354,7 @@ class Processor:
            raise ValueError(f"Token id {max_input_id} is out of vocabulary")

        max_prompt_len = self.model_config.max_model_len
-        if len(prompt_ids) >= max_prompt_len:
+        if len(prompt_ids) > max_prompt_len:
            if prompt_type == "encoder" and model_config.is_multimodal_model:
                mm_registry = self.input_preprocessor.mm_registry
                mm_processor = mm_registry.create_processor(