vllm/tests/core/utils.py

import time
from typing import Tuple

from vllm import SamplingParams
from vllm.sequence import Sequence, SequenceGroup


def create_dummy_prompt(
        request_id: str,
        prompt_length: int,
        block_size: int = None) -> Tuple[Sequence, SequenceGroup]:
    if not block_size:
        block_size = prompt_length

    # Create dummy prompt sequence with tokens 0...block_size-1
    # and prompt "0 ... block_size".
    prompt_tokens = list(range(prompt_length))
    prompt_str = " ".join([str(t) for t in prompt_tokens])
    prompt = Sequence(int(request_id), prompt_str, prompt_tokens, block_size)
    seq_group = SequenceGroup(request_id, [prompt], SamplingParams(),
                              time.time(), None)

    return prompt, seq_group


def round_up_to_next_block(seq_len: int, block_size: int) -> int:
    return (seq_len + block_size - 1) // block_size
[Tests] Add block manager and scheduler tests (#3108) 2024-03-06 11:23:34 +09:00			`import time`
			`from typing import Tuple`

			`from vllm import SamplingParams`
			`from vllm.sequence import Sequence, SequenceGroup`


			`def create_dummy_prompt(`
			`request_id: str,`
			`prompt_length: int,`
			`block_size: int = None) -> Tuple[Sequence, SequenceGroup]:`
			`if not block_size:`
			`block_size = prompt_length`

			`# Create dummy prompt sequence with tokens 0...block_size-1`
			`# and prompt "0 ... block_size".`
			`prompt_tokens = list(range(prompt_length))`
			`prompt_str = " ".join([str(t) for t in prompt_tokens])`
			`prompt = Sequence(int(request_id), prompt_str, prompt_tokens, block_size)`
			`seq_group = SequenceGroup(request_id, [prompt], SamplingParams(),`
[Testing] Fix core tests (#3224) 2024-03-06 01:04:23 -08:00			`time.time(), None)`
[Tests] Add block manager and scheduler tests (#3108) 2024-03-06 11:23:34 +09:00
			`return prompt, seq_group`


			`def round_up_to_next_block(seq_len: int, block_size: int) -> int:`
			`return (seq_len + block_size - 1) // block_size`