vllm/examples/paligemma_example.py

from vllm import LLM
from vllm.assets.image import ImageAsset


def run_paligemma():
    llm = LLM(model="google/paligemma-3b-mix-224")

    prompt = "caption es"

    image = ImageAsset("stop_sign").pil_image

    outputs = llm.generate({
        "prompt": prompt,
        "multi_modal_data": {
            "image": image
        },
    })

    for o in outputs:
        generated_text = o.outputs[0].text
        print(generated_text)


if __name__ == "__main__":
    run_paligemma()
[Model] Add PaliGemma (#5189) Co-authored-by: Woosuk Kwon <woosuk.kwon@berkeley.edu> 2024-07-06 18:25:50 -07:00			`from vllm import LLM`
[CI/Build] vLLM cache directory for images (#6444) 2024-07-16 14:12:25 +08:00			`from vllm.assets.image import ImageAsset`
[Model] Add PaliGemma (#5189) Co-authored-by: Woosuk Kwon <woosuk.kwon@berkeley.edu> 2024-07-06 18:25:50 -07:00

			`def run_paligemma():`
			`llm = LLM(model="google/paligemma-3b-mix-224")`

			`prompt = "caption es"`

[CI/Build] vLLM cache directory for images (#6444) 2024-07-16 14:12:25 +08:00			`image = ImageAsset("stop_sign").pil_image`
[Model] Add PaliGemma (#5189) Co-authored-by: Woosuk Kwon <woosuk.kwon@berkeley.edu> 2024-07-06 18:25:50 -07:00
			`outputs = llm.generate({`
			`"prompt": prompt,`
			`"multi_modal_data": {`
			`"image": image`
			`},`
			`})`

			`for o in outputs:`
			`generated_text = o.outputs[0].text`
			`print(generated_text)`


			`if __name__ == "__main__":`
[CI/Build] vLLM cache directory for images (#6444) 2024-07-16 14:12:25 +08:00			`run_paligemma()`