vllm/docs/source/dev/multimodal/multimodal_index.rst

Multi-Modality
==============

.. currentmodule:: vllm.multimodal
    
vLLM provides experimental support for multi-modal models through the :mod:`vllm.multimodal` package.

:class:`vllm.inputs.PromptStrictInputs` accepts an additional attribute ``multi_modal_data``
which allows you to pass in multi-modal input alongside text and token prompts.

By default, vLLM models do not support multi-modal inputs. To enable multi-modal support for a model,
you must decorate the model class with :meth:`InputRegistry.register_dummy_data <vllm.inputs.registry.InputRegistry.register_dummy_data>`,
as well as :meth:`MULTIMODAL_REGISTRY.register_input_mapper <MultiModalRegistry.register_input_mapper>` for each modality type to support.

# TODO: Add more instructions on how to do that once embeddings is in.

Module Contents
+++++++++++++++

.. automodule:: vllm.multimodal

Registry
--------

.. autodata:: vllm.multimodal.MULTIMODAL_REGISTRY

.. autoclass:: vllm.multimodal.MultiModalRegistry
    :members:
    :show-inheritance:

Base Classes
------------

.. autoclass:: vllm.multimodal.MultiModalDataDict
    :members:
    :show-inheritance:

.. autoclass:: vllm.multimodal.MultiModalPlugin
    :members:
    :show-inheritance:

Image Classes
-------------

.. automodule:: vllm.multimodal.image
    :members:
    :show-inheritance:
[Core] Support image processor (#4197) 2024-06-03 13:56:41 +08:00			`Multi-Modality`
			`==============`

			`.. currentmodule:: vllm.multimodal`

			vLLM provides experimental support for multi-modal models through the :mod:`vllm.multimodal` package.

			:class:`vllm.inputs.PromptStrictInputs` accepts an additional attribute ``multi_modal_data``
			`which allows you to pass in multi-modal input alongside text and token prompts.`

			`By default, vLLM models do not support multi-modal inputs. To enable multi-modal support for a model,`
[VLM] Remove `image_input_type` from VLM config (#5852) Signed-off-by: Xiaowei Jiang <xwjiang2010@gmail.com> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com> Co-authored-by: Roger Wang <ywang@roblox.com> 2024-07-02 00:57:09 -07:00			you must decorate the model class with :meth:`InputRegistry.register_dummy_data <vllm.inputs.registry.InputRegistry.register_dummy_data>`,
			as well as :meth:`MULTIMODAL_REGISTRY.register_input_mapper <MultiModalRegistry.register_input_mapper>` for each modality type to support.

			`# TODO: Add more instructions on how to do that once embeddings is in.`
[Core] Support image processor (#4197) 2024-06-03 13:56:41 +08:00
			`Module Contents`
			`+++++++++++++++`

			`.. automodule:: vllm.multimodal`

			`Registry`
			`--------`

[Core] Registry for processing model inputs (#5214) Co-authored-by: ywang96 <ywang@roblox.com> 2024-06-28 20:09:56 +08:00			`.. autodata:: vllm.multimodal.MULTIMODAL_REGISTRY`
[Core] Support image processor (#4197) 2024-06-03 13:56:41 +08:00
			`.. autoclass:: vllm.multimodal.MultiModalRegistry`
			`:members:`
			`:show-inheritance:`

			`Base Classes`
			`------------`

[VLM] Remove `image_input_type` from VLM config (#5852) Signed-off-by: Xiaowei Jiang <xwjiang2010@gmail.com> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com> Co-authored-by: Roger Wang <ywang@roblox.com> 2024-07-02 00:57:09 -07:00			`.. autoclass:: vllm.multimodal.MultiModalDataDict`
[Core] Support image processor (#4197) 2024-06-03 13:56:41 +08:00			`:members:`
			`:show-inheritance:`

			`.. autoclass:: vllm.multimodal.MultiModalPlugin`
			`:members:`
			`:show-inheritance:`

			`Image Classes`
			`-------------`

			`.. automodule:: vllm.multimodal.image`
			`:members:`
			`:show-inheritance:`