vLLM | NVIDIA NGC

NVIDIA

vLLM

Container

NVIDIA

vLLM

vLLM is a fast and easy-to-use library for LLM inference and serving. The NVIDIA vLLM NGC Container is optimized for GPU acceleration, and contains a validated set of libraries that enable and optimize GPU performance.

Layer	Label		Created
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	LABEL	`com.nvidia.build.ref=4b72d8148f9ffe067ac468dda616d07613a4db62`	09/27/2025 6:37 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`NVIDIA_BUILD_REF=4b72d8148f9ffe067ac468dda616d07613a4db62`	09/27/2025 6:37 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	LABEL	`com.nvidia.build.id=214638689`	09/27/2025 6:37 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`NVIDIA_BUILD_ID=214638689`	09/27/2025 6:37 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`NVIDIA_BUILD_ID=214638689`	09/27/2025 6:37 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`NVIDIA_VLLM_VERSION=25.09`	09/27/2025 6:37 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`NVIDIA_VLLM_VERSION=25.09`	09/27/2025 6:37 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	LABEL	`com.nvidia.vllm.version=0.10.1.1+381074ae`	09/27/2025 6:37 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`NVIDIA_PRODUCT_NAME=vLLM`	09/27/2025 6:37 AM UTC
sha256:3b44237b3c780d9318e8b9af36f39c778d92d6dba39b5ea03503d2b719833e8b	RUN	`TARGETARCH=amd64 VLLM_VERSION=0.10.1.1+381074ae sed -i -E 's/^([[:space:]]*)from \.modeling_utils import PreTrainedAudioTokenizerBase/\1pass/' /usr/local/lib/python3.12/dist-packages/transformers/processing_utils.py`	09/27/2025 6:37 AM UTC