TensorRT LLM Release

NVIDIA

Container

NVIDIA

TensorRT LLM Release

TensorRT LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and supports state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs.

Layer	Label		Created
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`TRT_LLM_GIT_COMMIT=819cc994df9ee920d874d42da9df6b44f890cff6 TRT_LLM_VERSION=0.20.0`	05/21/2025 6:11 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`TRT_LLM_VER=0.20.0`	05/21/2025 6:11 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`GIT_COMMIT=819cc994df9ee920d874d42da9df6b44f890cff6`	05/21/2025 6:11 PM UTC
sha256:14eaa703393aea7dae8573de28031748220482c1750cf59b6b20f848b2aa59fc	RUN	`SRC_DIR=/src/tensorrt_llm CPP_BUILD_DIR=/src/tensorrt_llm/cpp/build /bin/bash -c chmod -R a+w examples && rm -v benchmarks/cpp/bertBenchmark.cpp benchmarks/cpp/gptManagerBenchmark.cpp benchmarks/cpp/disaggServerBenchmark.cpp benchmarks/cpp/CMakeLists.txt && rm -rf /root/.cache/pip`	05/21/2025 6:11 PM UTC
sha256:fa401ab4c7ce85813429b916f606f470ea3d15deb0ae6cc5f7373f450b84722b	COPY	`examples examples`	05/21/2025 6:11 PM UTC
sha256:23619962c7163fd8b3ec4bcee37db6022ec9086a651153d9f5a95000f324a9ac	COPY	`/src/tensorrt_llm/cpp/build/benchmarks/bertBenchmark /src/tensorrt_llm/cpp/build/benchmarks/gptManagerBenchmark /src/tensorrt_llm/cpp/build/benchmarks/disaggServerBenchmark benchmarks/cpp/`	05/21/2025 6:11 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`CPP_BUILD_DIR=/src/tensorrt_llm/cpp/build`	05/21/2025 6:11 PM UTC
sha256:85a8f4407eea2c0aa47ba3a687e25ea0c2d26c088d970da83b32c490af5afb57	COPY	`/src/tensorrt_llm/benchmarks benchmarks`	05/21/2025 6:11 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`SRC_DIR=/src/tensorrt_llm`	05/21/2025 6:11 PM UTC
sha256:b58bcdd5e9259a03d18ec5dac03f2d7adc705c7b7e2d86a5a8429b43a1089da9	RUN	`/bin/bash -c ln -sv $(python3 -c 'import site; print(f"{site.getsitepackages()[0]}/tensorrt_llm/bin")') bin && test -f bin/executorWorker && ln -sv $(python3 -c 'import site; print(f"{site.getsitepackages()[0]}/tensorrt_llm/libs")') lib && test -f lib/libnvinfer_plugin_tensorrt_llm.so && echo "/app/tensorrt_llm/lib" > /etc/ld.so.conf.d/tensorrt_llm.conf && ldconfig && ! ( ldd -v bin/executorWorker \| grep tensorrt_llm \| grep -q "not found" )`	05/21/2025 6:11 PM UTC