Triton Inference Server

NVIDIA

Container

NVIDIA

Triton Inference Server

Triton Inference Server is an open source software that lets teams deploy trained AI models from any framework, from local or cloud storage and on any GPU- or CPU-based infrastructure in the cloud, data center, or embedded devices.

NVIDIA AI Enterprise Supported

Layer	Label		Created
sha256:dbcbf466be6873a8addb1a51df145d94904be2ebc90b740372a5f30b4ee68356	RUN	`NVIDIA_TRITON_SERVER_BASE_VERSION=26.03 NVIDIA_BUILD_ID=283962264 sed 's/Server/Server Base/' /opt/nvidia/entrypoint.d/10-banner.txt \| sed 's/^===/========/' > /opt/nvidia/entrypoint.d/10-banner.new && mv /opt/nvidia/entrypoint.d/10-banner.new /opt/nvidia/entrypoint.d/10-banner.txt`	03/18/2026 7:02 PM UTC
sha256:7f915777de919e100514a068fec4a510339231a8c78b1dc4e044e395c718abd7	COPY	`docker/entrypoint.d/ /opt/nvidia/entrypoint.d/`	03/18/2026 7:02 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`NVIDIA_PRODUCT_NAME=Triton Server Base`	03/18/2026 7:02 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`NVIDIA_BUILD_ID=283962264`	03/18/2026 7:02 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`NVIDIA_TRITON_SERVER_BASE_VERSION=26.03`	03/18/2026 7:02 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`NVIDIA_BUILD_ID=283962264`	03/18/2026 7:02 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`NVIDIA_TRITON_SERVER_BASE_VERSION=26.03`	03/18/2026 7:02 PM UTC
sha256:4f4fb700ef54461cfa02571ae0db9a0dc1e0cdb5577484a6d75e68dc38e8acc1	RUN	`TARGETARCH=amd64 ENABLE_FIPS=0 ENABLE_MITMPROXY=0 /tmp/manage_cert.sh uninstall`	03/10/2026 7:31 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`LIBRARY_PATH=/usr/local/cuda/lib64/stubs:/usr/local/cuda/lib64/stubs:`	03/10/2026 7:31 PM UTC
sha256:564f64065b22c22c83bb409e77ec9edc08c68db43ba4ff2a8002c6ec3cdcc5e4	RUN	RUN \|3 TARGETARCH=amd64 ENABLE_FIPS=0 ENABLE_MITMPROXY=0 /bin/sh -c set -exo pipefail export ARTIFACTORY_USER=$(cat /run/secrets/ARTIFACTORY_USER) export ARTIFACTORY_TOKEN=$(cat /run/secrets/ARTIFACTORY_TOKEN) export DEVEL=1 BASE=0 /nvidia/build-scripts/installNCU.sh /nvidia/build-scripts/installCUDA.sh /nvidia/build-scripts/installLIBS.sh /nvidia/build-scripts/installNCCL.sh /nvidia/build-scripts/installNVSHMEM.sh export CUDA_VERSION_MAJOR=$(echo "${CUDA_VERSION}" \| cut -d. -f1) # Link nvshmem libs to /usr/local/cuda/lib64 find /usr/lib/-linux-gnu/nvshmem/${CUDA_VERSION_MAJOR}/ -maxdepth 1 -type f -exec ln -sf {} /usr/local/cuda/lib64/ \; find /usr/lib/-linux-gnu/nvshmem/${CUDA_VERSION_MAJOR}/ -maxdepth 1 -type l -exec ln -sf {} /usr/local/cuda/lib64/ \; /nvidia/build-scripts/installCUDNN.sh /nvidia/build-scripts/installTRT.sh ARTIFACTORY_CLOUD=1 /nvidia/build-scripts/installNSYS.sh /nvidia/build-scripts/installCUSPARSELT.sh if [ -f "/tmp/cuda-${_CUDA_VERSION_MAJMIN}.patch" ]; then patch -p0 < /tmp/cuda-${_CUDA_VERSION_MAJMIN}.patch; fi rm -f /tmp/cuda-*.patch # buildkit	03/10/2026 7:31 PM UTC