Triton Inference Server

NVIDIA

Container

NVIDIA

Triton Inference Server

Triton Inference Server is an open source software that lets teams deploy trained AI models from any framework, from local or cloud storage and on any GPU- or CPU-based infrastructure in the cloud, data center, or embedded devices.

NVIDIA AI Enterprise Supported

Layer	Label		Created
sha256:5d079f7f5be712662bf33d853467a2b351b0589abecabac5f22c95e78489200e	RUN	`NVIDIA_TRITON_SERVER_BASE_VERSION=26.05 NVIDIA_BUILD_ID=321060090 sed 's/Server/Server Base/' /opt/nvidia/entrypoint.d/10-banner.txt \| sed 's/^===/========/' > /opt/nvidia/entrypoint.d/10-banner.new && mv /opt/nvidia/entrypoint.d/10-banner.new /opt/nvidia/entrypoint.d/10-banner.txt`	05/19/2026 1:17 AM UTC
sha256:fcfd8f6c9bac62f7b46ee5eabdf8a467b0100a8b6daaf7c07962dbb33c7c4544	COPY	`docker/entrypoint.d/ /opt/nvidia/entrypoint.d/`	05/19/2026 1:17 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`NVIDIA_PRODUCT_NAME=Triton Server Base`	05/19/2026 1:17 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`NVIDIA_BUILD_ID=321060090`	05/19/2026 1:17 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`NVIDIA_TRITON_SERVER_BASE_VERSION=26.05`	05/19/2026 1:17 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`NVIDIA_BUILD_ID=321060090`	05/19/2026 1:17 AM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ARG	`NVIDIA_TRITON_SERVER_BASE_VERSION=26.05`	05/19/2026 1:17 AM UTC
sha256:4f4fb700ef54461cfa02571ae0db9a0dc1e0cdb5577484a6d75e68dc38e8acc1	RUN	`TARGETARCH=amd64 ENABLE_FIPS=0 ENABLE_MITMPROXY=0 /tmp/manage_cert.sh uninstall`	05/07/2026 9:14 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`LIBRARY_PATH=/usr/local/cuda/lib64/stubs:/usr/local/cuda/lib64/stubs:`	05/07/2026 9:14 PM UTC
sha256:f7e8c93ed0a3ec5501f4ee34b3f78936c0505f9799d3c1a15a03a25f2a7371f3	RUN	RUN \|3 TARGETARCH=amd64 ENABLE_FIPS=0 ENABLE_MITMPROXY=0 /bin/sh -c set -exo pipefail export ARTIFACTORY_USER=$(cat /run/secrets/ARTIFACTORY_USER) export ARTIFACTORY_TOKEN=$(cat /run/secrets/ARTIFACTORY_TOKEN) export DEVEL=1 BASE=0 /nvidia/build-scripts/installNCU.sh /nvidia/build-scripts/installCUDA.sh /nvidia/build-scripts/installLIBS.sh /nvidia/build-scripts/installNCCL.sh # https://jirasw.nvidia.com/browse/DLR-4957 to get the headers and static files with symlinks to the common location DPKG_DIVERT=1 STATIC=1 /nvidia/build-scripts/installNVSHMEM.sh /nvidia/build-scripts/installCUDNN.sh /nvidia/build-scripts/installTRT.sh ARTIFACTORY_CLOUD=1 /nvidia/build-scripts/installNSYS.sh /nvidia/build-scripts/installCUSPARSELT.sh if [ -f "/tmp/cuda-${_CUDA_VERSION_MAJMIN}.patch" ]; then patch -p0 < /tmp/cuda-${_CUDA_VERSION_MAJMIN}.patch; fi rm -f /tmp/cuda-*.patch # buildkit	05/07/2026 9:14 PM UTC