Triton Inference Server

NVIDIA

Container

NVIDIA

Triton Inference Server

Triton Inference Server is an open source software that lets teams deploy trained AI models from any framework, from local or cloud storage and on any GPU- or CPU-based infrastructure in the cloud, data center, or embedded devices.

NVIDIA AI Enterprise Supported

Layer	Label		Created
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`LD_LIBRARY_PATH=/usr/local/tensorrt/lib/:/opt/tritonserver/backends/tensorrtllm:/usr/local/tensorrt/lib:/usr/local/cuda/compat/lib:/usr/local/nvidia/lib:/usr/local/nvidia/lib64`	01/27/2026 11:58 PM UTC
sha256:19c453483a3f4b93eb8e1f14ae49fdd2dc3469b409a1dd0dbc3fa7b13a88adf1	RUN	TRITON_VERSION=2.65.0 TRITON_CONTAINER_VERSION=26.01 ldconfig && ARCH="$(uname -i)" && rm -fr ${TRT_ROOT}/bin ${TRT_ROOT}/targets/${ARCH}-linux-gnu/bin ${TRT_ROOT}/data && rm -fr ${TRT_ROOT}/doc ${TRT_ROOT}/onnx_graphsurgeon ${TRT_ROOT}/python && rm -fr ${TRT_ROOT}/samples ${TRT_ROOT}/targets/${ARCH}-linux-gnu/samples && pip3 install --no-cache-dir transformers && find /usr -name libtensorrt_llm.so -exec dirname {} \; > /etc/ld.so.conf.d/tensorrt-llm.conf && find /opt/tritonserver -name libtritonserver.so -exec dirname {} \; > /etc/ld.so.conf.d/triton-tensorrtllm-worker.conf && pip3 install --no-cache-dir grpcio-tools==1.64.0 && pip3 uninstall -y setuptools	01/27/2026 11:58 PM UTC
sha256:998063661867ccc114a57677fee96308dc510a88f001dffe4a6422db8651808e	COPY	`--chown=1000:1000 docker/sagemaker/serve /usr/bin/.`	01/27/2026 11:58 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	LABEL	`com.amazonaws.sagemaker.capabilities.multi-models=true`	01/27/2026 11:58 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	LABEL	`com.amazonaws.sagemaker.capabilities.accept-bind-to-port=true`	01/27/2026 11:58 PM UTC
sha256:7dbb47676252eb056cb25ae47b02489bd91bb6ec8267b71c929c6555d8e8bd8e	RUN	`TRITON_VERSION=2.65.0 TRITON_CONTAINER_VERSION=26.01 pip3 install -r python/openai/requirements.txt`	01/27/2026 11:58 PM UTC
sha256:a9600b3378da14c8b22d48b7e09ca3d0ce4b8da84f516b27cb01a53adf3851fc	RUN	`TRITON_VERSION=2.65.0 TRITON_CONTAINER_VERSION=26.01 find /opt/tritonserver/python -maxdepth 1 -type f -name "tritonserver-.whl" \| xargs -I {} pip install --upgrade {}[all] && find /opt/tritonserver/python -maxdepth 1 -type f -name "tritonfrontend-.whl" \| xargs -I {} pip install --upgrade {}[all]`	01/27/2026 11:57 PM UTC
sha256:030162e07256f783a6197a4df3e947994c7f9e503cdb60ac3670cf524748ac08	COPY	`--chown=1000:1000 NVIDIA_Deep_Learning_Container_License.pdf .`	01/27/2026 11:57 PM UTC
sha256:4f4fb700ef54461cfa02571ae0db9a0dc1e0cdb5577484a6d75e68dc38e8acc1	WORKDIR	`/opt/tritonserver`	01/27/2026 11:57 PM UTC
sha256:f96412478ca41c16ed31189637148cd5e7588655045a6f54e6ddbab6b8b7434c	COPY	`--chown=1000:1000 build/install tritonserver`	01/27/2026 11:57 PM UTC