Triton Inference Server

NVIDIA

Container

NVIDIA

Triton Inference Server

Triton Inference Server is an open source software that lets teams deploy trained AI models from any framework, from local or cloud storage and on any GPU- or CPU-based infrastructure in the cloud, data center, or embedded devices.

NVIDIA AI Enterprise Supported

Layer	Label		Created
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	ENV	`LD_LIBRARY_PATH=/usr/local/tensorrt/lib/:/opt/tritonserver/backends/tensorrtllm:/usr/local/tensorrt/lib:/usr/local/cuda/compat/lib:/usr/local/nvidia/lib:/usr/local/nvidia/lib64`	10/29/2025 9:28 PM UTC
sha256:322d0027588ce033063050163045c099eaba2e0f9102da5aad66fca4ba7df531	RUN	TRITON_VERSION=2.62.0 TRITON_CONTAINER_VERSION=25.10 ldconfig && ARCH="$(uname -i)" && rm -fr ${TRT_ROOT}/bin ${TRT_ROOT}/targets/${ARCH}-linux-gnu/bin ${TRT_ROOT}/data && rm -fr ${TRT_ROOT}/doc ${TRT_ROOT}/onnx_graphsurgeon ${TRT_ROOT}/python && rm -fr ${TRT_ROOT}/samples ${TRT_ROOT}/targets/${ARCH}-linux-gnu/samples && pip3 install --no-cache-dir transformers && find /usr -name libtensorrt_llm.so -exec dirname {} \; > /etc/ld.so.conf.d/tensorrt-llm.conf && find /opt/tritonserver -name libtritonserver.so -exec dirname {} \; > /etc/ld.so.conf.d/triton-tensorrtllm-worker.conf && pip3 install --no-cache-dir grpcio-tools==1.64.0 && pip3 uninstall -y setuptools	10/29/2025 9:28 PM UTC
sha256:7226cc5631239e98e7353fd36eef160fa2501511126d1ab17707c88237a3f62b	COPY	`--chown=1000:1000 docker/sagemaker/serve /usr/bin/.`	10/29/2025 9:27 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	LABEL	`com.amazonaws.sagemaker.capabilities.multi-models=true`	10/29/2025 9:27 PM UTC
sha256:a3ed95caeb02ffe68cdd9fd84406680ae93d633cb16422d00e8a7c22955b46d4	LABEL	`com.amazonaws.sagemaker.capabilities.accept-bind-to-port=true`	10/29/2025 9:27 PM UTC
sha256:a95e3494d807f9fcd880d21e23c271ef3181a146a77b650fc08fca49f064fef9	RUN	`TRITON_VERSION=2.62.0 TRITON_CONTAINER_VERSION=25.10 pip3 install -r python/openai/requirements.txt`	10/29/2025 9:27 PM UTC
sha256:0a62aba1e4bed612cf5796882f34cec7120a27d827d669968d29d442364a7491	RUN	`TRITON_VERSION=2.62.0 TRITON_CONTAINER_VERSION=25.10 find /opt/tritonserver/python -maxdepth 1 -type f -name "tritonserver-.whl" \| xargs -I {} pip install --upgrade {}[all] && find /opt/tritonserver/python -maxdepth 1 -type f -name "tritonfrontend-.whl" \| xargs -I {} pip install --upgrade {}[all]`	10/29/2025 9:27 PM UTC
sha256:2dff31086026d961892480305c319727a2d9a869c3e188534f650470adf417b2	COPY	`--chown=1000:1000 NVIDIA_Deep_Learning_Container_License.pdf .`	10/29/2025 9:27 PM UTC
sha256:4f4fb700ef54461cfa02571ae0db9a0dc1e0cdb5577484a6d75e68dc38e8acc1	WORKDIR	`/opt/tritonserver`	10/29/2025 9:27 PM UTC
sha256:afcc2588e7bd4189377dfc740e439ecc8e4c8bca74524c16d2076032351540ee	COPY	`--chown=1000:1000 build/install tritonserver`	10/29/2025 9:27 PM UTC