docker

djl-serving docker image

This module contains docker file to build djl-serving docker image. This docker image is compatible with SageMaker hosting.

Build docker image

Currently, we created docker compose to simplify the building experience. Just run

cd serving/docker
export DJL_VERSION=$(awk -F '=' '/djl / {gsub(/ ?"/, "", $2); print $2}' ../../gradle/libs.versions.toml)
docker compose build --build-arg djl_version=${DJL_VERSION} <compose-target>

You can find different compose-target in docker-compose.yml, like cpu, lmi...

Run docker image

You can find DJL latest release docker image on dockerhub. DJLServing also publishes nightly publish to the dockerhub nightly. You can just pull the image you need from there.

djl-serving will load all models stored in /opt/ml/model folder. You only need to download your model files and mount the model folder to /opt/ml/model in the docker container.

Here are a few examples to run djl-serving docker image:

CPU

docker pull deepjavalibrary/djl-serving:0.28.0

mkdir models
cd models
curl -O https://resources.djl.ai/test-models/pytorch/bert_qa_jit.tar.gz

docker run -it --rm -v $PWD:/opt/ml/model -p 8080:8080 deepjavalibrary/djl-serving:0.28.0

GPU

docker pull deepjavalibrary/djl-serving:0.28.0-pytorch-gpu

mkdir models
cd models
curl -O https://resources.djl.ai/test-models/pytorch/bert_qa_jit.tar.gz

docker run -it --runtime=nvidia --shm-size 2g -v $PWD:/opt/ml/model -p 8080:8080 deepjavalibrary/djl-serving:0.28.0-pytorch-gpu

AWS Inferentia

docker pull deepjavalibrary/djl-serving:0.28.0-pytorch-inf2

mkdir models
cd models

curl -O https://resources.djl.ai/test-models/pytorch/resnet18_inf2_2_4.tar.gz
docker run --device /dev/neuron0 -it --rm -v $PWD:/opt/ml/model -p 8080:8080 deepjavalibrary/djl-serving:0.28.0-pytorch-inf2

aarch64 machine

docker pull deepjavalibrary/djl-serving:0.28.0-aarch64

mkdir models
cd models

curl -O https://resources.djl.ai/test-models/pytorch/resnet18_inf2_2_4.tar.gz
docker run --device /dev/neuron0 -it --rm -v $PWD:/opt/ml/model -p 8080:8080 deepjavalibrary/djl-serving:0.28.0-aarch64

Run docker image with custom command line arguments

You can pass command line arguments to djl-serving directly when you using docker run

docker run -it --rm -p 8080:8080 deepjavalibrary/djl-serving:0.28.0 djl-serving -m "djl://ai.djl.huggingface.pytorch/sentence-transformers/all-MiniLM-L6-v2"

Name		Name	Last commit message	Last commit date
parent directory ..
partition		partition
scripts		scripts
Dockerfile		Dockerfile
README.md		README.md
aarch64.Dockerfile		aarch64.Dockerfile
config.properties		config.properties
docker-compose.yml		docker-compose.yml
dockerd-entrypoint-with-cuda-compat.sh		dockerd-entrypoint-with-cuda-compat.sh
dockerd-entrypoint.sh		dockerd-entrypoint.sh
lmi.Dockerfile		lmi.Dockerfile
pytorch-gpu.Dockerfile		pytorch-gpu.Dockerfile
pytorch-inf2.Dockerfile		pytorch-inf2.Dockerfile
tensorrt-llm.Dockerfile		tensorrt-llm.Dockerfile

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

docker

docker

README.md

djl-serving docker image

Build docker image

Run docker image

CPU

GPU

AWS Inferentia

aarch64 machine

Run docker image with custom command line arguments

Files

docker

Directory actions

More options

Directory actions

More options

Latest commit

History

docker

Folders and files

parent directory

README.md

djl-serving docker image

Build docker image

Run docker image

CPU

GPU

AWS Inferentia

aarch64 machine

Run docker image with custom command line arguments