ubuntu18.04下搭建docker深度学习环境

1.安装显卡驱动

#卸载原先驱动
sudo apt-get remove --purge nvidia*

#查看当前显卡合适的驱动
ubuntu-drivers devices

ubuntu18.04下搭建docker深度学习环境_第1张图片


#安裝驱动,注意改成你自己合适的驱动
sudo apt-get install nvidia-driver-450-server

# 重启
reboot 

#查看显卡工作情况
nvidia-smi 

ubuntu18.04下搭建docker深度学习环境_第2张图片

2.docekr安裝

#docker安装
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository \
   "deb [arch=amd64] https://mirrors.tuna.tsinghua.edu.cn/docker-ce/linux/ubuntu \
   $(lsb_release -cs) \
   stable"
sudo apt-get update
sudo apt-get install docker-ce
#检查版本
docker -v

#为避免docker操作必须要sudo,将当前用户加入docker用户组(${YOUR_NAME_HERE}处填当前用户名)
sudo usermod -aG docker ${YOUR_NAME_HERE}

##设置docker 源
#新建配置文件
vi /etc/docker/daemon.json
#在文件中写入清华源
{
“registry-mirrors”: [“https://docker.mirrors.ustc.edu.cn/”]
}
#重启服务
service docker restart

3安装nvidia-docker支持

nvidia官方教程: https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#installing-on-ubuntu-and-debian.
其中有些步骤有错误
建议使用以下方案

# Add the package repositories
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker
#测试
#### Test nvidia-smi with the latest official CUDA image
docker run --gpus all nvidia/cuda:10.0-base nvidia-smi

你可能感兴趣的