Ubuntu 16.04将cuda 10.1降到cuda10.0

最近因为跑程序,需要用到cuda的版本为10.0,但是机器的cuda版本为10.1,所以就将其版本进行了降低。

卸载cuda 10.1
1
2
sudo /usr/local/cuda-10.1/bin/uninstall_cuda_10.1.pl
sudo apt --purge remove nvidia*
下载cuda和cudnn

在官网下载cuda10.0和cudnn7.3.1,两者的版本一定要匹配。
cuda和cudnn匹配列表:
https://developer.nvidia.com/rdp/cudnn-archive#a-collapse731-10

cuda10.0下载地址(选择runfile的文件下载,安装比较方便):
https://developer.nvidia.com/cuda-10.0-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal

cudnn7.3.1下载地址:
https://developer.nvidia.com/compute/machine-learning/cudnn/secure/v7.3.1/prod/10.0_2018927/cudnn-10.0-linux-x64-v7.3.1.20

安装cuda

1. 禁用nouveau driver

1
lsmod | grep nouveau

如果没有结果输出,则代表禁用掉了。如果有内容输出,则代表没有禁用掉。需要执行如下操作,

1)在/etc/modprobe.d中创建文件blacklist-nouveau.conf,

1
2
cd /etc/modprobe.d
sudo touch blacklist-nouveau.conf

2)在文件blacklist-nouveau.conf中输入如下内容,

1
2
blacklist nouveau
options nouveau modeset=0

保存并退出后,执行如下命令,

1
sudo update-initramfs -u

3)执行命令lsmod | grep nouveau 检查是否禁用成功。

2. 进入文本模式
按Ctrl+Alt+F1,进入文本模式,执行如下命令,关闭图形界面,

1
sudo service lightdm stop

然后进入cuda的安装包所在文件夹,执行如下命令:

1
sudo sh cuda_10.0.130_410.48_linux.run

输入上述命令后,会显示用户许可证信息,按空格键直到显示为100%,然后输入accept。

在这个过程中,会遇到如下选项,NVIDIA Accelerated Graphics Driver: 选择n;
openGL(有时不会出现): 选择n;
其他:都选择y;
安装路径可以选择默认:直接回车。

接着,输入命令sudo service lightdm start, 启动图形化界面,按住Alt+Ctrl+F7,返回图形化登录界面,输入账号密码后登录。 或者输入命令sudo reboot,重启回到图形界面。

3. 环境配置
输入如下命令,打开/etc/profile文件,

1
vim /etc/profile

在文件中输入如下内容,

1
2
export PATH=/usr/local/cuda-10.0/bin
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64

然后,保存并退出文件。接着,执行如下命令,使配置生效,

1
source /etc/profile

4. 检查cuda是否安装成功
输入如下命令,查看nvidia驱动的版本:

1
cat /proc/driver/nvidia/version

我的版本为410.48。
输入如下命令,查看CUDA Toolkit的版本:

1
nvcc -V

我的版本是V10.0.130。
至此,cuda安装成功,接下来安装cudnn。

安装cudnn

1. 解压cudnn安装包

1
tar -xvf cudnn-10.0-linux-x64-v7.3.1.20.tgz

2. 配置cudnn
在当前目录输入依次执行如下命令,

1
2
3
4
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

3. 查看cudnn版本
输入如下命令,查看版本,

1
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

如果有对应的CUDNN_MAJOR输出,则代表安装成功。

检查cuda和cudnn是否都安装成功

输入如下命令,

1
2
modprobe nvidia
nvidia-smi

如果出现GPU的信息列表,则说明安装成功。

常见错误
  1. 如果出现无法进入Ubuntu系统,输入如下命令,清除安装的驱动,
    1
    sudo apt-get purge nvidia*
    然后再输入命令sudo reboot重启,如果问题依然没有解决,按照上述步骤,重新安装cuda。
参考资料
  1. https://www.pythonf.cn/read/110763
  2. https://www.jianshu.com/p/89f1ab962d75
  3. https://blog.csdn.net/weixin_42279044/article/details/83181686
  4. https://blog.csdn.net/lihe4151021/article/details/90237681
  5. https://blog.csdn.net/qq_45049586/article/details/104582468
  6. https://blog.csdn.net/qq_41915226/article/details/103051602

Ubuntu 16.04将cuda 10.1降到cuda10.0
https://xiepeng21.cn/posts/8517e2d2/
作者
Peter
发布于
2020年7月25日
许可协议