最近更新于 2024-05-05 14:19
注意 VMware 虚拟机无法使用显卡,无法配置
于 2022.5.21 在 Ubuntu 20.04 x86_64 测试
CUDA 与驱动版本的对应关系:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
安装显卡驱动
查看设备可用驱动
ubuntu-drivers devices
安装驱动
sudo apt install -y nvidia-driver-版本
实际上系统也是预装了驱动的
cat /proc/driver/nvidia/version
但是我这里要安装 CUDA 11.6.2,要求驱动版本至少达到 510.47.03,按照上面的方式也是可以安装 510 的,但是那个应该是安装的公共驱动,有一次我安装后就开不了机了。所以我一般是去官网下载匹配显卡型号的驱动进行安装:https://www.nvidia.cn/geforce/drivers/
查看显卡型号
lspci | grep NVIDIA
桌面环境下系统预装的显卡驱动已经加载到内核中,直接安装会失败。建议重启进 Recovry 模式进行安装,root 权限执行下载的安装程序(NVIDIA-Linux-x86_64[版本]run)。
安装过程涉及到编译,在安装前应先安装工具链
sudo apt update sudo apt install -y build-essential pkg-config cmake libglvnd-dev
中间有一个询问是否安装 32 位驱动,可以选 no,64 位系统没有必要再装 32 位的。安装完重启正常进入系统。
安装 CUDA
CUDA 历史发布版本:https://developer.nvidia.com/cuda-toolkit-archive
选择 CUDA 版本后,再根据环境进行选择,下面会显示相关操作命令。
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600 wget https://developer.download.nvidia.com/compute/cuda/11.6.2/local_installers/cuda-repo-ubuntu2004-11-6-local_11.6.2-510.47.03-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu2004-11-6-local_11.6.2-510.47.03-1_amd64.deb sudo apt-key add /var/cuda-repo-ubuntu2004-11-6-local/7fa2af80.pub sudo apt-get update sudo apt-get -y install cuda
安装完 CUDA 后重启计算机
使用下面命令可以查看显卡信息,加上 -l 参数可以持续更新(显存、GPU 使用率)
nvidia-smi
注意上面显示的 CUDA 版本是指显卡驱动内置的 CUDA 版本,如果手动安装的 CUDA 版本不同,以手动安装的为准
/usr/local/cuda/bin/nvcc --version
安装 cuDNN
下载地址:https://developer.nvidia.com/rdp/cudnn-archive#a-collapse51b (需要注册登录帐号才能下载)
下载 cuDNN 版本需要与 CUDA 版本对应,需要下载两个文件,一个是运行库,另外一个是开发库。
下载后先安装文件名不带 dev 的运行库,再安装 dev 开发库