Ubuntu 配置 CUDA 环境

最近更新于 2024-05-05 14:19

注意 VMware 虚拟机无法使用显卡,无法配置

于 2022.5.21 在 Ubuntu 20.04 x86_64 测试

CUDA 与驱动版本的对应关系:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

安装显卡驱动

查看设备可用驱动

ubuntu-drivers devices

安装驱动

sudo apt install -y nvidia-driver-版本

实际上系统也是预装了驱动的

cat /proc/driver/nvidia/version

但是我这里要安装 CUDA 11.6.2,要求驱动版本至少达到 510.47.03,按照上面的方式也是可以安装 510 的,但是那个应该是安装的公共驱动,有一次我安装后就开不了机了。所以我一般是去官网下载匹配显卡型号的驱动进行安装:https://www.nvidia.cn/geforce/drivers/

查看显卡型号

lspci | grep NVIDIA

桌面环境下系统预装的显卡驱动已经加载到内核中,直接安装会失败。建议重启进 Recovry 模式进行安装,root 权限执行下载的安装程序(NVIDIA-Linux-x86_64[版本]run)。

安装过程涉及到编译,在安装前应先安装工具链

sudo apt update
sudo apt install -y build-essential pkg-config cmake libglvnd-dev

中间有一个询问是否安装 32 位驱动,可以选 no,64 位系统没有必要再装 32 位的。安装完重启正常进入系统。

安装 CUDA

CUDA 历史发布版本:https://developer.nvidia.com/cuda-toolkit-archive

选择 CUDA 版本后,再根据环境进行选择,下面会显示相关操作命令。

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.6.2/local_installers/cuda-repo-ubuntu2004-11-6-local_11.6.2-510.47.03-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-11-6-local_11.6.2-510.47.03-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu2004-11-6-local/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda

安装完 CUDA 后重启计算机

使用下面命令可以查看显卡信息,加上 -l 参数可以持续更新(显存、GPU 使用率)

nvidia-smi

注意上面显示的 CUDA 版本是指显卡驱动内置的 CUDA 版本,如果手动安装的 CUDA 版本不同,以手动安装的为准

/usr/local/cuda/bin/nvcc --version

安装 cuDNN

下载地址:https://developer.nvidia.com/rdp/cudnn-archive#a-collapse51b (需要注册登录帐号才能下载)

下载 cuDNN 版本需要与 CUDA 版本对应,需要下载两个文件,一个是运行库,另外一个是开发库。

下载后先安装文件名不带 dev 的运行库,再安装 dev 开发库

Ubuntu 配置 CUDA 环境
Scroll to top