目录
linux内核问题ubuntu中使用的有关于内核的指令
uname-r
dpkg--list|greplinux-image
sudoupdate-grub
sudoapt-getpurgelinux-image-具体版本号
查看须要安装的cuda所须要的内核版本
打开cuda的官网官网地址
本人所安装的cuda11.4
选择Documentation-->选择CUDAToolkitv11.4.0-->选择installationguidelinux
找到对应的内核版本请查看该地址
这儿可以看见安装cuda,须要内核版本在5.3.0以上,GCC版本须要在7.5.0以上,GLIBC版本须要在2.27以上!
怎么安装新的内核版本方式一:通过.deb的方式安装(简单推荐使用该方式)第一步:首先在该网页选择合适的内核版本
笔者这儿选择了v5.11,亲测有效,附联接。
第二步:下载不带lowlatency的四个文件
第三步:在下载的文件夹位置打开终端,输入命令
sudo dpkg -i *.deb
安装成功显示“成功”或者“done”
方式二:通过源码编译安装(麻烦不推荐)第一步:首先在该网页选择合适的内核版本的源码下载
第二步:解压.xz压缩文件
tar-zxf要解压的文件
第三步:安装依赖
sudo apt-get update
sudo apt-get install build-essential libncurses-dev bison flex libssl-dev libelf-dev dwarves liblz4-tool
第四步:配置内核编译选项。可以使用makemenuconfig命令来配置编译选项。
cd linux-6.4.0
make menuconfig
在菜单中选择须要的编译选项,之后保存配置文件。
默认配置:save-->load-->exit
第五步:编译内核
make -j4
上述-j4参数表示并行编译linux文本编辑器,可以按照CPU核心数和显存大小调整并行编译的数目。
可以使用htop或nproc命令查看逻辑核数!
第六步:安装内核
sudo make -j4 modules_install
sudo make -j4 install
第七步:更新GRUB引导程序。使用以下命令更新GRUB引导程序:
sudo update-grub
第八步:重启计算机。使用以下命令重启计算机:
sudo reboot
笔者更新内核时出现的问题:
问题描述:笔者觉得高版本的linux内核可以驱动更高版本的nvidia的主板驱动,因而支持更高的cuda版本,因而前前后后共安装了4个linux内核5.4-->5.11-->5.19-->6.4.0
linux5.4的问题
在安装完各类版本的nvidia主板驱动后,均卡死在登入界面(循环登录问题),在这个内核版本中,根本没法解决循环登录问题。
linux5.11的问题
在这个内核版本中nvidia-driver使用470版本时,可以正常使用,但一开始还是会出现循环登录问题,此处的循环登录问题是可以解决的linux查看内核版本命令,在使用535版本时,可以通过外接一个显示器使用美国linux主机,而电脑笔记本自己的屏幕是卡死在登入界面的,这块儿不太懂,也没有解决,有解决的uu可以私信,一起交流呀!
驱动535的问题如右图所示:
linux5.19的问题
直接卡死在登入界面
linux6.4.0的问题
error:outofmemory
循环登录问题的解决
笔者这儿是gnome管理器问题,解决方式如下:
ubuntu默认使用的gnome管理器是gdm3,可以安装sudoapt-getinstalllightdm等其他gnome管理器,使用sudodpkg-reconfigurelightdm/gdm3切换默认gnome管器,reboot查验。笔者使用了lightdm来管理登录界面,就解决了循环登录问题(只针对linux5.11的内核和470的驱动)
别的缘由造成的循环登录问题解决办法
若是由于内核和主板驱动不匹配的问题卡死在登入页面可以通过以下方式来解决:
先步入安全模式后,在root模式中进行如下操作:
apt-get purge nvidia*
reboot
reboot重启检测是否可以步入登录界面
若是不行则采用如下操作:(此操作是实在没有办法的情况下采用的!)
apt-get autoremove
reboot
安装nvidia主板驱动方式一:使用系统自带的更新第一步:找到系统推荐安装的主板驱动
ubuntu-drivers devices
第二步:在softwareandupdate-->addtionaldrivers-->选择470的驱动
第三步:安装完成,reboot后,使用nvidia-smi检测是否安装成功
注意:这儿显示只能安装CUDA最高版本是11.4
方式二:使用从NVIDIA官方下载的主板驱动安装第一步:确定笔记本的主板机型
lspci | grep -i vga
#----output------
01:00.0 VGA compatible controller: NVIDIA Corporation Device 2704 (rev a1)
07:00.0 VGA compatible controller: NVIDIA Corporation Device 2704 (rev a1)
从里面的输出可以看见主板的pci机型是2704
第二步:通过pci查询方式确定主板机型
output:
Name:AD103[GeForceRTX4080]
第三步:在NVIDIA官网下载对应版本的主板驱动
NVIDIA-Linux-x86_64-550.54.14.run
运行该文件:sudoNVIDIA-Linux-x86_64-550.54.14.run
第四步:重启笔记本
reboot
总结
有时侯方式一并不好用,我安装系统推荐的主板驱动后linux查看内核版本命令,重启笔记本时,卡死在了开机页面。
安装CUDA第一步:在该网址找到要下载的cuda版本,笔者下载的是11.4
第二步:步入到下载的目录中使用如下命令:
sudo sh cuda_11.4.0_470.42.01_linux.run
第三步:弹出一个对话框,输入accept:
第四步:笔者服务器早已安装过Nvidia主板驱动了,因而不须要再安装了。假如你仍未安装驱动,可以顺便一起安装了。摁一下空格取消Driver安装,直接选择Install安装:
安装成功标志:
第五步:配置环境变量
sudo vim ~/.bashrc
在文件末尾添加
export PATH=/usr/local/cuda-11.4/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64:$LD_LIBRARY_PATH
export LIBRARY_PATH=/usr/local/cuda-11.4/lib64:$LIBRARY_PATH
~
更新系统环境变量
source ~/.bashrc
sudo ldconfig
第六步:验证CUDA
nvcc -V
输出右图即为成功安装:
安装CUDNN
下载cuda对应版本的cudnn
笔者这儿选择cuDNNv8.9.2使用了LocalInstallerforLinuxx86_64(Tar)的形式来安装,得到cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xz具体步骤如下:
第一步:到下载的目录解压文件
tar -xvf cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xz
cd cudnn-linux-x86_64-8.9.2.26_cuda11-archive
第二步:使用如下命令
sudo cp lib/* /usr/local/cuda-11.4/lib64/
sudo cp include/* /usr/local/cuda-11.4/include/
sudo chmod a+r /usr/local/cuda-11.4/lib64/*
sudo chmod a+r /usr/local/cuda-11.4/include/*
第三步:查看cuDNN版本
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
得到结果如下:
表示安装成功