准备工作:奠定坚实基础
在动手安装之前,充分的准备工作可以避免后续绝大多数的常见问题。
系统更新与依赖安装
确保您的 CentOS 系统是最新版本,以避免潜在的兼容性问题,执行以下命令来更新系统并安装必要的开发工具包和内核头文件。
sudo yum update -y sudo yum groupinstall "Development Tools" -y sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y
这些依赖项是编译 NVIDIA 驱动模块所必需的。
禁用默认的 Nouveau 开源驱动
CentOS 默认使用名为 Nouveau 的开源 NVIDIA 驱动,这个驱动会与官方的专有驱动产生冲突,因此必须在安装前将其禁用。
检查 Nouveau 是否正在运行:lsmod | grep nouveau
创建一个配置文件来禁用它:
sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf" sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
备份当前的 initramfs 镜像并重新生成一个新的,以确保更改在下次启动时生效:
sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak sudo dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
完成以上步骤后,重启系统:sudo reboot
重启后,再次执行 lsmod | grep nouveau
,如果没有输出,则说明禁用成功。
确认硬件识别
使用 lspci
命令检查系统是否已正确识别 GTX 1080 显卡。lspci | grep -i nvidia
您应该能看到类似 “GeForce GTX 1080” 的输出信息。
安装 NVIDIA 官方驱动
安装驱动主要有两种方法:从 NVIDIA 官网下载 .run
文件手动安装,或通过 NVIDIA 官方提供的 YUM/DNF 仓库进行安装,对于追求长期维护和系统整洁性的用户,强烈推荐使用仓库安装方式。
安装方式 | 优点 | 缺点 | 适用场景 |
---|---|---|---|
官方仓库 (RPM) | 易于管理、更新方便、与系统集成度高 | 初始配置稍复杂 | 服务器、长期维护的系统 |
官方文件 (.run) | 控制度高、版本选择灵活 | 手动更新繁琐、可能与系统包管理冲突 | 临时测试、特定版本需求 |
推荐方法:使用 RPM 仓库安装
添加 NVIDIA 仓库:
访问 NVIDIA 官方开发者网站,找到适用于您 CentOS 版本的仓库配置包,对于 CentOS 7/RHEL 7:sudo yum install -y https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm sudo yum config-manager --add-repo=https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-rhel7.repo sudo yum clean all
安装驱动和 CUDA 工具包:
仓库配置好后,安装过程变得非常简单,以下命令会安装最新的驱动、CUDA 工具包以及相关的库文件。sudo yum install -y nvidia-driver-latest-dkms cuda
dkms
(Dynamic Kernel Module Support) 包能确保在内核更新后自动重建 NVIDIA 驱动模块,极大地简化了维护工作。验证安装:
安装完成后,再次重启系统。sudo reboot
登录后,在终端中运行nvidia-smi
命令,如果一切正常,您将看到一个详细的表格,其中包含驱动版本、CUDA 版本、GPU 型号(GeForce GTX 1080)、温度、功耗和使用率等信息,这标志着驱动已成功安装并运行。
配置 CUDA 环境
虽然上一步已经安装了 CUDA 工具包,但还需要配置环境变量,以便系统能够找到相关的可执行文件和库。
编辑用户的 shell 配置文件(如 ~/.bashrc
或 ~/.bash_profile
):vi ~/.bashrc
在文件末尾添加以下内容:
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存并退出后,执行 source ~/.bashrc
使配置立即生效,或者重新登录。
为了验证 CUDA 是否配置正确,可以编译并运行 CUDA 自带的示例程序:
cd /usr/local/cuda/samples/1_Utilities/deviceQuery make ./deviceQuery
如果程序最后输出 “Result = PASS”,则表示您的 GTX 1080 已经完全准备好执行 CUDA 计算任务了。
相关问答FAQs
问题 1:如何更新已安装的 NVIDIA 驱动程序?
解答: 如果您是通过官方 RPM 仓库安装的驱动,更新过程非常简单,只需执行标准的系统更新命令即可:sudo yum update -y
或者,为了更精确地更新 NVIDIA 相关的包:sudo yum update nvidia-driver-* cuda-*
系统会自动检查并下载最新版本的驱动和 CUDA 工具包,更新后重启系统即可生效,如果您是使用 .run
文件安装的,则需要重新下载新版本的安装包,并在运行时添加 --uninstall
参数先卸载旧版,再正常安装新版,过程相对繁琐。
问题 2:安装驱动后重启,系统进入命令行模式,无法启动图形界面怎么办?
解答: 这是一个典型的 X Server(图形服务器)配置问题,最常见的原因是禁用 nouveau
不彻底,或者驱动安装过程中 X Server 配置文件出错。
:在命令行模式下,再次运行 lsmod | grep nouveau
确保其没有加载。- 检查 X Server 日志:查看日志文件
/var/log/Xorg.0.log
,搜索关键词(EE)
(错误)或(WW)
(警告),通常会给出驱动加载失败的具体原因。 - 重新配置驱动:尝试以安全模式重新安装 NVIDIA 驱动,在运行
.run
安装文件时,可以添加选项来修复配置,sudo ./NVIDIA-Linux-x86_64-*.run --repair
,如果是通过 RPM 安装,可以尝试sudo yum reinstall nvidia-driver-latest-dkms
。
遵循本文档的准备工作步骤,尤其是彻底禁用nouveau
,可以最大程度地避免此问题的发生。
【版权声明】:本站所有内容均来自网络,若无意侵犯到您的权利,请及时与我们联系将尽快删除相关内容!
发表回复