在数据科学、统计分析和机器学习领域,R 语言凭借其强大的数据处理能力和丰富的可视化包,占据了举足轻重的地位,对于使用稳定且广泛部署的 CentOS 系统的系统管理员和数据科学家而言,正确安装并配置 R 环境是开展工作的第一步,本文将详细介绍如何在 CentOS 系统上,通过 yum
(或在较新版本中的 dnf
)包管理器,安装一个最新且功能完备的 R 语言环境。
为什么不应直接使用默认仓库
许多初学者的第一反应是直接执行 sudo yum install R
,虽然这个命令能够成功安装 R,但它通常会从 CentOS 的默认软件仓库中获取一个相对陈旧的版本,在 CentOS 7 中,默认仓库提供的 R 版本可能是 3.x 系列,而当前 R 的稳定版本已经更新至 4.x 系列,使用旧版本会带来几个问题:
- 功能缺失:无法使用新版本引入的特性和性能优化。
- 包兼容性:许多新开发的或更新的 R 包可能不再支持旧版本的 R,导致安装失败或运行时错误。
- 安全风险:旧版本可能包含未被修复的安全漏洞。
为了获得最佳的开发体验和安全性,我们需要采用更优的安装策略。
推荐的安装方案:配置 EPEL 与 CRAN 仓库
官方推荐的方法是结合使用 EPEL (Extra Packages for Enterprise Linux) 仓库和 CRAN (Comprehensive R Archive Network) 仓库,EPEL 提供了许多 R 所需的基础依赖包,而 CRAN 仓库则直接由 R 核心团队维护,提供最新版本的 R 语言,以下是详细的安装步骤。
第一步:更新系统并安装 EPEL
在安装任何新软件之前,首先确保系统是最新的,安装 EPEL 仓库,它为 CentOS 提供了额外的软件包。
# 更新系统所有已安装的软件包 sudo yum update -y # 安装 EPEL 仓库 sudo yum install -y epel-release
对于使用 dnf
的 CentOS 8/Stream 系统,命令是 sudo dnf install -y epel-release
。
第二步:配置 CRAN 仓库
这是最关键的一步,我们需要为 yum
添加 CRAN 的软件源,这可以通过创建一个新的仓库配置文件来实现,根据您的 CentOS 版本,需要选择对应的仓库地址。
下表列出了不同 CentOS 版本的配置方法:
CentOS 版本 | 仓库配置命令 | 说明 |
---|---|---|
CentOS 7 | sudo yum-config-manager --add-repo https://cran.rstudio.com/bin/linux/centos7/ | 为 CentOS 7 添加 CRAN 仓库。 |
CentOS 8 / Stream | sudo dnf config-manager --add-repo https://cran.rstudio.com/bin/linux/centos8/ | 为 CentOS 8/Stream 添加 CRAN 仓库。 |
执行上述命令后,系统会在 /etc/yum.repos.d/
目录下创建一个新的 .repo
文件,cran_rstudio_com_bin_linux_centos7.repo
。
第三步:安装 R 语言
我们的系统已经能够“看到” CRAN 仓库中的最新 R 版本了,接下来就可以进行安装。
# 安装 R 核心程序 sudo yum install -y R # (可选)安装 R 开发环境,用于编译从源码安装的 R 包 sudo yum install -y R-devel
yum
会自动处理所有依赖关系,从 EPEL 和 CRAN 仓库下载并安装所需的软件包。
第四步:验证安装
安装完成后,可以通过以下命令验证 R 是否已成功安装及其版本信息。
R --version
您应该会看到类似如下的输出,显示一个较新的版本号(R 4.x.x):
R version 4.2.2 (2025-10-31) -- "Innocent and Trusting"
Copyright (C) 2025 The R Foundation for Statistical Computing
Platform: x86_64-redhat-linux-gnu (64-bit)
R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under the terms of the
GNU General Public License versions 2 or 3.
For more information about these matters see
https://www.gnu.org/licenses/.
要进入 R 交互式控制台,只需在终端中输入 R
并回车,输入 q()
即可退出。
安装 R 包的准备工作
在 R 中安装许多包(特别是那些包含 C/C++/Fortran 代码的包)时,需要编译器,为了避免在 R 内部使用 install.packages()
时遇到编译错误,建议预先安装开发工具组。
# 安装“开发工具”包组,包含 gcc, make 等编译工具 sudo yum groupinstall -y "Development Tools"
完成这一步后,您就可以在 R 控制台中顺畅地安装绝大多数 CRAN 包了,
# 在 R 控制台中执行 install.packages("ggplot2") install.packages("dplyr")
通过以上步骤,您便在 CentOS 系统上成功搭建了一个现代化、易于维护的 R 语言开发环境,为后续的数据分析工作奠定了坚实的基础。
相关问答 (FAQs)
我按照文章操作,但在执行 yum-config-manager
时提示“command not found”,该怎么办?
解答: yum-config-manager
工具包含在 yum-utils
软件包中,如果您的系统没有安装它,就会报此错误,您可以通过以下命令先安装它:sudo yum install -y yum-utils
安装完成之后,再重新执行配置 CRAN 仓库的命令即可,对于 CentOS 8/Stream,对应的工具包是 dnf-plugins-core
,可以通过 sudo dnf install -y dnf-plugins-core
安装。
我已经成功安装了 R,但在尝试安装某个包时,系统提示缺少 -lgfortran
或类似的 Fortran 编译器相关错误,这是什么原因?
解答: 这个错误表明系统缺少 GNU Fortran 编译器,它用于编译 R 包中包含的 Fortran 语言源代码,虽然安装 “Development Tools” 包组通常会包含它,但在某些最小化安装的系统中可能被遗漏,您可以单独安装 gcc-gfortran
来解决这个问题:sudo yum install -y gcc-gfortran
安装完成后,再次尝试在 R 中安装包,通常就能成功。
【版权声明】:本站所有内容均来自网络,若无意侵犯到您的权利,请及时与我们联系将尽快删除相关内容!
发表回复