安装和使用IB驱动自带的Open MPI

准备工作
在开始安装和使用InfiniBand (IB)驱动自带的Open MPI之前,需要确保所有的硬件和网络环境已经正确配置,这包括确认所有集群中的节点均已正确接入IB网络,并且相互之间的网络连通性没有问题,确保所有节点的操作系统兼容并已更新至最新 。
添加Hostfile和Hostname配置
1、创建或编辑hostfile文件
使用命令vi hostfile
访问文件编辑界面。

在此文件中添加集群中所有节点的IP地址和主机名,192.168.1.138 bmsarmib0001
。
确保每个节点的核数也在该文件中指定,如每台主机2核 。
2、验证所有节点的主机名
登录到每个节点上,执行hostname
命令以确认其主机名正确无误 。
确保所有节点的主机名与hostfile中列出的名称一致。

IB驱动自带的Open MPI的安装步骤
1、检查IB驱动是否已安装
登录到其中一台BMS,执行ls /usr/mpi/gcc/openmpi4.0.2a1/bin/mpirun
来查看是否已经存在MPI运行命令 。
使用rpm qa | grep mlnxofa
命令来确认IB驱动的安装情况 。
2、安装Open MPI
下载Open MPI的适合版本,选择稳定版本4.0.2a1 。
解压下载的包并进行配置,构建和安装过程通常由一系列命令组成,例如./configure
,make
,make install
。
3、配置环境变量
将Open MPI的bin目录添加到系统的PATH环境变量中,以便可以在任何位置直接运行mpirun等命令 。
4、测试安装是否成功
在任意节点上运行mpirun version
来确认Open MPI已正确安装,并显示当前的版本号 。
可运行一个简单的MPI程序,如mpirun np 2 echo "Hello, World from MPI"
来测试并行运行环境是否配置正确。
实现SSH免密登录和NFS共享设置
1、配置SSH免密登录
为每一对节点生成SSH密钥,并将公钥分发到所有其他节点,实现免密码SSH登录 。
使用sshkeygen
生成密钥对,然后使用sshcopyid
命令将公钥复制到所有节点。
2、建立和挂载NFS共享目录
在其中一个节点上设置NFS服务器,并定义一个共享目录供所有节点访问 。
在其他节点上挂载这个共享目录,确保数据可以在集群中自由传输和访问。
相关问题与解答
Q1: 如果在使用Open MPI时遇到版本不一致的问题,应如何解决?
A1: 首先确认所有节点上Open MPI的版本,如有不同,请统一下载相同版本的安装包进行安装,确保环境变量在所有节点上一致,避免因路径不同导致版本混乱。
Q2: 如何优化IB驱动自带的Open MPI的性能?
A2: 可以通过调整MPI的运行时配置来实现性能优化,例如修改mca
参数来适应特定的网络条件和硬件配置,进一步,监控MPI应用的运行状况,根据实际表现调整并行策略和资源分配。
用户可以有效地在IB网络环境中安装和使用IB驱动自带的Open MPI,从而充分利用高性能计算资源进行并行处理任务。
【版权声明】:本站所有内容均来自网络,若无意侵犯到您的权利,请及时与我们联系将尽快删除相关内容!
发表回复