如何成功安装并使用IB驱动自带的Open MPI来调用ib网主机?

mpirun是用于在InfiniBand网络上执行并行计算的命令行工具。要在IB网络主机上使用它,需要先安装Open MPI库和相应的IB驱动。安装后,通过mpirun命令启动并行程序,并指定运行的主机和进程数。

安装和使用IB驱动自带的Open MPI

mpirun调用ib网主机_安装和使用IB驱动自带的Open MPI
(图片来源网络,侵删)

准备工作

在开始安装和使用InfiniBand (IB)驱动自带的Open MPI之前,需要确保所有的硬件和网络环境已经正确配置,这包括确认所有集群中的节点均已正确接入IB网络,并且相互之间的网络连通性没有问题,确保所有节点的操作系统兼容并已更新至最新 。

添加Hostfile和Hostname配置

1、创建或编辑hostfile文件

使用命令vi hostfile访问文件编辑界面。

mpirun调用ib网主机_安装和使用IB驱动自带的Open MPI
(图片来源网络,侵删)

在此文件中添加集群中所有节点的IP地址和主机名,192.168.1.138 bmsarmib0001

确保每个节点的核数也在该文件中指定,如每台主机2核 。

2、验证所有节点的主机名

登录到每个节点上,执行hostname命令以确认其主机名正确无误 。

确保所有节点的主机名与hostfile中列出的名称一致。

mpirun调用ib网主机_安装和使用IB驱动自带的Open MPI
(图片来源网络,侵删)

IB驱动自带的Open MPI的安装步骤

1、检查IB驱动是否已安装

登录到其中一台BMS,执行ls /usr/mpi/gcc/openmpi4.0.2a1/bin/mpirun来查看是否已经存在MPI运行命令 。

使用rpm qa | grep mlnxofa命令来确认IB驱动的安装情况 。

2、安装Open MPI

下载Open MPI的适合版本,选择稳定版本4.0.2a1 。

解压下载的包并进行配置,构建和安装过程通常由一系列命令组成,例如./configure,make,make install

3、配置环境变量

将Open MPI的bin目录添加到系统的PATH环境变量中,以便可以在任何位置直接运行mpirun等命令 。

4、测试安装是否成功

在任意节点上运行mpirun version来确认Open MPI已正确安装,并显示当前的版本号 。

可运行一个简单的MPI程序,如mpirun np 2 echo "Hello, World from MPI"来测试并行运行环境是否配置正确。

实现SSH免密登录和NFS共享设置

1、配置SSH免密登录

为每一对节点生成SSH密钥,并将公钥分发到所有其他节点,实现免密码SSH登录 。

使用sshkeygen生成密钥对,然后使用sshcopyid命令将公钥复制到所有节点。

2、建立和挂载NFS共享目录

在其中一个节点上设置NFS服务器,并定义一个共享目录供所有节点访问 。

在其他节点上挂载这个共享目录,确保数据可以在集群中自由传输和访问。

相关问题与解答

Q1: 如果在使用Open MPI时遇到版本不一致的问题,应如何解决?

A1: 首先确认所有节点上Open MPI的版本,如有不同,请统一下载相同版本的安装包进行安装,确保环境变量在所有节点上一致,避免因路径不同导致版本混乱。

Q2: 如何优化IB驱动自带的Open MPI的性能?

A2: 可以通过调整MPI的运行时配置来实现性能优化,例如修改mca参数来适应特定的网络条件和硬件配置,进一步,监控MPI应用的运行状况,根据实际表现调整并行策略和资源分配。

用户可以有效地在IB网络环境中安装和使用IB驱动自带的Open MPI,从而充分利用高性能计算资源进行并行处理任务。

【版权声明】:本站所有内容均来自网络,若无意侵犯到您的权利,请及时与我们联系将尽快删除相关内容!

(0)
热舞的头像热舞
上一篇 2024-08-20 01:15
下一篇 2024-08-20 01:15

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

QQ-14239236

在线咨询: QQ交谈

邮件:asy@cxas.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信