在高性能计算(HPC)集群上运行Intel MPI应用需要对ECS防火墙进行适当配置,并执行一系列步骤以确保集群中所有节点可以顺畅通信,以下是详细的操作步骤和注意事项:

操作场景与前提条件
在HPC集群上运行Intel MPI的操作场景主要包括关闭防火墙、修改配置文件、配置IB网卡的IP地址以及在ECS集群运行Intel MPI等步骤,其前提条件是已经成功创建带IB网卡的弹性云服务器,并绑定了弹性IP进行登录,同时已使用私有镜像创建多个弹性云服务器。
ECS防火墙配置
1、关闭防火墙:
登录集群中任意一台ECS,执行命令# systemctl stop firewalld.service
以关闭ECS防火墙。
执行# systemctl status firewalld.service
来确认防火墙是否已成功关闭。
依次登录集群中所有ECS,重复上述步骤,确保所有ECS的防火墙均已关闭。
2、配置文件修改:

查看ECS的主机名,通过执行# hostname
获取当前ECS的主机名。
添加hosts配置文件,通过执行# vi /etc/hosts
并添加集群中所有ECS的私网IP和主机名。
创建hostfile文件,通过执行# vi hostfile
并添加集群中所有ECS的主机名。
在所有ECS上重复上述步骤,确保每个节点都包含了整个集群的主机信息。
3、配置IB网卡的IP地址:
对集群中所有的ECS,执行# ifconfig ib0 192.168.23.34/24
为IB驱动配置IP地址。
IP地址可随意指定,但需要在同一网段内。
使用# ping 192.168.23.35
命令验证连通性。

4、运行Intel MPI:
执行# mpirun perhost 2 machinefile hostfile np 12 /root/intel_hello
命令,在ECS集群运行Intel MPI应用。
确保hostfile文件在运行时指定路径,且可执行文件路径为绝对路径。
为了进一步完善以上步骤,以下是一些建议:
在修改配置文件时,应确保所有ECS的hosts文件中包含集群的全部节点信息,以避免节点间的通信问题。
配置IB网卡时,指定IP地址需谨慎,避免与现有网络中的其他设备冲突。
在运行Intel MPI前,确认所需的Intel MPI版本及其与操作系统和编译器版本的兼容性。
相关问答环节
1、如何确认ECS防火墙已成功关闭?
回答:可以通过执行# systemctl status firewalld.service
命令来检查防火墙的状态,如果显示为非活动状态(inactive)则表示防火墙已成功关闭。
2、在HPC集群中配置Intel MPI时,为什么需要关闭ECS防火墙?
回答:关闭ECS防火墙是为了确保集群中的节点间可以无阻碍地进行通信,HPC应用通常要求节点之间有高效的数据传输能力,而防火墙可能会阻止或限制这些节点间的通讯请求,从而影响应用程序的性能。
关闭防火墙、正确配置hosts文件、设置IB网卡的IP地址以及确保Intel MPI的正确运行是确保HPC集群顺利运行的关键步骤。
【版权声明】:本站所有内容均来自网络,若无意侵犯到您的权利,请及时与我们联系将尽快删除相关内容!
发表回复