最近在用hpcc测试集在多节点服务器上进行性能测试,但在单节点上就遇到了问题。
节点相关信息是:2个CPU,每个CPU上20个核。系统为CentOS。
Linux COMPUTE-1-45 3.10.0-693.5.2.el7.x86_64 #1 SMP Fri Oct 20 20:32:50 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux
基本配置mpi、blas等都没问题。运行一个进程时,hpcc.c 为执行文件,测试时运行4个测试程序,输入文件hpccint.txt如下:
以上代码中,P x Q即为核数,设置为1×1=1,我理解为与“mpirun -np 1 ./hpcc"执行命令中的”1“一致。运行mpirun -np 1 ./hpcc后,结果如下:
以上结果没有报错,但运行2个以上进程时,会出现错误,输入文件hpccint.txt如下:
其中只修改了”Qs“值,改为2。执行命令:“mpirun -np 2 ./hpcc"后,结果如下:
后面还有结果,应该是默认为一个核进行的计算,因为前面提示”Need at least 2 processes for these tests “,两个核没有用上。
以上就是我的问题:当两个进程以上并行运行时,机器未能使用两个核,导致测试只在一个核上进行。同样的数据,在另一台较老旧的服务器上运行,系统为Redhet 7.0,却没有出错。
会不会是核在设置方面有什么问题?亦或是测试集所用的mpich版本问题?还是系统版本问题?
求大神指导指导!万分感谢!
原文链接:https://blog.csdn.net/chouqianyi9692/article/details/100945973
原创文章,作者:优速盾-小U,如若转载,请注明出处:https://www.cdnb.net/bbs/archives/6989