HPC性能——(1)HPC浮点性能

本文介绍如何使用HPL测试E-HPC集群的浮点性能。

背景信息

HPL(The High-Performance Linpack Benchmark)是测试高性能计算集群系统浮点性能的基准。HPL通过对高性能计算集群采用高斯消元法求解一元N次稠密线性代数方程组的测试,评价高性能计算集群的浮点计算能力。

浮点计算峰值是指计算机每秒可以完成的浮点计算次数,包括理论浮点峰值和实测浮点峰值。理论浮点峰值是该计算机理论上每秒可以完成的浮点计算次数,主要由CPU的主频决定。理论浮点峰值=CPU主频×CPU核数×CPU每周期执行浮点运算的次数。本文将为您介绍如何利用HPL测试实测浮点峰值。

准备工作

测试前您需要在本地准备好算例文件HPL.dat,文件包含了HPL运行的参数。如下示例是在单台scch5s实例上运行HPL的推荐配置。

测试过程中您可以根据节点的硬件配置,调整文件中相关参数,参数的说明如下所示。

N表示求解的矩阵数量与规模。矩阵规模N越大,有效计算所占的比例也越大,系统浮点处理性能也就越高。但矩阵规模越大会导致内存消耗量越多,如果系统实际内存空间不足,使用缓存、性能会大幅度降低。矩阵占用系统总内存的80%左右为最佳,即N×N×8=系统总内存×80%(其中总内存的单位为字节)。

求解矩阵过程中矩阵分块的大小。分块大小对性能有很大的影响,NB的选择和软硬件许多因素密切相关。NB值的选择主要是通过实际测试得出最优值,一般遵循以下规律:

一般通过单节点或单CPU测试可以得到几个较好的NB值,但当系统规模增加、问题规模变大,有些NB取值所得性能会下降。因此建议在小规模测试时选择3个性能不错的NB值,再通过大规模测试检验这些选择。

P表示水平方向处理器个数,Q表示垂直方向处理器个数。P×Q表示二维处理器网格。P×Q=系统CPU数=进程数。一般情况下一个进程对应一个CPU,可以得到最佳性能。对于Intel /sup> Xeon /sup>,关闭超线程可以提高HPL性能。P和Q的取值一般遵循以下规律:

操作步骤

  1. 登录弹性高性能计算控制台。

  2. 创建一个名为HPL.test的集群。

具体操作,请参见创建集群。请注意以下配置参数:

计算节点:选择SCC机型,如ecs.scch5s.16xlarge。
其他软件:选中linpack 2018软件和intel-mpi 2018通信库。

说明

您也可以为已创建的集群安装linpack 2018软件和intel-mpi 2018通信库,具体操作,请参见安装软件。

https://img-blog.csdnimg.cn/img_convert/5194a1dc0f2892f25e4ac8233d5a3ed0.png

来源:ibmleeca

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年8月21日
下一篇 2021年8月21日

相关推荐