GB/T 41779-2022 高性能计算机系统能效测试方法.pdf

GB/T 41779-2022 高性能计算机系统能效测试方法.pdf
积分0.00
特惠
积分0
VIP全站资料免积分下载
立即下载
同类资料根据编号标题搜索
文档
仅供个人学习
反馈
标准编号:
文件类型:.pdf
资源大小:2.6 M
标准类别:电力标准
资源ID:378404
VIP资源

标准规范下载简介:

内容预览由机器从pdf转换为word,准确率92%以上,供参考

GB/T 41779-2022 高性能计算机系统能效测试方法.pdf

高性能计算机系统能效测试方法

本文件给出了高性能计算机系统能效的计算公式,描述了高性能计算机系统能效测试的方法。 本文件适用于高性能计算机系统能效测试,可用于分析高性能计算机系统的能效状况,供高性能计 算机系统的研发、测试、生产等参考使用。本文件提出的高性能计算机系统能效值可作为评价高性能计 算机系统能效水平的参数。

GB/T 41779—2022

LU分解LUfactorization 在线性代数中矩阵分解的一种,将一个矩阵A分解为一个单位下三角矩阵L和一个上三角矩阵U 的乘积,其数学表达式为:A=LU。

LU分解LUfactorization 在线性代数中矩阵分解的一种GB 50028-2006(2020版) 城镇燃气设计规范(完整正版、高清无水印版).pdf,将一个矩阵A分解为一个单位下三角矩阵L和一个上三 的乘积,其数学表达式为:A=LU。

下列缩略语适用于本文件。 GPU:图形处理器(GraphicsProcessingUnit) MIC:多重整合核心架构(ManyIntegratedCore)

高性能计算机系统一般由计算子系统、存储子系统、网络子系统以及冷却子系统等组成。计算子系 统一般由管理节点、计算节点组成。计算节点包括普通计算节点(如刀片式服务器)和加速计算节点(如 含GPU、MIC等的服务器)。高性能计算机节点数应大于或等于10个节点,宜在50个节点以上,节点 总数无上限。 高性能计算机系统能效测试应包括该系统的计算能力测试和相应系统耗电量测试两部分。 高性能计算机系统计算能力通过FLOPS来衡量。计算能力应选取适当的软件测试程序对高性能 计算机系统的整体浮点运算性能进行测试。 高性能计算机系统能效通过HPCEE来衡量,HPCEE为系统计算能力与相应耗电量之比,其计算 公式见公式(1):

高性能计算机系统在进行能效测试时,应满足如下环境条件: a) 温度:18℃~40℃; b) 相对湿度:35%~80%(不应结露); c)大气压:86kPa~106kPa。

GB/T 417792022

高性能计算机系统的计算能力应通过采用高斯消元法求解一元N次稠密线性代数方程组的方法 进行测试。应选取适当的软件测试程序对高性能计算机系统的整体浮点运算性能进行测试。软件测试 程序应通过采用高斯消元法求解一元N次稠密线性代数方程组以评估整体浮点运算性能。 具体测试方案如下: a)使用随机数初始化得到一元N次稠密线性代数方程组Ax=b; b)指定方程组按公式(2)计算得出求解方程组总浮点运算次数; M=(2/3)×N²+2N2 式中: N一一元N次稠密线性代数方程组的次数; M一该方程组的总浮点运算次数。 c)按照7.2的架构设计要求编写程序对方程组求解,并记录总求解时间t; d)用总浮点运算次数M除以总求解时间t,即可得到系统的FLOPS。

7.2求解程序架构设计

高性能计算机系统计算能力测试程序可按照此框架设计要求自行编写。测试程序应包含如下 内容: a)初始化 测试程序应使用随机数初始化得到一元N次稠密线性代数方程组Ar=b,依据公式(2)计算 得到总浮点运算次数M并记录。 b)方程组求解 测试程序应采用高斯消元法,求解初始化后的一元N次稠密线性代数方程组Ar=b。求解过 程应分为两个步骤,分别是:将维度为N的矩阵A进行LU分解和求解三角系统。 1)LU分解应分为以下步骤: ·将矩阵A分解如公式(3):

Az1 A22 L21 loUzz

式中,矩阵A维度为NXN,矩阵A维度为NBXNB,矩阵A12维度为NB× (N一NB),矩阵A21维度为(N一NB)×NB,矩阵A22维度为(N一NB)X(N NB),L和L22为下三角矩阵,Un和U2为上三角矩阵。 将公式(3)进行分解计算得:

重复执行上述分解步骤,直至整个矩阵A全部完成LU分解。 注:测试程序设计可将矩阵A进行适当分块,并分布至高性能计算机系统的不同的计算节点,进行分布式 分解。 2)求解三角系统应分为以下步骤: ·矩阵A的LU分解完成之后,得到公式(11):

·求解三角系统公式(12),得到线性代数方程组的解,即完成一元N次稠密线性代 方程组Ar=b的整体求解过程。 2 测试时间记录与FLOPS结果输出 测试程序应记录高性能计算机系统对方程组求解的总时间t,用总浮点运算次数M除以总 解时间t计算得到系统的FLOPS并输出。

测试运行要求如下: a)进行高性能计算机系统能效测试应采用双精度浮点进行计算; b)计算能力测试应连续进行5轮,每轮测试结果及相关信息应按照8.2的要求进行记录; c) 一元N次稠密线性代数方程组计算规模N应使得每轮测试实际求解计算时间≥30min。 注:高性能计算机系统计算能力测试程序亦可选用TOP500高性能计算机排名所使用的线性系统软件包(Lin pack)。

高性能计算机系统能效测试是在系统运行计算能力测试程序的同时,使用电能计量仪表对高性能 计算机系统的能耗进行同步测量和记录 HPCEE测试方法含测试设备、测试点的选择、测试过程、测试结果记录4个部分,

测试设备要求如下: a) 2 电能测试仪表精度要求应符合GB/T32910.3—2016中7.2的要求; b) 温度计的测试精度不大于0.5℃,测试范围为一50℃~100℃; C) 湿度计的测试精度不大于2%,测试范围为0%~100%。

性能计算机系统总电能消耗测试点应位于图1中

NBT 10038-2017 煤层气小型压裂测试设计及评价规范高性能计算机系统电能消耗测试点

高性能计算机系统电能消耗测试过程如下。 a)测试准备阶段:调试电能表,启动高性能计算机系统,测量系统所在地室外大气环境温度和湿 度。判断测试环境是否满足测试条件。按照9.1的要求记录空载能耗。 b):计算能力测试:设定求解计算过程所需的方程组规模N并记录,执行计算能力测试程序对高 性能计算机系统FLOPS进行测量,记录测试开始及结束时间以及该时段内系统所消耗的 电能。 C )重复进行步骤b)计算能力测试5次,记录每轮相应测试结果

在HPCEE测试过程中,记录系统进行计算能力测试的计算时长和相应系统电能消耗。记录 见表A.1。 高性能计算机系统的公式(1)中参数R应为计算能力测试程序输出结果。 通过表B.1中平均功率P和实测值R,按照公式(1)计算可得HPCEE数值。 注:HPCEE测试记录表见附录A,HPCEE的能效分级见附录B。

在HPCEE测试过程中,记录系统进行计算能力测试的计算时长和相应系统电能消耗。记录的示 例见表A.1。 高性能计算机系统的公式(1)中参数R应为计算能力测试程序输出结果。 通过表B.1中平均功率P和实测值R,按照公式(1)计算可得HPCEE数值。 注:HPCEE测试记录表见附录A,HPCEE的能效分级见附录B。

披露HPCEE时应同时包含系统空载能耗信 成后,各进

一次时长为30min的系统空载能耗测试,空载功率记录表参照附录A进行记录。 注:空载待机状态是指参与计算能力测试的所有子系统都已全部开机,但不运行计算能力测试程序的状态。 命令Qstat或者Sinfo可查询到所有节点状态标识为idle

测试效率为实测值R与理论峰值Rmx之比,其中理论峰值按公式(13)计算: Rmx=芯片主频×单指令周期浮点操作数×核心数.…… *·.*·..*( 计算性能测试效率记录表参照附录A进行记录。

沈阳某实验学校临水设施施工方案GB/T41779—2022附录A(资料性)测试记录表格示例HPCEE测试记录表、空载功率记录表、计算性能测试效率记录表示例见表A.1、表A.2和表A.3。表A.1HPCEE测试记录表实测电能测试程序开始结束计算时长平均功率PFLOPS测试次序消耗计算规模N时间点时间点实测值RHPCEE R/PSWkW ·h第1次第2次第3次第4次第5次注:计算时长为结束时间点与开始时间点的时间差。平均功率为系统电能消耗与计算时长之比。表A.2空载功率记录表开始结束空载时长系统能耗系统功率状态时间点时间点SkW·hW测试前系统空载测试后系统空载表A.3计算性能测试效率记录表测试次序实测值R理论峰值Rmx计算效率(R/Rmx)/%第1次第2次第3次第4次第5次

由表A.1得到5个HPCEE后,取其中的最低值,对照表B.1的规定范围,可对已测试的高性能 机系统的能效进行级别评定。

©版权声明
相关文章