说明:收录25万 73个行业的国家标准 支持批量下载
ICS35.020 CCS L 04 中华人民共和国国家标准 GB/T41779—2022 高性能计算机系统能效测试方法 Test methods of energy efficiency for high performance computer system 2023-05-01实施 2022-10-12发布 国家市场监督管理总局 发布 国家标准化管理委员会 GB/T41779—2022 前言 本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任, 本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本文件起草单位:曙光信息产业(北京)有限公司、曙光数据基础设施创新技术(北京)股份有限公 司、中国计量科学研究院、兰州理工大学、中国电子技术标准化研究院、北京工翔科技有限公司、国家节 能中心、北京亦庄智能城市协同创新研究院有限公司、国家电网公司信息通信分公司、阿里云计算有限 公司、清华大学、中通服建设有限公司、山东省计算中心、北京大学、杭州万泰认证有限公司、国家发展和 改革委员会能源研究所、中国石油天然气股份有限公司勘探开发研究院、中科赛能(北京)科技有限公 司、北京节能环保中心、中国科学院电工研究所、中国科学院计算机网络信息中心、北京金茂绿建科技有 限公司、北京科计通电子工程有限公司、北京领智信通节能技术研究院、润和世联数据科技有限公司、中 国石油天然气股份有限公司吉林石化数据中心分公司、中国建设银行股份有限公司、北京纳源丰科技发 益电信科学技术研究所有限公司、建信金融科技公司、山东正云信息科技有限公司、北京林业大学。 本文件主要起草人:吉青、何继盛、武彤、林洁、刘宇、王力坚、韩孟之、郭志英、张鹏、孙健、欧阳述嘉、 高书辰、常乾坤、闫金光、卢毅军、蒋忠伟、陆腾、范娟、柳晓雷、尚振阳、俞灵林、奉有泉、冯升波、熊涛、 樊春、潘京津、戴京训、潘景山、佟钊、李震、金驰、杨绍鹏、钟杨帆、吕俊峰、刘艺斌、吕天文、区旸、关永芬、 黄群骥、阮琳、于庆友、林立、韩美玲、周佳新、曹继业、赵勇祥、程振兴、赵宏晨、梁纲、刘巍、王也、张林锋、 崔吉顺、冯剑超、刘晓旭、任凯、朱小舟、袁玉东、赵辉。 GB/T41779—2022 高性能计算机系统能效测试方法 1范围 本文件给出了高性能计算机系统能效的计算公式,描述了高性能计算机系统能效测试的方法 本文件适用于高性能计算机系统能效测试,可用于分析高性能计算机系统的能效状况,供高性能计 算机系统的研发、测试、生产等参考使用。本文件提出的高性能计算机系统能效值可作为评价高性能计 算机系统能效水平的参数。 2规范性引用文件 2 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文 本文件。 GB/T32910.3一2016数据中心资源利用第3部分:电能能效要求和测量方法 3术语和定义 下列术语和定义适用于本文件。 3.1 高性能计算机系统 highperformancecomputersystem 同时使用多个计算节点,用于处理大量数据或解决大规模数值计算问题的计算机系统。 注:高性能计算系统由计算子系统、存储子系统、网络子系统以及冷却子系统等组成。 3.2 计算子系统 computingsubsystem 高性能计算机系统(3.1)中由若干管理节点(3.3)、计算节点(3.4)组成负责数值运算的子系统。 3.3 管理节点 management node 负责管理软件运算的基础计算单元。 3.4 计算节点 computingnode 负责浮点数值运算的基础计算单元。 3.5 网络子系统 networksubsystem 高性能计算机系统(3.1)中负责通信的子系统。 3.6 存储子系统 storagesubsystem 高性能计算机系统(3.1)中负责数据存储的子系统 3.7 冷却子系统 cooling subsystem 高性能计算机系统(3.1)中负责提供计算机工作环境制冷的子系统 1 GB/T41779—2022 3.8 每秒浮点运算次数 floating-point operations per second FLOPS 每秒所执行的浮点运算次数。 注:用于评价高性能计算机系统计算能力。 3.9 高性能计算机系统总电能消耗highperformancecomputersystemtotalelectricenergyconsump tion 维持高性能计算机系统(3.1)正常运行所消耗的所有电能总和。 3.10 高性能计算机系统能源使用效率 高性能计算机系统能效 HPCEE 高性能计算机系统(3.1)的实测每秒浮点运算次数(3.8)与同一时段内系统相应总电能消耗量 之比。 3.11 LU分解 LUfactorization 在线性代数中矩阵分解的一种,将一个矩阵A分解为一个单位下三角矩阵L和一个上三角矩阵U 的乘积,其数学表达式为:A=LU。 4缩略语 下列缩略语适用于本文件。 GPU:图形处理器(GraphicsProcessingUnit) MIC:多重整合核心架构(ManyIntegratedCore) 5HPCEE 高性能计算机系统一般由计算子系统、存储子系统、网络子系统以及冷却子系统等组成。计算子系 统一般由管理节点、计算节点组成。计算节点包括普通计算节点(如刀片式服务器)和加速计算节点(如 含GPU、MIC等的服务器)。高性能计算机节点数应大于或等于10个节点,宜在50个节点以上,节点 总数无上限。 高性能计算机系统能效测试应包括该系统的计算能力测试和相应系统耗电量测试两部分 高性能计算机系统计算能力通过FLOPS来衡量。计算能力应选取适当的软件测试程序对高性能 计算机系统的整体浮点运算性能进行测试。 高性能计算机系统能效通过HPCEE来衡量,HPCEE为系统计算能力与相应耗电量之比,其计算 公式见公式(1): HPCEE=R/P 式中: R 实测每秒浮点运算次数的值; P 一平均功率,单位为瓦特(W); HPCEE一一高性能计算机系统能效, 在测量高性能计算机系统能效时,耗电量的测量应包括测试同期内所有运行子系统的能耗。 GB/T41779—2022 6测试环境 高性能计算机系统在进行能效测试时,应满足如下环境条件: 温度:18℃~40℃; a b) 相对湿度:35%~80%(不应结露); 大气压:86kPa~106kPa。 7计算能力测试框架 7.1 测试方案设计 高性能计算机系统的计算能力应通过采用高斯消元法求解一元N次稠密线性代数方程组的方法 进行测试。应选取适当的软件测试程序对高性能计算机系统的整体浮点运算性能进行测试。软件测试 程序应通过采用高斯消元法求解一元N次稠密线性代数方程组以评估整体浮点运算性能。 具体测试方案如下: 使用随机数初始化得到一元N次稠密线性代数方程组A.x=b; a)1 b) 指定方程组按公式(2)计算得出求解方程组总浮点运算次数; M=(2/3)XN3+2N ..(2) 式中: N 元N次稠密线性代数方程组的次数; M—该方程组的总浮点运算次数。 c) 按照7.2的架构设计要求编写程序对方程组求解,并记录总求解时间t; d)用总浮点运算次数M除以总求解时间t,即可得到系统的FLOPS。 7.2 2求解程序架构设计 高性能计算机系统计算能力测试程序可按照此框架设计要求自行编写。测试程序应包含如卜 内容: a) 初始化 测试程序应使用随机数初始化得到一元N次稠密线性代数方程组AT=b,依据公式(2)计算 得到总浮点运算次数M并记录。 b)方程组求解 测试程序应采用高斯消元法,求解初始化后的一元N次稠密线性代数方程组Ar=b。求解过 程应分为两个步骤,分别是:将维度为N的矩阵A进行LU分解和求解三角系统。 1)LU分解应分为以下步骤: ·将矩阵A分解如公式(3): AA12) LH Un U12 A: LXU A21A22 L21 L U2 .....(3) 式中,矩阵A维度为NXN,矩阵An维度为NBXNB矩阵Ai2维度为NBX (N-NB),矩阵A维度为(N一NB)XNB,矩阵A22维度为(N-NB)X(N NB),L1和L22为下三角矩阵,U和U2为上三角矩阵。 ·将公式(3)进行分解计算得: 3 GB/T41779—2022 LnXUu=An ..(4) L21XUn=A21 .(5) Ln XU12 =A12 L21U12XL22U22=A22 ..(7) ·将公式(5变换得到: L21 =A21 XUu-1 .(8) 将公式(6)变换得到: U12 =A12 × L1n-1 .(9) ·将公式(7变换得到: A22—L21XU12=L22XU22 (10) 重复执行上述分解步骤,直至整个矩阵A全部完成LU分解。 注:测试程序设计可将矩阵A进行适当分块,并分布至高性能计算机系统的不同的计算节点,进行分布式LU 分解。 2)求解三角系统应分为以下步骤: ·矩阵A的LU分解完成之后,得到公式(11): LUr=b (11) 。设y=Ur带人公式(11),得到公式(12): Ly=b ·(12) ·求解三角系统公式(12),得到线性代数方程组的解α,即完成一元N次稠密线性代数 方程组A.r=b的整体求解过程。 测试时间记录与FLOPS结果输出 测试程序应记录高性能计算机系统对方程组求解的总时间t,用总浮点运算次数M除以总求 解时间t计算得到系统的FLOPS并输出。 7.3测试运行要求 测试运行要求如下: a)

pdf文档 GB-T 41779-2022 高性能计算机系统能效测试方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 41779-2022 高性能计算机系统能效测试方法 第 1 页 GB-T 41779-2022 高性能计算机系统能效测试方法 第 2 页 GB-T 41779-2022 高性能计算机系统能效测试方法 第 3 页
下载文档到电脑,方便使用
本文档由 思安 于 2023-01-18 17:30:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。