CN116302728A - 服务器能效测试系统 - Google Patents

服务器能效测试系统 Download PDF

Info

Publication number
CN116302728A
CN116302728A CN202211378927.XA CN202211378927A CN116302728A CN 116302728 A CN116302728 A CN 116302728A CN 202211378927 A CN202211378927 A CN 202211378927A CN 116302728 A CN116302728 A CN 116302728A
Authority
CN
China
Prior art keywords
server
load
energy efficiency
cpu
performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211378927.XA
Other languages
English (en)
Inventor
刘韧
李鹏程
林翎
陈海红
徐秉声
赵学智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China National Institute of Standardization
Original Assignee
China National Institute of Standardization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China National Institute of Standardization filed Critical China National Institute of Standardization
Priority to CN202211378927.XA priority Critical patent/CN116302728A/zh
Publication of CN116302728A publication Critical patent/CN116302728A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2236Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种服务器能效测试系统。该系统包括:控制端、被测服务器、功率计和温度计,控制端利用网络设备连接到被测服务器,功率计和温度计通过网络与控制台连接,控制端通过选定的负载及不同的负载水平加载到测试的系统中,通过功率计完成测试并反馈回来能耗信息,被测服务器在控制台控制下按序执行各个负载,计算各个负载的负载性能,以及对应的负载能效比。本发明提供的服务器能效测试系统实现了对服务器能耗的精准评估。

Description

服务器能效测试系统
技术领域
本发明涉及能效管理技术领域,特别是涉及一种服务器能效测试系统。
背景技术
随着数字经济在全球加速推进以及5G、人工智能、物联网等相关技术的快速发展,数据已经成为影响全球竞争的关键战略性资源。只有获取和掌握更多的数据资源,才能在新一轮的全球话语权竞争中占据主导地位。根据国际权威机构Statista的统计,2020年全球数据产生量达到47ZB,并预计到2035年全球数据产生量将达到2142ZB,全球数据量将会大爆发。
自2014年以来,我国大数据战略逐步开始了布局。2014年3月,“大数据”一词首次写入政府工作报告,2015年8月印发《促进大数据发展行动纲要》(国发〔2015〕50号)对大数据发展进行了顶层设计和统筹布局。标志着数据要素市场化配置上升为国家战略,将对我国未来经济社会发展产生深远影响。
作为对“数据”的承载,从业界到政府都对数据中心和云计算基础设施的抱有很大期望。根据赛迪发布的《2020年中国大数据产业发现白皮书》显示2020年我国大数据产业整体规模将达到6670.2亿元,中国电子节能技术协会数据中心节能技术委员会指出,2020年集中规划报批的数据中心数量巨大,2021至2022年将是数据中心落地投产的爆发期,其中以大规模数据中心建设为主,同时边缘计算数据中心也将开始发力。地方政府,如黑龙江、山东等,希望利用数据中心建设的优势打造数字产业集群。
但事实上,我国数据中心耗电量在2020年已经达到全社会总耗电量的2.71%,年度能耗占我国社会用电总量第三,仅次于工业、建筑。降低数据中心能耗的首要途径是提升服务器能效,因为服务器产品作为数据中心的主要设备,其能耗占比高达数据中心总能耗的70%以上。正是这个原因,服务器的高效化、绿色化一直受到业界特别的关注。目前,我国的服务器使用量和服务器产业市场都非常巨大。据测算,我国在用服务器保有量超过了1000万台且保持年度增长率超过10%,保守预计中国将在未来的5年内成为全球最大的服务器消费及生产国。
近年来,我国积极参与国际社会碳减排,主动顺应全球绿色低碳发展潮流,国家也从源头上做出部署,要求加快调整优化产业结构、能源结构,以及大力发展新能源,继续打好污染防治攻坚战等。要加快调整优化产业结构、能源结构,推动煤炭消费尽早达峰,大力发展新能源,加快建设全国用能权、碳排放权交易市场,完善能源消费双控制度。要继续打好污染防治攻坚战,实现减污降碳协同效应。开展大规模国土绿化行动,提升生态系统碳汇能力。
服务器能效提升涉及到多个重要组件,包括CPU、内存、硬盘等诸多部件能耗的状况,随着各组件的平台架构及创新技术的推出,要协调好组件间计算性能和能效的关系。同时,服务器能效又与应用场景密不可分,应用场景在影响服务器系统性能的高低、规模的大小的同时,也在影响系统整体能效的状态,所以高性能计算机的能效评价我们必须考虑到应用场景和用户的因素,应用场景的多样性和服务器新的计算技术的涌现,导致了大规模计算机系统实现形式的多样性,能效评价必须要能适应这些新的变化。
正因为上述原因,服务器产品以至于上下游产业链,如CPU、硬盘、内存、数据中心等都受到服务器能效基准测试的限制,要实现数据中心节能,服务器产品的能效就必须要有工具进行判定,且工具使用应便捷,适用于多场景(AI、云存储等),以实现服务器高能效产品技术升级,数据中心的节能减排,推动整个计算行业和产业的绿色化升级。
目前,针对服务器设备能效评价的主流工具主要由国外开发,测试的方式和特点也有差异。美国国家环保局于2009年5月正式发布了能源之星服务器规范1.0版本并逐年更新,截止目前能源之星服务器规范即将发布最新的版本。能源之星服务器规范以服务器的闲置能耗作为主要判断标准,而不考虑服务器实际业务运行能耗,所以能源之星服务器规范难以通过工作负载来区分每个模块的单位能量消耗,但却能够直观的判断服务器能效高低。SPEC(Standard Performance Evaluation Corporation标准性能评估测试评估机构)于2007年12月发布了SPECpower_ssj2008,这是业界第一项用于评测系统级服务器设备及运算性能相关的功耗基准测试工具。SPEC power_ssj2008工具生成的服务器负载可以为刀片服务器、塔式服务器、机架式服务器端加载通用Java商业应用程序,可以评估服务器系统从待机模式(0%)到满负载状况(100%)下的多个负载状况功耗,同时该工具还可分布扩展,以多线程方式在不同的系统操作环境件移植。因此SPEC power_ssj2008不仅可以作为一项指标来比较不同服务器之间能耗和性能,还可帮助提升服务器效率,被业界广泛使用。SERT(Server energy efficiency rate tool)也是SPEC开发的一款服务器能效测试工具,测试类似于简化版SPEC power,同样是加载多个负载并通过某种算法与基准服务器测试结果对比,最终输出服务器评分结果。此外,还有Green500对全球超级计算机进行排名,由Linpack基准测试软件获得浮点计算结果判断性能,然后用功率计测得功耗并做比值进行对比,但是超级计算机服务器和小型客户机服务器有区别,故当前小型化多功能服务器并不采用这个评判指标。绿色网格全球联盟(Green Grid Association)于2007年成立,并将多年来研究的指标PUE(Power Usage Effectiveness,电力使用效率)和DCiE(Data CenterInfrastructure,数据中心基础设施效率)向外界推广,成为行业内测量数据中心效率和生产力公认的标准。但Green Grid测试方法基于数据中心总体能耗和IT设备整体能耗为基,并没有专门对服务器设各级别作细分能效测试研究。
服务器是网络环境中的高性能计算机,当网络中客户机提交的服务请求后提供相应的服务。为此,服务器必须具有承担服务并且保障服务的能力。它的高性能主要体现在高速度的运算能力、长时间的可靠运行、强大的外部数据吞吐能力等方面。服务器系统的硬件构成与普通PC结构类似,主要的硬件构成包含如下几个主要部分:中央处理器、内存、芯片组、I/O总线、I/O设备、电源、机箱。本文研究的服务器能耗与性能测试方法适合服务器对象包括塔式服务器、机架式服务器。主要分析中央处理器、内存、I/O设备等重点耗能部件。
CPU的内部结构可分为控制单元,逻辑单元和存储单元三大部分,并且控制、逻辑和存储单元格式一致采用二进制码0/1表示指令和数据,因此可以把CPU性能理解为数据运算性能,分为整数运算和浮点数运算。根据整数运算特性,一般将编译、压缩、视频压缩转换和XML处理等功能作为CPU处理器整数运算的性能指标,浮点运算主要是通过各种数学方法的计算进行。CPU性能受到其架构、制造工艺、核数、缓存类型、主频等多方面的影响。所以如何选择有效地计算方法,通过有限次较短时间的浮点和整点运算获得CPU性能是目前面临的问题。
服务器设备CPU性能主要体现在其对于整数运算和浮点数运算的计算性能方面,同时还应该考虑CPU主频,其决定了数据运算的速度指标。此外,要达到高速处理的CPU则需要数以亿计的晶体管组成;这些晶体管极小面积的CPU上工作发热,温度可以达到70℃,其产生的巨大功耗是令人畏惧旳。
内存系统一直是服务器的重要组成部件,它是构建硬盘与CPU之间数据通讯的桥梁。由于系统处理的数据量都是相当巨大的,因此几乎每一步操作都得经过内存,这也是整个系统中工作最为频繁的部件。同时研究表明,芯片处理能力正如摩尔定律预测的那样,每年都要有80%的提升,但是内存设备的速度每年只有7%的提高,因此决定处理器最高处理能力的并不是CPU处理能力,而是内存访问速度和传输速度。内存带宽是重要指标之一,内存不仅可以将暂存CPU计算数据和指令,而且与硬盘进行数据交互,将硬盘中的程序调入内存中运行。通常情况下,数据在CPU以及内存件传送所花的时间比处理器执行功能所花的时间更长,因此需要提高内存带宽,加快数据传输。内存读取速度也是重要指标。是指从启动一次存储器操作到完成该操作所需间隔的最小时间。按照数据顺序,CPU发出指令从内存寻找到硬盘数据读出数据处理,或者将CPU的数据结果经过内存写入硬盘或者直接输出,内存的读写速度决定系统整体运行速度快慢。
内存频率是影响内存性能的重要因素,它直接决定内存的运行速率大小。由于内存是硬盘存储数据输送给CPU,如果内存容量不够,将直接影响数据传输速率,造成时延,进而使得CPU因为等待数据输入而造成资源浪费。因此内存容量也是影响内存性能的重要因素之一。均衡提高内存主频和内存容量将加快数据传输和支持CPU多线程运行。
随着存储技术的发展,己经有了多种类型的存储设备:闪盘、磁盘、SSD(SoliclState Disk,固态硬盘)等,此外还有如NAS(Network Attached Storage.网络连接式存储)和SAN(Storage Area Network.存储区域网络)存储体系。然而由于性价比因素,磁盘还是目前使用较广的存储设备。通过数组方式累加构成的磁盘阵列(Redundant Arrays ofIntensive Disks,RAID)则是数据中心服务器的重要存储系统。磁盘阵列方便配合IT人员对数据存储的扩展,以及数据分散排列的设计,提升数据的安全性。
根据磁盘的工作原理、磁盘接口类型和磁盘在服务器中的数据缓存、输入输出作用可知,I/O性能参数至少有每秒请求数量、每秒传输数据量、平均响应时间、磁盘连续数据读写和随机数据读写、磁盘缓存读写性能。
经过一系列的测试,我们发现18核CPU比6核服务器能耗高,同时,CPU频率越高,能耗也越高。另外,从测试数据可见,CPU能耗并不能直接决定服务器能耗,还和内存和存储有关。关于内存,它随着负载的变化几乎为0,不同的内存容量耗能不同但并不呈倍数变化,CPU配置越高能耗越大,可见服务器能效收到CPU影响明显,内存的影响相对小。对于硬盘,其能耗受到内存和CPU的影响极大,6为8块HDD硬盘设备但能耗随着负载的增加基本不变,与配置5的能耗基本相同。其它配置中CPU和内存相同的配置,硬盘能耗的影响非常小。
综上所述,服务器能效不简单是某个部件的能耗可以代替的,另外,性能与能耗并不呈线性关系,所以要对服务器能效进行评价,就需要开发新的测试方法。首先,尚未确定不同负载的加载方式和负载的选取。对每个耗能部件的测试是必须的,在不同的负载率条件下,不同部件的耗能情况及性能均不相同,选择不同的负载进行测试获得能耗及性能参数是必须的,上面的分析中知道,测试曲线并不是呈现线性关系,所以在中间点(50%)和极值点(100%)的数值非常重要,此外,在空闲(idle)状态下(运转但无有效输出)能耗也需要考虑,所以至少应该选择3个点,即负载为0,50%,100%,为了保证精确可能还要选取0和50%中的一个负载点,50%和100%中的一个负载点,但:具体对负载的选择到底应该是怎么分布,如何能够体现出服务器所有的应用场景及计算服务能力,还需要重新考虑。
其次,尚未确定如何对同一个部件不同负载如何选择才能综合表征服务器能耗和性能。目前比较常见的方法有算数平均、几何平均等方法。但是并没有确定的方式能够体现出CPU、内存、硬盘之间的关系,无法反映三者间对应的关系。
第三,尚未确定以何种加权方式以综合不同部件对服务器性能的影响?针对服务器整机能耗,由于CPU、内存、存储对整机性能的影响不同,所以不能简单采用算数平均方法,否则所有的部件对服务器本身能耗的影响都是相同的,并不符合之前的测试结果。现有的主流的服务器负载共有29个,但是这些通用负载中,到底对CPU、内存、硬盘等重要影响因素的依赖程度如何,以及指标的加权方式都需要评估。
发明内容
本发明要解决的技术问题是提供一种服务器能效测试系统,实现了对服务器能耗的精准评估。
为解决上述技术问题,本发明提供了一种服务器能效测试系统,包括:控制端、被测服务器、功率计和温度计,控制端利用网络设备连接到被测服务器,功率计和温度计通过网络与控制台连接,控制端通过预设加载策略所选定的负载及不同的负载水平加载到测试的系统中,通过功率计完成测试并反馈回来能耗信息,被测服务器在控制台控制下按序执行各个负载,计算各个负载的负载性能,以及对应的负载能效比。
在一些实施方式中,被测系统自身运行情况将反馈会控制端。
在一些实施方式中,自身运行情况包括:负载运行次数、运行时间。
在一些实施方式中,服务器计算性能指标为整数及浮点数运算性能,而能耗则为测试期间的功耗,CPU主频则是决定数据运算的速度指标。
在一些实施方式中,对CPU的整数运算性能采用压缩计算的方式进行。
在一些实施方式中,压缩计算包含文件压缩和文件加密两个负载模块,均使用修正Lempel-Ziv-Welch方法。
在一些实施方式中,对CPU的整数运算性能采用高斯消元法模块进行。
在一些实施方式中,为对内存带宽进行测试,分别采用Copy、Scale、Add、Triad四种方法进行。
采用这样的设计后,本发明至少具有以下优点:
提出了基准负载的方案,并针对不同的部件提出了不同的加载顺序和循环验证的步骤;给出了一套加载逻辑能够实现不同类型部件间针对不同场景的能效测试方案;提出了能效比的概念(energy efficiency ratio)综合的考虑不同负载条件下的不同部件的负载执行能力给能效带来的影响。
附图说明
上述仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下结合附图与具体实施方式对本发明作进一步的详细说明。
图1是测试网络示意图;
图2是负载加载组网图;
图3是负载逻辑架构图;
图4是CPU负载加载方式(整型);
图5是CPU负载加载方式(浮点);
图6是Memory负载加载方式;
图7是Storage负载加载方式(读取);
图8是Storage负载加载方式(写入);
图9是Storage负载加载方式(顺序读写);
图10是负载合集的执行逻辑;
图11是每一个副本的执行逻辑;
图12是逻辑架构图;
图13是服务器能效测试系统模块设计。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
针对任何服务器的各个典型计算场景的应用模拟和能效计算,并输出能效评测报告。支持以下典型场景包括:通用计算、AI计算、HPC计算、BigData、云计算等,通过负载实施策略,实现各个典型计算场景的应用模拟和能效计算。
据统计,2008年我国服务器保有量已超过200万台,国际数据公司(IDC)报告显示,2007年全年,中国用于服务器运行和冷却的总耗电量相当于葛洲坝电站一年的发电量。而据国内数据显示,2008年至2012年我国服务器销量年复合增长率超过15%,如此庞大的服务器群将消耗大量的电力资源。在服务器高能耗的背后隐藏着严重的能源和环境危机。IDC的数据显示,每减少1000台传统的服务器,每年就可以节省大约540万度电,这相当于节约1944吨煤。
本发明技术方案的创新点如下:
创新点1:服务器能效测试基准负载的选择和加载方式
尽管针对CPU、内存和硬盘的测试方法有很多,但是并没有任何一个提出了整合的方案以及加载负载的方式,另外,针对不同的运行环境测试,运行工况的选择和匹配并没未见,本申请中,提出了一种包括11个基准负载的方案,并针对不同的部件提出了不同的加载顺序和循环验证的步骤。
创新点2:服务器能效测试加载策略
由于加载过程负载,针对不同类型的负载采用不同的加载策略变得十分必须,同时针对不同场景,如AI、云计算和交易模型,同一负载需要通过不同的加载水平和加载逻辑实现,本申请中给出了一套加载逻辑能够实现不同类型部件间针对不同场景的能效测试方案。
创新点3:整合不同部件测试结果评估服务器能效
通用计算的负载包括CPU计算密集(7个负载)、内存访问密集(2个负载)、存储访问密集(2个负载)、Idle负载(1个负载)四类共12个负载。其中,Idle负载仅用作被测系统空闲功耗的测量,不参与被测系统能效计算。其他11个负载参与能效计算。
为了整合上述不同负载,且考虑不同负载条件下的负载水平对不同部件带来的影响,本申请创新的提出了能效比的概念(energy efficiency ratio)综合的考虑不同负载条件下的不同部件的负载执行能力给能效带来的影响。
由于服务器产品部件众多,型号复杂,针对不同部件,如CPU、存储或者其他重要部件的单独的测试并不能完全反映出服务器整体的能效。综合的判定能效,需要对服务器进行条理化的加载,加载过程至少需要包括:负载稳定期、负载加载期,负载调试期,负载运行期。完成一次加载后重复运行多次的精确性也是准备统计服务器能效和对产品设计的重要指标。要实现上述目标,确定准确的服务器能效测试基准方案,是本研究的难点之一。
经过400组对照试验,整理了大量的数据,最终形成了当前的固定要求,用于不同部件的负载加载和稳定运行。
根据分析以及大量的调研数据,服务器能效的判定指标并不统一,仅考虑能源消耗将导致高性能的CPU无法实现能效的最优化,因为高性能的运算将会导致能源消耗的剧烈提升,存储及内存也有这方面不足,所以如果限制能源消耗的话,有可能导致产业界的技术发展停滞;仅考虑性能的话,CPU的重要性及能耗完全超过了内存和硬盘,对其它部件的判定不公平,另外,运算能力也不能完全的代表服务器整体能效,因为性能强对能源的消耗更大,预先设定的bios节能策略也不能发挥最大的作用。二者同时考虑,就需要确定不同部件对产品能效的影响和作用,比较难以实现统一,也是本申请的难点之一。
为实现服务器能效测试首先需要搭建测试网络,具体如图1。
由图1可见,通过控制端利用网络设备连接到被测服务器,通过选定的负载及不同的负载水平加载到测试的系统中,通过功率计完成测试并反馈回来能耗信息。服务器能效测试中,至少需要有控制台(服务器、台式机、或者笔记本电脑)、被测服务器(需要安装操作系统,配置要求见下文)、功率计、以及温度计。控制台需要通过以太网与被测服务器连接。功率计和温度计需要与控制台连接。组网图如图2所示。
同时被测系统自身运行情况,如:负载运行次数、运行时间等信息将反馈会控制端,这类信心反映出服务器本身的性能及能源消耗综合特性,具体的加载策略见图3。
用户利用前端设置负载。允许服务器测试和使用的用户从负载合集中选择一些待测负载,选择是否采用自适应算法或者根据适用场景自行选择,功率计将读取相应的测试结果。主控服务器将根据选择或者构建的负载场景设置,结合硬件信息和负载信息生成负载包,发送给被测机,之后配置任务。配置完成后可以启动任务。
由于涉及到负载部署、负载逻辑执行及能效比计算,技术方案分成如下部分。
(1)CPU测试标准负载
服务器计算性能指标为整数及浮点数运算性能,而能耗则为测试期间的功耗,CPU主频(时钟频率)则是决定数据运算的速度指标。功率(P)是描述CPU处理器工作特性的重要物理参数,根据公式P=U*I,将流经处理器的核心电流值、核心电压值和时间的相乘即可得知CPU功率。由于在表示CPU计算性能的涉及测试时间,为了方便测试及计算,CPU能耗测试项的取值为功率。
对CPU的整数运算性能采用压缩计算的方式进行。压缩计算包含文件压缩和文件加密两个负载模块,均使用修正Lempel-Ziv-Welch方法(LZW)。该方法提取原始文本文件数据中的不同字符,基于这些字符创建一个编译表,然后用编译表中的字符的索引来替代原始文本文件数据中的相应字符,减少原始数据大小。编译表根据原始文件数据随机动态创建的,解码时还要从已编码的数据中还原出原来的编译表,解压缩是编码的逆过程。过程中,顺序执行编译程序,以每秒执行次数进行性能考核。每次执行时产生固定大小的数列,数列内容随机生成。
对CPU的整数运算性能采用高斯消元法模块进行。该方法用于求解线性方程组,并可以求出矩阵的秩,以及求出可逆方阵的逆矩阵。采用初等行变换将方程组的增广矩阵转化成阶梯形矩阵,再写出该阶梯形矩阵所对应的方程组,逐步回代,求出方程组的解过程中,顺序执行编译程序,以每秒执行次数进行性能考核。
服务器计算性能指标为整数及浮点数运算性能,而能耗则为计算时的功耗,CPU计算能效为:
Figure SMS_1
Figure SMS_2
最终的能效计算值采用几何平均获得,
Figure SMS_3
测试中,由于不同服务器应用场景,需要选择不同类型的加载方式和对象,如线上交易过程则使用,CPU计算能效为OLTP负载进行,因为其交易过程复杂且交换过程较为繁琐,需要频繁使用CPU,所以选择负载等级7个,分别为100%、87.5%、75%、67.5%、50%、37.5%、25%、12.5%。针对存储型CPU,则不用考虑过多的负载等级,仅4个分别为:100%、75%、50%、25%。
(2)内存测试标准负载
考察服务器内存的主要性能指标以读写速度为主。为对内存带宽进行测试,分别采用Copy、Scale、Add、Triad四种方法进行。Copy操作最为简单,它先访问一个内存单元读出其中的值,再将值写入到另一个内存单元。Scale操作先从内存单元读出其中的值,作一个乘法运算,再将结果写入到另一个内存单元。Add操作先从内存单元读出两个值,做加法运算,再将结果写入到另一个内存单元。Triad表示的意思是将Copy、Scale、Add三种操作组合起来进行测试。
Copy:a(i)=b(i):8字节读取+8字节写,每次16字节运算量
Scale:a(i)=k*b(i):8字节读取+8字节写,每次16字节运算量
Add:a(i)=b(i)+c(i):16字节读取+8字节写,每次24字节运算量
Triad:a(i)=b(i)+k*c(i):16字节读取+8字节写,每次24字节运算量
测试流程图如图6。
Memory负载加载方式
内存的能效计算采用
Figure SMS_4
Figure SMS_5
Figure SMS_6
Figure SMS_7
对内存而言,四种运算的方式均体现内存的效能,各自权重相同,所以按照算数平均计算。
Figure SMS_8
(3)硬盘性能测试标准负载
硬盘存储能量消耗的实际数值是评价存储系统能耗的衡量标准。本研究中存储测试由顺序写入,顺序读取,随机写入,随机读取四部分组成。每个部分都有读写运算。考察每秒I/O性能。
流程图见图7、图8及图9。
上述三个部件的附件及加载等级列表如下表。
不同部件负载及加载等级
Figure SMS_9
下面介绍负载逻辑执行。
(1)负载合集的执行逻辑(部件层)
启动任务之后,被测端在控制台控制下按序执行各个负载,如下图所示。对于每一个负载而言,按序执行多个负荷水平(loadlevel),例如[100%,75%,50%,25%]。每个负荷水平下都启动多个副本(copy),当所有副本执行结束时,该负荷水平执行结束。之后按同样逻辑执行75%,50%和25%负荷水平,当所有负荷水平执行完毕时,该负载执行完毕。对于下一个负载,同样按序执行[100%,75%,50%,25%]的负荷水平。等到所有负载执行结束,测试完成,停止运行。
(2)单个副本的执行逻辑(负载层)
对于每一个副本而言,按序执行对应配置空间(configuration space)里的所有配置。对于每一个配置,先进行初始化,之后执行n轮(对应用户的设置,或者采用自适应算法自动调节n),最后报告结果给控制台并开始处理下一个配置。当配置空间所有配置执行结束时,副本停止运行,发送最终结果给控制台。
采用插入休眠时间片来达到事务量的控制。每次运行单次负载事务后,判断是否进入休眠,不同负荷水平插入不同长度的休眠时间,当休眠时间累积大于一定阈值后,负载进入休眠状态。休眠时间计算公式如下:
Figure SMS_10
式中:sleeptime(N)指的是第N次循休眠时间,maxTransRate是每毫秒最大负荷事务量,Trans_N是第N次循环,截止目前运行的总事务量,time_N是第N次循环,实际执行时间,loadlevel是不同负载加载等级水平,取值范围详见表1。
下面介绍部件负载性能的综合计算方案。
(1)服务器CPU工作负载能效比的计算如下,
Figure SMS_11
Figure SMS_12
式中:
Figure SMS_13
表示CPU加载工作负载i不同负载水平j的能效比;
Figure SMS_14
表示CPU加载工作负载i不同负载水平j的阶段耗电量,单位W·h;
Figure SMS_15
表示CPU加载工作负载后不同算例的标准化性能值;
Figure SMS_16
表示CPU加载工作负载i的能效比;
i表示CPU对应的不同工作负载;
j表示CPU工作负载对应的负载水平;
n表示CPU工作负载对应的负载水平个数,当负载为OLTP时,n取8;其它负载时,n取4。
(2)服务器内存工作负载能效比的计算如下,
Figure SMS_17
Figure SMS_18
式中:
Figure SMS_19
表示内存加载工作负载i不同负载水平j的能效比;
Figure SMS_20
表示内存加载工作负载i不同负载水平j的阶段耗电量,单位W·h;
Figure SMS_21
表示内存加载工作负载后不同算例的标准化性能值;
Figure SMS_22
表示内存加载工作负载i的能效比;
i表示内存对应的不同工作负载;
j表示内存工作负载对应的负载水平。
(3)服务器硬盘工作负载能效比的计算如下,
Figure SMS_23
Figure SMS_24
式中:
Figure SMS_25
表示硬盘加载工作负载i不同负载水平j的能效比;
Figure SMS_26
表示硬盘加载工作负载i不同负载水平j的阶段耗电量,单位W·h;
Figure SMS_27
表示硬盘加载工作负载后不同算例的标准化性能值;
Figure SMS_28
表示硬盘加载工作负载i的能效比;
i表示硬盘对应的不同工作负载;
j表示硬盘工作负载对应的负载水平。
下面介绍服务器能效综合计算方案。
通过上述部件在同一工作负载的不同负载水平下的能效比计算后,可通过下面的方式得到部件针对工作负载的综合能效比。
Figure SMS_29
式中:
SEECPU——服务器CPU工作状态下的能效比。
Figure SMS_30
式中:
SEEMEM——服务器内存工作状态下的能效比。
Figure SMS_31
式中:
SEESTO——服务器存储工作状态能效比。
通过不同部件的计算结果,采用加权几何平均方式求服务器整体的能效比用于判定。本申请提出了首次提出了整体的能效比加权方案。
Figure SMS_32
服务器能效测试按照下文的方式实现。
服务器能效测试的逻辑架构如下。
本申请的服务器能效测试技术主要是通过各个典型计算场景的应用模拟和能效,综合不同部件对不同负载的运行能力判定服务器能效情况,根据前文描述,至少需要控制端和被测端,控制端负责连接并发送负载和建立测试逻辑,被测端要求按照逻辑进行测试,执行负载并反馈回能耗、运行状态等信息。另外,还要考虑到功率计的连接和网络的通信。为保证上述要求顺利完成,逻辑框架机构见图12。
模块设计如下。
本方法的提出是为了服务器产品能效基准判定,从服务器硬件层面对其能耗和性能进行综合分析。首先是从现实场景中抽取很多传统应用并模拟服务器真实行为,进行负载分析构造负载集合,通过上文中分析的策略,将负载发给被测端进行执行。其次,将硬件分解并分析各个部件的能耗情况(如CPU、Memory、Storage),对于每个部件,测试多种负荷水平下的表现,分析其随负荷的变化结果。最终得到的数据有负载特征,负荷水平和硬件分解的三个维度。从负载特征、硬件功耗分解和负荷水平三个维度对服务器能效进行详细的评测,可用于指导硬件设计、软硬件协同、服务器调度算法等的优化,同时也用于服务器选型。为实现本方法,建议的系统模块设计如图13。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,本领域技术人员利用上述揭示的技术内容做出些许简单修改、等同变化或修饰,均落在本发明的保护范围内。

Claims (8)

1.一种服务器能效测试系统,其特征在于,包括:控制端、被测服务器、功率计和温度计,控制端利用网络设备连接到被测服务器,功率计和温度计通过网络与控制台连接,控制端通过预设加载策略所选定的负载及不同的负载水平加载到测试的系统中,通过功率计完成测试并反馈回来能耗信息,被测服务器在控制台控制下按序执行各个负载,计算各个负载的负载性能,以及对应的负载能效比。
2.根据权利要求1所述的服务器能效测试系统,其特征在于,被测系统自身运行情况将反馈回控制端。
3.根据权利要求2所述的服务器能效测试系统,其特征在于,自身运行情况包括:负载运行次数、运行时间。
4.根据权利要求1所述的服务器能效测试系统,其特征在于,服务器计算性能指标为整数及浮点数运算性能,能耗为测试期间的功耗,CPU主频是决定数据运算的速度指标。
5.根据权利要求4所述的服务器能效测试系统,其特征在于,对CPU的整数运算性能采用压缩计算的方式进行。
6.根据权利要求5所述的服务器能效测试系统,其特征在于,压缩计算包含文件压缩和文件加密两个负载模块,均使用修正Lempel-Ziv-Welch方法。
7.根据权利要求4所述的服务器能效测试系统,其特征在于,对CPU的整数运算性能采用高斯消元法模块进行。
8.根据权利要求4所述的服务器能效测试系统,其特征在于,为对内存带宽进行测试,分别采用Copy、Scale、Add、Triad四种方法进行。
CN202211378927.XA 2022-11-04 2022-11-04 服务器能效测试系统 Pending CN116302728A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211378927.XA CN116302728A (zh) 2022-11-04 2022-11-04 服务器能效测试系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211378927.XA CN116302728A (zh) 2022-11-04 2022-11-04 服务器能效测试系统

Publications (1)

Publication Number Publication Date
CN116302728A true CN116302728A (zh) 2023-06-23

Family

ID=86787495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211378927.XA Pending CN116302728A (zh) 2022-11-04 2022-11-04 服务器能效测试系统

Country Status (1)

Country Link
CN (1) CN116302728A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514083A (zh) * 2012-06-29 2014-01-15 上海宽带技术及应用工程研究中心 计算机设备的能效测试方法
CN106708682A (zh) * 2017-01-20 2017-05-24 郑州云海信息技术有限公司 一种提升服务器SPEC CPU speed测试成绩的方法
CN110597700A (zh) * 2019-09-06 2019-12-20 苏州浪潮智能科技有限公司 一种服务器测试方法及装置
CN113608953A (zh) * 2021-06-28 2021-11-05 苏州浪潮智能科技有限公司 测试数据生成方法、装置、电子设备及可读存储介质
CN113961413A (zh) * 2020-07-21 2022-01-21 中国移动通信有限公司研究院 服务器功耗测试方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514083A (zh) * 2012-06-29 2014-01-15 上海宽带技术及应用工程研究中心 计算机设备的能效测试方法
CN106708682A (zh) * 2017-01-20 2017-05-24 郑州云海信息技术有限公司 一种提升服务器SPEC CPU speed测试成绩的方法
CN110597700A (zh) * 2019-09-06 2019-12-20 苏州浪潮智能科技有限公司 一种服务器测试方法及装置
CN113961413A (zh) * 2020-07-21 2022-01-21 中国移动通信有限公司研究院 服务器功耗测试方法及装置
CN113608953A (zh) * 2021-06-28 2021-11-05 苏州浪潮智能科技有限公司 测试数据生成方法、装置、电子设备及可读存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MYDRIVERS.COM: "测试软件快餐文化――PCMark04详细解析", 电脑爱好者, no. 01, pages 1 - 2 *
葛昌荣;: "服务器能效测试新方法(上)", 电子质量, no. 02, pages 1 - 4 *
葛昌荣;: "服务器能效测试新方法(下)", 电子质量, no. 03 *
韩珂;蔡小波;容会;向丽萍;: "云计算环境中能效评估方法", 计算机系统应用, no. 07 *

Similar Documents

Publication Publication Date Title
Chen et al. Statistical workloads for energy efficient mapreduce
Di et al. Characterizing and modeling cloud applications/jobs on a Google data center
US20120060167A1 (en) Method and system of simulating a data center
Stanisic et al. Faithful performance prediction of a dynamic task‐based runtime system for heterogeneous multi‐core architectures
US20140012561A1 (en) Modeling and evaluating application performance in a new environment
Chen et al. Towards energy efficient mapreduce
Gandhi et al. The case for sleep states in servers
Chasapis et al. Power efficient job scheduling by predicting the impact of processor manufacturing variability
Shahid et al. Additivity: A selection criterion for performance events for reliable energy predictive modeling
Chen et al. Automated analysis of performance and energy consumption for cloud applications
Louis et al. Cloudsimdisk: Energy-aware storage simulation in cloudsim
Jiang et al. Energy proportional servers: Where are we in 2016?
Ahmed et al. An integrated interconnection network model for large-scale performance prediction
Zhu et al. Bigop: Generating comprehensive big data workloads as a benchmarking framework
Han et al. Benchmarking big data systems: State-of-the-art and future directions
Liang et al. Performance characterization of hadoop and data mpi based on amdahl's second law
Li et al. Energy prediction for mapreduce workloads
Stanisic et al. Modeling and simulation of a dynamic task-based runtime system for heterogeneous multi-core architectures
Chen et al. Green Databases Through Integration of Renewable Energy.
Bandara et al. On characteristics and modeling of P2P resources with correlated static and dynamic attributes
Stewart et al. Empirical examination of a collaborative web application
Han et al. Bigdatabench-mt: A benchmark tool for generating realistic mixed data center workloads
Yang et al. Redis automatic performance tuning based on eBPF
CN116302728A (zh) 服务器能效测试系统
Ren et al. Waxelephant: A realistic hadoop simulator for parameters tuning and scalability analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination