CN112084093B - 一种服务器的能耗管控装置、方法及设备 - Google Patents

一种服务器的能耗管控装置、方法及设备 Download PDF

Info

Publication number
CN112084093B
CN112084093B CN202010956050.2A CN202010956050A CN112084093B CN 112084093 B CN112084093 B CN 112084093B CN 202010956050 A CN202010956050 A CN 202010956050A CN 112084093 B CN112084093 B CN 112084093B
Authority
CN
China
Prior art keywords
energy consumption
server
consumption data
module
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010956050.2A
Other languages
English (en)
Other versions
CN112084093A (zh
Inventor
段谊海
郭锋
王晓通
王朋飞
邵凡
赵阳阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yingxin Computer Technology Co Ltd
Original Assignee
Shandong Yingxin Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yingxin Computer Technology Co Ltd filed Critical Shandong Yingxin Computer Technology Co Ltd
Priority to CN202010956050.2A priority Critical patent/CN112084093B/zh
Publication of CN112084093A publication Critical patent/CN112084093A/zh
Application granted granted Critical
Publication of CN112084093B publication Critical patent/CN112084093B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • G06F11/3423Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time where the assessed time is active or idle time
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Power Sources (AREA)

Abstract

本申请公开了一种服务器的能耗管控装置,包括能耗数据采集模块、幅值选取模块、相关性确定模块、周期性判断模块、状态确定模块、能耗控制模块,通过各个模块分工合作,能够采集并分析能耗数据,确定能耗数据的周期性,并判断服务器在单个周期内的各个时段是否处于空闲状态,在服务器处于空闲状态的时段向服务器下发低功耗策略,从而实现节省服务器能耗的目的。此外,本申请还提供了一种服务器的能耗管控方法和设备,其技术效果与上述装置相对应。

Description

一种服务器的能耗管控装置、方法及设备
技术领域
本申请涉及计算机技术领域,特别涉及一种服务器的能耗管控装置、方法及设备。
背景技术
随着互联网、IOT及人工智能的飞速发展,数据中心的规模不断扩大,数据中心的耗电量不断增大。因此,如何降低服务器能耗,是亟待本领域技术人员解决的问题。
发明内容
本申请的目的是提供一种服务器的能耗管控装置、方法及设备,用以解决目前服务器耗能较高的问题。其具体方案如下:
第一方面,本申请提供了一种服务器的能耗管控装置,包括:
能耗数据采集模块:用于按照预设频率采集服务器的能耗数据;
幅值选取模块:用于对目标时间范围内的能耗数据进行傅里叶变换,选取整个频谱上的最大幅值以作为第一幅值,选取目标频率对应的幅值以作为第二幅值;
相关性确定模块:用于计算单个周期内的能耗数据的平方和,并计算相邻两个周期内的能耗数据的平方和,确定两者的比值,以作为能耗数据的相关性参数,其中所述周期的大小等于所述目标频率的倒数;
周期性判断模块:用于根据所述第一幅值、所述第二幅值、所述相关性参数,判断能耗数据是否按照所述目标频率呈周期性变化,若是,则进入状态确定模块;
所述状态确定模块:用于根据所述目标时间范围内能耗数据的最大值、所述目标时间范围内能耗数据的最小值、所述目标时间范围内每一时间点的实际能耗数据,确定每一时间点的能耗数据的得分;将所述每一时间点的能耗数据的得分按照子周期进行分组,将每个组内的得分按照从小到大的顺序进行排序,选取排在第N位的得分,以踢除噪点数据,其中N为正整数;判断选取到的得分是否小于预设阈值,若是,则判定所述服务器处于空闲状态;
能耗控制模块:用于在所述服务器处于空闲状态时,向所述服务器下发低功耗策略。
优选的,所述周期性判断模块具体用于:
根据所述第一幅值、所述第二幅值、所述相关性参数,计算周期性得分,判断所述周期性得分是否大于0;若是,则判定所述能耗数据按照所述目标频率呈周期性变化,所述周期性得分的计算公式为:
score=Am24/AmMax+corr*2-2
其中,AmMax为第一幅值,Am24为第二幅值,corr为相关性参数。
优选的,所述状态确定模块具体用于:
根据所述目标时间范围内能耗数据的最大值、所述目标时间范围内能耗数据的最小值、所述目标时间范围内每一时间点的实际能耗数据,确定每一时间点的能耗数据的得分,所述得分的计算公式为:
Score=(power-PowerMin)/(PowerMax-PowerMin)
其中,power为每一时间点的实际能耗数据,PowerMax为目标时间范围内能耗数据的最大值,PowerMin为目标时间范围内能耗数据的最小值。
优选的,能耗数据采集模块具体用于:
通过IPMI协议或者Redfish协议,按照预设频率采集服务器的能耗数据。
优选的,所述周期为一天,所述子周期为一小时。
优选的,还包括:
利用率数据采集模块:用于按照预设频率对服务器的利用率指标进行数据采集,其中所述利用率指标包括CPU计算利用率、内存计算利用率、IO计算利用率;
指标筛选模块:用于确定目标时间范围内各项利用率指标的采集结果的最大值,并进行比较,得到目标最大值,将所述目标最大值对应的利用率指标作为目标指标;
使用率确定模块:用于依据所述目标指标的采集结果,确定所述目标时间范围内各个时间点的服务器使用率;
均值确定模块:用于根据所述目标时间范围内各个时间点的服务器使用率,确定服务器使用率的均值;
参考值确定模块:用于将所述目标时间范围内各个时间点的服务器使用率按照从小到大的顺序进行排序,取排在第N位的服务器使用率作为服务器使用率的参考值,以踢除噪点数据,其中N为正整数;
评估模块:用于根据所述均值和所述参考值,确定所述服务器的评估结果;根据所述评估结果与预设阈值的大小关系,判断所述服务器是否为僵尸服务器;在所述服务器不是僵尸服务器时,进入所述能耗数据采集模块;
相应的,所述能耗控制模块还用于:在所述服务器为僵尸服务器时,控制所述服务器停机。
优选的,还包括:
使用率确定模块:用于根据目标时间范围内能耗数据的最大值、所述目标时间范围内每一时间点的实际能耗数据,确定所述目标时间范围内各个时间点的服务器使用率;
均值确定模块:用于根据所述目标时间范围内各个时间点的服务器使用率,确定服务器使用率的均值;
参考值确定模块:用于将所述目标时间范围内各个时间点的服务器使用率按照从小到大的顺序进行排序,取排在第N位的服务器使用率作为服务器使用率的参考值,以踢除噪点数据,其中N为正整数;
评估模块:用于根据所述均值和所述参考值,确定所述服务器的评估结果;根据所述评估结果与预设阈值的大小关系,判断所述服务器是否为僵尸服务器;在所述服务器不是僵尸服务器时,进入所述能耗数据采集模块;
相应的,所述能耗控制模块还用于:在所述服务器为僵尸服务器时,控制所述服务器停机。
优选的,所述评估模块具体用于:
根据所述均值和所述参考值,确定所述服务器的评估结果,在所述评估结果大于0时,判定所述服务器为僵尸服务器,所述评估结果的计算公式为:
score=(0.1-Avg)*0.5+(0.15-Avg99)*0.5
其中Avg为均值,Avg99为参考值。
第二方面,本申请提供了一种服务器的能耗管控方法,包括:
按照预设频率采集服务器的能耗数据;
对目标时间范围内的能耗数据进行傅里叶变换,选取整个频谱上的最大幅值以作为第一幅值,选取目标频率对应的幅值以作为第二幅值;
计算单个周期内的能耗数据的平方和,并计算相邻两个周期内的能耗数据的平方和,确定两者的比值,以作为能耗数据的相关性参数,其中所述周期的大小等于所述目标频率的倒数;
根据所述第一幅值、所述第二幅值、所述相关性参数,判断能耗数据是否按照所述目标频率呈周期性变化;
若是,则根据所述目标时间范围内能耗数据的最大值、所述目标时间范围内能耗数据的最小值、所述目标时间范围内每一时间点的实际能耗数据,确定每一时间点的能耗数据的得分;将所述每一时间点的能耗数据的得分按照子周期进行分组,将每个组内的得分按照从小到大的顺序进行排序,选取排在第N位的得分,以踢除噪点数据,其中N为正整数;判断选取到的得分是否小于预设阈值,若是,则判定所述服务器处于空闲状态;
在所述服务器处于空闲状态时,向所述服务器下发低功耗策略。
第三方面,本申请提供了一种服务器的能耗管控设备,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如上所述的服务器的能耗管控方法。
本申请所提供的一种服务器的能耗管控装置,包括能耗数据采集模块、幅值选取模块、相关性确定模块、周期性判断模块、状态确定模块、能耗控制模块,通过各个模块分工合作,能够采集并分析能耗数据,确定能耗数据的周期性,并判断服务器在单个周期内的各个时段是否处于空闲状态,在服务器处于空闲状态的时段向服务器下发低功耗策略,从而实现节省服务器能耗的目的。
此外,本申请还提供了一种服务器的能耗管控方法和设备,其技术效果与上述装置相对应,这里不再赘述。
附图说明
为了更清楚的说明本申请实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请所提供的服务器的能耗管控装置实施例的功能框图;
图2为本申请所提供的服务器的能耗管控装置实施例的一种服务器整体使用率分析过程示意图;
图3为本申请所提供的服务器的能耗管控装置实施例的另一种服务器整体使用率分析过程示意图;
图4为本申请所提供的服务器的能耗管控方法实施例的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着互联网、IOT及人工智能的飞速发展,数据中心的规模不断扩大,数据中心的耗电量不断增大。在数据中心中,由于业务部署的不合理或者遗忘等问题,存在着一些僵尸服务器(空跑的服务器),或者存在着一些按照周期性使用的服务器。如何发现僵尸服务器,将其关机;如何发现服务器的使用规律,制定功耗策略,已成为服务器运维管理的研究热点。
针对上述问题,本申请的核心是提供一种服务器的能耗管控装置、方法及设备,用以根据能耗数据发现服务器能耗的周期性,确定单个周期内处于空闲状态的时段,并控制服务器在该时段按照低功耗策略运行,从而实现节省服务器能耗的目的。
下面对本申请提供的一种服务器的能耗管控装置进行介绍,参见图1,实施例一包括:
能耗数据采集模块101:用于按照预设频率采集服务器的能耗数据;
幅值选取模块102:用于对目标时间范围内的能耗数据进行傅里叶变换,选取整个频谱上的最大幅值以作为第一幅值,选取目标频率对应的幅值以作为第二幅值;
相关性确定模块103:用于计算单个周期内的能耗数据的平方和,并计算相邻两个周期内的能耗数据的平方和,确定两者的比值,以作为能耗数据的相关性参数,其中周期的大小等于目标频率的倒数;
周期性判断模块104:用于根据第一幅值、第二幅值、相关性参数,判断能耗数据是否按照目标频率呈周期性变化,若是,则进入状态确定模块;
状态确定模块105:用于根据目标时间范围内能耗数据的最大值、目标时间范围内能耗数据的最小值、目标时间范围内每一时间点的实际能耗数据,确定每一时间点的能耗数据的得分;将每一时间点的能耗数据的得分按照子周期进行分组,将每个组内的得分按照从小到大的顺序进行排序,选取排在第N位的得分,以踢除噪点数据,其中N为正整数;判断选取到的得分是否小于预设阈值,若是,则判定服务器处于空闲状态;
能耗控制模块106:用于在服务器处于空闲状态时,向服务器下发低功耗策略。
具体的,上述能耗数据采集模块具体用于:通过IPMI协议或者Redfish协议,按照预设频率实时采集服务器的能耗数据。其中,预设频率可以根据实际需求自行设置,例如设置为每分钟一次。
具体的,上述周期性判断模块具体用于:根据第一幅值、第二幅值、相关性参数,计算周期性得分,判断周期性得分是否大于0;若是,则判定能耗数据按照目标频率呈周期性变化,周期性得分的计算公式为:
score=Am24/AmMax+corr*2-2
其中,AmMax为第一幅值,Am24为第二幅值,corr为相关性参数。
可以理解的是,幅值选取模块、相关性确定模块和周期性判断模块三者共同完成对能耗数据的周期性判断,即判断能耗数据是否按照目标频率呈周期性变化。幅值选取模块和周期性判断模块中提及的目标频率与相关性确定模块中提及的周期实际上为相互对应的,即周期等于目标频率的倒数。
实际应用中,周期实际上是可以灵活调整的,例如,在将周期设置为一天时,相关性模块用于判断服务器不同天的能耗数据的相关程度,周期性判断模块用于判断服务器的能耗数据是否按照天呈周期性变化。当周期性判断模块的判断结果为否时,则可以重新调整周期,并利用三个模块判断能耗数据是否按照调整后的周期呈现周期性变化,直至得到能耗数据的变化周期。
在确定能耗数据的变化周期之后,则可以进一步判断单个周期内不同时段时服务器的能耗情况,从而确定服务器在每个周期内处于空闲状态的时段。上述子周期即指对单个周期进一步划分得到的区间,本实施例分别判断服务器在每个子周期的能耗状态。
具体的,上述状态确定模块具体用于:
根据目标时间范围内能耗数据的最大值、目标时间范围内能耗数据的最小值、目标时间范围内每一时间点的实际能耗数据,确定每一时间点的能耗数据的得分,得分的计算公式为:
Score=(power-PowerMin)/(PowerMax-PowerMin)
其中,power为每一时间点的实际能耗数据,PowerMax为目标时间范围内能耗数据的最大值,PowerMin为目标时间范围内能耗数据的最小值。
以上介绍了采集并分析能耗数据,确定能耗数据的变化周期,进而确定每个周期内服务器处于空闲状态的子周期,从而控制服务器在该子周期内按照低功耗策略运行的过程。
作为一种优选的实施方式,可以在执行上述过程之前,先对服务器进行整体使用率的分析,即判断服务器是否为僵尸服务器,若是僵尸服务器,则直接控制其关机;否则,按照上述过程控制服务器在相应的时段内按照低功耗策略运行。通过分析服务器的整体使用率,提前筛选出并关掉僵尸服务器,能够避免僵尸服务器带来的能耗浪费问题,还能够避免对僵尸服务器进行能耗数据的周期性分析,节省计算资源,提升能耗管控效率。
本实施例提供两种对服务器进行整体使用率分析的方式,一种基于能耗数据实现,另一种基于CUPS数据(CPU计算利用率、内存计算利用率、IO计算利用率)实现,下面分别对二者进行介绍。
基于能耗数据分析服务器整体使用率的过程如图2所示,首先通过能耗数据采集模块101实时采集能耗数据,然后通过以下模块实现后续分析:
第一使用率确定模块201:用于根据目标时间范围内能耗数据的最大值、目标时间范围内每一时间点的实际能耗数据,确定目标时间范围内各个时间点的服务器使用率;
均值确定模块202:用于根据目标时间范围内各个时间点的服务器使用率,确定服务器使用率的均值;
参考值确定模块203:用于将目标时间范围内各个时间点的服务器使用率按照从小到大的顺序进行排序,取排在第N位的服务器使用率作为服务器使用率的参考值,以踢除噪点数据,其中N为正整数;
评估模块204:用于根据均值和参考值,确定服务器的评估结果;根据评估结果与预设阈值的大小关系,判断服务器是否为僵尸服务器;在服务器不是僵尸服务器时,进入能耗数据采集模块;
相应的,能耗控制模块106还用于:在服务器为僵尸服务器时,控制服务器停机。
如图3所示,基于CUPS数据分析服务器整体使用率的过程通过以下模块实现:
利用率数据采集模块301:用于按照预设频率对服务器的利用率指标进行数据采集,其中利用率指标包括CPU计算利用率、内存计算利用率、IO计算利用率;
指标筛选模块302:用于确定目标时间范围内各项利用率指标的采集结果的最大值,并进行比较,得到目标最大值,将目标最大值对应的利用率指标作为目标指标;
第二使用率确定模块303:用于依据目标指标的采集结果,确定目标时间范围内各个时间点的服务器使用率;
均值确定模块202:用于根据目标时间范围内各个时间点的服务器使用率,确定服务器使用率的均值;
参考值确定模块203:用于将目标时间范围内各个时间点的服务器使用率按照从小到大的顺序进行排序,取排在第N位的服务器使用率作为服务器使用率的参考值,以踢除噪点数据,其中N为正整数;
评估模块204:用于根据均值和参考值,确定服务器的评估结果;根据评估结果与预设阈值的大小关系,判断服务器是否为僵尸服务器;在服务器不是僵尸服务器时,进入能耗数据采集模块;
相应的,能耗控制模块106还用于:在服务器为僵尸服务器时,控制服务器停机。
实际应用中,图2和图3中的评估模块具体用于:根据均值和参考值,确定服务器的评估结果,在评估结果大于0时,判定服务器为僵尸服务器,评估结果的计算公式为:
score=(0.1-Avg)*0.5+(0.15-Avg99)*0.5
其中Avg为均值,Avg99为参考值。
对于服务器整体使用率的分析过程,如果能采集到CUPS数据,优先使用CUPS数据进行分析;如果仅能采集到能耗数据,则使用能耗数据进行分析。
本实施例所提供一种服务器的能耗管控装置,包括能耗数据采集模块、幅值选取模块、相关性确定模块、周期性判断模块、状态确定模块、能耗控制模块,通过各个模块分工合作,能够采集并分析能耗数据,确定能耗数据的周期性,并判断服务器在单个周期内的各个时段是否处于空闲状态,在服务器处于空闲状态的时段向服务器下发低功耗策略,从而实现节省服务器能耗的目的。
下面开始详细介绍本申请提供的一种服务器的能耗管控装置实施例二,实施例二以实际应用为例,对本申请的服务器能耗管控过程进行了详尽的说明。
实施例二可以分为三个过程:数据采集、整体使用率分析、日使用率分析,下面分别对三者进行介绍。
第一,数据采集
使用率的分析依赖于服务器的CUPS数据和实时能耗数据,对于服务器的能耗和CUPS数据可以通过IPMI协议或者Redfish协议进行定时采集,本实施例具体通过数据采集模块每分钟采集一次CUPS数据和能耗数据。
在采集能耗数据的同时,比较能耗数据的大小,缓存能耗数据的最大值和最小值,视为观测到的服务器能耗的最大值和最小值,使用influxdb进行存储,之后进行分析。
第二,整体使用率分析
如果基于CUPS分析整体使用率,那么分析过程包括以下步骤:
S101、获取最少两天的服务器的CUPS数据,记为三维矩阵[CPU、Memory、IO]。
S102、通过遍历所有CUPS数据,寻找CPU、Memory和IO的最大值。
S103、比较CPU、Memory和IO的最大值,取出最大值MAX和最大值的类别Type(CPU、Memory或IO)。例如CPU最大值是95,Memory是70,IO是30,这里就使用95,类别是CPU。注意如果类别是CPU,则这里最大值固定取值100,其他类别取真实值。该步骤的主要核心意义在于评估影响服务器能耗的核心指标。
S104、采用S103的类别,计算每一时刻该类别评估的服务器的使用率CUPS[Type]/Max。例如,如果S103中选择的是CPU,MAX=100,则每一时刻获的服务器利用率=CPU计算利用率/100。
S105、取S104中每一时刻的服务器利用率,做平均得Avg。
S106、取S104中每一时刻的服务器利用率,按照从小到大得顺序进行排序,取数据总长*0.99得位置得利用率,得到Avg99,该步骤得核心目标在于剔除噪点数据。
S107、对服务器进行使用率评估:计算score=(0.1-Avg)*0.5+(0.15-Avg99)*0.5,如果score>0,则认为该服务器是僵尸服务器,如果score<0,则认为是业务服务器,需要进一步分析其日使用率。
如果基于能耗分析整体使用率,那么分析过程包括以下步骤:
S201、获取最少两天的服务器的能耗数据,并取出观测到的服务器能耗的最大值ObMax和最小值ObMin,做如下计算:
PowerMax=ObMax>2*ObMin?ObMax:2*ObMin
PowerMin=ObMin。
S202、计算每一时刻该类别评估的服务器的使用率:power/PowerMax。
S203、取S202中每一时刻的服务器利用率,做平均得Avg。
S204、取S202中每一时刻的服务器利用率,按照从小到大得顺序进行排序,取数据总长*0.99得位置得利用率,得到Avg99,该步骤得核心目标在于剔除噪点数据。
S205、对服务器进行使用率评估:计算score=(0.1-Avg)*0.5+(0.15-Avg99)*0.5,如果score>0,则认为该服务器是僵尸服务器,如果score<0,则认为是业务服务器,需要进一步分析其日使用率。
第三,日使用率分析
S301、检查能耗数据长度和数据有效性。能耗数据至少要包含两天的数据,数据中的有效数据不能少于95%。无效数据就是采集到的能耗为空。
S302、对能耗数据做DFFT变换,获取能耗的最大幅值AmMax和24小时变化的幅值Am24。
S303、对能耗做自相关计算,这里使用数据断移动的方式判读是否成24小时变化。
计算24小时采集的次数,lenth=24*60;将采集到的能耗,从1到lenth的数据平方后求和,得到P1;将采集到的能耗1到lenth和对应的lenth+1到2*lenth,进行平方求和,得到P2;计算二者的相关性corr=P1/P2。
S304、评估能耗是否成日变化:计算score=Am24/AmMax+corr*2-2,如果score大于0,则认为服务器成日进行周期性变化使用,并进入S305。
S305、如果服务器成日进行周期性变化,则按小时判断服务器是否空闲,具体步骤如下:
获取最少两天的服务器的能耗数据,并取出观测到的服务器能耗的最大值ObMax和最小值ObMin,做如下计算:
PowerMax=ObMax>2*ObMin?ObMax:2*ObMin
PowerMin=ObMin。
对每一时刻的能耗做如下计算:
Score=(power-PowerMin)/(PowerMax-PowerMin)。
按照小时将score进行分组,例如获取0:00-1:00分之间的sorce的所有值,然后按照从小到大的顺序进行排列,取总长的lenth*0.99的位置的数据score99,如果score99<0.03,则认为该时间区间内服务器处于空闲状态,否则处于运行状态。
S306、根据S305的判断结果进行功耗控制策略的下发,例如在1-5点处于空闲状态,则在服务器上下发功耗降低策略,使得服务器功耗降低。
本实施例所提供一种服务器的能耗管控装置,通过对服务器的能耗和CUPS进行采集,之后对能耗和CPUPS数据进行分析,最终识别出僵尸服务器和服务器的日使用规律,进行设定服务器功耗管理策略,从而使整个数据中心节省能耗。
下面对本申请实施例提供的一种服务器的能耗管控方法进行介绍,下文描述的一种服务器的能耗管控方法基于上文描述的服务器的能耗管控装置实现。
如图4所示,本实施例的服务器的能耗管控方法,包括以下步骤:
S401、按照预设频率采集服务器的能耗数据;
S402、对目标时间范围内的能耗数据进行傅里叶变换,选取整个频谱上的最大幅值以作为第一幅值,选取目标频率对应的幅值以作为第二幅值;
S403、计算单个周期内的能耗数据的平方和,并计算相邻两个周期内的能耗数据的平方和,确定两者的比值,以作为能耗数据的相关性参数,其中周期的大小等于目标频率的倒数;
S404、根据第一幅值、第二幅值、相关性参数,判断能耗数据是否按照目标频率呈周期性变化;若是,进入S405,否则调整目标频率,并进入S402;
S405、根据目标时间范围内能耗数据的最大值、目标时间范围内能耗数据的最小值、目标时间范围内每一时间点的实际能耗数据,确定每一时间点的能耗数据的得分;将每一时间点的能耗数据的得分按照子周期进行分组,将每个组内的得分按照从小到大的顺序进行排序,选取排在第N位的得分,以踢除噪点数据,其中N为正整数;
S406、判断选取到的得分是否小于预设阈值,若是,则判定服务器处于空闲状态,进入S407;否则,继续判断下一子周期;
S407、向服务器下发低功耗策略。
本实施例的服务器的能耗管控方法基于上文描述的服务器的能耗管控装置实现,因此该方法的具体实施方式可见前文中的服务器的能耗管控装置的实施例部分,在此不再展开介绍。
另外,由于本实施例的服务器的能耗管控方法基于上文描述的服务器的能耗管控装置实现,因此其作用与上述方法的作用相对应,这里不再赘述。
此外,本申请还提供了一种服务器的能耗管控设备,包括:
存储器:用于存储计算机程序;
处理器:用于执行计算机程序,以实现如上文所述的服务器的能耗管控方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (8)

1.一种服务器的能耗管控装置,其特征在于,包括:
能耗数据采集模块:用于按照预设频率采集服务器的能耗数据;
幅值选取模块:用于对目标时间范围内的能耗数据进行傅里叶变换,选取整个频谱上的最大幅值以作为第一幅值,选取目标频率对应的幅值以作为第二幅值;
相关性确定模块:用于计算单个周期内的能耗数据的平方和,并计算相邻两个周期内的能耗数据的平方和,确定两者的比值,以作为能耗数据的相关性参数,其中所述周期的大小等于所述目标频率的倒数;
周期性判断模块:用于根据所述第一幅值、所述第二幅值、所述相关性参数,判断能耗数据是否按照所述目标频率呈周期性变化,若是,则进入状态确定模块;
所述状态确定模块:用于根据所述目标时间范围内能耗数据的最大值、所述目标时间范围内能耗数据的最小值、所述目标时间范围内每一时间点的实际能耗数据,确定每一时间点的能耗数据的得分;将所述每一时间点的能耗数据的得分按照子周期进行分组,将每个组内的得分按照从小到大的顺序进行排序,选取排在第N位的得分,以剔 除噪点数据,其中N为正整数;判断选取到的得分是否小于预设阈值,若是,则判定所述服务器处于空闲状态;
能耗控制模块:用于在所述服务器处于空闲状态时,向所述服务器下发低功耗策略;
其中,所述周期性判断模块具体用于:
根据所述第一幅值、所述第二幅值、所述相关性参数,计算周期性得分,判断所述周期性得分是否大于0;若是,则判定所述能耗数据按照所述目标频率呈周期性变化,所述周期性得分的计算公式为:
score1=Am24/AmMax + corr *2-2
式中,AmMax为第一幅值,Am24为第二幅值,corr为相关性参数;
所述状态确定模块具体用于:
根据所述目标时间范围内能耗数据的最大值、所述目标时间范围内能耗数据的最小值、所述目标时间范围内每一时间点的实际能耗数据,确定每一时间点的能耗数据的得分,所述得分的计算公式为:
score2=(power-PowerMin)/( PowerMax- PowerMin)
式中,power为每一时间点的实际能耗数据,PowerMax为目标时间范围内能耗数据的最大值,PowerMin为目标时间范围内能耗数据的最小值。
2.如权利要求1所述的装置,其特征在于,能耗数据采集模块具体用于:
通过IPMI协议或者Redfish协议,按照预设频率采集服务器的能耗数据。
3.如权利要求1所述的装置,其特征在于,所述周期为一天,所述子周期为一小时。
4.如权利要求1所述的装置,其特征在于,还包括:
利用率数据采集模块:用于按照预设频率对服务器的利用率指标进行数据采集,其中所述利用率指标包括CPU计算利用率、内存计算利用率、IO计算利用率;
指标筛选模块:用于确定目标时间范围内各项利用率指标的采集结果的最大值,并进行比较,得到目标最大值,将所述目标最大值对应的利用率指标作为目标指标;
使用率确定模块:用于依据所述目标指标的采集结果,确定所述目标时间范围内各个时间点的服务器使用率;
均值确定模块:用于根据所述目标时间范围内各个时间点的服务器使用率,确定服务器使用率的均值;
参考值确定模块:用于将所述目标时间范围内各个时间点的服务器使用率按照从小到大的顺序进行排序,取排在第N位的服务器使用率作为服务器使用率的参考值,以剔 除噪点数据,其中N为正整数;
评估模块:用于根据所述均值和所述参考值,确定所述服务器的评估结果;根据所述评估结果与预设阈值的大小关系,判断所述服务器是否为僵尸服务器;在所述服务器不是僵尸服务器时,进入所述能耗数据采集模块;
相应的,所述能耗控制模块还用于:在所述服务器为僵尸服务器时,控制所述服务器停机。
5.如权利要求1所述的装置,其特征在于,还包括:
使用率确定模块:用于根据目标时间范围内能耗数据的最大值、所述目标时间范围内每一时间点的实际能耗数据,确定所述目标时间范围内各个时间点的服务器使用率;
均值确定模块:用于根据所述目标时间范围内各个时间点的服务器使用率,确定服务器使用率的均值;
参考值确定模块:用于将所述目标时间范围内各个时间点的服务器使用率按照从小到大的顺序进行排序,取排在第N位的服务器使用率作为服务器使用率的参考值,以剔 除噪点数据,其中N为正整数;
评估模块:用于根据所述均值和所述参考值,确定所述服务器的评估结果;根据所述评估结果与预设阈值的大小关系,判断所述服务器是否为僵尸服务器;在所述服务器不是僵尸服务器时,进入所述能耗数据采集模块;
相应的,所述能耗控制模块还用于:在所述服务器为僵尸服务器时,控制所述服务器停机。
6.如权利要求4或5所述的装置,其特征在于,所述评估模块具体用于:
根据所述均值和所述参考值,确定所述服务器的评估结果,在所述评估结果大于0时,判定所述服务器为僵尸服务器,所述评估结果的计算公式为:
score3=(0.1-Avg)*0.5+ (0.15-Avg99)*0.5
其中Avg为均值,Avg99为参考值。
7.一种服务器的能耗管控方法,其特征在于,包括:
按照预设频率采集服务器的能耗数据;
对目标时间范围内的能耗数据进行傅里叶变换,选取整个频谱上的最大幅值以作为第一幅值,选取目标频率对应的幅值以作为第二幅值;
计算单个周期内的能耗数据的平方和,并计算相邻两个周期内的能耗数据的平方和,确定两者的比值,以作为能耗数据的相关性参数,其中所述周期的大小等于所述目标频率的倒数;
根据所述第一幅值、所述第二幅值、所述相关性参数,判断能耗数据是否按照所述目标频率呈周期性变化;
若是,则根据所述目标时间范围内能耗数据的最大值、所述目标时间范围内能耗数据的最小值、所述目标时间范围内每一时间点的实际能耗数据,确定每一时间点的能耗数据的得分;将所述每一时间点的能耗数据的得分按照子周期进行分组,将每个组内的得分按照从小到大的顺序进行排序,选取排在第N位的得分,以剔 除噪点数据,其中N为正整数;判断选取到的得分是否小于预设阈值,若是,则判定所述服务器处于空闲状态;
在所述服务器处于空闲状态时,向所述服务器下发低功耗策略;
其中,所述根据所述第一幅值、所述第二幅值、所述相关性参数,判断能耗数据是否按照所述目标频率呈周期性变化,包括:
根据所述第一幅值、所述第二幅值、所述相关性参数,计算周期性得分,判断所述周期性得分是否大于0;若是,则判定所述能耗数据按照所述目标频率呈周期性变化,所述周期性得分的计算公式为:
score1=Am24/AmMax + corr *2-2
式中,AmMax为第一幅值,Am24为第二幅值,corr为相关性参数;
并且,所述每一时间点的能耗数据的得分的计算公式为:
score2=(power-PowerMin)/( PowerMax- PowerMin)
式中,power为每一时间点的实际能耗数据,PowerMax为目标时间范围内能耗数据的最大值,PowerMin为目标时间范围内能耗数据的最小值。
8.一种服务器的能耗管控设备,其特征在于,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如权利要求7所述的服务器的能耗管控方法。
CN202010956050.2A 2020-09-11 2020-09-11 一种服务器的能耗管控装置、方法及设备 Active CN112084093B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010956050.2A CN112084093B (zh) 2020-09-11 2020-09-11 一种服务器的能耗管控装置、方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010956050.2A CN112084093B (zh) 2020-09-11 2020-09-11 一种服务器的能耗管控装置、方法及设备

Publications (2)

Publication Number Publication Date
CN112084093A CN112084093A (zh) 2020-12-15
CN112084093B true CN112084093B (zh) 2022-07-05

Family

ID=73736948

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010956050.2A Active CN112084093B (zh) 2020-09-11 2020-09-11 一种服务器的能耗管控装置、方法及设备

Country Status (1)

Country Link
CN (1) CN112084093B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116431436A (zh) * 2023-03-23 2023-07-14 北京神州安付科技股份有限公司 基于云服务器密码机的能耗监测系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656851A (zh) * 2017-09-30 2018-02-02 华南理工大学 一种基于部件能耗模型的云服务器能耗测算方法及系统
CN110069044A (zh) * 2019-04-09 2019-07-30 北京汽车股份有限公司 用于高能耗车间能源计量的智能管控系统
CN110413488A (zh) * 2019-07-31 2019-11-05 中国工商银行股份有限公司 服务器使用率预警方法及装置
CN111178393A (zh) * 2019-12-11 2020-05-19 广东浩迪智云技术有限公司 一种基于智能电表的用电器用电量分类计量方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3076005B1 (fr) * 2017-12-22 2019-12-27 Bull Sas Commande de la consommation energetique d'une grappe de serveurs

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656851A (zh) * 2017-09-30 2018-02-02 华南理工大学 一种基于部件能耗模型的云服务器能耗测算方法及系统
CN110069044A (zh) * 2019-04-09 2019-07-30 北京汽车股份有限公司 用于高能耗车间能源计量的智能管控系统
CN110413488A (zh) * 2019-07-31 2019-11-05 中国工商银行股份有限公司 服务器使用率预警方法及装置
CN111178393A (zh) * 2019-12-11 2020-05-19 广东浩迪智云技术有限公司 一种基于智能电表的用电器用电量分类计量方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Comparative Study of HDD and SSD RAIDs’Impact on Server Energy Consumption;Erica Tomes 等;《IEEE》;20170926;第625-626页 *
云中心异构服务器能耗受限下的性能优化策略;何怀文 等;《计算机应用研究》;20160131;第42-45,55页 *

Also Published As

Publication number Publication date
CN112084093A (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN105740124B (zh) 一种面向云计算监控系统的冗余数据过滤方法
CN103186603B (zh) 确定sql语句对关键业务的性能的影响的方法、系统和设备
CN112084093B (zh) 一种服务器的能耗管控装置、方法及设备
CN116976707B (zh) 基于用电信息采集的用户用电数据异常分析方法及系统
Idrees et al. Adaptive distributed energy-saving data gathering technique for wireless sensor networks
CN114500578A (zh) 分布式存储系统负载均衡调度方法、装置及存储介质
CN112801555B (zh) 一种基于车联网大数据的车辆动力性综合评价方法
CN112398700A (zh) 一种服务降级方法及装置、存储介质、计算机设备
CN111737078A (zh) 基于负载类型的自适应云服务器能耗测算方法、系统及设备
CN114676380A (zh) 一种基于智能传感器边缘监测的触发式采集方法及系统
CN107566535B (zh) 基于Web地图服务并发访问时序规则的自适应负载均衡方法
CN109165045A (zh) 一种调整服务器的硬件配置的方法和装置
CN116345700A (zh) 一种用于储能电站的能耗监测方法及监测系统
CN114500543B (zh) 一种基于分布式的弹性边缘采集系统及其应用方法
CN111626360A (zh) 用于检测锅炉故障类型的方法、装置、设备和存储介质
CN103501253A (zh) 一种高性能计算应用特征的监控组织方法
CN105357026B (zh) 一种资源信息收集方法和计算节点
CN213906384U (zh) 一种基于物联网技术的自动化设备状态在线监测系统
WO2020057402A1 (zh) 系统状态监视方法、装置和存储介质
CN116881085A (zh) 一种服务器能耗优化的方法
CN111914000A (zh) 一种基于功耗预测模型的服务器功率封顶方法、系统
CN116307886A (zh) 一种企业生产状态的实时监测方法及装置
CN110287256A (zh) 一种基于云计算的电网数据并行处理系统及其处理方法
CN115701890A (zh) 调整告警规则的方法及相关设备
CN113032217B (zh) 一种集群监控方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant