CN111399622A - 一种服务器功耗控制方法、系统、电子设备及存储介质 - Google Patents

一种服务器功耗控制方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN111399622A
CN111399622A CN202010176098.1A CN202010176098A CN111399622A CN 111399622 A CN111399622 A CN 111399622A CN 202010176098 A CN202010176098 A CN 202010176098A CN 111399622 A CN111399622 A CN 111399622A
Authority
CN
China
Prior art keywords
power consumption
server
power
power supply
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010176098.1A
Other languages
English (en)
Other versions
CN111399622B (zh
Inventor
梁锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010176098.1A priority Critical patent/CN111399622B/zh
Publication of CN111399622A publication Critical patent/CN111399622A/zh
Application granted granted Critical
Publication of CN111399622B publication Critical patent/CN111399622B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本申请公开了一种服务器功耗控制方法,应用于基板管理控制器BMC,所述方法包括:当所述第二电源模块为所述第一电源模块的冗余电源时,记录所述服务器在当前功耗场景的功耗分配信息;根据所述当前功耗场景对应的时间段与功耗分配信息更新服务器功耗评价信息;当所述第二电源模块不为所述第一电源模块的冗余电源时,根据所述服务器功耗评价信息确定关键部件,并为所述关键部件分配当前时刻对应的功耗值,对除了所述关键部件之外的所述部件进行功耗限制操作。本申请能够合理调节服务器中各部件功耗,保持服务器的电源冗余。本申请还公开了一种服务器功耗控制系统、一种电子设备及一种存储介质,具有以上有益效果。

Description

一种服务器功耗控制方法、系统、电子设备及存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种服务器功耗控制方法、系统、一种电子设备及一种存储介质。
背景技术
服务器在网络中可以为其它客户机(如PC机、智能手机、ATM等终端)提供计算或者应用服务。服务器具有高速的CPU运算能力、长时间的可靠运行、强大的I/O外部数据吞吐能力以及更好的扩展性。
如今,用户对GPU或显卡的配置要求越来越多,但是对于通用服务器或者GPU服务器,在GPU、CPU、内存、硬盘满配的情况,电源的负载情况会越来越严重,在客户强负载使用或者机房温度升高的情况下,会出现无法实现电源1+1冗余的情况,这样带来的风险将会很大。
因此,如何合理调节服务器中各部件功耗,保持服务器的电源冗余是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种服务器功耗控制方法、系统、一种电子设备及一种存储介质,能够合理调节服务器中各部件功耗,保持服务器的电源冗余。
为解决上述技术问题,本申请提供一种服务器功耗控制方法,应用于基板管理控制器BMC,所述基板管理控制器BMC所在的服务器包括第一电源模块和第二电源模块,所述服务器功耗控制方法包括:
当所述第二电源模块为所述第一电源模块的冗余电源时,记录所述服务器在当前功耗场景的功耗分配信息;
根据所述当前功耗场景对应的时间段与功耗分配信息更新服务器功耗评价信息;其中,所述服务器功耗评价信息包括每一部件的功耗占比与时间的映射关系,所述功耗占比为所述部件的功耗与所述服务器的整体功耗之比;
当所述第二电源模块不为所述第一电源模块的冗余电源时,根据所述服务器功耗评价信息确定关键部件,并为所述关键部件分配当前时刻对应的功耗值,对除了所述关键部件之外的所述部件进行功耗限制操作。
可选的,还包括:
在所述服务器进行出厂测试时,获取每一所述部件的最大功耗值和服务器整机最大功耗值;
将所述部件的最大功耗值与所述服务器整机最大功耗值之比作为初始功耗占比,并将所述初始功耗占比设置为所述服务器功耗评价信息的初始值。
可选的,所述第一电源模块为所述服务器的主电源模块,所述第二电源模块为所述服务器的备电源模块;
相应的,还包括:
判断所述第二电源模块是否均处于工作状态;
若是,则判定所述第二电源模块不为所述第一电源模块的冗余电源;
若否,则判定所述第二电源模块为所述第一电源模块的冗余电源。
可选的,根据所述服务器功耗评价信息确定关键部件包括:
根据所述服务器功耗评价信息确定当前时刻下所有所述部件的功耗占比排序信息;
根据所述功耗占比排序信息将功耗占比前N位的部件作为所述关键部件。
可选的,还包括:
当GPU利用率大于第一预设值时,判定当前功耗场景为使用GPU算力的场景;
当CPU利用率大于第二预设值时,判定当前功耗场景为使用CPU算力的场景。
可选的,为所述关键部件分配当前时刻对应的功耗值,包括:
根据所述服务器功耗评价信息确定当前时刻下所述关键部件对应的功耗占比和服务器总功耗,根据所述服务器总功耗和所述功耗占比为所述关键部件分配对应的功耗值。
可选的,对除了所述关键部件之外的所述部件进行功耗限制操作包括:
将所述第一电源模块提供的最大功耗减去所述为所述关键部件分配的功耗值得到剩余可分配功耗;
确定其他部件之间的功耗比例;其中,所述其他部件为除了所述关键部件之外的所述部件;
根据所述功耗比例将所述剩余可分配功耗分配至对应的所述其他部件;其中,所述其他部件被分配的剩余可分配功耗与所述功耗比例正相关。
本申请还提供了一种服务器功耗控制系统,应用于基板管理控制器BMC,所述基板管理控制器BMC所在的服务器包括第一电源模块和第二电源模块,所述服务器功耗控制系统包括:
功耗分配记录模块,用于当所述第二电源模块为所述第一电源模块的冗余电源时,记录所述服务器在当前功耗场景的功耗分配信息;
功耗评价信息更新模块,用于根据所述当前功耗场景对应的时间段与功耗分配信息更新服务器功耗评价信息;其中,所述服务器功耗评价信息包括每一部件的功耗占比与时间的映射关系,所述功耗占比为所述部件的功耗与所述服务器的整体功耗之比;
功耗控制模块,用于当所述第二电源模块不为所述第一电源模块的冗余电源时,根据所述服务器功耗评价信息确定关键部件,并为所述关键部件分配当前时刻对应的功耗值,对除了所述关键部件之外的所述部件进行功耗限制操作。
本申请还提供了一种存储介质,其上存储有计算机程序,所述计算机程序执行时实现上述服务器功耗控制方法执行的步骤。
本申请还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现上述服务器功耗控制方法执行的步骤。
本申请提供了一种服务器功耗控制方法,应用于基板管理控制器BMC,所述基板管理控制器BMC所在的服务器包括第一电源模块和第二电源模块,所述服务器功耗控制方法包括:当所述第二电源模块为所述第一电源模块的冗余电源时,记录所述服务器在当前功耗场景的功耗分配信息;根据所述当前功耗场景对应的时间段与功耗分配信息更新服务器功耗评价信息;其中,所述服务器功耗评价信息包括每一部件的功耗占比与时间的映射关系,所述功耗占比为所述部件的功耗与所述服务器的整体功耗之比;当所述第二电源模块不为所述第一电源模块的冗余电源时,根据所述服务器功耗评价信息确定关键部件,并为所述关键部件分配当前时刻对应的功耗值,对除了所述关键部件之外的所述部件进行功耗限制操作。
本申请中的服务器包括第一电源模块和第二电源模块,当第二电源模块为第一电源模块的冗余电源时,说明第二电源模块尚未工作,此时第二电源模块可以作为第一电源模块的冗余,通过记录所述服务器在当前功耗场景的功耗分配信息,可以确定服务器中各个部件的功耗占比与时间的对应关系。当所述第二电源模块不为所述第一电源模块的冗余电源时,说明第一电源模块和第二电源模块共同为服务器提供电能,服务器此时不存在冗余电源,在上述情况下本申请根据服务器功耗评价信息将此时功耗占比较大的部件作为关键部件,保留关键部件的功耗并对除关键部件之外的部件进行功耗限制操作,以降低服务器的整体功耗,使得第二电源模块重新恢复不工作状态并作为第一电源模块的冗余电源。可见本申请能够合理调节服务器中各部件功耗,保持服务器的电源冗余。本申请同时还提供了一种服务器功耗控制系统、一种电子设备和一种存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种服务器功耗控制方法的流程图;
图2为本申请实施例所提供的一种基于自主学习的BMC整机功耗控制方法的原理图;
图3为本申请实施例所提供的一种服务器功耗控制系统的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面请参见图1,图1为本申请实施例所提供的一种服务器功耗控制方法的流程图。
具体步骤可以包括:
S101:当所述第二电源模块为所述第一电源模块的冗余电源时,记录所述服务器在当前功耗场景的功耗分配信息;
其中,本实施例可以应用于基板管理控制器BMC(Baseboard ManagementController),所述基板管理控制器BMC所在的服务器包括第一电源模块和第二电源模块。本实施例中的服务器采用电源1+1冗余机制,在电源1+1冗余机制下,第一电源模块为服务器提供电源,第二电源模块不为服务器提供电源,第二电源模块作为第一电源模块的冗余电源。当第一电源模块故障或服务器需求的电源负载量大于第一电源模块所能够提供的电源负载时,可以启用第二电源模块为服务器提供电源,当第二电源模块为服务器提供电源时服务器不存在冗余电源,故此时电源1+1冗余机制已失效。
当所述第二电源模块为所述第一电源模块的冗余电源时,本步骤记录服务器在当前功耗场景的功耗分配信息。本实施例中的功耗场景为一段时间内服务器的各个部件的功耗占比均处于稳定值对应的场景,也可以为某一部件的使用率处于较大值时对应的场景,例如当GPU利用率大于第一预设值时,判定当前功耗场景为使用GPU算力的场景;或,当CPU利用率大于第二预设值时,判定当前功耗场景为使用CPU算力的场景。功耗分配信息可以包括服务器的整机功耗,还可以包括服务器的各个部件(如中央处理器CPU、内存、硬盘、图形处理器GPU)的功耗。
在本实施例中,第一电源模块为服务器的主电源模块,第二电源模块为所述服务器的备电源模块。还可以通过以下方式判断第二电源模块是否为第一电源模块的冗余电源:判断所述第二电源模块是否均处于工作状态;若是,则判定所述第二电源模块不为所述第一电源模块的冗余电源;若否,则判定所述第二电源模块为所述第一电源模块的冗余电源。
S102:根据所述当前功耗场景对应的时间段与功耗分配信息更新服务器功耗评价信息;
其中,在得到了当前功耗场景的功耗分配信息的基础上,本实施例可以引入时间参数,确定各个时间段与功耗分配信息的对应关系,得到服务器功耗评价信息。具体的,服务器功耗评价信息可以包括每一部件的功耗占比与时间的映射关系,所述功耗占比为所述部件的功耗与所述服务器的整体功耗之比。例如,在GPU算力的功耗场景下,GPU的功耗占比为60%,CPU的功耗占比为20%,内存的功耗占比为10%,硬盘的功耗占比为5%,GPU算力的功耗场景对应时间为10:00~12:00,由此得到的服务器功耗评价信息可以包括:在10:00~12:00内GPU的功耗占比为60%,CPU的功耗占比为20%,内存的功耗占比为10%,硬盘的功耗占比为5%。可以理解的是,服务器功耗评价信息可以为通过对当前功耗场景对应的时间段与功耗分配信息取平均值得到的信息,能够反映每一时间段下服务器各个部件的功耗状况。一般的,服务器功耗评价信息可以将24小时作为统计的周期,得到一天内各个部件的功耗占比随时间的变化状况。
作为一种可行的实施方式,BMC可以记录服务器首次开机预设周期(如24小时)内各个部件功耗占比与时间的映射关系,进而得到服务器功耗评价信息,若在下一周期内部件功耗占比与时间的映射关系发生变化,则可以取两个周期功耗占比的平均值得到平均功耗占比与时间的映射关系。
在本步骤中通过采样服务器中CPU、内存、GPU、硬盘等部件的功耗,获取用户使用习惯。包括用户在使用GPU算力时,CPU、内存、硬盘等功耗的使用情况;还包括当用户使用CPU算力时,GPU等部件的功耗情况,以及其他应用场景各个部件的功耗情况,通过结合时间因素获取各个时间段内用户的操作习惯,以及各个时间段内每个部件功耗的比例关系。
作为一种可行的实施方式,本实施例在工厂出货测试环节,BMC获取CPU、内存、GPU、硬盘以及整机最大功耗,以及获取电源最大输出功耗,记录作为服务器配置的基础数据,BMC内部设置限制功耗的默认数值以及自主学习算法。自主学习算法即能够实现根据当前功耗场景对应的时间段与功耗分配信息更新服务器功耗评价信息的算法,自主学习算法可以持续新型,当用户习惯改变将会进行新的学习,适应用户习惯,得到新的服务器功耗评价信息。
S103:当所述第二电源模块不为所述第一电源模块的冗余电源时,根据所述服务器功耗评价信息确定关键部件,并为所述关键部件分配当前时刻对应的功耗值,对除了所述关键部件之外的所述部件进行功耗限制操作。
其中,在用户强负载使用或者机房温度升高的情况下,第一电源模块和第二电源模块共同为服务器提供电能,此时服务器的电源1+1冗余机制已失效,为了恢复服务器的电源1+1冗余机制,本实施例需要对一部分的服务器部件进行功耗限制操作,但为了保证服务器的关键服务能够继续提供,本实施例根据所述服务器功耗评价信息确定关键部件。为所述关键部件分配当前时刻对应的功耗值,对除了所述关键部件之外的所述部件进行功耗限制操作,降低其他非关键部件的功耗值。通过上述操作能够降低服务器整机的功耗值,进而使得第二电源模块处于待机状态,成为第一电源模块的冗余电源,服务器恢复电源1+1冗余机制。
本实施例中的服务器包括第一电源模块和第二电源模块,当第二电源模块为第一电源模块的冗余电源时,说明第二电源模块尚未工作,此时第二电源模块可以作为第一电源模块的冗余,通过记录所述服务器在当前功耗场景的功耗分配信息,可以确定服务器中各个部件的功耗占比与时间的对应关系。当所述第二电源模块不为所述第一电源模块的冗余电源时,说明第一电源模块和第二电源模块共同为服务器提供电能,服务器此时不存在冗余电源,在上述情况下本实施例根据服务器功耗评价信息将此时功耗占比较大的部件作为关键部件,保留关键部件的功耗并对除关键部件之外的部件进行功耗限制操作,以降低服务器的整体功耗,使得第二电源模块重新恢复不工作状态并作为第一电源模块的冗余电源。可见本实施例能够合理调节服务器中各部件功耗,保持服务器的电源1+1冗余。
作为对于图1对应实施例的进一步介绍,在所述服务器进行出厂测试时,还可以获取每一所述部件的最大功耗值和服务器整机最大功耗值,将所述部件的最大功耗值与所述服务器整机最大功耗值之比作为初始功耗占比,并将所述初始功耗占比设置为所述服务器功耗评价信息的初始值。
可以理解的是,在服务器初次使用后的一段时间内,通过S102得到的服务器功耗评价信息可能存在信息不完整的情况,例如在服务器初次使用的12小时内仅得到了8:00~20:00内各个时间段与功耗分配信息的对应关系,若在8:10时第二电源模块不为第一电源模块的冗余电源,此时可以根据出厂测试得到的初始功耗占比确定关键部件,进而实现功耗控制。
作为对于图1对应实施例的进一步介绍,可以根据功耗占比确定服务器中的关键部件,以便保留关键部件的全部功耗,具体过程如下:根据所述服务器功耗评价信息确定当前时刻下所有所述部件的功耗占比排序信息;根据所述功耗占比排序信息将功耗占比前N位的部件作为所述关键部件。
例如,在3月10日16:00服务器的电源1+1冗余失效,根据服务器功耗评价信息确定在过去的7天内每天的16:00时CPU、内存、GPU、硬盘的功耗占比分别为70%、5%、5%和10%,若N=1则将CPU作为关键部件并将内存、GPU和硬盘作为非关键部件,若N=2则将CPU和硬盘作为关键部件并将内存和GPU作为非关键部件。
作为对于图1对应实施例的进一步介绍,S103中为所述关键部件和除了所述关键部件之外的所述部件分配功耗值的操作可以包括:
步骤1:根据所述服务器功耗评价信息确定当前时刻下所述关键部件对应的功耗占比和服务器总功耗,根据所述服务器总功耗和所述功耗占比为所述关键部件分配对应的功耗值。
步骤2:将所述第一电源模块提供的最大功耗减去所述为所述关键部件分配的功耗值得到剩余可分配功耗;
步骤3:确定其他部件之间的功耗比例;其中,所述其他部件为除了所述关键部件之外的所述部件;
步骤4:根据所述功耗比例将所述剩余可分配功耗分配至对应的所述其他部件;其中,所述其他部件被分配的剩余可分配功耗与所述功耗比例正相关。
通过上述方式,可以在电源1+1冗余失效时实时保留关键部件的功耗,对其他部件功耗进行限制,功耗限制操作即降低对应部件功耗的操作,保证第二电源模块重新作为第一电源模块的冗余电源,服务器恢复电源1+1冗余。本实施例所提到的为某部件分配功耗指设置允许该部件产生的最大功耗值,可以通过控制部件的功率实现功耗限制。
举例说明上述实施方式:
例如服务器内仅CPU、内存、GPU、硬盘存在功耗,在3月10日16:00时由于新添加一块硬盘增加功耗导致服务器的电源1+1冗余失效,根据服务器功耗评价信息确定在过去的7天内每天的16:00时CPU、内存、GPU、硬盘的功耗占比分别为70%、5%、5%和10%,服务器总功耗为2000W。此时选择CPU作为关键部件,可以为CPU分配1400W的功耗,第一电源模块提供的最大功耗为1500W,剩余可分配功耗为100W,可以为内存分配25W功耗,为GPU分配25W的功耗,为硬盘分配50W的功耗,保证第二电源模块重新作为第一电源模块的冗余电源,服务器恢复电源1+1冗余。
请参见图2,图2为本申请实施例所提供的一种基于自主学习的BMC整机功耗控制方法的原理图。在工厂出货测试环节,BMC获取CPU、内存、GPU、硬盘以及整机最大功耗,以及获取电源最大输出功耗,记录作为服务器配置的基础数据,BMC内部设置限制功耗的默认数值以及自主学习算法。在用户使用之后,BMC采样CPU、内存、GPU、硬盘、GPU等部件的功耗,获取用户使用习惯,比如用户在使用GPU算力时,CPU、内存、硬盘等功耗的使用情况;当用户使用CPU算力时,GPU等部件的功耗情况,以及其他应用场景各个部件的功耗情况,结合时间因素可以获取各个时间段因为用户的操作习惯,以及每个部件功耗的对比关系,当电源1+1冗余失效时,BMC可以实时保留关键部件的功耗,对其他部件功耗进行限制,保证电源1+1冗余。而且BMC中的自主学习算法可以持续进行,当用户习惯改变将会进行新的学习,可以适应用户习惯。
请参见图3,图3为本申请实施例所提供的一种服务器功耗控制系统的结构示意图;应用于基板管理控制器BMC,所述基板管理控制器BMC所在的服务器包括第一电源模块和第二电源模块,所述服务器功耗控制系统包括:
功耗分配记录模块100,用于当所述第二电源模块为所述第一电源模块的冗余电源时,记录所述服务器在当前功耗场景的功耗分配信息;
功耗评价信息更新模块200,用于根据所述当前功耗场景对应的时间段与功耗分配信息更新服务器功耗评价信息;其中,所述服务器功耗评价信息包括每一部件的功耗占比与时间的映射关系,所述功耗占比为所述部件的功耗与所述服务器的整体功耗之比;
功耗控制模块300,用于当所述第二电源模块不为所述第一电源模块的冗余电源时,根据所述服务器功耗评价信息确定关键部件,并为所述关键部件分配当前时刻对应的功耗值,对除了所述关键部件之外的所述部件进行功耗限制操作。
本实施例中的服务器包括第一电源模块和第二电源模块,当第二电源模块为第一电源模块的冗余电源时,说明第二电源模块尚未工作,此时第二电源模块可以作为第一电源模块的冗余,通过记录所述服务器在当前功耗场景的功耗分配信息,可以确定服务器中各个部件的功耗占比与时间的对应关系。当所述第二电源模块不为所述第一电源模块的冗余电源时,说明第一电源模块和第二电源模块共同为服务器提供电能,服务器此时不存在冗余电源,在上述情况下本实施例根据服务器功耗评价信息将此时功耗占比较大的部件作为关键部件,保留关键部件的功耗并对除关键部件之外的部件进行功耗限制操作,以降低服务器的整体功耗,使得第二电源模块重新恢复不工作状态并作为第一电源模块的冗余电源。可见本实施例能够合理调节服务器中各部件功耗,保持服务器的电源冗余。
进一步的,还包括:
初始值设置模块,用于在所述服务器进行出厂测试时,获取每一所述部件的最大功耗值和服务器整机最大功耗值;将所述部件的最大功耗值与所述服务器整机最大功耗值之比作为初始功耗占比,并将所述初始功耗占比设置为所述服务器功耗评价信息的初始值。
进一步的,所述第一电源模块为所述服务器的主电源模块,所述第二电源模块为所述服务器的备电源模块;
相应的,还包括:
冗余判断模块,用于判断所述第二电源模块是否均处于工作状态;若是,则判定所述第二电源模块不为所述第一电源模块的冗余电源;若否,则判定所述第二电源模块为所述第一电源模块的冗余电源。
进一步的,功耗控制模块300包括:
关键部件确定单元,用于根据所述服务器功耗评价信息确定当前时刻下所有所述部件的功耗占比排序信息;还用于根据所述功耗占比排序信息将功耗占比前N位的部件作为所述关键部件。
进一步的,还包括:
场景划分模块,用于当GPU利用率大于第一预设值时,判定当前功耗场景为使用GPU算力的场景;当CPU利用率大于第二预设值时,判定当前功耗场景为使用CPU算力的场景。
进一步的,功耗控制模块300包括:
关键部件功耗分配单元,用于根据所述服务器功耗评价信息确定当前时刻下所述关键部件对应的功耗占比和服务器总功耗,根据所述服务器总功耗和所述功耗占比为所述关键部件分配对应的功耗值。
非关键部件功耗分配单元,用于将所述第一电源模块提供的最大功耗减去所述为所述关键部件分配的功耗值得到剩余可分配功耗;确定其他部件之间的功耗比例;其中,所述其他部件为除了所述关键部件之外的所述部件;根据所述功耗比例将所述剩余可分配功耗分配至对应的所述其他部件;其中,所述其他部件被分配的剩余可分配功耗与所述功耗比例正相关。
由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本申请还提供了一种存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供了一种电子设备,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种服务器功耗控制方法,其特征在于,应用于基板管理控制器BMC,所述基板管理控制器BMC所在的服务器包括第一电源模块和第二电源模块,所述服务器功耗控制方法包括:
当所述第二电源模块为所述第一电源模块的冗余电源时,记录所述服务器在当前功耗场景的功耗分配信息;
根据所述当前功耗场景对应的时间段与功耗分配信息更新服务器功耗评价信息;其中,所述服务器功耗评价信息包括每一部件的功耗占比与时间的映射关系,所述功耗占比为所述部件的功耗与所述服务器的整体功耗之比;
当所述第二电源模块不为所述第一电源模块的冗余电源时,根据所述服务器功耗评价信息确定关键部件,并为所述关键部件分配当前时刻对应的功耗值,对除了所述关键部件之外的所述部件进行功耗限制操作。
2.根据权利要求1所述服务器功耗控制方法,其特征在于,还包括:
在所述服务器进行出厂测试时,获取每一所述部件的最大功耗值和服务器整机最大功耗值;
将所述部件的最大功耗值与所述服务器整机最大功耗值之比作为初始功耗占比,并将所述初始功耗占比设置为所述服务器功耗评价信息的初始值。
3.根据权利要求1所述服务器功耗控制方法,其特征在于,所述第一电源模块为所述服务器的主电源模块,所述第二电源模块为所述服务器的备电源模块;
相应的,还包括:
判断所述第二电源模块是否均处于工作状态;
若是,则判定所述第二电源模块不为所述第一电源模块的冗余电源;
若否,则判定所述第二电源模块为所述第一电源模块的冗余电源。
4.根据权利要求1所述服务器功耗控制方法,其特征在于,根据所述服务器功耗评价信息确定关键部件包括:
根据所述服务器功耗评价信息确定当前时刻下所有所述部件的功耗占比排序信息;
根据所述功耗占比排序信息将功耗占比前N位的部件作为所述关键部件。
5.根据权利要求1所述服务器功耗控制方法,其特征在于,还包括:
当GPU利用率大于第一预设值时,判定当前功耗场景为使用GPU算力的场景;
当CPU利用率大于第二预设值时,判定当前功耗场景为使用CPU算力的场景。
6.根据权利要求1至5任一项所述服务器功耗控制方法,其特征在于,为所述关键部件分配当前时刻对应的功耗值,包括:
根据所述服务器功耗评价信息确定当前时刻下所述关键部件对应的功耗占比和服务器总功耗,根据所述服务器总功耗和所述功耗占比为所述关键部件分配对应的功耗值。
7.根据权利要求6所述服务器功耗控制方法,其特征在于,对除了所述关键部件之外的所述部件进行功耗限制操作包括:
将所述第一电源模块提供的最大功耗减去所述为所述关键部件分配的功耗值得到剩余可分配功耗;
确定其他部件之间的功耗比例;其中,所述其他部件为除了所述关键部件之外的所述部件;
根据所述功耗比例将所述剩余可分配功耗分配至对应的所述其他部件;其中,所述其他部件被分配的剩余可分配功耗与所述功耗比例正相关。
8.一种服务器功耗控制系统,其特征在于,应用于基板管理控制器BMC,所述基板管理控制器BMC所在的服务器包括第一电源模块和第二电源模块,所述服务器功耗控制系统包括:
功耗分配记录模块,用于当所述第二电源模块为所述第一电源模块的冗余电源时,记录所述服务器在当前功耗场景的功耗分配信息;
功耗评价信息更新模块,用于根据所述当前功耗场景对应的时间段与功耗分配信息更新服务器功耗评价信息;其中,所述服务器功耗评价信息包括每一部件的功耗占比与时间的映射关系,所述功耗占比为所述部件的功耗与所述服务器的整体功耗之比;
功耗控制模块,用于当所述第二电源模块不为所述第一电源模块的冗余电源时,根据所述服务器功耗评价信息确定关键部件,并为所述关键部件分配当前时刻对应的功耗值,对除了所述关键部件之外的所述部件进行功耗限制操作。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1至7任一项所述服务器功耗控制方法的步骤。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上权利要求1至7任一项所述服务器功耗控制方法的步骤。
CN202010176098.1A 2020-03-13 2020-03-13 一种服务器功耗控制方法、系统、电子设备及存储介质 Active CN111399622B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010176098.1A CN111399622B (zh) 2020-03-13 2020-03-13 一种服务器功耗控制方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010176098.1A CN111399622B (zh) 2020-03-13 2020-03-13 一种服务器功耗控制方法、系统、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111399622A true CN111399622A (zh) 2020-07-10
CN111399622B CN111399622B (zh) 2021-11-09

Family

ID=71428830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010176098.1A Active CN111399622B (zh) 2020-03-13 2020-03-13 一种服务器功耗控制方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111399622B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114461048A (zh) * 2022-01-07 2022-05-10 苏州浪潮智能科技有限公司 一种psu冗余模式设置方法、装置及其介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7340620B2 (en) * 2005-05-10 2008-03-04 Hewlett-Packard Development Company, L.P. Rapid load reduction for power-over-LAN system using lower and higher priority states for ports
US20100211807A1 (en) * 2009-02-17 2010-08-19 Shunsuke Akimoto Power distribution system and method thereof
CN101937264A (zh) * 2010-08-27 2011-01-05 北京星网锐捷网络技术有限公司 电源功率管理方法、装置及模块化设备
CN102023694A (zh) * 2009-09-15 2011-04-20 联想(北京)有限公司 电源管理装置、电子设备和电源管理方法
US8010617B2 (en) * 2005-11-22 2011-08-30 Dell Products L.P. Securing serial console redirection via serial-over-LAN (SOL)
US20130227310A1 (en) * 2012-02-29 2013-08-29 Quanta Computer Inc. Server power system
CN104168122A (zh) * 2014-08-20 2014-11-26 浪潮电子信息产业股份有限公司 一种降低系统轻载功耗的服务器电源冗余方法
CN104216307A (zh) * 2013-05-31 2014-12-17 沁园集团股份有限公司 家庭电能分配控制系统及方法
CN104423528A (zh) * 2013-08-30 2015-03-18 鸿富锦精密工业(深圳)有限公司 数据中心电源调配方法及系统
CN104777886A (zh) * 2008-02-15 2015-07-15 惠普开发有限公司 改变数据处理设备的功率状态以满足冗余准则
CN109116959A (zh) * 2017-06-23 2019-01-01 佛山市顺德区顺达电脑厂有限公司 电源供应系统
CN110147155A (zh) * 2019-05-21 2019-08-20 苏州浪潮智能科技有限公司 基于bmc的服务器电源冷冗余控制方法、装置及bmc

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7340620B2 (en) * 2005-05-10 2008-03-04 Hewlett-Packard Development Company, L.P. Rapid load reduction for power-over-LAN system using lower and higher priority states for ports
US8010617B2 (en) * 2005-11-22 2011-08-30 Dell Products L.P. Securing serial console redirection via serial-over-LAN (SOL)
CN104777886A (zh) * 2008-02-15 2015-07-15 惠普开发有限公司 改变数据处理设备的功率状态以满足冗余准则
US20100211807A1 (en) * 2009-02-17 2010-08-19 Shunsuke Akimoto Power distribution system and method thereof
CN102023694A (zh) * 2009-09-15 2011-04-20 联想(北京)有限公司 电源管理装置、电子设备和电源管理方法
CN101937264A (zh) * 2010-08-27 2011-01-05 北京星网锐捷网络技术有限公司 电源功率管理方法、装置及模块化设备
US20130227310A1 (en) * 2012-02-29 2013-08-29 Quanta Computer Inc. Server power system
CN104216307A (zh) * 2013-05-31 2014-12-17 沁园集团股份有限公司 家庭电能分配控制系统及方法
CN104423528A (zh) * 2013-08-30 2015-03-18 鸿富锦精密工业(深圳)有限公司 数据中心电源调配方法及系统
CN104168122A (zh) * 2014-08-20 2014-11-26 浪潮电子信息产业股份有限公司 一种降低系统轻载功耗的服务器电源冗余方法
CN109116959A (zh) * 2017-06-23 2019-01-01 佛山市顺德区顺达电脑厂有限公司 电源供应系统
CN110147155A (zh) * 2019-05-21 2019-08-20 苏州浪潮智能科技有限公司 基于bmc的服务器电源冷冗余控制方法、装置及bmc

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114461048A (zh) * 2022-01-07 2022-05-10 苏州浪潮智能科技有限公司 一种psu冗余模式设置方法、装置及其介质
CN114461048B (zh) * 2022-01-07 2023-08-04 苏州浪潮智能科技有限公司 一种psu冗余模式设置方法、装置及其介质

Also Published As

Publication number Publication date
CN111399622B (zh) 2021-11-09

Similar Documents

Publication Publication Date Title
US20210224114A1 (en) Capacity Analysis Using Closed-System Modules
CN1969248B (zh) 用于管理服务器的功耗的方法和装置
Meng et al. Efficient resource provisioning in compute clouds via vm multiplexing
CN109918194A (zh) 智能化扩容缩容方法、装置、计算机设备及存储介质
CN111818159B (zh) 数据处理节点的管理方法、装置、设备及存储介质
US9870269B1 (en) Job allocation in a clustered environment
US20110302578A1 (en) System and method for virtual machine multiplexing for resource provisioning in compute clouds
CN104407926B (zh) 一种云计算资源的调度方法
US20100251254A1 (en) Information processing apparatus, storage medium, and state output method
CN111625080B (zh) 一种服务器节能方法、装置及电子设备和存储介质
US20130185717A1 (en) Method and system for managing power consumption due to virtual machines on host servers
CN111966449B (zh) 一种虚拟机备份管理方法、系统、终端及存储介质
CN113688001B (zh) 服务器硬盘功耗动态均衡方法、装置、终端及存储介质
EP2712122A1 (en) Energy saving monitoring method and device
CN111399622B (zh) 一种服务器功耗控制方法、系统、电子设备及存储介质
CN113342827A (zh) 一种基于多租户技术的电网数据存储方法、存储介质及系统
CN110347546B (zh) 监控任务动态调整方法、装置、介质及电子设备
CN109389522B (zh) 一种柔性负荷的能量区块化方法及系统
JP6935005B2 (ja) 需給管理装置、プログラム、及び需給管理方法
CN114817134A (zh) 一种快照任务监控方法、装置、设备及介质
EP3761175B1 (en) Method and apparatus for managing application program
CN110399216B (zh) 一种整机箱功耗的分配方法、系统、装置及可读存储介质
CN113888228A (zh) 一种配电网运行特点的表征方法及装置
CN113521753A (zh) 系统资源调节方法、装置、服务器及存储介质
US11823294B1 (en) Site management apparatus and management method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant