CN109917900B - 系统电源管理方法及计算机系统 - Google Patents

系统电源管理方法及计算机系统 Download PDF

Info

Publication number
CN109917900B
CN109917900B CN201711285374.2A CN201711285374A CN109917900B CN 109917900 B CN109917900 B CN 109917900B CN 201711285374 A CN201711285374 A CN 201711285374A CN 109917900 B CN109917900 B CN 109917900B
Authority
CN
China
Prior art keywords
power consumption
power
node
real
sum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711285374.2A
Other languages
English (en)
Other versions
CN109917900A (zh
Inventor
王伟丞
张家政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technical Steel Technology Co ltd
Original Assignee
Technical Steel Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technical Steel Technology Co ltd filed Critical Technical Steel Technology Co ltd
Priority to CN201711285374.2A priority Critical patent/CN109917900B/zh
Publication of CN109917900A publication Critical patent/CN109917900A/zh
Application granted granted Critical
Publication of CN109917900B publication Critical patent/CN109917900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Power Sources (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本公开提供一种系统电源管理方法,应用于一计算机系统。所述方法取得多个电源供应单元及多个运算节点的功率输出及功耗状态,而间接取得附属装置的实时附属功耗,据以持续更新附属装置的最大附属功耗。当电源供应单元其中之一为异常,重新取得其余的所述电源供应单元的剩余最大输出功率总和,并以剩余最大输出功率总和减去最大附属功耗,作为所述运算节点的一第一节点功耗总和。最后,依据第一节点功耗总和,调降所述运算节点至少其中之一的功耗为一第一节点功耗。本公开提供的系统电源管理方法可以在停用异常的电源供应单元之后,仍然尽可能地维持系统效能,而有助于计算机系统的系统稳定。

Description

系统电源管理方法及计算机系统
技术领域
本发明有关于多电源供应单元的控制,特别涉及一种系统电源管理方法及应用该方法的计算机系统。
背景技术
在服务器系统或是高速运算主机中,通常会采用两个以上电源供应单元构成的冗余电源供应单元,来满足电源供应的需求,使电源供应单元彼此互为备援电源。每一个电源供应单元都可以单独供应完整的系统电功率消耗需求。例如系统最大的总电功率消耗为2200W时,则每一个电源供应单元都能提供2200W的最大输出。当任一电源供应单元异常时,另一个电源供应单元也可以维持系统的正常运行。但是,若所有的电源供应单元都正常时,过高的冗余电功率就会形成电源资源的浪费,如前述的例子中,就会有2200W的冗余电力形成不必要的闲置。
针对上述问题,现有技术中是采用个别最大输出功率较小的电源供应单元,使得多个电源供应单元的最大输出功率总和等于或略大于系统电力消耗的最大值;每一个电源供应单元的个别最大输出功率都可以被充分利用,使得电源资源不会被闲置。当个别电源供应单元出现异常时,系统就会使该电源供应单元离线不再供电,同时将系统运行模式切换为极低频率模式(Ultra-Low Frequency Mode,ULFM),此时系统效能快速降低。然而,来自外界存取或要求提供服务所需的消耗电源不必然会同时降低,进而造成系统运行的不稳定。
发明内容
鉴于上述问题,本发明提出一种系统电源管理方法以及应用该方法的计算机系统,可解决现有技术中冗余电源功率的浪费或是降频操作产生的问题。
本发明提出一种系统电源管理方法,包含下列步骤:取得多个电源供应单元的一最大输出功率总和。分别取得电源供应单元的一个别实时输出功率以及多个运算节点的一实时节点功耗,加总各个别实时输出功率作为一实时输出功率总和以及加总各该加总实时节点功耗作为一实时功耗总和,以实时输出功率总和及实时功耗总和的一差值,作为一附属装置的实时附属功耗。持续取得实时附属功耗,以更新附属装置的一最大附属功耗。检测各电源供应单元是否异常。
当所述电源供应单元其中之一为异常,从其余的所述电源供应单元取得一剩余最大输出功率总和;以剩余最大输出功率总和减去最大附属功耗,作为所述运算节点的一第一节点功耗总和;以及依据该第一功耗总和,调降所述运算节点至少其中之一的功耗为一第一节点功耗。
在本发明一或多个实施例中,更新最大附属功耗的步骤包含:记录附属装置的一第一实时附属功耗以作为最大附属功耗,并持续取得附属装置的一第二实时附属功耗;以及比较第二实时附属功耗以及最大附属功耗,当第二实时附属功耗大于最大附属功耗,以第二实时附属功耗取代最大附属功耗。
在本发明一或多个实施例中,调降所述运算节点至少其中之一的功耗为第一节点功耗的步骤包含:以第一节点功耗总和,平均分配给运算节点。
在本发明一或多个实施例中,调降所述运算节点至少其中之一的功耗为该第一节点功耗的步骤包含:将所述运算节点分组为一主要群及一次要群;以及以第一节点功耗总和减去主要群的实时节点功耗后,平均分配给次要群。
在本发明一或多个实施例中,若检测各电源供应单元已无异常状态,停止调降所述运算节点至少其中之一的功耗为该第一节点功耗。
在本发明一或多个实施例中,当所述电源供应单元其中之一为异常之后,若实时输出功率总和不大于剩余最大输出功率总和,则维持各运算节点的实时节点功耗。
在本发明一或多个实施例中,调降所述运算节点至少其中之一的功耗为该第一节点功耗的步骤包含:将所述运算节点分组为一主要群及一次要群;以及判断一电源控制模式是否被启动。若电源控制模式被启动,以第一节点功耗总和减去主要群的该实时节点功耗后,平均分配给次要群;若电源控制模式未被启动,以第一节点功耗总和平均分配给主要群以及次要群。
在本发明一或多个实施例中,调降所述运算节点至少其中之一的功耗为该第一节点功耗的步骤后还包含:在一预设时间区间取得附属装置的最大附属功耗;于该预设时间区间后,判断在预设时间区间的最大附属功耗,是否小于在预设时间区间之前最大附属功耗;根据判断结果,依据预设时间区间的最大附属功耗,取得一第二节点功耗总和;以及依据第二节点功耗总和,重新调整被调整的运算节点的功耗为一第二节点功耗。
在本发明一或多个实施例中,检测各该电源供应单元是否异常的步骤包含:以各电源供应单元持续发出状态正常信号;以及当状态正常信号中断,判断电源供应单元为异常。
在本发明一或多个实施例中,检测各该电源供应单元是否异常的步骤包含:在电源供应单元发生异常时,电源供应单元发出一警示信息,于接收警示信息后判断电源供应单元为异常。
本发明还提出一种计算机系统,执行系统电源管理系统。所述计算机系统包含多个电源供应单元、多个运算节点、至少一附属装置以及一管理控制装置。所述电源供应单元分别用以提供一电力,且各电源供应单元分别具有一个别最大输出功率,而加总为一最大输出功率总和,且各电源供应单元可回报一个别实时功率输出,而加总为一实时功率输出总和。所述运算节点分别提供一运算功能,所述运算节点分别自所述电源供应单元取得电力,各运算节点可分别回报一实时消耗功率,而加总为一实时功耗总和。附属装置由所述电源供应单元取得电力,且附属装置具有一实时附属功耗及一最大附属功耗。管理控制装置用以连接并控制所述电源供应单元及所述运算节点,并且取得最大输出功率总和、实时输出功率总和以及实时功耗总和;其中,管理控制装置依据实时功率输出总和以及实时功耗总和的一差值,得到实时附属功耗,并以实时附属功耗的变化,持续更新最大附属功耗。
其中,当管理控制装置检测所述电源供应单元其中之一为异常,管理控制装置从其余的所述电源供应单元取得一剩余最大输出功率总和,以剩余最大输出功率总和减去最大附属功耗,作为所述运算节点的一第一节点功耗总和,依据一第一节点功耗总和,调降所述运算节点至少其中之一的功耗为一第一节点功耗。
在本发明一或多个实施例中,管理控制装置记录该附属装置的一第一实时附属功耗以作为该最大附属功耗,并持续取得该附属装置的一第二实时附属功耗,该管理控制装置还比较第二实时附属功耗以及最大附属功耗,当第二实时附属功耗大于最大附属功耗,以第二实时附属功耗取代最大附属功耗。
在本发明一或多个实施例中,管理控制装置以第一节点功耗总和,平均分配给运算节点。
在本发明一或多个实施例中,所述运算节点分组为一主要群及一次要群,管理控制装置以第一节点功耗总和减去主要群的该实时节点功耗后,平均分配给次要群。
在本发明一或多个实施例中,若检测各电源供应单元已无异常状态,管理控制装置停止调降所述运算节点至少其中之一的功耗为该第一节点功耗。
在本发明一或多个实施例中,当所述电源供应单元其中之一为异常,且实时输出功率总和不大于该剩余最大输出功率总和,管理控制装置维持各运算节点的实时节点功耗。
在本发明一或多个实施例中,所述运算节分组为一主要群及一次要群,且管理控制装置判断一电源控制模式是否被启动;若电源控制模式被启动,管理控制装置以第一节点功耗总和减去主要群的实时节点功耗后,平均分配给次要群;若电源控制模式未被启动,管理控制装置以第一节点功耗总和平均分配给主要群以及次要群。
在本发明一或多个实施例中,于调降所述运算节点至少其中之一的功耗为第一节点功耗后,管理控制装置在一预设时间区间,取得附属装置的最大附属功耗;于预设时间区间后,管理控制装置判断在预设时间区间的最大附属功耗,是否小于在预设时间区间之前的最大附属功耗;根据判断结果,管理控制装置依据预设时间区间的最大附属功耗,取得一第二节点功耗总和,并且依据第二节点功耗总和,调整被调整的运算节点的功耗为一第二节点功耗。
在本发明一或多个实施例中,各电源供应单元持续发出一状态正常信号,当状态正常信号中断,管理控制装置判断电源供应单元为异常。
在本发明一或多个实施例中,在各电源供应单元发生异常时,电源供应单元发出一警示信息,管理控制装置于接收警示信息后判断电源供应单元为异常。
依据本发明的系统电源管理方法以及计算机系统,计算机系统中的电源供应状态、电源功耗状态,都被实时检测并记录。因此,当电源供应单元异常时,可以精准快速地估算需要功耗调整值,并且选择性地针对负载较轻的运算节点降低容许功耗,而维持其他运算节点的容许功耗。因此,计算机系统的整体运算效能,可以在停用异常的电源供应单元之后,仍然尽可能地维持系统效能,而有助于计算机系统的稳定。
附图说明
图1为本发明第一实施例的计算机系统的电路方框图。
图2及图3为本发明第一实施例的系统电源管理方法的流程图。
图4为本发明第二实施例的计算机系统的电路方框图。
图5至图9为本发明第二实施例的系统电源管理方法的流程图。
附图标记说明:
100       计算机系统
110       管理控制装置        120,120a,120b    运算节点
122       中央处理器          124              系统芯片组
124a      路径控制器          124b             主机板管理控制器
124c      逻辑芯片            126              存储器
130       电源供应单元        140              附属装置
步骤110~步骤292步骤
具体实施方式
请参阅图1所示,为本发明第一实施例所提供的一种计算机系统100的电路方框图,执行系统电源管理方法。所述计算机系统100包含一管理控制装置110(ChassisManagement Control,CMC)、多个运算节点120、多个电源供应单元130(Power SupplyUnit,PSU)以及至少一个附属装置140。
如图1所示,多个运算节点120分别提供一运算功能,以执行计算机系统的一或多个服务。各运算节点120分别电性连接于管理控制装置110,以供管理控制装置110统合操作管理,以分配工作处理程序以及运算节点120之间的系统资源调度。
如图1所示,各运算节点120电性连接至各电源供应单元130,以取得电力;运算节点120通常为一主机板以及容置主机板的电脑机壳结构,而可抽换于计算机系统100的机壳。运算节点120包含中央处理器122、系统芯片组124、存储器126以及必要的总线。前述的总线包含但不限定于SMBus(System Management Bus,系统管理总线)、PMBus(PowerManagement Bus,电源管理总线)以及PECI(Platform Environmental ControlInterface,平台环境控制接口)。
图1所示的系统芯片组124组成为一范例,包含路径控制器124a(control hub)、主机板管理控制器124b(board management control,BMC)以及逻辑芯片124c(logic IC);路径控制器124a可为南桥芯片与北桥芯片的组合、平台路径控制器(platform control hub,PCH)、存储器控制器(Memory Controller Hub,MCH)、I/O路径控制器(I/O control hub,ICH)、AMD Fusion Controller Hub等。图1所示的系统芯片组124及其组成仅为范例,非用以限定实施方式,大致上只要用于处理中央处理器122与其他元件之间I/O作业的电路芯片皆为系统芯片组124。
如图1所示,运算节点120通过SMBus、PMBus以及其他协定的总线电性连接于管理控制装置110,以通过管理控制装置110对外进行连接。同时,管理控制装置110的控制运算节点120,以调度系统资源的应用。
于一具体实施例中,计算机系统100同时执行多个服务程序,而每一服务程序分别由一组运算节点120群执行,每一群包含一或多个运算节点120。
如图1所示,多个电源供应单元130分别用以提供电力,且各电源供应单元130分别具有一个别最大输出功率。各电源供应单元130可通过PMBus回报其个别最大输出功率、个别实时功率输出以及状态正常信号(PW_OK)给管理控制装置110,前述信息也可以通过PMBus进一步转发给各运算节点120的系统芯片组124。所述个别最大输出功率为电源供应单元130所能输出的功率最大值。所述电源供应单元130的个别最大输出功率的加总为一最大输出功率总和,而所述电源供应单元130的实时输出功率加总为一实时功率输出总和。
于一理想状态下,最大输出功率总和等于计算机系统100的最大功耗;实际的系统设计中,由于可由市场直接取得的电源供应单元130通常为固定规格,而非针对计算机系统100的功耗进行客制化,因此最大输出功率总和通常是略大于计算机系统100的最大功耗,以利于系统设计。举例而言,常见的计算机系统100会设置两个功率相同的电源供应单元130,当计算机系统100的最大功耗是3000W,而市场上可以取得的电源供应单元130的个别最大输出功率有1200W、1600W、2000W三种时,则个别最大输出功率是1600W的电源供应单元130会被选用,使得最大输出功率总和为3200W,略大于计算机系统100的最大功耗3000W。如此一来,电源供应单元130的配置可以满足计算机系统100的最大功耗3000W,又不会使得电源供应单元130的配置出现过度设计(over-design)。
如图1所示,附属装置140由所述电源供应单元130取得电力,且附属装置140具有一实时附属功耗及一最大附属功耗。于计算机系统100中,管理控制装置110通常无法直接由各种总线取得附属装置140的实时附属功耗及最大附属功耗。
在计算机系统100中,不属于管理控制装置110以及运算节点120的部分即为附属装置140。常见的附属装置140有硬盘机阵列、风扇阵列、可移除式存储媒体读取装置、电脑总线插卡(PCI Express card,PCIe card)等,或前述装置的任意组合,通过电脑总线插槽(PCI Express slot,PCIe slot)连接于一电路板,再通过一连接接口连接到管理控制装置110。需注意的是,有时候个别的硬盘机或风扇会直接设置于运算节点120中,或是直接连接于运算节点120的总线并由运算节点120取得电力,此时这些硬盘机或风扇就属于运算节点120的一部分,而不是附属装置140。在本实施例中,附属装置140以独立于各运算节点120之外的硬盘机阵列及风扇阵列的组合为范例进行说明。
如图1所示,管理控制装置110用以连接并控制电源供应单元130及运算节点120,并且取得最大输出功率总和、实时输出功率总和以及实时功耗总和。管理控制装置110依据实时功率输出总和以及实时功耗总和的一差值,得到实时附属功耗,亦即,实时功率输出总和以及实时功耗总和的差值即为实时附属功耗。管理控制装置110可持续取得实时附属功耗,并以实时附属功耗的变化,持续更新最大附属功耗。
参阅图2及图3所示,为本发明第一实施例的系统电源管理方法的流程图。
如图1及图2所示,计算机系统100于开机后,首先通过管理控制装置110进行功率参数检测阶段,如步骤110所示。于此阶段中,主要的目的是要取得跟功率输出以及功耗相关的参数。
如图1及图3所示,步骤110中,管理控制装置110取得的参数如下所述。以下叙述的顺序,不代表对各参数的取得顺序进行限制,所述参数的取得顺序可以任意变化。
管理控制装置110通过PMBus可以取得电源供应单元130的电源信息,包括软硬件规格以及实时的运行状态。因此,管理控制装置110可以取得多个电源供应单元130的个别最大输出功率以及个别实时输出功率,如步骤112所示。同时,通过PMBus接口进行连接,让各电源供应单元130持续发出状态正常信号(PW_OK)给管理控制装置110,若状态正常信号(PW_OK)中断,则管理控制装置110可判断电源供应单元130为异常。
前述步骤112中,检测电源供应单元130的个别最大输出功率的作业,可以是计算机系统100于开机时的初始化步骤的一部分。在系统开机初始化过程中,电源供应单元130可传送电源信息(包括软硬件规格以及实时的运行状态)给管理控制装置110,使得管理控制装置110在开机时就取得每一个电源供应单元130的个别最大输出功率。取得每一个电源供应单元130的个别最大输出功率之后,管理控制装置110即可通过加总计算取得所有电源供应单元130的最大输出功率总和,并将数值写入管理控制装置110的缓冲存储的一存储位址中。同样地,取得每一个电源供应单元130的个别实时输出功率之后,管理控制装置110即可通过加总计算取得所有电源供应单元130的实时输出功率总和,写入另一缓冲位址中。
再参阅图1及图3所示,同样通过PMBus或其他总线的连接,管理控制装置110取得各运算节点120的运行状态,包括各运算节点120的实时节点功耗,如步骤114。如前所述,管理控制装置110以PMBus连接于各运算节点120的主机板管理控制器124b,取得实时节点功耗以及容许功耗,从而加总所述实时功耗以得到多个运算节点120的实时功耗总和。
运算节点120的容许功耗不必然等于运算节点120的硬件规格的最大功耗,此一容许功耗可设定为比最大功耗来得小。
参阅图1以及图3所示,取得前述数值之后,管理控制装置110再计算所述电源供应单元130的实时输出功率总和以及所述运算节点120的实时功耗总和的一差值,以取得附属装置140的实时附属功耗,如步骤116。
参阅图1及图3所示,管理控制装置110持续取得附属装置140的实时附属功耗,以更新附属装置140的一最大附属功耗,如步骤118。
管理控制装置110以缓冲存储来记录附属装置140的最大附属功耗。更新附属装置140的最大附属功耗的方式为,管理控制装置110记录一第一实时附属功耗作为最大附属功耗,并记录于缓冲存储。接着,管理控制装置110持续取得附属装置140的一第二实时附属功耗。接着管理控制装置110比较附属装置的一第二实时附属功耗以及已记录于缓冲存储的最大附属功耗。当第二实时附属功耗大于已记录的最大附属功耗,管理控制装置以第二实时附属功耗取代已记录的最大附属功耗,而更新最大附属功耗。若第二实时附属功耗不大于缓冲存储中记录的最大附属功耗,则维持缓冲存储中记录的数值作为附属装置140的最大附属功耗。
参阅图1及图2所示,于相关参数取得之后,管理控制装置110开始监控所述电源供应单元130的运行,从而检测各电源供应单元130是否发生异常,如步骤120所示。
如图1以及图2所示,电源供应单元130本身会进行自我监控,而在其输出或输入发生异常状态时,例如,输出不稳定或输出功率无法提升,此时电源供应单元130可针对异常状态产生接口引脚的信号变化。管理控制装置110则通过PMBus或其他总线与电源供应单元130的连接,依据接口引脚的信号变化,检测各电源供应单元130是否异常,如步骤120所示。
如前所述,其中一种检测异常的方式是管理控制装置110通过PMBus的其中一个闲置引脚发出状态询问信号,由各电源供应单元130发出状态正常信号(PW_OK)进行回应,管理控制装置110则通过PMBus的闲置引脚由电源供应单元130接收状态正常信号(PW_OK)。当状态正常信号(PW_OK)中断,则管理控制装置110判断电源供应单元130发生异常。于另一实施例中,可通过PMbus中的数据引脚及时钟引脚检测状态,各电源供应单元130持续发出状态正常信号,管理控制装置110通过PMBus的数据引脚及时钟引脚由电源供应单元130接收状态正常信号。上述检测异常的方式亦可同时使用。
另一种检测异常的方式是对电源供应单元130进行可程序化设定。在电源供应单元130发生异常时,电源供应单元130通过PMBus发出一PMBusAlert作为一警示信息给管理控制装置110,管理控制装置110于接收警示信息判断电源供应单元130为异常。前述异常的事件包含电源供应单元130过热(Over Temperature)、电压过高(Over Voltage)、电压过低(Under Voltage)(例如:市电过低)、电流过高(Over Current),风扇异常(Fan fault)等。
如图1及图2所示,当所述电源供应单元130其中之一为异常,管理控制装置110就会从其余的电源供应单元130取得一剩余最大输出功率总和;接着管理控制装置110以剩余最大输出功率总和减去最大附属功耗,作为所述运算节点120的一第一节点消耗总和,如步骤130所示。
如图1及图2所示,最后,管理控制装置110依据第一节点功耗总和,调降所述运算节点120至少其中之一的功耗为一第一节点功耗,如步骤140所示。
所述运算节点120至少其中之一的功耗,是依据电源供应单元130的最大输出功率总和的变化而被调降为第一节点功耗,使得调整后的计算机系统100最大功耗,不会大于剩余最大输出功率总和。当被调降的运算节点120的数量为多个时,则依据平均分配功耗。亦即,第一节点功耗总和减去其他的所述运算节点120的实时节点功耗之后,平均分配给被调降的运算节点120。
上述的调整,尽可能地估算运算节点120还可以利用的输出功率,而差异性地针对特定一个或一个群的运算节点120进行功耗的调降,以使得电源供应单元130的剩余最大输出功率总和仍然可以满足计算机系统100的需求,同时尽可能让一部分的运算节点120维持原有的运算效能。
亦即,本公开精确地,仅针对特定运算节点120进行调降,而不是一次将所有的运算节点120都调整到低能耗模式,因此可以尽可能地维持系统效能。特别是原本负载就比较重的部分(例如提供文件服务器的运算节点120)仍可以维持原有的功耗模式,而次要系统(例如利用率较低的使用者帐号管理服务)则被选择性地开启功耗限制模式。如此一来,基于本发明的计算机系统100,在电源供应出现障碍时,只有部分的运算节点120被降频操作,因此系统整体运行效能不会快速被降低,而有助于计算机系统100暂时性地稳定运行。
请参阅图4所示,为本发明第二实施例所提供的一种计算机系统100的电路方框图,执行系统电源管理方法。于第二实施例的计算机系统100大致与第一实施例所示者相同,差异在于第二实施例的运算节点120a、120b进一步被分组,以利于精确的电源管理。
如图4所示,多个运算节点120a、120b被分组为主要群以及次要群。主要群包含至少一运算节点120a,次要群也包含至少一运算节点120b。图4中的主要群以及次要群分别包含一运算节点120a、120b仅为例示,实际上主要群以及次要群可以分别包含多个运算节点120a、120b。主要群以及次要群的分组原则,可以依据平均负载来区分。平均负载较重的运算节点120a可以分类为主要群的一部分,平均负载较轻的运算节点120b可以作为次要群的一部分。例如,在一个文件服务器中,用于提供使用者进行文件存取的运算节点120a分类为主要群,而用于管理使用者帐号信息的运算节点120b可以分类为次要群。
参阅图5至图9所示,为本发明第二实施例的系统电源管理方法的流程图。
如图5所示,第二实施例同样先以管理控制装置110执行功率参数检测阶段,如步骤210所示。
于步骤210中,管理控制装置110先取得多个电源供应单元130的一最大输出功率总和。接着管理控制装置110取得电源供应单元130的实时输出功率总和以及运算节点120a、120b的实时功耗总和,而以实时输出功率总和及实时功耗总和的一差值,作为一附属装置140的实时附属功耗。管理控制装置110又持续取得实时附属功耗,以更新附属装置140的一最大附属功耗。步骤210大致与第一实施例的步骤110相同,以下不再赘述。
如图5所示,于相关参数取得之后,管理控制装置110开始检测些电源供应单元130的运行,从而检测各电源供应单元130是否异常,如步骤220所示。
参阅图5及图6所示,若检测各电源供应单元130已无异常状态,则管理控制装置110进一步确认是否有启用容许功耗限制设定,亦即是否已经有运算节点120的功耗被调降第一实时节点功耗,若有,则解除容许功耗限制设定,亦即管理控制装置110停止调降运算节点120至少其中之一的功耗为第一节点功耗,并结束流程,如步骤221以及步骤223所示。
如图5所示,当所述电源供应单元130其中之一为异常,管理控制装置110取得其余的电源供应单元130的剩余最大输出功率总和,并判断实时输出功率总和是否大于剩余最大输出功率总和,如步骤222所示。
如图5及图6所示,若实时输出功率总和不大于剩余最大输出功率总和,则系统维持正常运行,亦即则维持各运算节点120的功耗,亦即不进行调降运算节点120功耗的功耗限制设定,如步骤225所示,并结束流程。
如图5所示,若实时输出功率总和大于剩余最大输出功率总和,则进一步判断一电源控制模式是否被启动,如步骤224所示。电源控制模式通常以计算机系统100的BIOS中的一设定位址记录,若设定位址数值为TRUE,则电源控制模式被启动,若设定位址数值为FALSE,则电源控制模式未启动。
如图5所示,若电源控制模式被启动时,管理控制装置110以电源供应单元130的剩余最大输出功率总和减去附属装置140的最大附属功耗,以重新取得所述运算节点120a,120b的第一节点功耗总和,如步骤230所示。
于步骤230中,主要群的运算节点120的功耗不作调整,管理控制模块110以第一节点功耗总和减去主要群的实时节点功耗后,平均分配给次要群的每一运算节点120。
如图5所示,最后,管理控制装置110依据第一节点功耗总和,对次要群的运算节点120设定第一节点功耗,调降次要群的功耗为第一节点功耗,如步骤240所示。通常的作法是,以第一节点功耗总和减去主要群的运算节点120的容许功耗后,平均分配给次要群的运算节点120,以作为该第一节点功耗。
附属装置140的最大附属功耗,例如硬盘阵列或风扇阵列的功耗,是会随着运算节点120的实时节点功耗下降而跟着下降。也就是说,当一或多个运算节点120的功耗被调降为第一节点功耗之后,附属装置140的最大附属功耗,实际上也会跟着下降。
因此,本发明还包含一功率释放流程,用以将被保留给附属装置140的功耗,释放出来提供给运算节点120。
请参阅图7所示,为本发明实施例的系统电源管理方法中的功率释放流程,其步骤说明如下。
如图7所示,于步骤240之后,管理控制装置110先记录容许功耗限制已经被设定并启用,如步骤250所示。
如图7以及图8所示,于运算节点120b的功率被调降为第一节点功耗之后,亦即设定容许功耗限制之后,管理控制装置110启动一计时作业,以一预设时间区间T开始倒数计时,等待预设时间区间T后再进行下一步骤,如步骤260所示。
参阅图7及图8所示,于一具体实施例中,附属装置140包含至少一风扇,而需等待预设时间区间T后再进行下一步骤的理由在于至少部分的运算节点120的功耗被调降为第一节点功耗之后,这些被调整的运算节点120发热量降低,计算机系统100内部的温度会开始重新平衡。大约于预设时间区间T后会到达新的平衡状态,使得风扇的运行状态到达一个新的平衡状态,一般而言,风扇的运行状态在30分钟(1800秒)后可到达热平衡状态。此时,附属装置140的最大附属功耗会下降,使得电源供应单元130的有多余的输出功率可以分配给运算节点120。具体的计时流程如图8的环路,如步骤262至步骤268所示。
如图7所示,接着管理控制装置110再次执行功率参数检测,取得附属装置140在预设时间区间T中的最大附属功耗,如步骤270所示。
如图7所示,然后,于预设时间区间T后,管理控制装置110判断在预设时间区间T的最大附属功耗,是否小于在预设时间区间T之前最大附属功耗,亦即,判断于预设时间区间T后,附属装置140的最大附属功耗是否下降,如步骤280所示。
如图7所示,根据判断结果,预设时间区间T的最大附属功耗,若小于预设时间区间T之前最大附属功耗,代表电源供应单元130的有多余的输出功率可以重新分配给运算节点120。此时,管理控制装置110依据预设时间区间T的最大附属功耗,取得一第二节点功耗总和,如步骤290所示。
如图7所示,然后,依据第二节点功耗总和,管理控制装置110重新调整次要群的运算节点120的功耗为第二节点功耗,如步骤292所示。然后,管理控制装置110记录新的功耗限制已经被设定并启用,如步骤294所示。之后,流程回到步骤260,再度启动启计时作业。
参阅图5以及图9所示,若步骤224中,若电源控制模式没有被启动,管理控制装置110仍然会执行运算节点120的功耗调整。此时,管理控制装置110计算第一节点功耗总和,亦即以剩余最大输出功率总和减去附属装置140的最大附属功耗,而取得一第一节点功耗总和,如步骤224a所示。接着,管理控制装置110以第一节点功耗总和平均分配给主要群以及次要群的运算节点120,而作为所述运算节点120的第一节点功耗,如步骤224b所示。最后,结束流程。
计算机系统100中的电源供应状态、电源功耗状态,都被实时检测并记录。因此,当电源供应单元130异常时,计算机系统100可以精准快速地估算需要功耗调整值,并且选择性地针对负载较轻的运算节点120/120b降低节点功耗,而维持其他运算节点120/120a的节点功耗。因此,计算机系统100的整体运算效能,可以在停用异常的电源供应单元之后,仍然尽可能地维持系统效能,而有助于计算机系统的系统稳定。

Claims (18)

1.一种系统电源管理方法,包含:
取得多个电源供应单元的一最大输出功率总和;
分别取得所述电源供应单元的一个别实时输出功率以及多个运算节点的一实时节点功耗,加总各该个别实时输出功率作为一实时输出功率总和以及加总各该实时节点功耗作为一实时功耗总和,以该实时输出功率总和及该实时功耗总和的一差值,作为一附属装置的一实时附属功耗;
持续取得该实时附属功耗,以更新该附属装置的一最大附属功耗;
检测各该电源供应单元是否异常;
当所述电源供应单元其中之一为异常,从其余的所述电源供应单元取得一剩余最大输出功率总和;
以该剩余最大输出功率总和减去该最大附属功耗,作为所述运算节点的一第一节点功耗总和;以及
依据该第一节点功耗总和,调降所述运算节点至少其中之一的功耗为一第一节点功耗;
其中,调降所述运算节点至少其中之一的功耗为该第一节点功耗的步骤包含:
将所述运算节点分组为一主要群及一次要群;
判断一电源控制模式是否被启动;
若该电源控制模式被启动,以该第一节点功耗总和减去该主要群的该实时节点功耗后,平均分配给该次要群;以及
若该电源控制模式未被启动,以该第一节点功耗总和平均分配给该主要群以及该次要群。
2.如权利要求1所述的系统电源管理方法,其中,更新该最大附属功耗的步骤包含:
记录该附属装置的一第一实时附属功耗以作为该最大附属功耗,并持续取得该附属装置的一第二实时附属功耗;以及
比较该第二实时附属功耗以及该最大附属功耗,当第二实时附属功耗大于该最大附属功耗,以该第二实时附属功耗取代该最大附属功耗。
3.如权利要求1所述的系统电源管理方法,其中,调降所述运算节点至少其中之一的功耗为该第一节点功耗的步骤包含:
以该第一节点功耗总和平均分配给所述运算节点。
4.如权利要求1所述的系统电源管理方法,其中,调降所述运算节点至少其中之一的功耗为该第一节点功耗的步骤包含:
将所述运算节点分组为一主要群及一次要群;以及
以该第一节点功耗总和减去该主要群的该实时节点功耗后,平均分配给该次要群。
5.如权利要求1所述的系统电源管理方法,其中,若检测各该电源供应单元已无异常状态,停止调降所述运算节点至少其中之一的功耗为该第一节点功耗。
6.如权利要求1所述的系统电源管理方法,其中,当所述电源供应单元其中之一为异常之后,若该实时输出功率总和不大于该剩余最大输出功率总和,则维持各该运算节点的该实时节点功耗。
7.如权利要求1所述的系统电源管理方法,其中,调降所述运算节点至少其中之一的功耗为该第一节点功耗的步骤后还包含:
在一预设时间区间,取得该附属装置的最大附属功耗;
于该预设时间区间后,判断在该预设时间区间的该最大附属功耗,是否小于在该预设时间区间之前的该最大附属功耗;
根据判断结果,依据该预设时间区间的该最大附属功耗,取得一第二节点功耗总和;以及
依据该第二节点功耗总和,调整被调整的该运算节点的功耗为一第二节点功耗。
8.如权利要求1所述的系统电源管理方法,其中,检测各该电源供应单元是否异常的步骤包含:
接收各该电源供应单元持续发出一状态正常信号;以及
当该状态正常信号中断,判断该电源供应单元为异常。
9.如权利要求1所述的系统电源管理方法,其中,检测各该电源供应单元是否异常的步骤包含:
在该电源供应单元发生异常时,该电源供应单元发出一警示信息,于接收该警示信息后判断该电源供应单元为异常。
10.一种计算机系统,包含:
多个电源供应单元,分别用以提供一电力,且各该电源供应单元分别具有一个别最大输出功率,而加总为一最大输出功率总和,且各该电源供应单元回报一个别实时功率输出,而加总为一实时功率输出总和;
多个运算节点,分别提供一运算功能,所述运算节点分别自所述电源供应单元取得该电力,且各该运算节点分别回报一实时节点功耗,而加总为一实时功耗总和;
一附属装置,由所述电源供应单元取得该电力,且该附属装置具有一实时附属功耗及一最大附属功耗;以及
一管理控制装置,用以连接并控制所述电源供应单元及所述运算节点,并且取得该最大输出功率总和、该实时功率输出总和以及该实时功耗总和;其中,该管理控制装置依据该实时功率输出总和以及该实时功耗总和的一差值,得到该实时附属功耗,并根据该实时附属功耗的变化,持续更新该最大附属功耗;
其中,当该管理控制装置检测所述电源供应单元其中之一为异常,该管理控制装置从其余的所述电源供应单元取得一剩余最大输出功率总和,并以该剩余最大输出功率总和减去该最大附属功耗,作为所述运算节点的一第一节点功耗总和;依据该第一节点功耗总和,调降所述运算节点至少其中之一的功耗为一第一节点功耗;
其中,所述运算节点分组为一主要群及一次要群,且该管理控制装置判断一电源控制模式是否被启动;
若该电源控制模式被启动,该管理控制装置以该第一节点功耗总和减去该主要群的该实时节点功耗后,平均分配给该次要群;以及
若该电源控制模式未被启动,该管理控制装置以该第一节点功耗总和平均分配给该主要群以及该次要群。
11.如权利要求10所述的计算机系统,其中,该管理控制装置记录该附属装置的一第一实时附属功耗以作为该最大附属功耗,并持续取得该附属装置的一第二实时附属功耗,且该管理控制装置还比较该第二实时附属功耗以及该最大附属功耗,当该第二实时附属功耗大于该最大附属功耗,以该第二实时附属功耗取代该最大附属功耗。
12.如权利要求10所述的计算机系统,其中,该管理控制装置以该第一节点功耗总和平均分配给所述运算节点。
13.如权利要求10所述的计算机系统,其中,所述运算节点分组为一主要群及一次要群,该管理控制装置以该第一节点功耗总和减去主要群的该实时节点功耗后,平均分配给该次要群。
14.如权利要求10所述的计算机系统,其中,若检测各该电源供应单元已无异常状态,该管理控制装置停止调降所述运算节点至少其中之一的功耗为该第一节点功耗。
15.如权利要求10所述的计算机系统,其中,当所述电源供应单元其中之一为异常,且该实时功率输出总和不大于该剩余最大输出功率总和,该管理控制装置维持各该运算节点的该实时节点功耗。
16.如权利要求10所述的计算机系统,其中,于调降所述运算节点至少其中之一的功耗为该第一节点功耗后,该管理控制装置在一预设时间区间,取得该附属装置的最大附属功耗;于该预设时间区间后,该管理控制装置判断在该预设时间区间的该最大附属功耗,是否小于在该预设时间区间之前的该最大附属功耗;根据判断结果,该管理控制装置依据该预设时间区间的该最大附属功耗,取得一第二节点功耗总和,并且依据该第二节点功耗总和,调整被调整的该运算节点的功耗为一第二节点功耗。
17.如权利要求10所述的计算机系统,其中,各该电源供应单元持续发出一状态正常信号,当该状态正常信号中断,该管理控制装置判断该电源供应单元为异常。
18.如权利要求10所述的计算机系统,其中,在各该电源供应单元为异常,该电源供应单元发出一警示信息,该管理控制装置于接收该警示信息后判断该电源供应单元为异常。
CN201711285374.2A 2017-12-07 2017-12-07 系统电源管理方法及计算机系统 Active CN109917900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711285374.2A CN109917900B (zh) 2017-12-07 2017-12-07 系统电源管理方法及计算机系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711285374.2A CN109917900B (zh) 2017-12-07 2017-12-07 系统电源管理方法及计算机系统

Publications (2)

Publication Number Publication Date
CN109917900A CN109917900A (zh) 2019-06-21
CN109917900B true CN109917900B (zh) 2023-05-02

Family

ID=66956686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711285374.2A Active CN109917900B (zh) 2017-12-07 2017-12-07 系统电源管理方法及计算机系统

Country Status (1)

Country Link
CN (1) CN109917900B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113079116B (zh) * 2021-03-17 2022-04-26 新华三技术有限公司 一种供电方法、装置及设备
CN113467595B (zh) * 2021-09-03 2021-11-05 苏州浪潮智能科技有限公司 一种四路服务器电源功耗管理装置
CN113885691B (zh) * 2021-09-30 2024-06-11 上海阡视科技有限公司 芯片功耗调整、神经网络训练方法、装置以及芯片系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467220A (zh) * 2010-11-12 2012-05-23 英业达股份有限公司 电脑系统与其电源管理方法
CN103455120A (zh) * 2012-05-28 2013-12-18 鸿富锦精密工业(深圳)有限公司 电源控制系统及方法
CN105357313A (zh) * 2015-11-30 2016-02-24 浪潮电子信息产业股份有限公司 功耗控制方法及系统、机架管理控制器

Also Published As

Publication number Publication date
CN109917900A (zh) 2019-06-21

Similar Documents

Publication Publication Date Title
KR102140219B1 (ko) 시스템 전원 관리방법 및 컴퓨터 시스템
US7043650B2 (en) System and method for intelligent control of power consumption of distributed services during periods when power consumption must be reduced
US6957353B2 (en) System and method for providing minimal power-consuming redundant computing hardware for distributed services
US7203846B2 (en) System and method for intelligent control of power consumption of distributed services during periods of reduced load
JP5317360B2 (ja) データ処理システムにおいてシステムの電力損失通知をしきい値処理するためのコンピュータ・プログラム、システム、および方法
US20190227616A1 (en) Power Budgeting in an Information Handling System
US8390148B2 (en) Systems and methods for power supply wear leveling in a blade server chassis
TWI571733B (zh) 伺服器機櫃系統與其電源管理方法
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
US10310572B2 (en) Voltage based thermal control of processing device
US10198353B2 (en) Device and method for implementing save operation of persistent memory
US10248186B2 (en) Processor device voltage characterization
CN109917900B (zh) 系统电源管理方法及计算机系统
EP3367538B1 (en) Smart power supply management for high standby power system
US20170357310A1 (en) Input voltage reduction for processing devices
US11340684B2 (en) System and method for predictive battery power management
CN111949320A (zh) 提供系统数据的方法、系统及服务器
US11733762B2 (en) Method to allow for higher usable power capacity in a redundant power configuration
US20050086460A1 (en) Apparatus and method for wakeup on LAN
WO2020263409A1 (en) Software-correlated supply voltages for processing devices
US20220114066A1 (en) System and method for highly granular power/thermal control in information handling systems
US11181961B2 (en) System and method for increasing power delivery to information handling systems
US20210397240A1 (en) Systems and methods for enabling power budgeting in an information handling system comprising a plurality of modular information handling systems
CN117348713A (zh) 关机控制方法、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230222

Address after: Chinese Taiwan New Taipei City

Applicant after: Technical Steel Technology Co.,Ltd.

Address before: Chinese Taiwan New Taipei City

Applicant before: GIGA-BYTE TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant