CN104777886A - 改变数据处理设备的功率状态以满足冗余准则 - Google Patents

改变数据处理设备的功率状态以满足冗余准则 Download PDF

Info

Publication number
CN104777886A
CN104777886A CN201510186573.2A CN201510186573A CN104777886A CN 104777886 A CN104777886 A CN 104777886A CN 201510186573 A CN201510186573 A CN 201510186573A CN 104777886 A CN104777886 A CN 104777886A
Authority
CN
China
Prior art keywords
redundancy
data processing
criterion
power
delivery devices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510186573.2A
Other languages
English (en)
Inventor
P.汉森
D.切普利斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Priority claimed from CN2008801267845A external-priority patent/CN101946224A/zh
Publication of CN104777886A publication Critical patent/CN104777886A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Power Sources (AREA)

Abstract

本申请涉及改变数据处理设备的功率状态以满足冗余准则,提供一种方法,包括:选择用于安装在计算机系统中的能量传递设备的冗余准则;监视所述能量传递设备以便跟踪与所述能量传递设备关联的冗余水平;检测所述能量传递设备何时未能满足所述冗余准则;以及改变所述计算机系统的一个或多个数据处理设备的一种或多种功率状态,以便满足所述准则。

Description

改变数据处理设备的功率状态以满足冗余准则
本申请是分案申请,其母案申请的国际申请号是:PCT/US2008/054164,国际公开号是:WO2009/102337;国际申请号是:200880126784.5,其母案申请的申请日是:2008年2月15日;其母申请的发明名称是:“改变数据处理设备的功率状态以满足冗余准则”。
背景技术
任务关键和高可用性计算机应用(例如万维网上的政府和商业站点)经常需要高冗余水平以便最小化由于装置故障而引起的停机时间。这不仅适用于数据处理元件(例如处理器)、介质(包括盘和固态存储器)和通信设备(包括输入/输出设备和网络接口设备),而且适用于诸如电源(其将电能带入计算机中)之类的能量传递设备以及诸如风扇(其从计算机中移除热能)之类的冷却设备。例如,系统可以提供比所需更多的电源,以便在一个发生故障的情况下,系统能够不中断地继续工作。
最小冗余仅仅解决了单个故障点。在上面的示例中,如果第二电源在第一电源被修理或更换之前发生故障,那么整个计算机可能发生故障。在许多情况下,该中断可能罕见得足以容忍,在其他情况下,它可能不可接受。在后一情况下,附加电源可以用来提供更多的冗余,但是在某个时候,成本(经济和体积)超过益处。所需要的是对于给定初始冗余水平增强正常运行时间的方式。
在这里,描述了有利于理解本发明的相关技术。标记为“现有技术”的相关技术是公认的现有技术;没有标记为“现有技术”的相关技术不是公认的现有技术。
附图说明
附图描绘了本发明的实现方式/实施例,而不是本发明本身。
图1为依照本发明实施例的、包括结合了冗余的计算机系统的框图和提供所述控制的方法的流程图的组合示图。
具体实施方式
本发明提供了改变数据处理设备(DHD)的功率状态以便满足能量传递设备(ETD)的冗余准则。例如,当由于三个或更多电源之一发生故障而损失冗余时,可以降低处理器和其他DHD的功率状态以便即使在第二电源发生故障的情况下也可以满足功率要求。类似地,如果环境温度增大到当前的风扇组不再冗余的程度,那么可以降低DHD功率状态以便恢复冗余。另一方面,如果环境温度下降,那么本发明可以提供增大功率状态以交换降低的过量冗余。
计算机系统AP1包括基本上相似的服务器11和12,如图1中所示。服务器11包括数据处理部件13,所述数据处理部件包括:1)处理器15,其用于依照指令程序来操纵数据;2)计算机可读介质17,其包括主存储器、其他固态介质以及基于盘的介质,用于存储所述程序和数据;以及3)通信设备19,其包括输入/输出设备和其他通信设备,例如网络接口卡。此外,服务器AP1包括能量传递设备20,所述能量传递设备20包括电源21和例如风扇的冷却设备23。电源监视器25、电源控制器27和功率传感器29与电源21关联。风扇控制器31、风扇监视器33和热传感器35与风扇23关联。电源功率状态控制器37例如依照ACPI标准来控制数据处理部件的功率状态。
功率状态控制器37响应于热和功率调节逻辑40,该逻辑分别通过电源控制器27和风扇控制器31控制电源21和风扇23的操作。逻辑40包括冗余评估器41,其依照冗余策略43(其是为服务器AP1实施的若干管理定义策略之一)评估电源21和风扇23的冗余水平。
服务器AP1包括六个电源23,但是该数量在实施例之间有所变化。电源控制器27可以在活动状态和备用状态之间切换每个起作用的电源。通常,四个电源可以为服务器11提供足够的功率;在这种情况下,五个可以是活动的而使一个不活动处于备用。如果一个发生故障,那么另外四个足以继续工作,同时激活备用电源。系统操作未被中断,但是损失了冗余。如果另一电源发生故障,那么系统操作将被中断。本发明通过降低功率状态,使得三个电源能够提供系统的继续操作来避免该中断。
电源监视器25监视电源21的“健康状况”,并且检测电源何时发生故障。功率传感器29跟踪电源21输出的功率。功率传感器数据可以用来检测高要求情形,其中冗余可能由于电源21上的负载的增大而损失。
服务器11包括六个风扇23。风扇控制器31可以单独地接通和断开风扇,并且对于那些接通的风扇控制风扇速度。风扇监视器33监视风扇23的健康状况以便检测故障或受损操作。热传感器35或“温度计”跟踪内部和环境温度以用于调节风扇23的速度。
热和功率调节逻辑40接收来自热传感器35的输入以用于调节风扇速度。它也从功率传感器29接收指示服务器11的实际功耗的数据。服务器11的冗余状态的评估由逻辑40的冗余评估器41做出。
冗余评估器41负责实现冗余策略43。冗余策略43典型地由系统管理员设置。该策略43规定希望的冗余水平以及为实现这些水平而可以采取的动作。冗余评估器41耦合到电源监视器25和风扇监视器33以便它被告知活动的、不活动的以及发生故障的电源和风扇的数量。此外,冗余评估器41耦合到服务器12以便实现考虑外部服务器的状态的策略。(例如,相比于服务器12具有低冗余的情况,在服务器12具有高冗余的情况下,对于服务器11可能需要更低的局部冗余。)
一些简单的冗余策略忽略了外部服务器并且独立地处理功率和冷却。一种功率策略是在电源发生故障的情况下降低数据处理部件的功率状态以便恢复冗余。相当的冷却策略会是在风扇发生故障的情况下降低功率状态以便恢复冗余。更复杂的策略可以考虑诸如其他服务器(例如服务器12)中可用的冗余和性能要求之类的因素。例如,当要求高性能时,策略可能接受有限持续时间的低于标准的冗余。
其他策略在电源冗余高时接受更低的冷却系统冗余,并且反之亦然。理由将是,故障的特定总似然率可能是可容忍的。例如,当风扇23的冗余高时,策略可能容忍电源21的单个故障点,因为故障的总似然率足够低,而如果电源和风扇都缺乏冗余,那么故障的变化将会太高并且冗余将不得不恢复到这些子系统中的至少一个。另一种策略在另一个子系统中的冗余低时放弃一个子系统中的冗余,所基于的理论是第一子系统的低冗余不是故障的最可能原因。像这些示例所表明的,本发明提供了大范围的冗余策略。
图1的下部给出了本发明的方法ME1的流程图。在方法部分MS1处,设置或选择冗余-性能准则。该准则由冗余策略43规定。在方法部分MS2处,持续地监视风扇23和电源21,该方法部分可以与方法ME1中的所有其他方法部分重叠。在方法部分MS3处,检测影响冗余的某种变化。该变化可以是电源或风扇的故障。逻辑40可以通过促使功率状态控制器37实现处理器15和/或介质17和通信设备19的更低功率状态而进行响应。
方法部分MS3可以涉及检测温度的变化。例如,环境温度的增加影响风扇21的冷却功率。当由于用于冷却的空气的温度升高,视为冗余的风扇变为需要用来实现充分的冷却以使操作继续时,可能损失冗余。在这种情况下,逻辑40可以要求降低功率状态以便恢复冗余。类似地,环境温度的降低可以增大风扇的冷却效率,从而增大冗余。冗余策略可以规定过量冗余水平,其当被检测时可以导致功率状态的增大以便实现更高的性能。在这个意义上,冗余准则可以规定最大以及最小冗余水平;最大冗余水平指示何时可以通过增大数据处理设备的功率状态水平来降低冗余。
一旦在方法部分MS3处检测到影响冗余的变化,就对照在方法部分MS1建立的冗余准则来评估得到的冗余。如果变化的条件并不满足该准则,那么可以在方法部分MS5处改变功率状态以便满足该准则。
在一种情形中,电源发生故障。系统操作不被中断,但是损失了冗余。数据处理设备的功率状态不能足够快速地降低以便防止操作被中断。因此,在任何故障之前,功率状态例如从P0降低到P3以便恢复冗余。如果第二故障发生,那么系统可以不被中断地继续。当更换发生故障的电源(物理上或者通过激活备用电源)时,数据处理设备的功率状态可以例如从P3再次升高到P0。
高级配置和电源接口(ACPI)规范是1996年12月第一次发布的由HP、Intel、Microsoft、Phoenix和Toshiba开发的开放工业标准,其定义用于硬件识别、主板以及设备配置和功率管理的公共接口。ACPI将先前仅可用于便携式计算机的功率管理特征引入到台式计算机和服务器。例如,可以将系统置于极低的消耗状态下;在这种状态下,诸如实时时钟、键盘或调制解调器之类的设备可以触发“通用事件”(GPE,类似于中断)以便快速地唤醒系统。
本发明可以应用于具有足以处理至少两个与能量传递设备有关的故障的资源的系统。典型地,三个或更多的电源以及三个或更多的风扇将是可用的,但是一些实施例需要更少的这类部件。多计算机系统可以具有在计算机之间相互作用以使得在设置一个计算机的冗余时可以考虑另一个计算机的冗余的策略。可以采用不同数量的风扇以及不同类型的冷却设备(例如液体热交换器)。所公开实施例的这些和其他修改和变型由本发明提供,本发明的范围由所附的权利要求书限定。

Claims (19)

1.一种用于改变数据处理设备的功率状态的方法,包括:
选择用于安装在计算机系统中的能量传递设备的冗余准则,所述冗余准则对应于在能量传递设备发生故障的情况下为了确保所述计算机系统的不被中断的操作所需的冗余水平;
监视所述能量传递设备以便跟踪与所述能量传递设备关联的冗余水平;
检测所述能量传递设备何时未能满足所述冗余准则;以及
改变所述计算机系统的一个或多个数据处理设备的一种或多种功率状态,以便满足所述冗余准则,并且所述数据处理设备的操作不被中断;
其中所述能量传递设备包括风扇和三个或更多个电源。
2.如权利要求1所述的方法,其中所述检测响应于能量传递设备的故障。
3.如权利要求1所述的方法,其中所述检测涉及检测温度的变化。
4.如权利要求1所述的方法,其中所述冗余准则独立地处理所述电源和所述风扇。
5.如权利要求1所述的方法,其中所述改变功率状态涉及降低数据处理设备的功率状态。
6.如权利要求1所述的方法,其中所述改变功率状态涉及增大数据处理设备的功率状态。
7.如权利要求1所述的方法,其中所述冗余准则部分地为另一计算机系统的冗余状态的函数。
8.如权利要求1所述的方法,其中所述冗余准则部分地为对数据处理设备的要求的函数。
9.如权利要求1所述的方法,其中所述冗余准则部分地为电源提供的实际功率的函数。
10.一种计算机系统,包括:
一个或多个具有能够选择的功率状态的数据处理设备;
用于选择所述数据处理设备的功率状态的功率状态控制器;
包括热移除设备和三个或更多个电源的能量传递设备;
一个或多个用于检测所述能量传递设备何时未能满足冗余准则的监视器,所述冗余准则对应于在能量传递设备发生故障的情况下为了确保所述计算机系统的不被中断的操作所需的冗余水平;以及
冗余控制逻辑单元,其耦合到所述监视器和所述功率状态控制器,以用于改变所述数据处理设备的功率状态以便满足所述冗余准则并且提供所述数据处理设备的连续操作。
11.如权利要求10所述的系统,其中所述冗余控制逻辑单元降低所述功率状态以便恢复冗余。
12.如权利要求10所述的系统,其中所述冗余控制逻辑单元增大所述功率状态以便移除过量冗余。
13.如权利要求10所述的系统,其中所述一个或多个监视器检测能量传递设备的故障。
14.如权利要求10所述的系统,其中所述监视器包括用于检测所述能量传递设备何时由于温度升高而损失冗余的传感器。
15.如权利要求10所述的系统,其中所述数据处理设备包括用于依照指令程序操纵数据的数据处理器。
16.如权利要求10所述的系统,其中所述冗余准则包括用于电源和用于风扇的独立子准则。
17.如权利要求10所述的系统,其中所述冗余准则包括用于电源和风扇的相互作用的子准则。
18.如权利要求10所述的系统,其中所述冗余准则部分地为另一计算机系统的状态的函数。
19.如权利要求10所述的系统,其中所述功率状态符合ACPI标准。
CN201510186573.2A 2008-02-15 2008-02-15 改变数据处理设备的功率状态以满足冗余准则 Pending CN104777886A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008801267845A CN101946224A (zh) 2008-02-15 2008-02-15 改变数据处理设备的功率状态以满足冗余准则

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2008801267845A Division CN101946224A (zh) 2008-02-15 2008-02-15 改变数据处理设备的功率状态以满足冗余准则

Publications (1)

Publication Number Publication Date
CN104777886A true CN104777886A (zh) 2015-07-15

Family

ID=53719568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510186573.2A Pending CN104777886A (zh) 2008-02-15 2008-02-15 改变数据处理设备的功率状态以满足冗余准则

Country Status (1)

Country Link
CN (1) CN104777886A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111399622A (zh) * 2020-03-13 2020-07-10 苏州浪潮智能科技有限公司 一种服务器功耗控制方法、系统、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050067902A1 (en) * 2003-09-26 2005-03-31 Bemat Mohamed A. Power management in a system having a plurality of power supplies
CN1717657A (zh) * 2002-11-27 2006-01-04 国际商业机器公司 基于特定于应用的冗余特征的自动功率控制策励
US20060259792A1 (en) * 2005-05-10 2006-11-16 Dove Daniel J Rapid load reduction for power-over-LAN system
CN1896914A (zh) * 2005-07-15 2007-01-17 联想(北京)有限公司 风扇冗余系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1717657A (zh) * 2002-11-27 2006-01-04 国际商业机器公司 基于特定于应用的冗余特征的自动功率控制策励
US20050067902A1 (en) * 2003-09-26 2005-03-31 Bemat Mohamed A. Power management in a system having a plurality of power supplies
US20060259792A1 (en) * 2005-05-10 2006-11-16 Dove Daniel J Rapid load reduction for power-over-LAN system
CN1896914A (zh) * 2005-07-15 2007-01-17 联想(北京)有限公司 风扇冗余系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111399622A (zh) * 2020-03-13 2020-07-10 苏州浪潮智能科技有限公司 一种服务器功耗控制方法、系统、电子设备及存储介质
CN111399622B (zh) * 2020-03-13 2021-11-09 苏州浪潮智能科技有限公司 一种服务器功耗控制方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN1947096B (zh) 用于虚拟机计算机程序的动态迁移的方法和系统
CN101946224A (zh) 改变数据处理设备的功率状态以满足冗余准则
CN100470494C (zh) 集群可用性管理方法和系统
US8321622B2 (en) Storage system with multiple controllers and multiple processing paths
US20130179718A1 (en) Server rack system and power management method applicable thereto
CN101782746B (zh) 一种监控装置和监控方法
US20060271810A1 (en) Backup control system and method
US8671296B2 (en) Storage control apparatus and method
JP2010146546A (ja) クラスタシステムに対する遠隔電源管理システム及びその方法
JP6130520B2 (ja) 多重系システムおよび多重系システム管理方法
US20100057991A1 (en) Method for controlling storage system, storage system, and storage apparatus
US9535479B2 (en) Method of performing power management in rack-mount system
CN101593082A (zh) 一种管理存储设备电源电路的装置、方法和计算机
CN109062753A (zh) 一种硬盘监控系统以及监控方法
CN103246242A (zh) 工厂监视控制装置以及工厂监视控制方法
JP2012128573A (ja) 二重化システムおよびそのシステムを用いたビル管理システム
WO2011083778A1 (ja) 計算機及び計算機管理方法並びに計算機管理プログラム
CN104777886A (zh) 改变数据处理设备的功率状态以满足冗余准则
CN106534262A (zh) 一种网络信息系统故障的切换方法
JP2008152552A (ja) 計算機システム及び障害情報管理方法
JP2012108757A (ja) 電力供給管理システム
EP2083537B1 (en) Data network and method of controlling thereof
TWI462691B (zh) 伺服器機櫃及其管理方法
CN116204502B (zh) 一种高可用性的nas存储服务方法及系统
JP2018097739A (ja) 計算機システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150715