CN101946224A - 改变数据处理设备的功率状态以满足冗余准则 - Google Patents

改变数据处理设备的功率状态以满足冗余准则 Download PDF

Info

Publication number
CN101946224A
CN101946224A CN2008801267845A CN200880126784A CN101946224A CN 101946224 A CN101946224 A CN 101946224A CN 2008801267845 A CN2008801267845 A CN 2008801267845A CN 200880126784 A CN200880126784 A CN 200880126784A CN 101946224 A CN101946224 A CN 101946224A
Authority
CN
China
Prior art keywords
criterion
power
redundant
energy transfer
power rating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2008801267845A
Other languages
English (en)
Inventor
P·汉森
D·切普利斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Priority to CN201510186573.2A priority Critical patent/CN104777886A/zh
Publication of CN101946224A publication Critical patent/CN101946224A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/263Arrangements for using multiple switchable power supplies, e.g. battery and AC

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Engineering (AREA)
  • Human Computer Interaction (AREA)
  • Power Sources (AREA)

Abstract

一种计算机系统提供了响应于与能量传递设备关联的冗余的变化的检测而改变数据处理设备的功率状态。

Description

改变数据处理设备的功率状态以满足冗余准则
背景技术
任务关键和高可用性计算机应用(例如万维网上的政府和商业站点)经常需要高冗余水平以便最小化由于装置故障而引起的停机时间。这不仅适用于数据处理元件(例如处理器)、介质(包括盘和固态存储器)和通信设备(包括输入/输出设备和网络接口设备),而且适用于诸如电源(其将电能带入计算机中)之类的能量传递设备以及诸如风扇(其从计算机中移除热能)之类的冷却设备。例如,系统可以提供比所需更多的电源,以便在一个发生故障的情况下,系统能够不中断地继续工作。
最小冗余仅仅解决了单个故障点。在上面的示例中,如果第二电源在第一电源被修理或更换之前发生故障,那么整个计算机可能发生故障。在许多情况下,该中断可能罕见得足以容忍,在其他情况下,它可能不可接受。在后一情况下,附加电源可以用来提供更多的冗余,但是在某个时候,成本(经济和体积)超过益处。所需要的是对于给定初始冗余水平增强正常运行时间的方式。
在这里,描述了有利于理解本发明的相关技术。标记为“现有技术”的相关技术是公认的现有技术;没有标记为“现有技术”的相关技术不是公认的现有技术。
附图说明
附图描绘了本发明的实现方式/实施例,而不是本发明本身。
图1为依照本发明实施例的、包括结合了冗余的计算机系统的框图和提供所述控制的方法的流程图的组合示图。
具体实施方式
本发明提供了改变数据处理设备(DHD)的功率状态以便满足能量传递设备(ETD)的冗余准则。例如,当由于三个或更多电源之一发生故障而损失冗余时,可以降低处理器和其他DHD的功率状态以便即使在第二电源发生故障的情况下也可以满足功率要求。类似地,如果环境温度增大到当前的风扇组不再冗余的程度,那么可以降低DHD功率状态以便恢复冗余。另一方面,如果环境温度下降,那么本发明可以提供增大功率状态以交换降低的过量冗余。
计算机系统AP1包括基本上相似的服务器11和12,如图1中所示。服务器11包括数据处理部件13,所述数据处理部件包括:1)处理器15,其用于依照指令程序来操纵数据;2)计算机可读介质17,其包括主存储器、其他固态介质以及基于盘的介质,用于存储所述程序和数据;以及3)通信设备19,其包括输入/输出设备和其他通信设备,例如网络接口卡。此外,服务器AP1包括能量传递设备20,所述能量传递设备20包括电源21和例如风扇的冷却设备23。电源监视器25、电源控制器27和功率传感器29与电源21关联。风扇控制器31、风扇监视器33和热传感器35与风扇23关联。电源功率状态控制器37例如依照ACPI标准来控制数据处理部件的功率状态。
功率状态控制器37响应于热和功率调节逻辑40,该逻辑分别通过电源控制器27和风扇控制器31控制电源21和风扇23的操作。逻辑40包括冗余评估器41,其依照冗余策略43(其是为服务器AP1实施的若干管理定义策略之一)评估电源21和风扇23的冗余水平。
服务器AP1包括六个电源23,但是该数量在实施例之间有所变化。电源控制器27可以在活动状态和备用状态之间切换每个起作用的电源。通常,四个电源可以为服务器11提供足够的功率;在这种情况下,五个可以是活动的而使一个不活动处于备用。如果一个发生故障,那么另外四个足以继续工作,同时激活备用电源。系统操作未被中断,但是损失了冗余。如果另一电源发生故障,那么系统操作将被中断。本发明通过降低功率状态,使得三个电源能够提供系统的继续操作来避免该中断。
电源监视器25监视电源21的“健康状况”,并且检测电源何时发生故障。功率传感器29跟踪电源21输出的功率。功率传感器数据可以用来检测高要求情形,其中冗余可能由于电源21上的负载的增大而损失。
服务器11包括六个风扇23。风扇控制器31可以单独地接通和断开风扇,并且对于那些接通的风扇控制风扇速度。风扇监视器33监视风扇23的健康状况以便检测故障或受损操作。热传感器35或“温度计”跟踪内部和环境温度以用于调节风扇23的速度。
热和功率调节逻辑40接收来自热传感器35的输入以用于调节风扇速度。它也从功率传感器29接收指示服务器11的实际功耗的数据。服务器11的冗余状态的评估由逻辑40的冗余评估器41做出。
冗余评估器41负责实现冗余策略43。冗余策略43典型地由系统管理员设置。该策略43规定希望的冗余水平以及为实现这些水平而可以采取的动作。冗余评估器41耦合到电源监视器25和风扇监视器33以便它被告知活动的、不活动的以及发生故障的电源和风扇的数量。此外,冗余评估器41耦合到服务器12以便实现考虑外部服务器的状态的策略。(例如,相比于服务器12具有低冗余的情况,在服务器12具有高冗余的情况下,对于服务器11可能需要更低的局部冗余。)
一些简单的冗余策略忽略了外部服务器并且独立地处理功率和冷却。一种功率策略是在电源发生故障的情况下降低数据处理部件的功率状态以便恢复冗余。相当的冷却策略会是在风扇发生故障的情况下降低功率状态以便恢复冗余。更复杂的策略可以考虑诸如其他服务器(例如服务器12)中可用的冗余和性能要求之类的因素。例如,当要求高性能时,策略可能接受有限持续时间的低于标准的冗余。
其他策略在电源冗余高时接受更低的冷却系统冗余,并且反之亦然。理由将是,故障的特定总似然率可能是可容忍的。例如,当风扇23的冗余高时,策略可能容忍电源21的单个故障点,因为故障的总似然率足够低,而如果电源和风扇都缺乏冗余,那么故障的变化将会太高并且冗余将不得不恢复到这些子系统中的至少一个。另一种策略在另一个子系统中的冗余低时放弃一个子系统中的冗余,所基于的理论是第一子系统的低冗余不是故障的最可能原因。像这些示例所表明的,本发明提供了大范围的冗余策略。
图1的下部给出了本发明的方法ME1的流程图。在方法部分MS1处,设置或选择冗余-性能准则。该准则由冗余策略43规定。在方法部分MS2处,持续地监视风扇23和电源21,该方法部分可以与方法ME1中的所有其他方法部分重叠。在方法部分MS3处,检测影响冗余的某种变化。该变化可以是电源或风扇的故障。逻辑40可以通过促使功率状态控制器37实现处理器15和/或介质17和通信设备19的更低功率状态而进行响应。
方法部分MS3可以涉及检测温度的变化。例如,环境温度的增加影响风扇21的冷却功率。当由于用于冷却的空气的温度升高,视为冗余的风扇变为需要用来实现充分的冷却以使操作继续时,可能损失冗余。在这种情况下,逻辑40可以要求降低功率状态以便恢复冗余。类似地,环境温度的降低可以增大风扇的冷却效率,从而增大冗余。冗余策略可以规定过量冗余水平,其当被检测时可以导致功率状态的增大以便实现更高的性能。在这个意义上,冗余准则可以规定最大以及最小冗余水平;最大冗余水平指示何时可以通过增大数据处理设备的功率状态水平来降低冗余。
一旦在方法部分MS3处检测到影响冗余的变化,就对照在方法部分MS1建立的冗余准则来评估得到的冗余。如果变化的条件并不满足该准则,那么可以在方法部分MS5处改变功率状态以便满足该准则。
在一种情形中,电源发生故障。系统操作不被中断,但是损失了冗余。数据处理设备的功率状态不能足够快速地降低以便防止操作被中断。因此,在任何故障之前,功率状态例如从P0降低到P3以便恢复冗余。如果第二故障发生,那么系统可以不被中断地继续。当更换发生故障的电源(物理上或者通过激活备用电源)时,数据处理设备的功率状态可以例如从P3再次升高到P0。
高级配置和电源接口(ACPI)规范是1996年12月第一次发布的由HP、Intel、Microsoft、Phoenix和Toshiba开发的开放工业标准,其定义用于硬件识别、主板以及设备配置和功率管理的公共接口。ACPI将先前仅可用于便携式计算机的功率管理特征引入到台式计算机和服务器。例如,可以将系统置于极低的消耗状态下;在这种状态下,诸如实时时钟、键盘或调制解调器之类的设备可以触发“通用事件”(GPE,类似于中断)以便快速地唤醒系统。
本发明可以应用于具有足以处理至少两个与能量传递设备有关的故障的资源的系统。典型地,三个或更多的电源以及三个或更多的风扇将是可用的,但是一些实施例需要更少的这类部件。多计算机系统可以具有在计算机之间相互作用以使得在设置一个计算机的冗余时可以考虑另一个计算机的冗余的策略。可以采用不同数量的风扇以及不同类型的冷却设备(例如液体热交换器)。所公开实施例的这些和其他修改和变型由本发明提供,本发明的范围由所附的权利要求书限定。

Claims (20)

1.一种方法,包括:
选择用于安装在计算机系统中的能量传递设备的冗余准则;
监视所述能量传递设备以便跟踪与所述能量传递设备关联的冗余水平;
检测所述能量传递设备何时未能满足所述冗余准则;以及
改变所述计算机系统的一个或多个数据处理设备的一种或多种功率状态,以便满足所述准则。
2.如权利要求1所述的方法,其中所述能量传递设备包括电源和风扇。
3.如权利要求1所述的方法,其中所述检测响应于能量传递设备的故障。
4.如权利要求1所述的方法,其中所述检测涉及检测温度的变化。
5.如权利要求2所述的方法,其中所述准则独立地处理所述电源和所述风扇。
6.如权利要求1所述的方法,其中所述改变功率状态涉及降低处理器的功率状态。
7.如权利要求1所述的方法,其中所述改变功率状态涉及增大处理器的功率状态。
8.如权利要求1所述的方法,其中所述准则部分地为另一计算机系统的冗余状态的函数。
9.如权利要求1所述的方法,其中所述准则部分地为对所述处理器的要求的函数。
10.如权利要求1所述的方法,其中所述准则部分地为电源提供的实际功率的函数。
11.一种计算机系统,包括:
一个或多个具有能够选择的功率状态的数据处理设备;
用于选择所述数据处理设备的功率状态的功率状态控制器;
包括电源和热移除设备的能量传递设备;
一个或多个用于检测所述能量传递设备何时未能满足冗余准则的监视器;以及
冗余控制逻辑,其耦合到所述监视器装置和所述处理器控制器,以用于改变所述处理器的功率状态以便满足所述冗余准则。
12.如权利要求11所述的系统,其中所述冗余控制逻辑降低所述功率状态以便恢复冗余。
13.如权利要求11所述的系统,其中所述冗余控制逻辑增大所述功率状态以便移除过量冗余。
14.如权利要求11所述的系统,其中所述一个或多个监视器检测能量传递设备的故障。
15.如权利要求11所述的系统,其中所述监视器包括用于检测所述能量传递设备何时由于温度升高而损失冗余的传感器。
16.如权利要求11所述的系统,其中所述数据处理设备包括用于依照指令程序操纵数据的数据处理器。
17.如权利要求11所述的系统,其中所述准则包括用于电源和用于风扇的独立子准则。
18.如权利要求11所述的系统,其中所述准则包括用于电源和风扇的相互作用的子准则。
19.如权利要求11所述的系统,其中所述准则部分地为另一计算机系统的状态的函数。
20.如权利要求11所述的系统,其中所述功率状态符合ACPI标准。
CN2008801267845A 2008-02-15 2008-02-15 改变数据处理设备的功率状态以满足冗余准则 Pending CN101946224A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510186573.2A CN104777886A (zh) 2008-02-15 2008-02-15 改变数据处理设备的功率状态以满足冗余准则

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2008/054164 WO2009102337A1 (en) 2008-02-15 2008-02-15 Changing power states of data handling devices to meet redundancy criterion

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201510186573.2A Division CN104777886A (zh) 2008-02-15 2008-02-15 改变数据处理设备的功率状态以满足冗余准则

Publications (1)

Publication Number Publication Date
CN101946224A true CN101946224A (zh) 2011-01-12

Family

ID=40957210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801267845A Pending CN101946224A (zh) 2008-02-15 2008-02-15 改变数据处理设备的功率状态以满足冗余准则

Country Status (4)

Country Link
US (1) US20100318826A1 (zh)
EP (1) EP2245518A4 (zh)
CN (1) CN101946224A (zh)
WO (1) WO2009102337A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103197748A (zh) * 2012-01-10 2013-07-10 广达电脑股份有限公司 伺服器机柜系统与其电源管理方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201220036A (en) * 2010-11-11 2012-05-16 Inventec Corp Computer system and power management method thereof
CN102541239A (zh) * 2010-12-16 2012-07-04 鸿富锦精密工业(深圳)有限公司 网络设备及其功耗控制方法
CN104115077B (zh) 2011-12-16 2018-12-07 施耐德电气美国股份有限公司 主机代管电气架构
US9313930B2 (en) 2013-01-21 2016-04-12 International Business Machines Corporation Multi-level redundant cooling system for continuous cooling of an electronic system(s)
TWI506412B (zh) * 2013-03-15 2015-11-01 Quanta Comp Inc 伺服器系統的電源管理方法
US9958923B2 (en) * 2014-06-20 2018-05-01 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Preventing oversubscription to power resources in a computing system
US9832088B2 (en) 2014-09-30 2017-11-28 Microsoft Technology Licensing, Llc Monitoring of shared server set power supply units

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050067902A1 (en) * 2003-09-26 2005-03-31 Bemat Mohamed A. Power management in a system having a plurality of power supplies
US20060259792A1 (en) * 2005-05-10 2006-11-16 Dove Daniel J Rapid load reduction for power-over-LAN system

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5396635A (en) * 1990-06-01 1995-03-07 Vadem Corporation Power conservation apparatus having multiple power reduction levels dependent upon the activity of the computer system
US5664089A (en) * 1994-04-26 1997-09-02 Unisys Corporation Multiple power domain power loss detection and interface disable
JPH08278823A (ja) * 1995-04-07 1996-10-22 Hitachi Ltd 電源制御方式
US6084813A (en) * 1998-06-04 2000-07-04 Canon Kabushiki Kaisha Apparatus and method for controlling memory backup using main power supply and backup power supply
US6301670B1 (en) * 1998-10-06 2001-10-09 Ricoh Corporation Method and apparatus for erasing data when a problem is identified
US6415388B1 (en) * 1998-10-30 2002-07-02 Intel Corporation Method and apparatus for power throttling in a microprocessor using a closed loop feedback system
JP3937064B2 (ja) * 2000-04-24 2007-06-27 パイオニア株式会社 記録再生装置
US6948021B2 (en) * 2000-11-16 2005-09-20 Racemi Systems Cluster component network appliance system and method for enhancing fault tolerance and hot-swapping
US6507128B2 (en) * 2001-05-23 2003-01-14 General Electric Company Low-energy storage fast-start uninterruptible power supply system and method
US6934864B2 (en) * 2002-01-11 2005-08-23 International Business Machines Corporation System and method for co-operative thermal management of electronic devices within a common housing
US7089459B2 (en) * 2002-09-30 2006-08-08 Intel Corporation Limit interface for performance management
US7436950B2 (en) * 2003-07-02 2008-10-14 Hewlett-Packard Development Company, L.P. Apparatus and method for real-time power distribution management
US7237130B2 (en) * 2003-08-04 2007-06-26 Inventec Corporation Blade server performance management method and system
US7451336B2 (en) * 2003-10-16 2008-11-11 International Business Machines Corporation Automated load shedding of powered devices in a computer complex in the event of utility interruption
DE102004017529A1 (de) * 2004-04-08 2005-11-03 Siemens Ag Automatisierungsnetzwerk sowie Automatisierungsgerät, Netzwerkkomponente und Feldgerät für ein derartiges Netzwerk
JP4401954B2 (ja) * 2004-12-20 2010-01-20 富士通株式会社 電源制御装置及び電源制御プログラム
KR20060125102A (ko) * 2005-06-01 2006-12-06 엘지전자 주식회사 절전 기능을 갖는 컴퓨터 시스템 및 컴퓨터 시스템에서의절전 모드 구현 방법
US7340325B2 (en) * 2005-08-03 2008-03-04 Texas Instruments Incorporated Priority powerdown system and method for power distribution systems
US7650517B2 (en) * 2005-12-19 2010-01-19 International Business Machines Corporation Throttle management for blade system
US7493503B2 (en) * 2005-12-22 2009-02-17 International Business Machines Corporation Programmable throttling in blade/chassis power management
US7406365B2 (en) * 2006-03-31 2008-07-29 Intel Corporation Power manager with selective load reduction
US7730365B1 (en) * 2007-04-30 2010-06-01 Hewlett-Packard Development Company, L.P. Workload management for maintaining redundancy of non-data computer components
US8103907B2 (en) * 2009-10-29 2012-01-24 International Business Machines Corporation Power architecture to provide power supply redundancy

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050067902A1 (en) * 2003-09-26 2005-03-31 Bemat Mohamed A. Power management in a system having a plurality of power supplies
US20060259792A1 (en) * 2005-05-10 2006-11-16 Dove Daniel J Rapid load reduction for power-over-LAN system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103197748A (zh) * 2012-01-10 2013-07-10 广达电脑股份有限公司 伺服器机柜系统与其电源管理方法
US9304562B2 (en) 2012-01-10 2016-04-05 Quanta Computer Inc. Server rack system and power management method applicable thereto

Also Published As

Publication number Publication date
US20100318826A1 (en) 2010-12-16
EP2245518A4 (en) 2013-04-17
WO2009102337A1 (en) 2009-08-20
EP2245518A1 (en) 2010-11-03

Similar Documents

Publication Publication Date Title
CN101946224A (zh) 改变数据处理设备的功率状态以满足冗余准则
CN1947096B (zh) 用于虚拟机计算机程序的动态迁移的方法和系统
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
US20060112286A1 (en) Method for dynamically reprovisioning applications and other server resources in a computer center in response to power and heat dissipation requirements
US20070162620A1 (en) Power over ethernet powered management and diagnoses of information handling systems
CN101689070A (zh) 为了高效率操作的动态转换器控制
US20060271810A1 (en) Backup control system and method
CN103135732B (zh) 服务器机柜系统
US8671296B2 (en) Storage control apparatus and method
JP2013030154A (ja) ラックサーバシステム
CN103197748A (zh) 伺服器机柜系统与其电源管理方法
CN101132314A (zh) 实现冗余备份的方法
WO2012050568A1 (en) Resource management for data centers
CN101593082A (zh) 一种管理存储设备电源电路的装置、方法和计算机
US8457121B1 (en) Heterogeneous network switch system
CN116195375A (zh) 分解的计算机系统
CN103246242A (zh) 工厂监视控制装置以及工厂监视控制方法
TW201344060A (zh) 機櫃系統及其風扇控制系統及其控制方法
US9348395B2 (en) Power demand reduction system
JP2012128573A (ja) 二重化システムおよびそのシステムを用いたビル管理システム
CN109995597B (zh) 一种网络设备故障处理方法及装置
CN104777886A (zh) 改变数据处理设备的功率状态以满足冗余准则
CN106534262A (zh) 一种网络信息系统故障的切换方法
US9720481B2 (en) Energy-saving mode for a rail system signaling system
TWI462691B (zh) 伺服器機櫃及其管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110112