CN1801108A - 限制冗余信号中的故障的装置、系统以及方法 - Google Patents

限制冗余信号中的故障的装置、系统以及方法 Download PDF

Info

Publication number
CN1801108A
CN1801108A CNA2005101247464A CN200510124746A CN1801108A CN 1801108 A CN1801108 A CN 1801108A CN A2005101247464 A CNA2005101247464 A CN A2005101247464A CN 200510124746 A CN200510124746 A CN 200510124746A CN 1801108 A CN1801108 A CN 1801108A
Authority
CN
China
Prior art keywords
signal
module
power
output signal
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005101247464A
Other languages
English (en)
Other versions
CN100412808C (zh
Inventor
布赖恩·J·卡格诺
约翰·C·埃利奥特
卡尔·E·琼斯
罗伯特·A·库博
格雷格·S·卢卡斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1801108A publication Critical patent/CN1801108A/zh
Application granted granted Critical
Publication of CN100412808C publication Critical patent/CN100412808C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2015Redundant power supplies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

公开了一种限制冗余信号中的故障的装置、系统以及方法。协调模块为多个电源模块中的每一个生成电源状态信号。输入模块接收源信号。信号生成模块从源信号与至少一个电源状态信号生成多个输出信号。如果至少一个电源供应正常运行,则输出信号不被置为有效。如果信号生成模块的设备失灵,则不会错误地将多于一个输出信号置为有效。

Description

限制冗余信号中的故障的装置、系统以及方法
技术领域
本发明涉及冗余信号,更具体地讲,涉及限制冗余信号中的由单个设备失灵导致的故障。
背景技术
对于诸如企业计算机系统、独立盘冗余阵列(“RAID”)系统、以及交易处理系统等关键(critical)系统,丢失数据以及减少数据丢失的成本可能较高。为了减少数据丢失的可能性,关键系统经常采用报警信号,以向诸如计算机、硬盘驱动器、路由器等等组件通知可能影响该组件功能的状态改变。该报警信号预先警告该组件,从而该组件可以采取及时措施以防止数据丢失。
例如,某些RAID系统生成关于马上到来的掉电的报警信号,例如早期关断电源报警(“EPOW”)信号。硬盘驱动器可以接收该报警信号,并且作为对该信号的响应,完成从易失性写缓冲区到非易失性硬盘的数据写入,并且在掉电之前离线。在掉电之前完成写入保护在写缓冲区中的数据不会丢失。另外,离线保护硬盘驱动器不会在电源不可用时受到损坏或数据丢失。
不幸的是,如果组件接收了作为生成报警信号的设备的故障的结果而生成的错误的报警信号,该组件可能响应于该错误报警而采取会对该关键系统造成不利影响的行动。例如,传统RAID系统的硬盘驱动器一旦接收到关于掉电的错误报警就会离线,从而减少了RAID系统的冗余度,并且增加了数据丢失的风险。
关键系统一般采用多个冗余组件,以防止如果一个组件出故障时的数据丢失。例如,如果RAID系统的单个硬盘驱动器出故障或者变得不可用,则该RAID系统一般不会丢失数据,因为其他硬盘驱动器包含来自故障硬盘驱动器的冗余数据。关键系统还经常包含冗余报警信号,以限制错误报警信号的后果。例如,某些RAID系统为每个硬盘驱动器生成不同的报警信号。由此,为第一硬盘驱动器生成的第一错误报警信号不会使第二硬盘驱动器采取不利行动,因为第二硬盘驱动器希望得到不同的第二报警信号。
不幸的是,诸如半导体门阵列或者分立电子设备的一个或多个设备经常共同生成多个冗余报警信号。例如,所述多个报警信号可能都从被配置来进行逻辑AND(与)操作的共同AND逻辑门的输出生成。如果生成冗余报警信号的共同设备中的一个(例如共同AND逻辑门)出故障,则所述多个报警信号可能是错误的。作为结果,多个组件可能会通过离线等等而作出响应。如果对该错误信号作出响应的组件的数目超过该关键系统的冗余度,则该系统的数据可能存在风险。
例如,如果两个或更多个RAID系统的硬盘驱动器接收作为共同设备故障的结果的、指示马上有掉电的错误报警信号,则每个硬盘驱动器都可能将缓冲区数据写入该硬盘中,并且离线。通过使RAID系统不能访问在离线硬盘驱动器上存储的冗余数据或者使该系统不能将冗余数据写入该硬盘驱动器,离线的硬盘驱动器可能使RAID系统的所有数据都经受风险。因此,通过消除RAID系统的冗余度,错误报警信号可能使系统数据经受风险。
根据上述讨论,可以看出需要一种限制生成冗余信号中的故障的装置、系统、以及方法。有利的是,这样的装置、系统、以及方法会制约设备故障对生成冗余信号的影响。
发明内容
响应于现有技术的状态而开发了本发明,更具体地讲,是响应于现有技术中当前可用的冗余信号生成方法还没能完全解决的问题与需求。相应地,开发本发明用来提供一种克服现有技术中上述所有或者其中许多缺点的生成冗余信号的装置、系统、以及方法。
生成冗余信号的装置配备有包含多个模块的逻辑单元,这些模块被配置来在功能上执行以下必要步骤:生成电源状态信号,接收源信号,以及生成输出信号。在所述实施方式中的这些模块包含协调模块、输入模块、以及信号生成模块。
协调模块为多个电源模块中的每一个生成电源状态信号。电源模块向一个或多个系统组件供电。如果电源模块正在供电,则可以将该电源模块的电源状态信号置为有效(assert)。在一种实施方式中,每个电源模块都包含协调模块、输入模块、以及信号生成模块。
输入模块接收源信号。源信号指示对于一种或多种情况(例如电网上的电力可用性)的随后的状态变化。例如,源信号可指示马上到来的掉电。在一种实施方式中,源信号比状态变化超前指定的时间间隔。例如,源信号可以指示在5毫秒(5ms)内要发生掉电。
信号生成模块从源信号与至少一个电源状态信号生成多个输出信号。在一种实施方式中,输出信号为EPOW信号。如果至少一个电源供应正常运行,则输出信号不被置为有效。信号生成模块设备的单一失灵导致不多于一个输出信号的故障。在一种实施方式中,信号生成模块、输入模块、以及协调模块由多个分立冗余固态电子设备制造。该装置将单个设备的失灵限制于单个输出信号的故障。
还提出了本发明的系统来生成冗余信号。该系统可以在诸如RAID系统等关键系统中实现。具体地讲,在一种实施方式中,该系统包含多个存储设备、控制器模块、多个电源模块、输入模块、协调模块、以及信号生成模块。
存储设备存储并检索数据。在一种实施方式中,该存储设备是RAID系统的硬盘驱动器。控制器模块控制存储设备。电源模块为存储设备供电。在一种实施方式中,电源模块将来自电网的交流(“AC”)电转换为直流(“DC”)电,以向存储设备提供DC电。在某一实施方式中,如果至少一个电源模块供电,则存储设备被充分供电。
协调模块为多个电源模块中的每一个生成电源状态信号。输入模块接收源信号,并且信号生成模块从源信号与至少一个电源状态信号生成多个输出信号。在一种实施方式中,该系统还包含一个或多个EPOW模块。每个EPOW模块都可以接收输出信号,并且从输出信号生成一个或多个EPOW信号。在一种实施方式中,EPOW信号符合纤维通道EPOW信号的规格。
在某种实施方式中,该系统包含测试模块。该测试模块可被配置来响应于一个或多个控制信号被置为有效而生成输出信号。另外,该测试模块可以生成用来测试该系统功能性的其他信号。
在一种实施方式中,该系统包含多个输入模块、多个协调模块、以及多个信号生成模块。所述多个输入模块、协调模块、以及信号生成模块可以由补充电源模块供电。当每个电源模块都不供电时,该补充电源模块可以为多个输入模块、协调模块、以及信号生成模块供电。
还提出了本发明的一种生成冗余信号的方法。所公开实施方式中的方法基本上包含执行以上相对于所述装置与系统的操作描述的功能所必须的步骤。在一种实施方式中,该方法包含为生成电源状态信号、接收源信号、以及生成多个输出信号。
协调模块为为多个电源模块中的每一个生成电源状态信号。输出模块接收源信号。信号生成模块从源信号与至少一个电源状态信号生成多个输出信号。在一种实施方式中,电池信号模块生成电池信号。该电池信号可以引导电池备用模块供电。另外,控制器信号模块可以生成控制器信号,向控制器模块指示马上到来的状态变化,例如一个或多个存储设备的状态变化。
在本说明书中,对特征、优点的指称或者类似的语言并不意味着可以通过本发明实现的所有的特征与优点都应该或者实际存在于本发明的任一单个实施方式中。相反,指称特征与优点的语言应该理解为是指:结合实施方式描述的特定特征、优点、或者特点包含在本发明的至少一种实施方式中。由此,在本说明书中,对特征与优点的讨论以及类似的语言,可以但不必要指相同的实施方式。
另外,在一种或多种实施方式中,所描述的本发明的特征、优点以及特点可以任何适当方式组合。本领域技术人员应该理解:在没有特定实施方式的一个或多个特定特征或优点的前提下,可以实现本发明。在其他例子中,可以在某些实施方式中认识到并不在本发明所有实施方式中存在的其他特征与优点。
通过生成冗余输出信号,本发明减少了关键系统中的故障。另外,本发明限制了由信号生成设备失灵产生的输出信号故障的影响。本发明的这些特征与优点将在以下描述与所附权利要求书中变得更加明显,或者可以如下所述通过对本发明的实践而被了解。
附图说明
为了使本发明的优点更容易理解,将参照在附图中图示的具体实施方式给出对以上简单描述的本发明的更具体的描述。在理解这些附图只描绘了本发明的典型实施方式、并且因此不应该被理解为对其范围的限制的前提下,将借助附图利用其他具体特性和细节来描述与解释本发明,其中:
图1为图示根据本发明的冗余信号生成系统的一种实施方式的示意方框图;
图2为图示本发明的冗余信号生成装置的一种实施方式的示意方框图;
图3为图示本发明的双电源模块冗余信号生成系统的一种实施方式的示意方框图;
图4为图示本发明的冗余信号生成电路的一种实施方式的电路图;
图5为图示根据本发明的冗余信号生成方法的一种实施方式的示意流程图;和
图6为图示本发明的多个电源模块的系统的一种实施方式的示意方框图。
具体实施方式
本说明书中描述的许多功能单元被标注为模块,以更具体地强调其实现独立性。例如,模块可以实现为硬件电路,包含定制超大规模集成(“VLSI”)电路或者门阵列、市面上可购买的半导体,例如逻辑芯片、晶体管、或者其他分立组件。模块也可以实现在可编程硬件设备中,例如现场可编程门阵列、可编程门阵列、可编程逻辑设备等等。
模块也可以实现在软件中,以供各种处理器执行。可执行代码的所标识模块可以(例如)包含一个或多个计算机指令的物理或逻辑块,其(例如)可以被组织为对象、过程、或者函数。然而,所标识模块的可执行部分不需要在物理上位于一处,而是可以包含在不同地点中存储的不同的指令,当这些不同的指令被逻辑地连接在一起时,构成了该模块,并且达到该模块所声明的目的。
实际上,可执行代码模块可以是单个指令、或者许多指令,甚至可以分布在几个不同的代码段上、不同程序之间、并跨越几个存储器设备。类似地,运算数据可以在模块内标识与显示、并且可以任何适当形式实现、并且组织在任何适当类型的数据结构内。运算数据可以被收集为单个的数据集,或者可以分布在不同的地点上(包含不同的存储设备),并且可以至少部分地只作为系统或网络上的电子信号存在。
本说明书中,对“一种实施方式”、“实施方式”或者类似语言的引用是指结合该实施方式描述的特定特征、结构或者特点包含在本发明的至少一种实施方式中。因此,本说明书中,出现术语“在一种实施方式中”、“在实施方式中”或者类似语言的地方可以但不一定都指同一实施方式。
另外,在一种或多种实施方式中,所描述的本发明的特征、结构、或者特点可以任何适当的方式组合。在以上描述中,提供了许多具体的细节,例如编程、软件模块、用户选择、网络交易、数据库查询、数据库结构、硬件模块、硬件电路、硬件芯片等等的例子,用来提供对本发明实施方式的彻底理解。但是,本领域技术人员应该理解:在没有所述具体细节中的一个或多个的前提下,或者在使用其他方法、组件、材料等等的前提下,可以实现本发明。在其他例子中,不详细示出或描述公知的结构、材料、或者操作,以避免遮蔽本发明的各方面。
图1为图示本发明的冗余信号生成系统100的一种实施方式的示意方框图。系统100包括多个存储设备150a、150b、控制器模块145以及电源模块105,在电源模块105中具有多个电源供应模块130a、130b、输入模块185、协调模块110、信号生成模块125、测试模块120、以及电池信号模块135。还示出了电池备用模块155、以及多个EPOW模块140。
虽然系统100被描绘为具有两个存储设备150a、150b、一个控制器模块145、两个电源供应模块130a、130b、一个输入模块185、一个协调模块110、一个信号生成模块125、一个测试模块120、一个电池信号模块135、一个电池备用模块155、以及两个EPOW模块140,但是可以采用任何数目的存储设备150a、150b、控制器模块145、电源供应模块130a、130b、输入模块185、协调模块110、信号生成模块125、测试模块120、控制器信号模块115、电池信号模块135、电池备用模块155、以及EPOW模块140。
存储设备150a、150b存储并检索数据。在一种实施方式中,存储设备150a、150b是RAID系统的硬盘驱动器。控制器模块145通过通信通道190a、190b与存储设备150a、150b通信,并且控制它们。在某种实施方式中,通信通道190a、190b为纤维通道仲裁环(Fibre Channel Arbitrated Loop)。例如,控制器模块145可以通过通信通道190a、190b将数据传送给第一存储设备150a,并且第一存储设备150a响应于控制器模块145命令而存储所传送的数据。
电源供应模块130a、130b将电力提供给存储设备150a、150b。在一种实施方式中,电源供应模块130a、130b将来自电网的交流(“AC”)电转换为直流(“DC”)电,以通过电源边界160向存储设备150a、150b提供DC电。在某种实施方式中,如果至少一个电源供应模块130a、130b通过电源边界160供电,则存储设备150a、150b被充分供电。在一种实施方式中,电源供应模块130a、130b还向协调模块110、控制器信号模块115、测试模块120、信号生成模块125、输入模块185、以及电池信号模块135供电。
协调模块110为每个电源供应模块130a、130b生成电源状态信号。如果电源供应模块130a、130b供电,则可以将每个电源状态信号置于有效。输入模块185接收源信号。该源信号可以指示对于系统100或者相关设备的一个或多个情况的、随后的状态变化。例如,该源信号可以指示电网故障。
信号生成模块125从源信号以及一个或多个电源状态信号生成多个输出信号165a、165b。在一种实施方式中,输出信号165a、165b比电源边界160的电源损耗超前5毫秒(5ms)。另外,信号生成模块125生成至少一个电源状态信号。信号生成模块125、输入模块185、以及协调模块110的每个都由诸如半导体设备或者分立电子设备的一个或多个设备构成。单个信号生成模块125、输入模块185、或者协调模块110设备的失灵导致多于一个输出信号165a、165b的故障。
例如,如果诸如与其他设备合作的执行AND功能的设备等设备出现故障,则信号生成模块125可能失灵,从而生成被错误置于有效的输出信号165a、165b。失灵的信号生成模块125至多生成一个错误输出信号,例如第一输出信号165a或者第二输出信号165b。第一与第二输出信号165a、165b不会都被错误地置于有效。
每个EPOW模块140接收输出信号165a、165b,并且从信号生成模块输出的信号165a、165b生成一个或多个EPOW信号175。在一种实施方式中,EPOW信号175符合纤维通道仲裁环设备背板规格,例如华盛顿特区的美国国家标准协会出版的SFF-8045规格6.4.8.2小节的掉电报警(Power FailureWarning)。在所示实施方式中,EPOW信号175用来根据SFF-8045规格6.4.8.2小节而建立至存储设备150a、150b的输入信号。该输入信号引导存储设备150a、150b在掉电之前采取行动。
例如,在诸如存储设备150a、150b等符合SFF-8045规格6.4.8.2小节的设备中,每个EPOW信号175都可以用来引导存储设备150a、150b完成保持写入数据完整性所需的动作,该写入数据正在从写入缓冲区传递到诸如硬盘等存储介质设备。按照SFF-8045规格6.4.8.2小节的写入高速缓冲被禁止的纤维通道仲裁环硬盘驱动器需要在有宽限的情况下(gracefully)在纤维通道帧边界处禁止其纤维通道端口,并且在数据扇区边界处停止向非易失存储介质写入数据。每个EPOW信号175也都可以引导存储设备150a、150b离线,并且不接受用来存储的数据或者检索数据的请求。在可替换实施方式中,每个存储设备150a、150b都可以直接接收每个输出信号。
响应于一个或多个测试信号被置于有效,测试模块120可以生成输出信号165a、165b。另外,响应于测试信号,测试模块120可以生成其他信号。例如,尽管源信号未被置于有效,但是一个或多个测试信号被置于有效也可以引导测试模块120将输出信号165a、165b置于有效。
在一种实施方式中,控制器信号模块115生成控制器信号170。控制器信号170向控制器模块145通知系统100的状态变化,例如存储设备150a、150b的变化。在某种实施方式中,控制器信号170指示存储设备150a、150b状态的马上到来的变化。
电池信号模块135生成电池信号180。在一种实施方式中,电池信号180向电池备用模块155通知为系统100供电的电网的状态变化。响应于电池信号180,电池备用模块155可以准备为系统100的一个或多个元件供电。系统100生成冗余输出信号165a、165b,并且限制由冗余输出信号165a、165b失灵导致的故障的影响。
图2为图示用于冗余信号生成的电源模块105的一种实施方式的示意方框图。电源模块105包括多个电源供应模块130a、130b、输入模块185、协调模块110、信号生成模块125、控制器信号模块115、测试模块120、以及电池信号模块135。
在一种实施方式中,信号生成模块125、输入模块185、协调模块110、测试模块120、以及控制器信号模块115由多个分立冗余固态电子设备制造,例如分立晶体管等等。在可替换实施方式中,信号生成模块125、输入模块185、协调模块110、测试模块120、以及控制器信号模块115由半导体门设备制造在基底上。
参照图1与2,协调模块110为多个电源供应模块130a、130b中的每一个生成电源状态信号。电源供应模块130a、130b向一个或多个系统元件供电,例如存储设备150a、150b、控制器模块145等等。如果电源供应模块130a、130b正在供电,则可以将电源供应模块130a、130b的电源状态信号置于有效。输入模块185接收源信号。信号生成模块125从源信号以及至少一个电源状态信号生成多个输出信号165a、165b。
如果至少一个电源状态信号被置于有效,并且如果源信号未被置于有效,则信号生成模块125不将输出信号165a、165b置于有效。例如,如果至少一个电源状态信号被置于有效,指示至少一个电源供应模块130a、130b正在供电,并且如果源信号未被置于有效,指示没有马上到来的电网故障,则信号生成模块125不将输出信号165a、165b置于有效。
如下配置包含协调模块110、输入模块185、以及信号生成模块125的设备,从而任何一个设备的故障将导致不多于一个错误的输出信号165a、165b。例如,一个信号生成模块125失灵可以导致使一个输出信号165a、165b被错误地置于有效的故障。错误的输出信号165a、165b可以使接收该错误输出信号165a、165b的组件(例如存储设备150a、150b)由于预料到有掉电而采取行动,从而导致存储设备150a、150b离线。该失灵的影响被限制在单个的存储设备150a、150b。由此,例如,在数据被冗余地存储在多个存储设备150a、150b上的RAID系统中,一个存储设备150a、150b可能会错误地离线,但是该RAID系统会有足够的发挥作用的存储设备150a、150b来维持对RAID系统所有数据的访问。装置105将单个设备的失灵限制到单个输出信号165a、165b的故障。
图3为图示本发明的双电源模块冗余信号生成系统300的一种实施方式的示意方框图。系统300包含两个电源模块105,每个都包含协调模块110、控制器信号模块115、测试模块120、信号生成模块125、电池信号模块135、以及输入模块185。虽然该系统被描绘为具有两个电源模块105,但是可以采用任意数目的电源模块105。
电源模块105通过电源边界160向多个存储设备150a、150b供电。第一电源模块105a与第二电源模块105b每个都可以向存储设备150提供充足的电源。每个协调模块110为每个电源模块105生成电源状态信号310。由此,第一协调模块110a为第一电源模块105a生成第一电源状态信号310a,并且将第一电源状态信号310a传送给第二电源模块105b。类似地,第二协调模块110b生成第二电源状态信号310b,并且将第二电源状态信号310b传送给第一电源模块105a。
第一与第二输入模块185a、185b每个都接收源信号。第一信号生成模块125a从源信号以及第二电源状态信号310b生成多个输出信号165a、165b,同时第二信号生成模块125b从源信号以及第一电源状态信号310a生成多个输出信号165c、165d。虽然每个信号生成模块125被描绘为生成两个输出信号165,但是可以采用任意数目的输出信号165。
每个电源供应模块130的输入模块185、协调模块110、信号生成模块125、控制器信号模块115、电池信号模块135、以及测试模块120都可以接收来自补充电源模块315的电源。在一种实施方式中,电池备用模块155向补充电源模块315供电。系统300从可以是可替换组件的多个电源模块105生成冗余输出信号165。
图4为图示本发明的冗余信号生成电路400的一种实施方式的电路图。电路400为图1-3的电源模块105的一种实施方式。在一种实施方式中,电路400与图1-3的协调模块110、控制器信号模块115、测试模块120、信号生成模块125、电池信号模块135、以及输入模块185相连接。
电路400包括配置为以下的设备:AND门425a、425b、425c、425d、425e、425f,OR门440a、440b、440c、440d,以及反相器430a、b、c,这些设备对数字信号执行逻辑功能,如本领域技术人员所公知。虽然为了简单,每个AND门425a、b、c、d、e、f、OR门440a、b、c、d、以及反相器430a、b、c的输出可以被描绘为从共同设备集合(例如晶体管或半导体门)生成多个输入共有的输出,但是每个AND门425a、b、c、d、e、f、OR门440a、b、c、d、以及反相器430a、b、c的输出表示对于每个输入的特有输出,其中每个输出从该输出所特有的设备集合生成。
例如,第一AND门425a接收Power Good(电源良好)信号415与EPOWIn信号410。Power Good信号415可以指示电源模块130正在发挥功能。EPOWIn信号410可以是图1-3中描述的源信号,并且当被置于有效时指示电网故障。第一AND门425a可以作为图1-3的输入模块185。
利用特有设备集合(每个设备都为第一AND门425a驱动的每个输入生成不同的输出信号),第一AND门425a对Power Good信号415与EPOW In信号410执行多个逻辑AND运算。如图所示,第一AND门425a使用7个特有设备集合执行AND功能,并且生成7个不同的输出信号,每个信号用于第一OR门440a、第二OR门440b、第二AND门425b、第三AND门425c、第四AND门425d、第五AND门425e、以及第六AND门425f。
在所示实施方式中,Power Status In(电源状态进入)信号310a可以从多个协调模块110接收。如果没有第二电源供应模块130b,则下拉电阻器420允许将Power Status In信号310a置于有效。如果协调模块110将电源状态信号310置于有效,并且由于Power Good信号415被置于无效(de-asserted)或者EPOW In信号410被置于有效而使得第一AND门425a输出为低,则第一与第二OR门440a、440b将第一与第二输出信号165a、165b置于有效。第一与第二OR门440a、440b可以构成图1-3中描述的信号生成模块125。在一种实施方式中,输出模块165与其他静态逻辑结合使用,以满足ANSI纤维通道规格SFF-80456.4.8小节Dev_Ctrl_Code函数以及6.4.8.2小节掉电报警的需求。
如果:1)First EPOW Test Bit(第一EPOW测试位)405a被置于有效;或者2)Power Good信号415未被置于有效;或者3)EPOW In信号410被置于有效,则第四与第五AND门425d、425e将第一与第二电池信号180a、180b置于有效。虽然电池信号180被描绘为包含电池信号零(0)180a与电池信号一(1)信号180b,但是电池信号180可以包含任意数目的信号。第四与第五AND门425d、425e可以构成图1-3中描述的电池信号模块135。
如果:1)协调模块110将Power Status(电源状态)信号310a置于有效,并且Second EPOW Test Bit(第二EPOW测试位)405b被置于有效;或者2)Power Good信号415未被置于有效;或者3)EPOW In信号410被置于有效,则第三OR门440c将控制器信号零(0)170a置于有效。如果:1)协调模块110将Power Status信号310a置于有效,并且Third EPOW Test Bit(第三EPOW测试位)405c被置于有效;或者2)Power Good信号415未被置于有效;或者3)EPOW In信号410被置于有效,则第四OR门440d将控制器信号一(1)170b置于有效。虽然描绘了两个控制器信号170a、170b,但是可以采用任意数目的控制器信号170。第三与第四OR门440c、440d可以构成图1-3中描述的控制器信号模块115。
如果:1)First EPOW Test Bit 405a被置于有效;或者2)Power Good信号415未被置于有效;或者3)EPOW In信号410被置于有效,则第六AND门425f将Power Status Out(电源状态输出)信号310b置于有效。第六AND门425f可以构成图1-3中描述的协调模块110。电路400生成冗余输出信号165a、165b、以及其他控制信号(包括电池信号180a、b、电源状态输出信号310b、以及控制器信号170a、b)。
以下的示意流程图被一般地列出作为逻辑流程图。这样,所示的顺序以及所标注的步骤显示了所呈现方法的一种实施方式。可以设想功能、逻辑、或者效果等同于所示方法的一个或多个步骤、或者其一部分的其他步骤与方法。另外,所采用的格式与符号是提供用来解释该方法的逻辑步骤的,应该理解为不是要限定该方法的范围。虽然在流程图种可能采用各种箭头类型与线条类型,但是应该将其理解为不是要限定对应方法的范围。实际上,某些箭头或者其他连接符可以用来只指示该方法的逻辑流。例如,箭头可以指示所显示方法的所列举步骤之间的、未指定持续时间的等待或监控周期。另外,特定方法发生的顺序可能也可能不严格符合所示对应步骤的顺序。例如,该方法可能并行或者以其他顺序发生。
图5为图示根据本发明的冗余信号生成方法500的一种实施方式的示意流程图。根据方法500,(图1-4的)协调模块110为(图1-4的)多个电源供应模块130中的每一个生成505(图3的)电源状态信号310a、b。(图1-4的)输入模块185接收510源信号,例如(图4的)EPOW信号410。在一种实施方式中,EPOW In信号410指示电网已出故障,并且(图1-4的)电源供应模块130的故障马上要发生。
(图1-4的)信号生成模块125从源信号以及(图3-4的)多个电源状态信号310a、b生成515(图1-4的)多个输出信号165。在一种实施方式中,(图1-4的)多个EPOW模块140从(图1-4的)每个输出信号165生成(图1-4的)一个或多个EPOW信号175。在替换实施方式中,(图1-4的)的每个输出信号165都起到(图1-4的)存储设备150a、150b的(图1-4的)EPOW信号175a、b的作用。
在一种实施方式中,(图1-4的)的电池信号模块135生成520电池信号180。(图1-4的)电池信号180可以引导(图1-4的)的电池备用模块155供电。另外,(图1-4的)的控制器信号模块115可以生成525(图1-4的)控制器信号170。(图1-4的)控制器信号170可以向(图1-4的)控制器模块145指示马上到来的状态变化,例如(图1-4的)一个或多个存储设备150a、b的状态变化。
图6为图示本发明的电源模块系统600的一种实施方式的示意方框图。系统600包含第一与第二电源模块620a、b。每个电源模块620都包含12伏特(12V)模块605、5伏特(5V)模块610a、b、以及3.3伏特(3.3V)模块615a、b。作为例子给出图6,并且虽然每个电源模块620a、b都被描绘为具有一个12伏特(12V)模块605a、b、一个5伏特(5V)模块610a、b、以及一个3.3伏特(3.3V)模块615a、b,但是可能采用任意数目的模块以及具有不同电压和/或安培数的模块。
第一与第二12伏特(12V)模块605a、605b、第一与第二5伏特(5V)模块610a、610b、以及第一与第二3.3伏特(3.3V)模块615a、615b中的每个都提供电源边界。例如,12伏特(12V)模块605a、b通过12伏特(12V)输出625提供12伏特(12V)电源边界,5伏特(5V)模块610a、b通过5伏特(5V)输出630提供5伏特(5V)电源边界,而3.3伏特(3.3V)模块615a、b通过3.3伏特(3.3V)输出635提供3.3伏特(3.3V)电源边界。
每个3.3伏特(3.3V)模块615a、b都可以向输入模块185a、b、协调模块110a、b、信号生成模块125a、b、控制器模块115a、b、测试模块120a、b,以及电池信号模块135a、b供电。3.3伏特(3.3V)模块615a、b可以为图3中描述的补充电源模块315。
在一种实施方式中,如果第一与第二电源模块620a、620b未从电网收到电源,则3.3伏特(3.3V)模块615a、b继续供电。例如,3.3伏特(3.3V)模块615可以从电池接收电源。图1与3中描述的电池备用模块155可以包含电池。如果一个或多个电源模块620未能从电网接收电源,则输入模块185a、b、协调模块110a、b、信号生成模块125a、b、控制器模块115a、b、测试模块120a、b、以及电池信号模块135a、b继续发挥作用。
通过生成(图1-4的)冗余输出信号165a、b、c、d,本发明减少了关键系统中的故障。(图1-4的)输出信号165a、b、c、d可以用来对状态改变(例如掉电)进行报警,并且可以用来保护数据。另外,本发明首次限制了由一个设备(包含生成(图1-4的)冗余输出信号165a、b、c、d的多个设备)的失灵产生的故障的影响,从而不会有多于一个的(图1-4的)输出信号165a、b、c、d被错误地置于有效。
在不脱离其精神或实质特点的前提下,本发明可以以其他特定形式实现。所描述的实施方式在所有方面都应被认为只是说明性的,而非限定性的。因此,本发明的范围由所附权利要求而前述非说明书限定。在权利要求等同物的意义与范围内的所有改变都包含在其范围之内。

Claims (30)

1.一种生成冗余信号的装置,该装置包含:
协调模块,被配置来为多个电源模块中的每一个生成电源状态信号;
输入模块,被配置来接收源信号;以及
信号生成模块,被配置来从源信号与至少一个电源状态信号生成多个输出信号,其中如果至少一个电源供应正常运行,则输出信号不被置为有效,并且其中信号生成模块设备的单一失灵导致不多于一个输出信号的故障。
2.如权利要求1所述的装置,其中该信号生成模块由多个分立冗余固态电子设备制造。
3.如权利要求1所述的装置,其中每个输出信号都被配置为早期断电报警信号。
4.如权利要求3所述的装置,其中冗余输出信号被配置为纤维通道早期断电报警信号。
5.如权利要求4所述的装置,其中信号生成模块与多个早期断电报警模块通信,所述多个早期断电报警模块被配置来从每个输出信号生成多个纤维通道早期断电报警信号。
6.如权利要求1所述的装置,还包含测试模块,被配置来验证该信号生成模块的功能性。
7.如权利要求1所述的装置,还包含电池信号模块,被配置来生成被配置来激活电池备用模块的电池信号。
8.如权利要求1所述的装置,还包含控制器信号模块,被配置来生成被配置来向控制器模块通知存储设备状态变化的控制器信号。
9.如权利要求1所述的装置,还包含多个输入模块、多个协调模块、以及多个信号生成模块,其中每个模块都由补充电源模块供电。
10.一种生成冗余信号的装置,该装置包含:
多个电源传感器,被配置来检测活动的电源线;
输入模块,被配置来接收源信号;
信号生成模块,被配置来从源信号与至少一个所检测的活动电源线生成多个输出信号,其中如果至少一个电源线正常运行,则输出信号不被置为有效,并且其中信号生成模块设备的单一失灵导致不多于一个输出信号的故障。
11.一种生成冗余信号的系统,该系统包含:
多个存储设备;
控制器模块,被配置来控制所述存储设备;
多个电源模块,被配置来为所述存储设备供电;
输入模块,被配置来接收源信号;
协调模块,被配置来为每个电源模块生成电源状态信号;以及
信号生成模块,被配置来从源信号与至少一个电源状态信号生成多个输出信号,其中每个输出信号都与一个存储设备通信,如果至少一个电源供应正常运行,则输出信号不被置为有效,并且其中信号生成模块设备的单一失灵导致不多于一个输出信号的故障。
12.如权利要求11所述的系统,其中信号生成模块由多个分立冗余固态电子设备制造。
13.如权利要求11所述的系统,其中每个输出信号都被配置为早期断电报警信号。
14.如权利要求13所述的系统,其中每个输出信号被配置为纤维通道早期断电报警信号。
15.如权利要求14所述的系统,还包含多个早期断电报警模块,被配置来从每个输出信号生成多个纤维通道早期断电报警信号。
16.如权利要求11所述的系统,还包含多个输入模块、多个协调模块、以及多个信号生成模块,其中每个模块都由补充电源模块供电。
17.如权利要求11所述的系统,还包含测试模块,被配置来验证信号生成模块的功能性。
18.如权利要求11所述的系统,还包含电池信号模块,被配置来生成被配置来激活电池备用模块的电池信号。
19.如权利要求11所述的系统,还包含控制器信号模块,被配置来生成被配置来向控制器模块通知存储设备状态变化的控制器信号。
20.一种生成冗余信号的方法,该方法包含:
为多个电源模块中的每一个生成电源状态信号;
接收源信号;以及
从源信号与至少一个电源状态信号生成多个输出信号,其中如果至少一个电源供应正常运行,则输出信号不被置为有效,并且其中信号生成模块设备的单一失灵导致不多于一个输出信号的故障。
21.如权利要求20所述的方法,其中输出信号由多个分立冗余固态电子设备生成。
22.如权利要求20所述的方法,其中每个输出信号都被配置为早期断电报警信号。
23.如权利要求22所述的方法,还包含从每个输出信号生成多个纤维通道早期断电报警信号。
24.如权利要求20所述的方法,还包含验证电源状态信号生成部件、源信号接收部件、以及输出信号生成部件的功能性。
25.如权利要求20所述的方法,还包含生成被配置来激活电池备用模块的电池信号。
26.如权利要求20所述的方法,还包含生成被配置来向控制器模块通知存储设备状态变化的控制器信号。
27.如权利要求20所述的方法,还包含为电源状态信号生成部件、源信号接收部件、以及输出信号生成部件提供补充电源。
28.一种生成冗余信号的方法,该方法包含:
控制多个存储设备;
为被配置来为所述存储设备供电的多个电源模块的每个生成电源状态信号;
接收源信号;以及
从源信号与至少一个电源状态信号生成多个输出信号,其中如果至少一个电源供应正常运行,则输出信号不被置为有效,并且其中信号生成模块设备的单一失灵导致不多于一个输出信号的故障。
29.如权利要求28所述的方法,其中输出信号由多个分立冗余固态电子设备生成。
30.一种生成冗余信号的装置,该装置包含:
用来为多个电源模块中的每一个生成电源状态信号的部件;
用来接收源信号的部件;以及
用来从源信号与至少一个电源状态信号生成多个输出信号的部件,其中如果至少一个电源供应正常运行,则输出信号不被置为有效,并且其中信号生成模块设备的失灵导致不多于一个输出信号的故障。
CNB2005101247464A 2004-11-16 2005-11-16 限制冗余信号中的故障的装置、系统以及方法 Expired - Fee Related CN100412808C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/989,656 2004-11-16
US10/989,656 US7337357B2 (en) 2004-11-16 2004-11-16 Apparatus, system, and method for limiting failures in redundant signals

Publications (2)

Publication Number Publication Date
CN1801108A true CN1801108A (zh) 2006-07-12
CN100412808C CN100412808C (zh) 2008-08-20

Family

ID=36462266

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005101247464A Expired - Fee Related CN100412808C (zh) 2004-11-16 2005-11-16 限制冗余信号中的故障的装置、系统以及方法

Country Status (2)

Country Link
US (1) US7337357B2 (zh)
CN (1) CN100412808C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375410A (zh) * 2010-08-24 2012-03-14 空中客车运营简化股份公司 冗余信号的处理系统、相关方法和包括这类系统的航空器

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7363520B1 (en) * 2005-03-29 2008-04-22 Emc Corporation Techniques for providing power to a set of powerable devices
US20070226536A1 (en) * 2006-02-06 2007-09-27 Crawford Timothy J Apparatus, system, and method for information validation in a heirarchical structure
US20080084680A1 (en) * 2006-10-09 2008-04-10 Shah Mohammad Rezaul Islam Shared docking bay accommodating either a multidrive tray or a battery backup unit
US7774650B2 (en) * 2007-01-23 2010-08-10 International Business Machines Corporation Power failure warning in logically partitioned enclosures
US7818597B2 (en) * 2007-03-26 2010-10-19 International Business Machines Corporation Computer system fault detection
US7747900B2 (en) * 2007-04-02 2010-06-29 International Business Machines Corporation Thresholding system power loss notifications in a data processing system based on vital product data
US7937602B2 (en) * 2007-04-02 2011-05-03 International Business Machines Corporation System and method for thresholding system power loss notifications in a data processing system based on current distribution network configuration
US8028195B2 (en) * 2007-12-18 2011-09-27 International Business Machines Corporation Structure for indicating status of an on-chip power supply system
US7917806B2 (en) * 2007-12-18 2011-03-29 International Business Machines Corporation System and method for indicating status of an on-chip power supply system
US8190925B2 (en) 2008-10-02 2012-05-29 International Business Machines Corporation Single shared power domain dynamic load based power loss detection and notification
US20120137289A1 (en) * 2010-11-30 2012-05-31 International Business Machines Corporation Protecting high priority workloads in a virtualized datacenter
US20140082406A1 (en) * 2012-09-18 2014-03-20 Sandisk Technologies Inc. Data protection through power loss prediction
CN112487119B (zh) * 2020-11-30 2024-04-26 深圳供电局有限公司 一种停电预警信号校验方法及系统

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4228496A (en) * 1976-09-07 1980-10-14 Tandem Computers Incorporated Multiprocessor system
JPS56162122A (en) * 1980-05-16 1981-12-12 Canon Inc Electronic apparatus equipped with printing device
US4812677A (en) * 1987-10-15 1989-03-14 Motorola Power supply control with false shut down protection
US4997288A (en) * 1988-12-09 1991-03-05 The Exchange System Limited Partnership Power supply arrangement for fault-tolerant operation in a microcomputer-based encryption system
US5367697A (en) * 1991-10-22 1994-11-22 Bull Hn Information Systems Inc. Means for providing a graceful power shut-down capability in a multiprocessor system having certain processors not inherently having a power shut-down capability
JP2888401B2 (ja) * 1992-08-03 1999-05-10 インターナショナル・ビジネス・マシーンズ・コーポレイション 冗長ディスクドライブアレイに対する同期方法
US5623596A (en) * 1994-05-09 1997-04-22 Apple Computer, Inc. Power fault protection in a computer system having multiple power supplies
US5928368A (en) * 1994-06-23 1999-07-27 Tandem Computers Incorporated Method and apparatus for fault-tolerant multiprocessing system recovery from power failure or drop-outs
JP3474665B2 (ja) * 1995-03-02 2003-12-08 富士通株式会社 計算機システムの電源制御装置及び方法
US5708771A (en) * 1995-11-21 1998-01-13 Emc Corporation Fault tolerant controller system and method
US5790773A (en) * 1995-12-29 1998-08-04 Symbios, Inc. Method and apparatus for generating snapshot copies for data backup in a raid subsystem
US5925139A (en) * 1996-03-25 1999-07-20 Sanyo Electric Co., Ltd. Microcomputer capable of preventing writing errors in a non-volatile memory
US5745670A (en) * 1996-06-11 1998-04-28 Lanart Corporation Fault tolerant power supply system
KR100186349B1 (en) * 1996-12-17 1999-04-15 Lg Ind Systems Co Ltd Power failure compensation method of plc and plc having function of power failure compensation
US6195754B1 (en) * 1997-01-28 2001-02-27 Tandem Computers Incorporated Method and apparatus for tolerating power outages of variable duration in a multi-processor system
US6145098A (en) * 1997-05-13 2000-11-07 Micron Electronics, Inc. System for displaying system status
US6163849A (en) * 1997-05-13 2000-12-19 Micron Electronics, Inc. Method of powering up or powering down a server to a maintenance state
US6088816A (en) * 1997-10-01 2000-07-11 Micron Electronics, Inc. Method of displaying system status
US6345369B1 (en) * 1998-11-12 2002-02-05 International Business Machines Corporation Environmental and power error handling extension and analysis for systems with redundant components
US6140926A (en) * 1999-07-21 2000-10-31 Hewlett-Packard Company Redundant status indicators for fault tolerance
JP3264272B2 (ja) * 1999-09-16 2002-03-11 インターナショナル・ビジネス・マシーンズ・コーポレーション コンピュータ及びコンピュータの電源制御方法
JP4219516B2 (ja) * 1999-12-20 2009-02-04 富士通株式会社 電源制御装置及び電源制御方法及び記憶媒体
US6594786B1 (en) * 2000-01-31 2003-07-15 Hewlett-Packard Development Company, Lp Fault tolerant high availability meter
US6813634B1 (en) * 2000-02-03 2004-11-02 International Business Machines Corporation Network fault alerting system and method
US6600238B1 (en) * 2000-11-20 2003-07-29 International Business Machines Corporation Redundancy and component failure detection within a switching power system
US7152175B2 (en) * 2003-03-06 2006-12-19 Sun Microsystems, Inc. Power supply system
US7219258B2 (en) * 2003-12-10 2007-05-15 International Business Machines Corporation Method, system, and product for utilizing a power subsystem to diagnose and recover from errors

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375410A (zh) * 2010-08-24 2012-03-14 空中客车运营简化股份公司 冗余信号的处理系统、相关方法和包括这类系统的航空器
CN102375410B (zh) * 2010-08-24 2016-06-15 空中客车运营简化股份公司 冗余信号的处理系统、相关方法和包括这类系统的航空器

Also Published As

Publication number Publication date
CN100412808C (zh) 2008-08-20
US7337357B2 (en) 2008-02-26
US20060112305A1 (en) 2006-05-25

Similar Documents

Publication Publication Date Title
CN1801108A (zh) 限制冗余信号中的故障的装置、系统以及方法
CN1776596A (zh) 用于备选锁定设施连接路径的装置、系统和方法
US7263582B2 (en) System and method for raid configuration
CN101131675B (zh) 预防存储控制器的分区高速缓存中写饥饿的装置和方法
CN107832199A (zh) 基于cpld的硬盘监控系统
US20080040463A1 (en) Communication System for Multiple Chassis Computer Systems
US20070250723A1 (en) Storage apparatus and power supply control method thereof
CN1099067C (zh) 信息处理设备
CN200983158Y (zh) 一种计算机刀片服务器用刀片管理卡
WO2011158294A1 (en) Storage apparatus and method of detecting power failure in storage apparatus
US20150154032A1 (en) Server bootstrapping method and computer system
US20080263393A1 (en) Storage controller and storage control method
JP2005301476A (ja) 給電制御システム、及び記憶装置
CN1920763A (zh) 存储系统
US8073993B2 (en) Management of redundant physical data paths in a computing system
US7774545B2 (en) System and method of volume group creation based on an automatic drive selection scheme
CN1300027A (zh) 对多个主机访问共享读/写驱动器进行库局部管理的数据存储库
CN1825269A (zh) 盘阵列设备和数据备份方法
CN1573705A (zh) 存储控制器及数据存储方法
US20170270044A1 (en) Active Storage Unit and Array
CN1776623A (zh) 连接路径分组的装置、系统和方法
US7825799B2 (en) Method and apparatus for monitoring power supply failure
US20130132766A1 (en) Method and apparatus for failover and recovery in storage cluster solutions using embedded storage controller
US7484116B2 (en) Apparatus, system, and method for accessing redundant data
KR101139495B1 (ko) 스위치 기반 하이브리드 저장 시스템 및 그 제공 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: GOOGLE INC.

Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINES CORP.

Effective date: 20120427

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20120427

Address after: American California

Patentee after: Google Inc.

Address before: American New York

Patentee before: International Business Machines Corp.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080820

Termination date: 20171116