CN1111793C - 冗余装置 - Google Patents

冗余装置 Download PDF

Info

Publication number
CN1111793C
CN1111793C CN98115553A CN98115553A CN1111793C CN 1111793 C CN1111793 C CN 1111793C CN 98115553 A CN98115553 A CN 98115553A CN 98115553 A CN98115553 A CN 98115553A CN 1111793 C CN1111793 C CN 1111793C
Authority
CN
China
Prior art keywords
unit
stand
state
diagnosis
corresponding device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN98115553A
Other languages
English (en)
Other versions
CN1223403A (zh
Inventor
泷田雅敏
大西和荣
斋藤孝充
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN1223403A publication Critical patent/CN1223403A/zh
Application granted granted Critical
Publication of CN1111793C publication Critical patent/CN1111793C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements

Abstract

在由现用单元和备用单元构成的冗余装置中,上单元在正常情况下通过连接控制器和现用单元相连,当在现用单元中发生故障时,控制连接控制器使现用单元换路到备用单元。连接控制器包括诊断部分,用于利用测试信号诊断备用单元或现用单元,并把结果通知上单元。

Description

冗余装置
技术领域
本发明涉及一种冗余装置,尤其涉及一种由现用单元和备用单元构成的冗余装置,其中当在现用单元中发生故障时,现用单元被换路到备用单元。
背景技术
近年来,信息处理系统不断增大,并且愈加复杂。特别是在联机即实时工作的系统中,局部发生的故障可能影响整个系统而导致大的破坏。
为了对付这种故障,出现了用于克服故障影响的冗余技术,故障诊断和修复技术,以及前述两种技术的结合。在这些技术当中,在冗余装置中利用冗余技术,在发生故障时,使现用单元换路到备用单元,并对故障进行诊断和修复,以便缩短系统的非利用时间。
在这种冗余装置中,具有一个使系统不受故障影响的恢复速度,以及一个合理的性能/价格比显得越来越重要。
图17表示作为冗余装置的现有技术的公知的电子开关板的结构。这种装置包括和用户1,用户2相连的电路设备DTSH,以及通过控制信号电路C和主信号电路A0-A2和这一电路设备DTSH相连的上单元100。上单元100包括和控制信号电路C相连的控制器110,和主信号电路A0-A2以及控制器110相连的开关部分120,以及和开关部分120相连的诊断部分212。
电路设备DTSH包括和用户1,2相连的换路部分300;电路对应设备(缩写为CCE)DT0-DT2,它们分别通过主信号电路A6-A8和换路部分300相连;以及电路控制器DTC,它通过主信号电路A3-A5分别和电路对应设备DT0-DT2相连,同时还和控制信号电路C以及主信号电路A0-A2相连。
应该注意的是,主信号电路A0,A3和A6,主信号电路A1,A4,和A7,以及主信号电路A3,A5和A8分别和主信号电路A0,A1和A2相同。因此,在下面的说明中,主信号电路A0,A1和A2代表其它的主信号电路。而且,把电路控制器DTC和开关部分120相连的主信号电路A0,A1和A2可以是作为总线的一个逻辑电路。
在正常操作时,电路对应设备DT0,DT1被预置为现用单元。通过换路部分300,电路对应设备DT0和DT1分别和用户1,2相连。电路对应设备DT2被预置为备用单元,并且不和用户1,2相连。即设备DT2是备用的电路对应设备。
如图17所示,用户1和开关部分120由主信号电路A0通过换路部分300、电路对应设备DT0、以及电路控制器DTC被固定地相连。按同样方式,用户2和开关部分120由主信号电路A1通过换路部分300、电路对应设备DT1、以及电路控制器DTC被固定地相连。
诊断部分212在控制器110的控制下在主信号电路A2上通过开关部分120和电路控制器DTC向备用电路对应设备DT2发出测试信号,从而根据响应信号诊断电路对应设备DT2是否正常。
图18表示在图17所示的电路对应设备DT0中发生故障的情况下所进行的操作的例子。控制器110在收到来自电路控制器DTC的表示在电路对应设备DT0中发生故障的信号时,控制器110便使换路部分300把电路对应设备DT0与用户1断开,以便使电路对应设备DT0退出其现用状态。
控制器110在命令开关部分120使从主信号电路A0到主信号电路A2再次接通之后,便使换路部分300把备用电路对应设备DT2和用户1相连,以便继续工作。
即,和图17不同,用户1将通过换路部分300、备用电路对应设备DT2、电路控制器DTC以及开关部分120和主信号电路A2相连。
控制器110再次使开关部分120建立通路,由主信号电路A0使诊断部分212和电路对应设备DT0相连。在故障的电路对应设备DT0被更换并修复之后,诊断部分212根据控制器110的指令通过主信号电路A0向电路对应设备DT0发出测试信号,从而根据响应信号诊断电路对应设备DT0。将诊断结果送到控制器110中。
控制器110根据诊断结果识别电路对应设备DT0已经恢复到正常状态时,使备用电路对应设备DT2和恢复的电路对应设备DT0分别返回备用状态和现用状态,并控制开关部分120和换路部分300返回图17所示的连接。
应该注意,当电路对应设备DT0故障而备用电路对应设备DT2为现用设备且电路对应设备DT1也故障时,和电路对应设备DT1相连的用户2便不能使用任何电路对应设备,因为此时没有可利用的备用电路对应设备。
作为解决这一问题的一种方法,有一种具有多个备用电路对应设备的冗余装置。这种冗余装置的功能和只有一个备用电路对应设备的冗余装置相同。
在这种现有技术的N+1型的冗余装置中,其中例如包括N个现用电路对应设备和一个备用电路对应设备,通过提供和每个电路对应设备相应的N+1个信号系统进行诊断。即如图17中所示的主信号电路A0-A2对于实际上应该配备的所有的电路对应设备都是需要的。因此,在电子开关板中,开关部分的硬件容量的1/N总是保持不用。
电路对应设备的诊断要求具有通过利用包括电路对应设备DTC以便使信号返回的装置进行确认信号的发送和接收的功能。对于这种功能,一直利用在电子开关板中的开关部分的硬件资源。
即N+1型的冗余装置的电路对应设备的诊断在硬件方面要求占用1/N的容量,而在软件方面,要求进行关于电路对应设备之外的其它部分的处理。
发明内容
因而,本发明的目的在于,提供一种由现用单元和备用单元构成的冗余装置,当在现用单元中发生故障时现用单元被换路到备用单元,其中消除了硬件资源(开关部分)的浪费,并且高效率地进行现用单元和备用单元(电路对应设备)的诊断。
【1】为了实现上述目的,按照本发明的的冗余装置包括连接控制器,其和现用单元以及备用单元相连并转换所述的连接;上单元,其通过连接控制器和现用单元相连并在正常状态下向现用单元发送主信号,并检测现用单元中的故障,控制连接控制器从而把故障的现用单元换路到备用单元;以及换路部分,其在正常状态下被连接在下单元和现用单元之间,并在上单元的控制下,和连接控制器相结合把故障的现用单元换路到和下单元相连的备用单元。
具体地说,图1表示按照上述本发明的作为冗余装置的电子开关板的示意的结构(1)。这种结构和图17所示的装置的区别在于,被包含在上单元100中的开关部分120不通过主信号电路A2和作为连接控制器的电路控制器DTC相连。因此,作为备用单元的电路对应设备DT2不由主信号电路A2通过电路控制器DTC和开关部分120相连。
应该注意,作为现用单元的电路对应设备DT0和DT1由主信号A0和A1通过电路控制器DTC和开关部分120相连,和上述的现有技术中的结构一样。
在正常工作时,和图17所示的现有技术不同,电路控制器DTC不固定地和主信号电路A0,A1相连,但是开关部分120和电路对应设备DT0,DT1可以相互换路。
图2表示在图1中的电路对应设备DT0中发生故障的情况。已经检测出在电路对应设备DT0中的故障的控制器110控制电路控制器DTC切断开关部分120和电路对应设备DT0之间的主信号电路A0,还控制换路部分300使得电路对应设备DT0和用户1断开。
电路控制器DTC由主信号电路A0连接开关部分120和备用电路对应设备DT2。备用电路对应设备DT2由换路部分300和用户1相连,从而由主信号电路A0使用户1和开关部分120相连。
如图1和图2所示,开关部分120不需要容纳主信号电路A2。因此,便可以减少开关部分120的硬件容量。例如,具有4个现用电路对应设备和1个备用电路对应设备的冗余装置可以减少1/4的开关容量。
【2】在上述的发明中,当现用单元从故障状态恢复时,连接控制器可以使备用单元和现用单元返回其初始状态,从而在上单元的控制下使恢复的现用单元和上单元相连。
如图2所示,当电路对应设备DT0被恢复时,电路控制器DTC在控制器110的控制下使和开关部分120连接的主信号电路A0从备用电路对应设备DT2换接回到电路对应设备DT0,并且换路部分300使用户1从电路对应设备DT2换接回到电路对应设备DT0。
【3】在没有可被换路的备用单元的情况下,上述的连接控制器在上单元的控制下可以使故障的现用单元和上单元断开。
图3表示在图2中的电路对应设备9T1中发生故障的情况。检测到电路对应设备DT1中的故障的控制器110切断电路对应设备DT1和开关部分120之间的主信号电路A1的连接。在这种情况下,备用电路对应设备DT2是唯一的一个备用单元并已处于现用状态,因而在电路对应设备DT1和电路对应设备DT2之间不能进行换路,因而用户2便不能利用。
【4】当把现用单元和备用单元返回其初始状态时,上述的连接控制器可以使有故障的或已经被断开的现用单元换路到已被复原的备用单元,以便和上单元连接。
即,当电路对应设备DT0被恢复成图3所示的正常状态时,电路对应设备DT0和备用电路对应设备DT2进行换路,从而使电路对应设备DT0和电路对应设备DT2分别成为现用状态和备用状态,如图4所示。在换路时,控制器110当识别出电路对应设备DT1由于故障而被断开时,使电路对应设备DT2换路到电路对应设备DT1,从而释放用户2不能利用的状态。
结果,因为先前故障的电路对应设备DT0被换路到备用电路对应设备DT2,和新发生故障的对应设备DT1相连的主信号电路A1没有要被换路的备用电路对应设备,因而保持不能利用状态。只要备用对应设备DT2返回,电路对应设备DT1和对应设备DT2便可以相互换路,使主信号电路A1复原。
【5】上述的作为连接控制器的电路连接控制器DTC可以进一步包括诊断部分,用于在上单元的控制下用测试信号诊断电路对应设备DT0-DT2,它们或者是和上单元100断开的现用单元,或者是和上单元100断开的备用单元,并把诊断结果通知上单元100。
即图5表示按照本发明的冗余装置的示意的结构(2)。这种结构和图1的示意的结构的区别在于,电路控制器DTC包括诊断部分212,它和电路对应设备DT0-DT2以及控制器110通过主信号电路A0-A2和控制信号电路C相连。
结果,用于在图17中所示的现有技术的电子开关板中使用的测试信号的主信号电路A2不再需要,因而开关部分的开关容量可以比现有技术的例子中的小。
【6】上述诊断部分可以在换路之前诊断备用单元,并且只有在备用单元中没有故障时,连接控制器才进行换路。
当在图5的电路对应设备DT0中发生故障时,电路控制器DTC首先把诊断部分212连接到备用电路对应设备DT2,对其进行诊断。只有在电路对应设备DT2中没有故障时,电路对应设备DT0才被换路到电路对应设备DT2。
结果,当在电路对应设备DT0中已经发生故障时而备用电路对应设备DT2已经故障的情况下,可以阻止电路对应设备DT0换路到电路对应设备DT2。特别是,在没有用于自动地执行诊断系统的换路功能的装置,而维护人员定期地诊断备用电路对应设备DT2以便阻止潜在的故障的情况下,这是有效的。
【7】上述诊断部分可以和故障的现用单元相连,用于诊断在换路时已经和上单元断开的现用单元。
即,当电路控制器DTC把故障的电路对应设备DT0换路到备用电路对应设备DT2时,如图5所示,诊断部分212被同时连接到电路对应设备DT0。只要该电路对应设备DT0被修复和更换,便进行诊断从而证实恢复。
【8】上述诊断部分可以在上单元的控制下或自动地定期诊断备用单元。
在图5中,诊断部分212可以根据控制器110的指令或自动地定期诊断备用电路对应设备DT2,并可以确认和保证备用电路对应设备的正常性。
【9】当在诊断期间在现用单元中已经发生故障时,上述诊断可以停止,并把故障的现用单元换路到备用单元。
在图5中,当在诊断备用电路对应设备DT2的同时在电路对应设备DT0中发生故障时,诊断可以立即停止,并可以把发生故障的电路对应设备DT0换路到备用电路对应设备DT2。在这种情况下,诊断结果将被放弃。
结果,现用电路对应设备的恢复比备用电路对应设备DT2的诊断具有优先权,从而增强了系统对于故障的可靠性。
【10】上述的上单元可以把备用单元划分为现用状态、维护状态、0S(不工作)状态=故障状态、备用状态、诊断-备用状态或作为一种现用状态的诊断-维护状态,其中备用单元从现用单元换路以便诊断处于维护状态/(或)OS状态(“OUS”)的现用单元,并控制每种状态使得故障的现用单元不换路到处于现用状态、维护状态、OS状态、或诊断-维护状态(“DIA-OUS”)的备用单元。
在图5中,控制器110把电路对应设备DT2分为现用状态、维护状态、OS状态、备用状态、诊断-备用状态或作为一种现用状态的诊断-维护状态,其中电路对应设备DT2从处于维护状态或OS状态下的要被诊断的电路对应设备DT0或DT1换路,其中每种状态被控制。
在电路对应设备DT2处于现用状态、OS状态、或诊断-维护状态时,即使在电路对应设备DT0或DT1中新发生故障,也不执行从执行电路对应设备向电路对应设备DT2的换路。
结果,控制器110存储最近的诊断结果和每个电路对应设备的状态。因此,通过参照存储的状态,控制器110可以立即确定是否执行使故障的现用单元向备用电路对应设备DT2的换路。
【11】在上述的发明【10】中,上单元还可以不定期地诊断处于现用状态、维护状态或OS状态的备用单元。
在图5中,当备用电路对应设备DT2处于维护状态或0S状态或例如从电路对应设备DT0被换路之后而处于现用状态时,控制器便不发送使备用电路对应设备DT2被定期诊断的指令。
结果,对电路对应设备DT2的定期诊断被禁止,对其可以不执行也不需要执行。
【12】上述的上单元可以把现用单元分为现用状态、维护状态、或OS状态,并且如果没有要被换路的备用单元,上单元便可以使故障的现用单元和上单元断开并使其处于OS状态,并在处于OS状态的现用单元恢复之前,使现用单元换路到处于备用状态、或诊断-备用状态的备用单元。
在图5中,当上单元100把电路对应设备DT0和DT1分成现用状态、维护状态、OS状态、并管理每种状态时,当存在和电路A1断开的处于OS状态的电路对应设备DT1时,以及当处于OS状态的、在电路对应设备DT1恢复之前被换路到电路对应设备DT2的电路对应设备DT0被恢复时,电路对应设备DT2被恢复到备用状态或诊断-备用状态。在这种状态下,电路对应设备DT2可以被换路到故障的电路对应设备DT1。
【13】上述的上单元可以把处于维护状态的现用单元连接到诊断部分进行诊断。
在图5中,为了维护电路对应设备DT0,控制器110在把其设置为维护状态之后使其和电路A0断开。此时,因为电路对应设备DT0由于故障而不处于维护状态,所以不执行把电路对应设备DT0换路到电路对应设备DT2的处理。控制器110把电路对应设备DT0和诊断部分212相连,以便执行诊断。
【14】在上述的发明【10】中,当诊断部分不和现用单元或处于维护状态或OS状态的要被诊断的备用单元相连时,以及当备用单元处于现用状态或诊断-维护状态时,上单元可以不把诊断部分和现用单元或要被诊断的备用单元相连。
在图5中,当诊断部分212由于电路对应设备DT0-DT2处于维护状态或处于OS状态而不和它们相连时,以及当电路对应设备DT2的状态处于现用状态或诊断-维护状态时,控制器110不把电路对应设备DT0-DT2和诊断部分212相连,因而不进行诊断。
结果,如果不提供作为可连接的用于诊断的诊断部分212,控制器110则不向诊断部分212发出执行诊断的指令,因此将不执行诊断。
【15】上述上单元可以把故障的现用单元换路到在停止对现用单元的诊断之后处于诊断-维护状态的备用单元。
在图5中,当电路对应设备DT0被换路到备用电路对应设备DT2以便维护电路对应设备DT0时,电路对应设备DT2的状态被设置为诊断-维护状态。此时,如果电路对应设备DT1故障并处于OS状态,控制器110则释放电路A0对电路对应设备DT2的连接,并把后者换路到电路对应设备DT1。
【16】上述的上单元在诊断之后,代替停止对现用单元的诊断可以执行换路。
当为进行维护而对电路对应设备DT0的诊断被完成之后,并且电路对应设备DT2的状态不再是诊断/维护状态时,控制器110则释放电路A0对电路对应设备DT2的连接,并把后者换路到电路对应设备DT1。
【17】在上述的发明【1】-【16】中,可以有多个现用单元和备用单元。
在图1-5的示意的结构中,有两个现用单元,但可以只具有一个或者具有3个以上的现用单元。此外,其中只具有一个备用单元,但也可以具有2个以上的备用单元。
【18】上述的诊断部分可以按顺序诊断被断开的多个备用单元。
如果有两个或多个备用电路对应设备,可以按顺序把一个诊断部分连接到处于备用状态的备用单元进行诊断,借以证实和确保备用电路对应设备的正常性。
因而,在整个系统中诊断部分的数量被减少了,有效地降低了成本。
【19】在上述的发明【17】中,可以提供和被诊断的备用单元数量相同的诊断部分。
提供每个相应于备用单元的多个诊断部分,并把每个诊断部分连接到每个备用单元执行诊断,从而确保正常性。
结果,和只有一个诊断部分的情况不同,每个诊断部分可以不用换接到每个备用单元而执行诊断,因而改善了诊断的可靠性。
【20】上述的上单元可以由开关部分和控制器构成。连接控制器可以是电路控制器,现用单元和备用单元可以是电路对应设备,并且下单元可以是用户的终端设备。如图1-5的示意的结构所示,按照本发明的冗余装置可以应用于电子开关板。
【21】为了实现上述目的,按照本发明的冗余装置可以包括连接控制器,其和现用单元以及备用单元相连并换接所述的连接;以及上单元,其在正常情况下通过连接控制器和现用单元相连,并向现用单元发送主信号,并且检测现用单元中的故障,并控制连接控制器使得把故障的现用单元换路到备用单元。
具体地说,图6表示按照本发明的冗余装置的示意的结构(3)。图1表示电子开关板的原理结构,而结构原理(3)则在原理上表示一般的信息处理器。
在图6中,图5所示的换路部分300和在电路对应设备DT0-DT2下方连接的用户1以及用户2被排除了。电路对应设备DT0和DT1,备用电路对应设备DT2,以及电路控制器DTC分别是现用单元220,221,和备用单元222,以及连接控制器210。
结果,上单元不必包括使现用单元换路到备用单元的开关部分,从而减少成本。
【22】上述的连接控制器可以配备有诊断部分,用于通过使用测试信号在上单元的控制下诊断和上单元断开的现用单元或备用单元,并把结果通知上单元。
结果,上单元不必包括用于使现用单元和备用单元换路到诊断部分的开关部分,从而降低了成本。
附图说明
图1是表示按照本发明的冗余装置的原理结构(1)的方块图;
图2是表示图1的原理结构(1)中发生故障时装置的状态的方块图;
图3是表示图1的原理结构(1)中发生故障时装置(2)的状态的方块图;
图4是表示图1的原理结构(1)中发生故障时装置(3)的状态的方块图;
图5是表示按照本发明的冗余装置的原理结构(2)方块图;
图6是表示按照本发明的冗余装置的原理结构(3)方块图;
图7是表示按照本发明的冗余装置的实施例(1)的方块图;
图8是表示在实施例(1)中的诊断例(1)的方块图;
图9是表示诊断例(1)的操作程序的流程图;
图10是表示在实施例(1)中换路操作的方块图;
图11是表示装置的换路操作的程序的流程图;
图12是表示在实施例(1)中的诊断例(2)的方块图;
图13是表示诊断例(2)的操作程序的流程图;
图14是表示按照本发明的冗余装置的实施例(2)的流程图;
图15是表示按照本发明的冗余装置的实施例(3)的流程图;
图16是表示按照本发明的冗余装置的实施例(4)的流程图;
图17是表示现有技术的冗余装置的方块图;以及
图18是表示在现有技术的冗余装置中发生故障时的一个操作例子的方块图。
具体实施方式
在全部附图中,相同的标号表示相同或相应的部件。
图7表示作为按照本发明的冗余装置的一个例子的电子开关板的实施例(1)。在本实施例(1)中,尤其说明了在图5的原理结构(2)中所示的换路部分300和电路控制器DTC。
电路控制器DTC包括开关电路211和诊断部分212。开关电路211包括开关SW01-SW20,换路部分300包括开关SW1和SW2。
电路对应设备DT0-DT2以及诊断部分212分别通过控制信号电路C0-C3和控制器110相连。诊断部分212和电路对应设备DT2由主信号电路A2通过开关SW21和SW20相互连接。此外,电路对应设备DT2和开关SW1,SW2相连。
用户1和开关部分120由主信号电路A0通过开关SW1、电路对应设备DT0和开关SW01、SW00相互连接。用户2和开关部分120由主信号电路A1通过开关SW2、电路对应设备DT1和开关SW11、SW10相互连接。
在正常操作时,电路对应设备DT0和DT1被设置为现用状态并作为现用单元。电路对应设备DT2被设置为备用状态并作为备用单元。用户1和用户2由主信号电路A0、A1分别和开关部分120相连。
图8表示图7所示的实施例(1)中备用电路对应设备DT2的诊断例(1)。
控制器110对控制信号电路C3发出命令诊断的信号。诊断部分212接收到这一信号之后,通过主信号电路A2向电路对应设备DT2发出测试信号,并接收来自电路对应设备DT2的对测试信号的响应信号。
诊断部分212根据所述响应信号确定电路对应设备DT2是否正常,并通过控制信号电路C3向控制器110返回作为诊断结果的警报信息。控制器110接收到该警报信息之后将进行相应于警报信息的处理。
在这种情况下,开关部分120不需要开关容量,因为警报信息不经开关部分120而被送到控制器110。
图9表示图8所示的备用电路对应设备DT2的定期诊断的例子。诊断部分212根据保持在其中的或保持在控制器110中的时间定时器的指令启动对备用电路对应设备DT2的周期诊断。
在步S100,如果备用电路对应设备DT2的状态是现用“ACT”、维护/不使用(OS)“OUS”或诊断-不使用“DIA-OUS”则诊断部分212结束处理而不执行定期诊断。如果电路对应设备DT2的状态是“SBY”,则在步S101进行诊断。
在步S102,如果诊断结果“正常”,,则诊断部分212结束处理,而如果诊断结果为“异常”,则再次检查备用电路对应设备DT2的状态。
如果备用电路对应设备DT2的状态是“ACT”,则诊断被中断并结束处理。这在例如被换路到现在处于现用状态的电路对应设备DT2的电路对应设备DT0中发生故障(S102,S103)的情况下执行。
在另一方面,如果备用电路对应设备DT2是“SBY”,则诊断部分212认为电路对应设备DT0的状态是“OUS”。此时诊断部分212则通知控制器110电路对应设备DT2是“OUS”,并结束处理。
结果,备用电路对应设备DT2将定期地执行诊断操作。因此,在因电路对应设备发生故障而换路到备用电路对应设备时备用电路对应设备DT2的操作的可靠性被增强了。
图10表示在图7的实施例(1)中的电路对应设备DT0中发生故障时的操作。这一操作将参照图11的流程图进行说明。
当由控制信号电路C0检测到在电路对应设备DT0中发生故障时,控制器110启动OS处理1,并在步S200确认备用电路对应设备DT2的状态。
当备用电路对应设备DT2具有“ACT”或“OUS”的状态时,则处理结束。当状态是“SBY”时,则在步S201,电路对应设备DT2被换路到发生故障的或处于OS状态的电路对应设备DT0。
控制器110向电路控制器DTC发出在电路对应设备DT0和对应设备DT2之间换路的指令。电路控制器DTC利用开关SW00、SW01和SW1切断主信号电路A0,并利用在开关电路211中的开关SW20、SW21和换路部分300切断主信号电路A2。
然后,电路控制器DTC利用开关SW1把电路对应设备DT2连接到用户1,并分别使在开关电路211和换路部分300中的开关SW00,SW20和开关SW21,SW01相连。此外,控制器110在步S202和S203分别把电路对应设备DT2和DT0设置为现用状态和OS状态。
这样,用户1和开关部分120将由主信号电路A0通过开关SW1和备用电路对应设备DT2以及开关SW21和SW00相连。此外,电路对应设备DT0和诊断部分212将通过开关SW01、SW20相连。
结果开关部分120不需要再次设置电路通路,因为用户1和开关部分120在故障发生之前在同一个主信号电路A0中使用其信号进行操作。测试信号不需要通过开关部分120发送,因而不需要为此而设置开关容量。
图12表示在图10中已经发生故障的电路对应设备的诊断的例子(2)。这一诊断的操作程序将参照图13的流程图进行说明。
在步S300控制器110确认作为诊断对象的电路对应设备DT0是否和诊断部分212相连。如果是,则诊断部分212执行电路对应设备DT0的诊断,然后结束处理(步S301)。
如果电路对应设备DT0没有连接,诊断部分212则确认电路对应设备DT2的状态。如果其状态是“ACT”或“DIA-OUS”,则在步S303拒绝诊断。这是因为备用电路对应设备DT2和诊断部分212相互同步,并因为备用对应设备DT2的状态是“ACT”或“DIA-OUS”意味着诊断部分212正被使用。
如果在步S302备用电路对应设备DT2的状态被发现为“OUS”或“SBY”,则备用电路对应设备DT2的状态被保留,然后在步S304被设置为“DIA-OUS”。
在步S305,控制器110把诊断部分212连接到作为此时的诊断对象的电路对应设备DT0。在步S306,诊断部分212执行连接的电路对应设备DT0的诊断。在步S307当在诊断之后证实电路对应设备DT0的恢复时,控制器110再把诊断部分212和电路对应设备DT2相连,并在步S308把备用电路对应设备DT2的状态恢复为保留的原始状态。
在这诊断例(2)中,不和图8的诊断例(1)那样需要开关部分120的开关资源。
图14表示本发明的实施例(2)其中说明当电路对应设备DT0例如从图10的OS状态恢复时的操作程序。
控制器110通过接收指令进行启动恢复的处理。在步S400把电路对应设备DT0设置为现用状态之后,在步S401控制器110确认电路对应设备DT2和DT0是否被换路或替换。如果没有,则结束处理。如果是,则电路对应设备DT2和DT0被恢复到图7所示的连接。
此外,控制器110确认在同一控制器下是否有处于OS状态的电路对应设备(S403)。如果不是,则备用电路对应设备DT0被设置为备用状态,并在步S404结束处理。如果是,例如电路对应设备DT1,则在步S405控制器110把电路对应设备DT1换路到电路对应设备DT2。
图15表示本发明的实施例(3),其中表示当在图10的电路对应设备DT0中发生故障时的处理程序。
控制器110当检测到电路对应设备DT0中的故障时,则在步S500把电路对应设备DT0设置为OS状态,并然后确认备用电路对应设备DT2的状态。
当电路对应设备DT2的状态是“ACT”,“OUS”或“DIA-OUS”时(S501),控制器110则确认电路对应设备DT0是否在经过预定时间之后已经恢复(步S503)。
如果是,则恢复的电路对应设备DT0被设置为“ACT”并结束处理。如果不是,则返回步S501并重复相同的操作。
如果在步S501的诊断下电路对应设备是“SBY”或“SBY”,则执行步S505。如果在步S505的诊断下电路对应设备的状态是“SBY”,则停止诊断并给予状态“SBY”,然后执行步S507(步S506)。如果电路对应设备的状态是“SBY”,则直接执行步S507。
在步S507备用电路对应设备DT2被换路到电路对应设备DT0之后,电路对应设备DT2被设置为现用状态。在步S509,控制器110检查电路对应设备DT0是否恢复。如果没有,则每隔预定时间间隔重复这种检查,直到恢复为止(步S510,S509)。
如果是,则控制器110在步S511使备用电路对应设备DT2与电路对应设备DT0恢复原来的连接,并把电路对应设备DT0和DT2的状态分别返回“ACT”和“SBY”,然后结束处理。
应该注意,如果在步S501备用电路对应设备DT2的状态被发现是“DIA-OUS”,则在执行步S505之前可以断开备用电路对应设备DT2,使得恢复备用状态“SBY”。
图16表示本发明的实施例(4),其中说明确定处于OS状态的电路对应设备是否应该被换路到备用电路对应设备的处理。
首先,如果备用电路对应设备DT2处于“ACT”或“OUS”状态,则控制器110不执行换路。只有其处于“SBY”状态时,才执行诊断(步S601,S602)。
此外,只有当发现诊断结果是正常时,控制器110把处于OS状态的电路对应设备换路到电路对应设备DT2。如果发现诊断结果为不正常,将电路对应设备设置为“OUS”,并结束处理。
结果,只有当备用电路对应设备DT2为正常时,才执行换路到处于OS状态的电路对应设备的处理。
在图7所示的实施例(1)中,电路对应设备DT0-DT2可被设为终端设备,并且可以构成其中换路部分300和用户1,2不被连接在每个终端设备下的系统。
如上所述,按照本发明的冗余装置被这样设置,使得连接控制器把现用单元转换到备用单元,并且上单元在正常操作时通过连接控制器被连接到现用单元,并且这样控制连接控制器,使得当发生故障时,把现用单元换路到备用单元。因此,可以避免在上单元中的硬件资源的浪费。
此外,本发明被如此设计,使得连接控制器含有诊断部分,用于通过测试信号诊断现用单元和备用单元,并把诊断结果通知上单元。因此,可以避免上单元的硬件资源的浪费并有效地诊断现用单元和备用单元。
当把按照本发明的冗余装置用于例如电子开关板时,可以获得以下优点。
(1)不需要在上单元的开关部分(交换部分)中制备相应于备用电路对应设备的电路。在故障情况下不需要总是确保开关部分的容量。
(2)当在电路对应设备中发生故障时,可以在上单元(控制部分)的控制下,只通过接通电路控制器的开关而执行利用备用电路对应设备的换路操作。开关部分不需要再次设置通路,并且使处理更为简单,速度更高。
(3)利用设置在电路控制器内部的诊断部分执行现用和备用电路对应设备的诊断。因此,不需要开关部分的电路,也不需要设置测试通路。结果,可以有效地进行诊断。

Claims (22)

1一种由现用单元和备用单元构成的冗余装置,当发生故障时现用单元被换路到备用单元,包括:
连接控制器,其和现用单元以及备用单元相连并换接所述的连接,
上单元,其通过连接控制器和现用单元相连并在正常状态下向现用单元发送主信号,并检测现用单元中的故障,控制连接控制器从而把故障的现用单元换路到备用单元,以及
换路部分,其在正常状态下被连接在下单元和现用单元之间,并在上单元的控制下,和连接控制器相结合把故障的现用单元换路到和下单元相连的备用单元。
2如权利要求1所述的冗余装置,其中当故障的现用单元从故障状态恢复时,连接控制器使备用单元和现用单元返回其初始状态,从而在上单元的控制下使恢复的现用单元和上单元相连。
3如权利要求1所述的冗余装置,其中在没有要被换路的备用单元的情况下,上述的连接控制器在上单元的控制下使故障的现用单元和上单元断开。
4如权利要求3所述的冗余装置,其中当使现用单元和备用单元返回其初始状态时,上述的连接控制器可以使有故障的或已经被断开的现用单元换路到已被复原的备用单元以便和上单元连接。
5如权利要求3所述的冗余装置,其中电路连接控制器(DTC)进一步包括诊断部分,用于在上单元的控制下用测试信号诊断和上单元断开的现用单元或备用单元,并把诊断结果通知上单元。
6如权利要求5所述的冗余装置,其中诊断部分在换路之前诊断备用单元,并且只有在备用单元中没有故障时,连接控制器才进行换路。
7如权利要求5所述的冗余装置,其中诊断部分和故障的现用单元相连,用于诊断在换路时已经和上单元断开的现用单元。
8如权利要求5所述的冗余装置,其中诊断部分可以在上单元的控制下或自动地定期诊断备用单元。
9如权利要求5所述的冗余装置,其中当在诊断期间在现用单元中已经发生故障时,上述诊断被停止,并把故障的现用单元换路到备用单元。
10如权利要求1所述的冗余装置,其中上单元把备用单元划分为现用状态、维护状态、不工作状态、备用状态、诊断-备用状态或作为一种现用状态的诊断-维护状态,其中备用单元被从现用单元换路以便诊断处于维护状态或不工作状态的现用单元,并控制每种状态从而不使故障的现用单元换路到具有现用状态、维护状态、不工作状态、或诊断-维护状态中至少一种状态的备用单元。
11如权利要求10所述的冗余装置,其中上单元不是定期地诊断具有现用状态、维护状态和不工作状态中至少一种状态的备用单元。
12如权利要求10所述的冗余装置,其中上单元可以把现用单元分为现用状态、维护状态、或不工作状态,并且如果没有要被换路的备用单元,上单元便使故障的现用单元和上单元断开并使现用单元处于不工作状态,并在故障的现用单元恢复之前,使现用单元换路到处于备用状态、或诊断-备用状态的备用单元。
13如权利要求10所述的冗余装置,其中上单元把处于维护状态的现用单元连接到诊断部分进行诊断。
14如权利要求10所述的冗余装置,其中当诊断部分不和处于维护状态或不工作状态的要被诊断的现用单元或备用单元相连时,以及当备用单元处于现用状态或诊断-维护状态时,上单元不把诊断部分和要被诊断的现用单元或备用单元相连。
15如权利要求10所述的冗余装置,其中上单元把故障的现用单元换路到在停止对现用单元的诊断之后处于诊断-维护状态的备用单元。
16如权利要求15所述的冗余装置,其中上单元在诊断之后,代替停止对现用单元的诊断而执行换路。
17如权利要求1所述的冗余装置,分别具有多个现用单元和备用单元。
18如权利要求17所述的冗余装置,其中诊断部分可以按顺序诊断被断开的多个备用单元。
19如权利要求17所述的冗余装置,其中提供有和被诊断的备用单元数量相同的诊断部分。
20如权利要求1所述的冗余装置,其中上单元由开关部分和控制器构成,连接控制器是电路控制器,现用单元和备用单元是电路对应设备,下单元是用户的终端设备。
21一种由现用单元和备用单元构成的冗余装置,当发生故障时现用单元被换路到备用单元,包括:
连接控制器,其和现用单元以及备用单元相连并换接所述的连接,以及
上单元,其在正常情况下通过连接控制器和现用单元相连,并向现用单元发送主信号,检测现用单元中的故障,并控制连接控制器使得把故障的现用单元换路到备用单元。
22如权利要求21所述的冗余装置,其中连接控制器包括诊断部分,用于通过使用测试信号在上单元的控制下诊断和上单元断开的现用单元或备用单元,并把结果通知上单元。
CN98115553A 1998-01-13 1998-06-30 冗余装置 Expired - Fee Related CN1111793C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP004629/98 1998-01-13
JP004629/1998 1998-01-13
JP10004629A JPH11203157A (ja) 1998-01-13 1998-01-13 冗長装置

Publications (2)

Publication Number Publication Date
CN1223403A CN1223403A (zh) 1999-07-21
CN1111793C true CN1111793C (zh) 2003-06-18

Family

ID=11589326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98115553A Expired - Fee Related CN1111793C (zh) 1998-01-13 1998-06-30 冗余装置

Country Status (3)

Country Link
US (1) US6192485B1 (zh)
JP (1) JPH11203157A (zh)
CN (1) CN1111793C (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6505306B1 (en) * 1999-09-15 2003-01-07 International Business Machines Corporation Redundant bit steering mechanism with delayed switchover of fetch operations during redundant device initialization
KR100340686B1 (ko) * 2000-09-19 2002-06-15 오길록 다중 호스트 컴퓨터와 레이드 사이의 중복연결을 위한 장치
ES2275008T3 (es) * 2001-09-14 2007-06-01 Siemens Aktiengesellschaft Procedimiento y equipo de comunicaciones para realizar al menos una relacion de comunicacion segura.
US7409576B2 (en) 2004-09-08 2008-08-05 Hewlett-Packard Development Company, L.P. High-availability cluster with proactive maintenance
JP2006285448A (ja) * 2005-03-31 2006-10-19 Oki Electric Ind Co Ltd 冗長システム
JP4710688B2 (ja) * 2006-03-28 2011-06-29 沖電気工業株式会社 冗長システムのファイル更新方法
JP2007304687A (ja) * 2006-05-09 2007-11-22 Hitachi Ltd クラスタ構成とその制御手段
JP4647550B2 (ja) * 2006-06-01 2011-03-09 富士通株式会社 無線基地局装置のリソース制御方法及び制御装置
CN101217353B (zh) * 2007-01-05 2010-09-08 深圳市科陆电子科技股份有限公司 一种呼叫中心多点双机冗余系统的控制方法
JP5022062B2 (ja) 2007-03-01 2012-09-12 株式会社日立製作所 プールi/oデバイス動作確認方法、及び計算機システム
JP4829931B2 (ja) * 2008-07-01 2011-12-07 Necフィールディング株式会社 情報処理装置、判定方法、および判定プログラム
JP5054654B2 (ja) * 2008-10-24 2012-10-24 三菱電機株式会社 プラント運転装置
JP5294324B2 (ja) * 2009-06-22 2013-09-18 日本電気株式会社 ネットワークシステム
JP5481658B2 (ja) * 2011-06-17 2014-04-23 株式会社日立製作所 光通信システム、インタフェース盤、及び、制御方法
CN104849527A (zh) * 2015-03-13 2015-08-19 沈阳中科博微自动化技术有限公司 一种面向功能安全的冗余电流输入模块
CN107949267A (zh) * 2017-10-20 2018-04-20 珠海格力电器股份有限公司 控制器主板及其电路控制方法和电器设备
CN111089411B (zh) * 2019-12-02 2021-06-15 珠海格力电器股份有限公司 一种运行控制装置、电器设备及其运行控制方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5710845A (en) 1980-06-23 1982-01-20 Hitachi Ltd Diagnostic method of other system
JPS62237535A (ja) 1986-04-09 1987-10-17 Fujitsu Ltd 切り替え制御装置
US4965717A (en) * 1988-12-09 1990-10-23 Tandem Computers Incorporated Multiple processor system having shared memory with private-write capability
US5633999A (en) * 1990-11-07 1997-05-27 Nonstop Networks Limited Workstation-implemented data storage re-routing for server fault-tolerance on computer networks
US5313386A (en) * 1992-06-11 1994-05-17 Allen-Bradley Company, Inc. Programmable controller with backup capability
JP2837038B2 (ja) 1992-08-03 1998-12-14 日本電信電話株式会社 パケット交換装置の回線対応部
JPH0760395B2 (ja) * 1992-11-06 1995-06-28 日本電気株式会社 フォールトトレラントコンピュータシステム
US5473771A (en) * 1993-09-01 1995-12-05 At&T Corp. Fault-tolerant processing system architecture
JP3329604B2 (ja) 1994-03-17 2002-09-30 富士通株式会社 交換機
US5544304A (en) * 1994-03-25 1996-08-06 International Business Machines Corporation Fault tolerant command processing
JPH0836502A (ja) 1994-07-25 1996-02-06 Fujitsu Ltd 情報処理システム
US5491787A (en) * 1994-08-25 1996-02-13 Unisys Corporation Fault tolerant digital computer system having two processors which periodically alternate as master and slave
US5630056A (en) * 1994-09-20 1997-05-13 Stratus Computer, Inc. Digital data processing methods and apparatus for fault detection and fault tolerance
US5812754A (en) * 1996-09-18 1998-09-22 Silicon Graphics, Inc. Raid system with fibre channel arbitrated loop
US5983371A (en) * 1997-07-11 1999-11-09 Marathon Technologies Corporation Active failure detection

Also Published As

Publication number Publication date
CN1223403A (zh) 1999-07-21
US6192485B1 (en) 2001-02-20
JPH11203157A (ja) 1999-07-30

Similar Documents

Publication Publication Date Title
CN1111793C (zh) 冗余装置
CN1251100C (zh) 存储器系统及其控制方法
CN1129857C (zh) 多处理器转换装置和主处理器转换方法
CN1285036C (zh) 数据处理系统和远程复制方法
CN100352132C (zh) 无中断电源装置的并列运转系统
CN1160638C (zh) 多计算机系统及其控制方法
CN100340948C (zh) 电子设备、电池组、电子设备的电源控制方法
CN1176436A (zh) 通信监视控制装置及通信监视控制方法
CN1181419C (zh) 工厂监视系统
CN1690973A (zh) 远程复制方法及远程复制系统
CN101035388A (zh) 无断电电源装置、无断电电源系统以及关闭方法
CN1842020A (zh) 一种实现数据业务备份的方法
CN1859219A (zh) 基于设备容灾的业务接管方法、业务转接设备及备份机
CN101076736A (zh) 在监督处理控制系统中配置冗余
CN1855025A (zh) 远程复制处理方法、程序及系统
CN1499208A (zh) 建立自诊断和自修复自动系统的方法、系统及程序产品
CN101038621A (zh) 设备控制系统、控制单元及其使用的设备控制方法
CN1096772C (zh) 通信网络系统及其再构筑方法
CN1889464A (zh) 一种实现通信接管的方法及装置
CN1933433A (zh) 通信设备,通信状态检测方法和通信状态检测程序
CN1881902A (zh) 冗余组状态管理设备和方法
CN1574768A (zh) 设备故障应对委托系统及其服务器、程序、方法
CN1251103C (zh) 提高商务机群可服务性的方法
JPWO2010061446A1 (ja) 情報処理装置,処理部切換方法及び処理部切換プログラム
CN1862499A (zh) 多处理器设备单元主备保护方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee