CN100555234C - 双机冗余容错系统及其冗余切换方法 - Google Patents

双机冗余容错系统及其冗余切换方法 Download PDF

Info

Publication number
CN100555234C
CN100555234C CNB2008101063445A CN200810106344A CN100555234C CN 100555234 C CN100555234 C CN 100555234C CN B2008101063445 A CNB2008101063445 A CN B2008101063445A CN 200810106344 A CN200810106344 A CN 200810106344A CN 100555234 C CN100555234 C CN 100555234C
Authority
CN
China
Prior art keywords
machine
unit
backup
working machine
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2008101063445A
Other languages
English (en)
Other versions
CN101281483A (zh
Inventor
孙汉旭
贾庆轩
党崇伦
叶平
曹红玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CNB2008101063445A priority Critical patent/CN100555234C/zh
Publication of CN101281483A publication Critical patent/CN101281483A/zh
Application granted granted Critical
Publication of CN100555234C publication Critical patent/CN100555234C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Safety Devices In Control Systems (AREA)

Abstract

本发明公开了一种双机冗余容错系统及其冗余切换方法。该系统包括A机、B机,AB机内的冗余切换控制单元将各自产生的切换信号通过冗余切换选择单元的选择而将产生的最终控制信号传至被控单元。冗余切换控制单元包括仲裁切换单元、心跳收发单元、加断电单元和监视器单元。该方法包括:双机上电,上电策略确定主从机;判断双机状态;若双机无故障,则判断系统所处任务段:若一般任务段,则工作机对备份机断电,实行冷备策略;若关键任务段,则工作机对备份机上电,实行热备策略;若有一单机故障:故障可恢复,则恢复,反之,则进入单机状态。本发明系统结构简单,信号传输可靠,本发明方法控制简单,极大降低系统故障率,起到很好的容错效果。

Description

双机冗余容错系统及其冗余切换方法
技术领域
本发明涉及一种冗余容错系统及其切换方法,具体地说,是涉及一种双机冗余容错系统以及对该双机冗余容错系统中的双机进行冗余切换的方法。
背景技术
对于以计算机作为核心的系统而言,很重要的一点是该系统的某个计算机出现故障后,系统仍能继续工作。为了解决这个问题,目前普遍采取的措施是为该系统设计冗余系统,以支持容错操作。考虑到成本和使用面积等因素,一般情况下,对该系统进行动态双模冗余设计。动态双模冗余系统包括一个工作机和一个备份机,它们的职能可以互换。在这种双机冗余设计中,需要确定一种机制,以使在各阶段内具有作为主控制器的控制器和作为备份而处于空闲状态的控制器,同时,还需要确定当单个控制器产生故障时,正常的控制器应作出怎样的反应,以保证系统的正常运行。这种机制需要在工作机与备份机之间有大量的电路连接,以进行信号交互,是一套复杂的机制。
传统的动态双模冗余系统的设计较为单一,一般只考虑双机同时工作状态,以及单机发生不可恢复故障时的状态,而没有考虑到控制器工作的复杂环境和对功耗的特殊要求。同时,为了降低设计的复杂度,传统动态双模冗余系统的故障检测切换方法比较单一,一般为:一套监视电路观察工作机的状态,在工作机故障时进行切换。这种故障检测切换方法一方面忽视了备份机的工作状态,当工作机故障时,可能备份机处于更糟的故障状态,另一方面,该方法不能防止单一的监视电路出错,会造成切换逻辑的误操作。在这种传统的切换方法设计中,冗余设备间加入了专门的切换部件,由这个切换部件接收并监视双机的状态信号,根据接收状态信号来决定主从机的选择,同时,给出互斥的信号来选择工作机输出。但是,当这个切换部件发生错误时,便会引起单点故障,导致系统无法工作。后来,冗余设备之间开始采用了一种状态信号线直连的方法,各冗余设备根据这些状态信号来确定系统的工作状态。这种方法防止了切换部件故障带来的隐患,但是,这种状态信号线直连方式会导致冗余信号较多,电路连接很复杂。另外,传统的容错冗余系统设计对故障检测关注不高。但是,故障检测信号是是否进行切换的重要依据,如果故障检测发生了问题,系统可能会处于死锁或“乒乓切换”,从而故障将难以判断。
发明内容
本发明的目的在于提供一种双机冗余容错系统及其冗余切换方法,该冗余容错系统结构简单,信号传输可靠,该冗余切换方法控制简单,可极大降低系统故障率,可起到很好的容错效果。
为了达到上述目的,本发明采用以下技术方案:
一种双机冗余容错系统,其特征在于:它包括A机、B机、冗余切换选择单元和被控单元,A机和B机内均设有一冗余切换控制单元,A机和B机内的冗余切换控制单元分别将各自产生的切换信号传输至冗余切换选择单元,冗余切换选择单元通过两冗余切换控制单元传输的切换信号对A机和B机分别输出的控制信号进行选择后产生一最终控制信号,并将该最终控制信号传输至被控单元,其中:该冗余切换控制单元包括仲裁切换单元、心跳收发单元、加断电单元和监视器单元,A机的仲裁切换单元分别与A机的心跳收发单元、加断电单元和监视器单元相连,该A机的心跳收发单元与B机的心跳收发单元相连,该A机的加断电单元与B机的电源单元相连,该A机的监视器单元与A机的CPU相连,该A机的CPU与A机的仲裁切换单元相连,该A机的仲裁切换单元与B机的仲裁切换单元相连,该A机的仲裁切换单元输出一切换信号;B机的仲裁切换单元分别与B机的心跳收发单元、加断电单元和监视器单元相连,该B机的加断电单元与A机的电源单元相连,该B机的监视器单元与B机的CPU相连,该B机的CPU与B机的仲裁切换单元相连,该B机的仲裁切换单元输出一切换信号。
一种双机冗余容错系统的冗余切换方法,其特征在于它包括步骤:步骤A:双机同时上电,通过上电策略确定工作机、备份机;步骤B:判断双机状态:若双机无故障,则跳至步骤C;若工作机或备份机故障,则跳至步骤D;步骤C:判断系统所处任务段:若系统工作在一般任务段,则工作机通过自身的加断电单元对备份机断电,系统实行冷备策略,并返回步骤B;若系统工作在关键任务段,则工作机通过自身的加断电单元对备份机上电,系统实行热备策略,并返回步骤B;步骤D:判断故障是否可恢复:若故障可恢复,则进行故障恢复,并返回步骤B;若故障不可恢复,则系统进入单机状态;
该上电策略进一步包括步骤:步骤1-1:双机上电后,各单机均默认系统指定的一单机为工作机,继续步骤1-2;步骤1-2:各单机开始初始化并自检测:若其中一单机自检测失败,则该自检测失败的单机进入死循环,等待对机处理;若双机均自检测成功,则继续步骤1-3;步骤1-3:双机各自设置将要交互的状态信号,继续步骤1-4;步骤1-4:经随机时间的延迟后,各单机读取对机的状态信号,先读取到对机状态信号的单机被确定为工作机,被确定为工作机的单机设置当班标志信号,并将该当班标志信号传输至自身的仲裁切换单元,以进行自身为工作机的控制权确认;后读取到对机状态信号的单机通过对机仲裁切换单元传输的当班标志信号判断出对机已经成为工作机后放弃抢权,且向被确定为工作机的仲裁切换单元返回确认备份机信号而成为备份机,继续步骤1-5;步骤1-5:双机稳定工作一段时间后,工作机通过自身的加断电单元对备份机断电,系统实行冷备策略;
该冷备策略进一步包括步骤:步骤2-1:判断工作机的工作状态:若工作机发生影响系统任务完成的错误,则进入步骤2-2;若工作机发生不影响系统任务完成的错误,则跳至步骤2-4;若工作机工作正常,则返回步骤2-1;步骤2-2:工作机的监视器单元向自身的仲裁切换单元发送错误信号,工作机通过自身的加断电单元对备份机加电,继续进行步骤2-3;步骤2-3:工作机自动复位:若工作机复位后正常且备份机上电后正常,则跳至步骤2-5;若工作机复位且备份机上电后,有一单机不正常,则跳至步骤2-6;步骤2-4:工作机对发生错误的故障单元进行重试:若重试后状态正常,则返回步骤2-1;若重试多次后仍不正常,则认为工作机发生故障,跳至步骤2-2;步骤2-5:双机进行抢权,待系统运行稳定后,抢权成功的新工作机通过自身的加断电单元对对机断电,返回步骤2-1;步骤2-6:正常的单机成为新工作机,并且该新工作机通过自身的加断电单元对对机进行断电和上电操作:若断电上电后对机正常,则对机成为备份机,工作机对备份机断电,返回步骤2-1;若断电上电多次后对机仍不正常,则跳至步骤2-7;步骤2-7:断电上电后仍不正常的对机自动复位:若对机复位后正常,则对机成为备份机,工作机通过自身的加断电单元对备份机断电,返回步骤2-1;若对机复位后仍不正常,则认为对机失效,系统进入单机状态;
该热备策略进一步包括步骤:步骤3-1:判断双机的工作状态:若工作机发生故障,则进入步骤3-2;若备份机发生故障,则跳至步骤3-3;若双机工作正常,则返回步骤3-1;步骤3-2:工作机判断自身的监视器单元是否检测到故障:若监视器单元检测到故障,则跳至步骤3-4;若监视器单元未检测到故障,则该故障是由备份机的心跳收发单元检测到的,跳至步骤3-7;步骤3-3:备份机判断自身的监视器单元是否检测到故障:若监视器单元检测到故障,则跳至步骤3-9;若监视器单元未检测到故障,则该故障是由工作机的心跳收发单元检测到的,跳至步骤3-11;步骤3-4:工作机将自身的故障情况通知备份机,备份机升级为新工作机,接替原工作机的工作任务,继续步骤3-5;步骤3-5:原工作机自动复位:若原工作机复位后自检测正常,则原工作机作为新备份机运行,返回步骤3-1;若原工作机复位后连续多次自检不正常,则原工作机设置故障标志信号,继续步骤3-6;步骤3-6:新工作机通过自身的加断电单元对原工作机进行断电和上电操作:若原工作机断电上电多次后自检测仍不正常,则认为原工作机失效,系统进入单机状态;若原工作机断电上电后自检测正常,则原工作机作为新备份机运行,返回步骤3-1;步骤3-7:备份机实行工作机与备份机间的切换,该备份机升级为新工作机,接替原工作机的工作任务,继续步骤3-8;步骤3-8:新工作机对原工作机进行复位:若原工作机复位后自检测正常,则原工作机作为新备份机运行,返回步骤3-1;若原工作机复位后连续多次自检不正常,则原工作机设置故障标志信号,跳至步骤3-6;步骤3-9:备份机自动复位:若备份机复位后自检测正常,则备份机仍作为备份机运行,返回步骤3-1;若备份机复位后连续多次自检不正常,则备份机设置故障标志信号,继续步骤3-10;步骤3-10:工作机通过自身的加断电单元对备份机进行断电和上电操作:若备份机断电上电多次后自检测仍不正常,则认为备份机失效,系统进入单机状态;若备份机断电上电后自检测正常,则备份机仍作为备份机运行,返回步骤3-1;步骤3-11:工作机对备份机进行复位:若备份机复位后自检测正常,则备份机仍作为备份机运行,返回步骤3-1;若备份机复位后连续多次自检不正常,则备份机设置故障标志信号,跳至步骤3-10。
本发明具有如下优点:本发明双机冗余容错系统可在一般任务段和关键任务段两种状态下工作,且在各状态下发生不同故障时,系统通过本发明冗余切换方法进行及时故障处理,以保证系统正常工作或工作在故障安全侧,防止引起毁灭性故障。在本发明中,当系统采用冷备策略和处于单机状态时,单机的冗余切换控制单元采用看门狗自检测一种故障检测手段。当系统采用热备策略时,每个单机的冗余切换控制单元采用两种故障检测手段,一种为看门狗自检测,另一种为对机心跳收发单元监视。这两种检测手段起到了故障检测功能冗余的效果,防止了由于硬件链路问题使得个体故障检测单元本身错误影响整个系统正常运行的现象发生。而且,对心跳收发单元和自检测设计了优先级判断,对同一错误引起的多个故障信号进行处理,优先级低的信号被屏蔽,优先级高的信号传输至仲裁切换单元,防止了信号冲突“死锁”。本发明双机冗余容错系统结构简单,信号传输可靠,本发明冗余切换方法控制简单,可极大降低系统故障率,可起到很好的容错效果。本发明双机冗余容错系统及其冗余切换方法适用于运行可靠性要求高(即故障情况下仍需连续运行)的环境。
附图说明
图1是本发明双机冗余容错系统的组成示意图;
图2是双机的冗余切换控制单元的连接示意图;
图3是本发明冗余切换方法的流程示意图。
具体实施方式
下面结合附图对本发明作进一步描述。
首先需要提及的是,在本发明中,设定系统处于工作状态时,A机和B机中的其中一个必定是可以正常工作的,即系统不会出现两个单机均发生故障的情况。在下文中,工作机即为主机,备份机即为从机。A机被描述为本机时,B机为对机,同样地,B机被描述为本机时,A机为对机。
如图1和图2所示,本发明双机冗余容错系统包括A机100、B机200、冗余切换选择单元300和被控单元400。A机100内设有一冗余切换控制单元110,B机200内设有一冗余切换控制单元210,A机100内的冗余切换控制单元110和B机200内的冗余切换控制单元210分别将各自产生的切换信号传输至冗余切换选择单元300,冗余切换选择单元300通过两冗余切换控制单元110和210传输的切换信号对A机100的CPU 120和B机200的CPU 210分别输出的控制信号进行选择后而产生一最终控制信号,并将该最终控制信号传输至被控单元400,被控单元400根据该最终控制信号进行操作。
A机100内的冗余切换控制单元110包括仲裁切换单元111、心跳收发单元112、加断电单元113和监视器单元114,B机200内的冗余切换控制单元210包括仲裁切换单元211、心跳收发单元212、加断电单元213和监视器单元214。A机100的仲裁切换单元111分别与A机100的心跳收发单元112、加断电单元113和监视器单元114相连,该A机100的心跳收发单元112与B机200的心跳收发单元212相连,该A机100的加断电单元113与B机200的电源单元230相连,该A机100的监视器单元114与A机100的CPU 120相连,该A机100的CPU 120与A机100的仲裁切换单元111相连,该A机100的仲裁切换单元111与B机200的仲裁切换单元211相连,该A机100的仲裁切换单元111输出一切换信号,该切换信号传输至冗余切换选择单元300。B机200的仲裁切换单元211分别与B机200的心跳收发单元212、加断电单元213和监视器单元214相连,该B机200的加断电单元213与A机100的电源单元130相连,该B机200的监视器单元214与B机200的CPU 220相连,该B机200的CPU 220与B机200的仲裁切换单元211相连,该B机200的仲裁切换单元211输出一切换信号,该切换信号传输至冗余切换选择单元300。
加断电单元的加断电操作是正常机对故障机或者工作机对备份机所做的操作。加断电单元接收本机仲裁切换单元的加断电指令后,便对对机的电源单元传递加断电指令,从而使对机进行加断电操作。其中,正常机对故障机断电后再加电,可以使故障机上电后进行初始化、重新下载配置文件,这种方式是恢复故障的一种重要手段。
监视器单元由看门狗组成,其用于监视本机是否发生故障,是一种常用的容错手段。监视器单元的工作原理为:本机的CPU向监视器单元提供周期性的喂狗脉冲信号,看门狗计数,监视器单元正常工作。若本机的CPU不能继续向监视器单元提供喂狗信号,监视器单元的看门狗在设定的时间段内没有进行清零操作,发生溢出,则认为本机发生故障,监视器单元向本机的仲裁切换单元发出本机故障信号。若本机的CPU持续向监视器单元提供喂狗信号,看门狗不断计数、清零,则认为本机未发生故障。
心跳收发单元主要用于监视对机是否发生故障。心跳收发单元接收对机发出的心跳信号来判断对机是否工作正常(若对机定时发出心跳信号,则表明对机处于正常工作状态),同时,其产生本机的心跳信号而发送给对机。当本机的心跳收发单元在设定的时间段内没有收到对机发出的心跳信号,则判断对机发生故障,则将该故障信号传输至本机的仲裁切换单元,从而让本机的仲裁切换单元做出相应的容错措施。
在实际应用中,冗余切换控制单元110还可包括优先级单元115,该优先级单元115接收A机(即本机)100的心跳收发单元112输出的信号和B机(即对机)200的仲裁切换单元211输出的信号,该优先级单元115将处理后产生的信号输出至A机100的仲裁切换单元111。同样地,冗余切换控制单元210也可包括优先级单元215,该优先级单元215接收B机(即本机)200的心跳收发单元212输出的信号和A机(即对机)100的仲裁切换单元111输出的信号,该优先级单元215将处理后产生的信号输出至B机200的仲裁切换单元211。也就是说,无论是本机的心跳收发单元判断出对机发生故障,还是对机自身的仲裁切换单元向该本机提供对机故障信号,本机的仲裁切换单元均可通过优先级单元接收到对机故障状态信号。优先级单元的作用是对同一错误引起的多个故障信号进行处理,优先级低的信号被屏蔽,优先级高的信号传输至仲裁切换单元,以防止信号冲突“死锁”。
在实际实施中,双机间可进行约定:备份机主动向工作机提供心跳信号,工作机在接收到备份机的心跳信号后判断自身是否具备发送心跳信号的条件,若符合条件,则回复备份机心跳信号,反之,则等待备份机的下一次心跳信号再做出判断。
在实际实施过程中,“心跳”停止的原因可能有两种。一种是由于线路瞬态干扰而引起的信号短暂性丢失。针对这种情况,可以设定心跳等待时间来解决,即连续几个周期都没有接收到对机的“心跳”,才认为对机发生故障。另一种是传输物理链路引起的故障。若物理链路发生故障,那么双机间都会认为对方出现了问题,双机间不断地来回切换,即“乒乓切换”。针对这种情况,可以采取主从机响应不同时的方法来消除,即主从机发现心跳停止时,主从机分别等待不同的响应周期后再进行故障处理,其中主机等待较短时间后便令从机复位,而从机在较长时间后主机未作反应的情况下才进行切换。这样,在物理链路发生故障的情况下,主机会比从机先响应,从而防止了由于链路问题导致的连续切换。
在本发明中,当系统采用热备策略时,每个单机的冗余切换控制单元采用两种故障检测手段,一种为看门狗自检测,另一种为对机心跳收发单元监视。这两种检测手段起到了故障检测功能冗余的效果,防止了由于硬件链路问题使得个体故障检测单元本身错误影响整个系统正常运行的现象发生。当系统采用冷备策略和处于单机状态时,单机的冗余切换控制单元采用看门狗自检测一种故障检测手段。
仲裁切换单元是冗余切换控制单元的核心,主要负责监测系统的运行状态。仲裁切换单元通过将心跳收发单元、监视器单元等发出的各种容错信号进行逻辑组合判断,以及通过读取双方的工作状态信号进行双机状态的判断,来最终做出加断电命令和切换命令,从而使双机承担各自对应任务。具体来说,仲裁切换单元接收心跳收发单元发出的对机故障信号、监视器单元发出的本机故障信号,和本机CPU自检测后发出的自检测信号等。例如,当本机故障时,本机仲裁切换单元将故障信号传输给对机优先级单元,若本机为工作机,则本机仲裁切换单元向自身CPU发出复位指令,若本机为备份机,则本机仲裁切换单元接收对机仲裁切换单元传输来的复位指令,并将该复位指令传递给本机CPU,以使CPU执行复位操作。当本机正常工作或本机为工作机时,本机可根据情况需要,命令本机仲裁切换单元通过向自身的加断电单元发出控制信号,而使加断电单元对对机的电源单元进行加电和/或断电操作。若本机通过心跳收发单元检测到对机发生故障,则本机仲裁切换单元接收到故障信号后,将该故障信号传递给本机CPU,本机CPU处理后告知本机仲裁切换单元自身现为工作机,然后本机仲裁切换单元将自身为工作机的信息告知对机仲裁切换单元,从而对机仲裁切换单元向本机仲裁切换单元返回确认对机成为工作机的信号。当双机间将要进行主从机切换时,双机的仲裁切换单元向冗余切换选择单元分别发出各自的切换信号。
在实际设计中,上述仲裁切换单元111和211、心跳收发单元112和212、加断电单元113和213、监视器单元114和214、优先级单元115和215、冗余切换选择单元300等均可根据功能要求而实现每个单元的电路,具体电路实现过程属公知技术(例如:用硬件描述语言来实现),在此不赘述。
对于双机冗余容错系统,上位机(图中未示出)对其中的被控单元进行操作控制,且上位机通过总线(如CAN总线)与双机连接,以实时与双机进行通信。
针对上述双机冗余容错系统,如图3所示,本发明提出了一种冗余切换方法,该方法主要包括以下步骤:
步骤A:上位机令双机同时上电,通过上电策略确定工作机、备份机;
步骤B:上位机判断双机状态:若双机无故障,则跳至步骤C;若工作机或备份机故障,则跳至步骤D;
步骤C:上位机判断系统(指双机冗余容错系统,下同)所处任务段:若系统工作在一般任务段,则工作机通过自身的加断电单元对备份机断电,系统实行冷备策略,并返回步骤B;若系统工作在关键任务段,则工作机通过自身的加断电单元对备份机上电,系统实行热备策略,并返回步骤B;
步骤D:故障单机自身的CPU判断故障是否可恢复:若故障可恢复,则进行故障恢复,并返回步骤B;若故障不可恢复,则系统进入单机状态。
其中的上电策略还进一步包括以下步骤:
步骤1-1:双机上电后,各单机均默认系统指定的一单机为工作机,继续步骤1-2;
步骤1-2:各单机的CPU开始初始化并自检测(CPU产生的自检测信号传输至自身的仲裁切换单元):若其中一单机自检测失败,则该自检测失败的单机进入死循环,等待对机处理;若双机均自检测成功,则继续步骤1-3;
步骤1-3:双机各自设置将要交互的状态信号,继续步骤1-4;
步骤1-4:经一段随机时间的延迟后,各单机的仲裁切换单元之间读取对机的状态信号,先读取到对机状态信号的单机被确定为工作机,被确定为工作机的单机的CPU设置当班标志信号,并将该当班标志信号传输至自身的仲裁切换单元,以进行自身为工作机的控制权确认;后读取到对机状态信号的单机通过对机(即已被确定为工作机的单机)仲裁切换单元传输的当班标志信号判断出对机已经成为工作机后放弃抢权,且向被确定为工作机的仲裁切换单元返回确认备份机信号而成为备份机,继续步骤1-5;
步骤1-5:双机稳定工作一段时间后,工作机通过自身的加断电单元对备份机断电,系统实行冷备策略。
实际应用时,在步骤1-2中,若其中一单机自检测失败,则自检测成功的单机通过自身的加断电单元对该自检测失败的单机进行断电和上电操作(即将断电上电指令传递给自检测失败的单机的电源单元),如果该自检测失败的单机连续三次上电自检测都不正确,则该自检测失败的单机被认为是失效,系统进入单机状态。
其中的冷备策略还进一步包括以下步骤:
步骤2-1:上位机判断工作机的工作状态:若工作机发生影响系统任务完成的错误,则进入步骤2-2;若工作机发生不影响系统任务完成的错误,则跳至步骤2-4;若工作机工作正常,则返回步骤2-1;
步骤2-2:工作机的监视器单元向自身的仲裁切换单元发送错误信号,工作机通过自身的加断电单元对备份机加电,继续进行步骤2-3;
步骤2-3:工作机的仲裁切换单元向自身的CPU发出复位信号,工作机自动复位:若工作机复位后正常且备份机上电后正常,则跳至步骤2-5;若工作机复位且备份机上电后,有一单机不正常,则跳至步骤2-6;
步骤2-4:工作机对发生错误的故障单元进行重试:若重试后状态正常,则返回步骤2-1;若重试多次后仍不正常,则认为工作机发生故障,跳至步骤2-2;
步骤2-5:双机进行抢权(双机各自CPU通过随机数函数产生一等待时间,通过双机等待时间差值实现抢权),待系统运行稳定后,抢权成功的新工作机通过自身的加断电单元对对机(即新备份机)断电,返回步骤2-1;
步骤2-6:正常的单机成为新工作机,并且该新工作机通过自身的加断电单元对对机进行断电和上电操作:若断电上电后对机正常,则对机成为备份机(即新备份机),工作机对备份机断电,返回步骤2-1;若断电上电多次后对机仍不正常,则跳至步骤2-7;
步骤2-7:断电上电后仍不正常的对机的仲裁切换单元向自身的CPU发出复位信号而自动复位:若对机复位后正常,则对机成为备份机(即新备份机),工作机通过自身的加断电单元对备份机断电,返回步骤2-1;若对机复位后仍不正常,则认为对机失效,系统进入单机状态。
其中的热备策略还进一步包括以下步骤:
处于热备策略的双机状态为:双机都处于正常工作状态,工作机和备份机执行相同的控制任务,且双机都有控制信号输出,但是冗余切换选择单元300只选择工作机输出的控制信号。
步骤3-1:上位机判断双机的工作状态:若工作机发生故障,则进入步骤3-2;若备份机发生故障,则跳至步骤3-3;若双机工作正常,则返回步骤3-1;
步骤3-2:工作机判断自身的监视器单元是否检测到故障:若监视器单元检测到故障,则跳至步骤3-4;若监视器单元未检测到故障,则该故障是由备份机的心跳收发单元检测到的,跳至步骤3-7;
步骤3-3:备份机判断自身的监视器单元是否检测到故障:若监视器单元检测到故障,则跳至步骤3-9;若监视器单元未检测到故障,则该故障是由工作机的心跳收发单元检测到的,跳至步骤3-11;
步骤3-4:工作机通过自身的仲裁切换单元将故障信号传输至备份机的仲裁切换单元,以将自身的故障情况通知备份机,工作机和备份机的仲裁切换单元分别输出相应的切换信号,备份机升级为新工作机,接替原工作机的工作任务,继续步骤3-5;
步骤3-5:原工作机的仲裁切换单元向自身的CPU发出复位信号,原工作机自动复位:若原工作机复位后自检测正常,则原工作机作为新备份机运行,返回步骤3-1;若原工作机复位后连续多次(如三次)自检不正常,则原工作机设置故障标志信号,继续步骤3-6;
步骤3-6:新工作机通过自身的加断电单元对原工作机进行断电和上电操作:若原工作机断电上电多次后自检测仍不正常,则认为原工作机失效,系统进入单机状态;若原工作机断电上电后自检测正常,则原工作机作为新备份机运行,返回步骤3-1;
步骤3-7:备份机实行工作机与备份机间的切换,工作机和备份机的仲裁切换单元分别输出相应的切换信号,该备份机升级为新工作机,接替原工作机的工作任务,继续步骤3-8;
步骤3-8:新工作机通过自身的仲裁切换单元向原工作机的仲裁切换单元发出复位信号,原工作机的仲裁切换单元向自身的CPU传输该复位信号,从而实现新工作机对原工作机进行复位:若原工作机复位后自检测正常,则原工作机作为新备份机运行,返回步骤3-1;若原工作机复位后连续多次(如三次)自检不正常,则原工作机设置故障标志信号,跳至步骤3-6;
步骤3-9:备份机的仲裁切换单元向自身的CPU发出复位信号,备份机自动复位:若备份机复位后自检测正常,则备份机仍作为备份机运行,返回步骤3-1;若备份机复位后连续多次(如三次)自检不正常,则备份机设置故障标志信号,继续步骤3-10;
步骤3-10:工作机通过自身的加断电单元对备份机进行断电和上电操作:若备份机断电上电多次后自检测仍不正常,则认为备份机失效,系统进入单机状态;若备份机断电上电后自检测正常,则备份机仍作为备份机运行,返回步骤3-1;
步骤3-11:工作机通过自身的仲裁切换单元向备份机的仲裁切换单元发出复位信号,备份机的仲裁切换单元向自身的CPU传输该复位信号,从而实现工作机对备份机进行复位:若备份机复位后自检测正常,则备份机仍作为备份机运行,返回步骤3-1;若备份机复位后连续多次(如三次)自检不正常,则备份机设置故障标志信号,跳至步骤3-10。
按照上述方法,当单机从工作机转换为备份机或者从备份机转换为工作机时,该单机发出一切换信号。冗余切换选择单元300通过实时接收双机发出的切换信号而对双机CPU输出的控制信号进行选择,从而将正常的最终控制信号输出给被控单元400,被控单元400根据接收的控制信号而运行。例如,系统降级为单机状态,那么冗余切换选择单元300将该单机CPU输出的控制信号作为最终控制信号传输给被控单元400。又如,若A机为工作机,B机为备份机,A机故障,B机升级为工作机,则B机向冗余切换选择单元300输送切换信号,冗余切换选择单元300通过该切换信号对双机CPU输出的控制信号进行选择,从而将B机CPU输出的控制信号作为最终控制信号传输给被控单元400。
本发明具有如下优点:
本发明双机冗余容错系统可在一般任务段和关键任务段两种状态下工作,且在各状态下发生不同故障时,系统通过本发明冗余切换方法进行及时故障处理,以保证系统正常工作或工作在故障安全侧,防止引起毁灭性故障。
在本发明中,当系统采用冷备策略和处于单机状态时,单机的冗余切换控制单元采用看门狗自检测一种故障检测手段。当系统采用热备策略时,每个单机的冗余切换控制单元采用两种故障检测手段,一种为看门狗自检测,另一种为对机心跳收发单元监视。这两种检测手段起到了故障检测功能冗余的效果,防止了由于硬件链路问题使得个体故障检测单元本身错误影响整个系统正常运行的现象发生。而且,对心跳收发单元和自检测设计了优先级判断,对同一错误引起的多个故障信号进行处理,优先级低的信号被屏蔽,优先级高的信号传输至仲裁切换单元,防止了信号冲突“死锁”。
本发明双机冗余容错系统结构简单,信号传输可靠,本发明冗余切换方法控制简单,可极大降低系统故障率,可起到很好的容错效果。本发明双机冗余容错系统及其冗余切换方法适用于运行可靠性要求高(即故障情况下仍需连续运行)的环境。

Claims (4)

1、一种双机冗余容错系统,其特征在于:它包括A机、B机、冗余切换选择单元和被控单元,A机和B机内均设有一冗余切换控制单元,A机和B机内的冗余切换控制单元分别将各自产生的切换信号传输至冗余切换选择单元,冗余切换选择单元通过两冗余切换控制单元传输的切换信号对A机和B机分别输出的控制信号进行选择后产生一最终控制信号,并将该最终控制信号传输至被控单元,其中:
该冗余切换控制单元包括仲裁切换单元、心跳收发单元、加断电单元和监视器单元,A机的仲裁切换单元分别与A机的心跳收发单元、加断电单元和监视器单元相连,该A机的心跳收发单元与B机的心跳收发单元相连,该A机的加断电单元与B机的电源单元相连,该A机的监视器单元与A机的CPU相连,该A机的CPU与A机的仲裁切换单元相连,该A机的仲裁切换单元与B机的仲裁切换单元相连,该A机的仲裁切换单元输出一切换信号;B机的仲裁切换单元分别与B机的心跳收发单元、加断电单元和监视器单元相连,该B机的加断电单元与A机的电源单元相连,该B机的监视器单元与B机的CPU相连,该B机的CPU与B机的仲裁切换单元相连,该B机的仲裁切换单元输出一切换信号。
2、根据权利要求1所述的双机冗余容错系统,其特征在于:所述冗余切换控制单元还包括优先级单元,该优先级单元接收本机的心跳收发单元输出的信号和对机的仲裁切换单元输出的信号,该优先级单元将处理后产生的信号输出至本机的仲裁切换单元。
3、一种双机冗余容错系统的冗余切换方法,其特征在于它包括步骤:
步骤A:双机同时上电,通过上电策略确定工作机、备份机;
步骤B:判断双机状态:若双机无故障,则跳至步骤C;若工作机或备份机故障,则跳至步骤D;
步骤C:判断系统所处任务段:若系统工作在一般任务段,则工作机通过自身的加断电单元对备份机断电,系统实行冷备策略,并返回步骤B;若系统工作在关键任务段,则工作机通过自身的加断电单元对备份机上电,系统实行热备策略,并返回步骤B;
步骤D:判断故障是否可恢复:若故障可恢复,则进行故障恢复,并返回步骤B;若故障不可恢复,则系统进入单机状态;
该上电策略进一步包括步骤:
步骤1-1:双机上电后,各单机均默认系统指定的一单机为工作机,继续步骤1-2;
步骤1-2:各单机开始初始化并自检测:若其中一单机自检测失败,则该自检测失败的单机进入死循环,等待对机处理;若双机均自检测成功,则继续步骤1-3;
步骤1-3:双机各自设置将要交互的状态信号,继续步骤1-4;
步骤1-4:经随机时间的延迟后,各单机读取对机的状态信号,先读取到对机状态信号的单机被确定为工作机,被确定为工作机的单机设置当班标志信号,并将该当班标志信号传输至自身的仲裁切换单元,以进行自身为工作机的控制权确认;后读取到对机状态信号的单机通过对机仲裁切换单元传输的当班标志信号判断出对机已经成为工作机后放弃抢权,且向被确定为工作机的仲裁切换单元返回确认备份机信号而成为备份机,继续步骤1-5;
步骤1-5:双机稳定工作一段时间后,工作机通过自身的加断电单元对备份机断电,系统实行冷备策略;
该冷备策略进一步包括步骤:
步骤2-1:判断工作机的工作状态:若工作机发生影响系统任务完成的错误,则进入步骤2-2;若工作机发生不影响系统任务完成的错误,则跳至步骤2-4;若工作机工作正常,则返回步骤2-1;
步骤2-2:工作机的监视器单元向自身的仲裁切换单元发送错误信号,工作机通过自身的加断电单元对备份机加电,继续进行步骤2-3;
步骤2-3:工作机自动复位:若工作机复位后正常且备份机上电后正常,则跳至步骤2-5;若工作机复位且备份机上电后,有一单机不正常,则跳至步骤2-6;
步骤2-4:工作机对发生错误的故障单元进行重试:若重试后状态正常,则返回步骤2-1;若重试多次后仍不正常,则认为工作机发生故障,跳至步骤2-2;
步骤2-5:双机进行抢权,待系统运行稳定后,抢权成功的新工作机通过自身的加断电单元对对机断电,返回步骤2-1;
步骤2-6:正常的单机成为新工作机,并且该新工作机通过自身的加断电单元对对机进行断电和上电操作:若断电上电后对机正常,则对机成为备份机,工作机对备份机断电,返回步骤2-1;若断电上电多次后对机仍不正常,则跳至步骤2-7;
步骤2-7:断电上电后仍不正常的对机自动复位:若对机复位后正常,则对机成为备份机,工作机通过自身的加断电单元对备份机断电,返回步骤2-1;若对机复位后仍不正常,则认为对机失效,系统进入单机状态;
该热备策略进一步包括步骤:
步骤3-1:判断双机的工作状态:若工作机发生故障,则进入步骤3-2;若备份机发生故障,则跳至步骤3-3;若双机工作正常,则返回步骤3-1;
步骤3-2:工作机判断自身的监视器单元是否检测到故障:若监视器单元检测到故障,则跳至步骤3-4;若监视器单元未检测到故障,则该故障是由备份机的心跳收发单元检测到的,跳至步骤3-7;
步骤3-3:备份机判断自身的监视器单元是否检测到故障:若监视器单元检测到故障,则跳至步骤3-9;若监视器单元未检测到故障,则该故障是由工作机的心跳收发单元检测到的,跳至步骤3-11;
步骤3-4:工作机将自身的故障情况通知备份机,备份机升级为新工作机,接替原工作机的工作任务,继续步骤3-5;
步骤3-5:原工作机自动复位:若原工作机复位后自检测正常,则原工作机作为新备份机运行,返回步骤3-1;若原工作机复位后连续多次自检不正常,则原工作机设置故障标志信号,继续步骤3-6;
步骤3-6:新工作机通过自身的加断电单元对原工作机进行断电和上电操作:若原工作机断电上电多次后自检测仍不正常,则认为原工作机失效,系统进入单机状态;若原工作机断电上电后自检测正常,则原工作机作为新备份机运行,返回步骤3-1;
步骤3-7:备份机实行工作机与备份机间的切换,该备份机升级为新工作机,接替原工作机的工作任务,继续步骤3-8;
步骤3-8:新工作机对原工作机进行复位:若原工作机复位后自检测正常,则原工作机作为新备份机运行,返回步骤3-1;若原工作机复位后连续多次自检不正常,则原工作机设置故障标志信号,跳至步骤3-6;
步骤3-9:备份机自动复位:若备份机复位后自检测正常,则备份机仍作为备份机运行,返回步骤3-1;若备份机复位后连续多次自检不正常,则备份机设置故障标志信号,继续步骤3-10;
步骤3-10:工作机通过自身的加断电单元对备份机进行断电和上电操作:若备份机断电上电多次后自检测仍不正常,则认为备份机失效,系统进入单机状态;若备份机断电上电后自检测正常,则备份机仍作为备份机运行,返回步骤3-1;
步骤3-11:工作机对备份机进行复位:若备份机复位后自检测正常,则备份机仍作为备份机运行,返回步骤3-1;若备份机复位后连续多次自检不正常,则备份机设置故障标志信号,跳至步骤3-10。
4、根据权利要求3所述的冗余切换方法,其特征在于:所述步骤1-2中,若其中一单机自检测失败,则自检测成功的单机通过自身的加断电单元对该自检测失败的单机进行断电和上电操作,如果该自检测失败的单机连续三次上电自检测都不正确,则该自检测失败的单机被认为是失效,系统进入单机状态。
CNB2008101063445A 2008-05-12 2008-05-12 双机冗余容错系统及其冗余切换方法 Expired - Fee Related CN100555234C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2008101063445A CN100555234C (zh) 2008-05-12 2008-05-12 双机冗余容错系统及其冗余切换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2008101063445A CN100555234C (zh) 2008-05-12 2008-05-12 双机冗余容错系统及其冗余切换方法

Publications (2)

Publication Number Publication Date
CN101281483A CN101281483A (zh) 2008-10-08
CN100555234C true CN100555234C (zh) 2009-10-28

Family

ID=40013968

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2008101063445A Expired - Fee Related CN100555234C (zh) 2008-05-12 2008-05-12 双机冗余容错系统及其冗余切换方法

Country Status (1)

Country Link
CN (1) CN100555234C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108693861A (zh) * 2017-04-10 2018-10-23 西门子(中国)有限公司 热备中继器、双机热备份系统及控制切换方法

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101782754B (zh) * 2009-12-30 2012-07-18 北京宇航系统工程研究所 一种用于运载火箭地面测试发控系统的冗余切换电路
CN101786453B (zh) * 2010-02-08 2012-07-18 清华大学 一种全等双中央协调器的互控方法
CN101916096A (zh) * 2010-07-28 2010-12-15 新太科技股份有限公司 一种高效的双机热备切换的设计方法
CN102377592A (zh) * 2010-08-24 2012-03-14 鸿富锦精密工业(深圳)有限公司 主备用控制单元切换装置及切换方法
CN101968756B (zh) * 2010-09-29 2012-07-18 航天东方红卫星有限公司 一种基于fpga的星载计算机自主切机系统
CN102339246B (zh) * 2011-09-19 2014-04-16 深圳航天东方红海特卫星有限公司 基于热备份的星载电子系统及热备份方法
CN102436409B (zh) * 2011-11-04 2013-09-11 青岛海信网络科技股份有限公司 双机冗余系统的冗余管理及切换方法
CN102708028B (zh) * 2012-05-18 2015-01-07 中国人民解放军第二炮兵装备研究院第四研究所 一种可信冗余容错计算机系统
CN102970167B (zh) * 2012-11-26 2016-06-29 华为技术有限公司 集群系统中网络节点的故障检测方法、网络节点和系统
CN103853626A (zh) * 2012-12-07 2014-06-11 深圳航天东方红海特卫星有限公司 一种星载电子设备的双工冗余备份总线通信方法及装置
CN103092183B (zh) * 2012-12-25 2015-07-22 中国航空工业集团公司第六三一研究所 一种系统控制器及控制权分配方法
CN103903365A (zh) * 2012-12-27 2014-07-02 航天信息股份有限公司 一种嵌入式网络开票系统
CN103425113A (zh) * 2013-08-14 2013-12-04 中山大学深圳研究院 一种基于双处理单元的并行智能控制终端
CN103576600A (zh) * 2013-10-23 2014-02-12 北京和隆优化科技股份有限公司 一种基于plc的优化站无扰安全切换方法
CN103744753B (zh) * 2013-12-26 2015-11-04 北京交控科技有限公司 一种双机系统的数据交互方法与装置
CN105278516B (zh) * 2014-06-24 2017-12-12 南京理工大学 一种双冗余开关量plc控制系统可靠容错控制器的实现方法
CN105262201B (zh) * 2014-07-18 2018-01-16 中国长城科技集团股份有限公司 一种冗余电源的冷备份切换方法、电路及冗余电源
CN104111881B (zh) * 2014-07-25 2016-03-30 中国航天科工集团第二研究院七〇六所 一种用于双机冗余热备份计算机的仲裁装置
CN104133744A (zh) * 2014-08-01 2014-11-05 浪潮(北京)电子信息产业有限公司 一种面向关键应用的仲裁系统及方法
CN104199353A (zh) * 2014-08-22 2014-12-10 山东超越数控电子有限公司 一种冷备份与热备份组合的双主机指挥控制系统
CN104407948B (zh) * 2014-11-28 2016-08-17 中国航天科技集团公司第九研究院第七七一研究所 一种冷备份冗余星载计算机的加电切换控制系统及方法
CN105717787A (zh) * 2014-11-30 2016-06-29 上海航空电器有限公司 用于智能电源配电装置的双余度控制系统及其控制方法
CN104536850A (zh) * 2014-12-02 2015-04-22 苏州长风航空电子有限公司 一种多级冗余备份系统及其工作模式
CN104679610B (zh) * 2015-02-11 2020-05-01 东莞前沿技术研究院 计算机系统的管理方法和装置
CN105005283A (zh) * 2015-03-31 2015-10-28 北京航天发射技术研究所 一种主控单元双冗余热备份发射车控制方法
CN106445747B (zh) * 2015-08-08 2018-12-11 昆达电脑科技(昆山)有限公司 备援监控方法
CN106598017A (zh) * 2015-10-20 2017-04-26 中车大连电力牵引研发中心有限公司 冗余控制系统
CN105353604B (zh) * 2015-12-01 2018-01-23 清华大学 一种双机冷热备份自主切换的控制与信息处理系统及方法
CN105487945B (zh) * 2016-02-19 2017-11-03 中国航天科技集团公司第五研究院第五一三研究所 一种非相似双余度四机自监控容错控制方法
US9952948B2 (en) * 2016-03-23 2018-04-24 GM Global Technology Operations LLC Fault-tolerance pattern and switching protocol for multiple hot and cold standby redundancies
CN105974906B (zh) * 2016-05-12 2019-12-17 深圳市中工巨能科技有限公司 一种双监控-激活测控装置
CN106302064B (zh) * 2016-08-16 2019-03-08 新誉集团有限公司 电动汽车用双通道冗余can总线的数据传输优化方法及系统
CN107957692B (zh) * 2016-10-14 2020-06-09 中国石油天然气集团公司 控制器冗余方法、装置及系统
CN107272400B (zh) * 2017-06-26 2020-05-19 北京机械设备研究所 一种同步冗余的顺序控制装置及方法
CN107728463A (zh) * 2017-08-31 2018-02-23 北京宇航系统工程研究所 一种基于国产龙芯处理器的测控设备冗余切换单元
CN108051998B (zh) * 2017-11-16 2020-11-13 中国航空工业集团公司西安飞机设计研究所 一种冗余系统同步与监控判决方法
CN109814519B (zh) * 2017-11-22 2021-11-16 成都凯天电子股份有限公司 切换双余度航电设备输出信号的方法
CN108009047B (zh) * 2017-11-24 2021-11-02 武汉船用电力推进装置研究所(中国船舶重工集团公司第七一二研究所) 一种双机热备模型及实现方法
CN109901380A (zh) * 2017-12-11 2019-06-18 上海航空电器有限公司 基于硬件仲裁的余度设计在供电处理机上的应用电路及方法
CN110647426B (zh) * 2018-06-27 2023-04-11 龙芯中科技术股份有限公司 双机热备份方法、装置、系统与计算机存储介质
CN109617721A (zh) * 2018-12-11 2019-04-12 中国航空工业集团公司西安航空计算技术研究所 一种机载网络管理端双机容错备份方法、装置及存储介质
CN109739697B (zh) * 2018-12-13 2022-10-14 北京计算机技术及应用研究所 一种基于高速数据交换的强实时性双机同步容错系统
CN110442094B (zh) * 2019-07-26 2021-05-07 新华三大数据技术有限公司 一种分布式系统仲裁方法及装置
CN111045863B (zh) * 2019-11-19 2023-09-15 中国航空工业集团公司西安航空计算技术研究所 一种传感器数据分配网络故障容错架构及方法
CN111077764B (zh) * 2019-11-26 2023-10-20 山东航天电子技术研究所 一种兼顾上电和复位的冷热备负载交叉控制方法及电路
CN111443593A (zh) * 2020-04-08 2020-07-24 中国人民解放军国防科技大学 一种网络化多余度的飞行器控制系统
CN111679928B (zh) * 2020-06-01 2023-02-24 西安微电子技术研究所 一种基于Master-Slave基础框架的系统故障检测及恢复方法
CN112015150A (zh) * 2020-07-31 2020-12-01 唐山钢铁集团微尔自动化有限公司 一种实现工业控制计算机双机热切的方法
CN112650620B (zh) * 2020-12-21 2022-10-04 中国人民解放军63919部队 一种存在主从关系的双机冷备份自主冗余方法
CN112782967A (zh) * 2021-01-05 2021-05-11 广东合一新材料研究院有限公司 喷淋液冷系统的冗余控制方法及装置
CN112860470B (zh) * 2021-02-05 2024-04-26 中国科学院微小卫星创新研究院 卫星双机切换系统及方法
CN113703353A (zh) * 2021-07-28 2021-11-26 中国铁道科学研究院集团有限公司通信信号研究所 一种应用于列尾设备的冗余控制和冗余通信的方法及系统
CN113778060B (zh) * 2021-09-15 2023-07-25 上海卫星工程研究所 卫星遥控接收终端在轨异常监测与故障恢复方法及系统
CN113778737A (zh) * 2021-09-15 2021-12-10 上海卫星工程研究所 基于冗余与降级的星载计算机运行方法及系统
CN114002943B (zh) * 2021-09-30 2024-05-24 中航通飞华南飞机工业有限公司 一种电传飞行控制系统的备份系统的架构
CN114326365A (zh) * 2021-11-25 2022-04-12 宜昌测试技术研究所 一种auv冗余控制装置
CN114355803A (zh) * 2021-12-15 2022-04-15 北京电子工程总体研究所 基于任务监听的加固机多机系统及冗余设计方法
CN114440407A (zh) * 2022-03-14 2022-05-06 上海海联智通信息科技有限公司 用于控制双空调机组冷藏集装箱的方法和系统
CN115038136B (zh) * 2022-05-25 2024-04-09 中国科学院国家空间科学中心 一种多通道自适应带宽切换方法及系统
CN115408240B (zh) * 2022-09-09 2023-07-25 中国兵器装备集团自动化研究所有限公司 一种冗余系统主备方法、装置、设备及储存介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
机器人关节控制器双机容错技术设计与实现. 党崇伦等.机电产品开发与创新,第20卷第6期. 2007
机器人关节控制器双机容错技术设计与实现. 党崇伦等.机电产品开发与创新,第20卷第6期. 2007 *
空间机器人冷热双冗余CAN总线系统的研制. 陈尧等.测控技术与仪器仪表,第2期. 2008
空间机器人冷热双冗余CAN总线系统的研制. 陈尧等.测控技术与仪器仪表,第2期. 2008 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108693861A (zh) * 2017-04-10 2018-10-23 西门子(中国)有限公司 热备中继器、双机热备份系统及控制切换方法
CN108693861B (zh) * 2017-04-10 2021-08-31 西门子(中国)有限公司 热备中继器、双机热备份系统及控制切换方法

Also Published As

Publication number Publication date
CN101281483A (zh) 2008-10-08

Similar Documents

Publication Publication Date Title
CN100555234C (zh) 双机冗余容错系统及其冗余切换方法
CN107187465B (zh) 一种单元级热备冗余的ato系统架构
CN103647781B (zh) 一种基于设备冗余和网络冗余的混合冗余可编程控制系统
CN110351174B (zh) 一种模块冗余的安全计算机平台
CN107733684B (zh) 一种基于龙芯处理器的多控制器计算冗余集群
CN103853622A (zh) 一种互为备份的双余度控制方法
CN101807076B (zh) 基于profibus现场总线的具有协同热备份功能的双模冗余容错高可靠控制系统
CN110376876B (zh) 一种双系同步的安全计算机平台
CN101576836B (zh) 一种可降级的三机冗余容错系统
CN101634959B (zh) 一种基于嵌入式cpu的双机冗余容错系统
CN106648997A (zh) 一种基于非实时操作系统的主从双机切换方法
CN110427283B (zh) 一种双余度的燃油管理计算机系统
CN102724083A (zh) 基于软件同步的可降级三模冗余计算机系统
CN105718336A (zh) 一种飞机告警计算机用双余度调度控制系统
CN103176870B (zh) 一种多模式信息交互的冗余安全计算机平台
CN103425553A (zh) 一种双机热备份系统及该系统的故障检测方法
CN105717787A (zh) 用于智能电源配电装置的双余度控制系统及其控制方法
CN102402220A (zh) 基于负荷分担式的容错飞行控制系统及故障检测方法
CN103309319A (zh) 分布冗余式飞机自动配电控制系统
JPH0934809A (ja) 高信頼化コンピュータシステム
CN115113516A (zh) 一种主从冗余控制系统及控制方法
CN112445751B (zh) 适用于多模冗余系统的计算机主机接口板
CN101741532A (zh) 一种用于冗余服务器切换的双机切换装置
CN212541329U (zh) 基于国产龙芯平台的双冗余计算机设备
WO2020156584A1 (zh) 前端处理器的自动切换系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091028

Termination date: 20110512