CN106648997A - 一种基于非实时操作系统的主从双机切换方法 - Google Patents

一种基于非实时操作系统的主从双机切换方法 Download PDF

Info

Publication number
CN106648997A
CN106648997A CN201611204666.4A CN201611204666A CN106648997A CN 106648997 A CN106648997 A CN 106648997A CN 201611204666 A CN201611204666 A CN 201611204666A CN 106648997 A CN106648997 A CN 106648997A
Authority
CN
China
Prior art keywords
slave
master
main frame
switching
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611204666.4A
Other languages
English (en)
Inventor
朱瓅
李洁
唐学术
翟宇
黄珊珊
陈韬
杨增顺
解梦迪
文毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aerospace Measurement and Control Technology Co Ltd
Original Assignee
Beijing Aerospace Measurement and Control Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aerospace Measurement and Control Technology Co Ltd filed Critical Beijing Aerospace Measurement and Control Technology Co Ltd
Priority to CN201611204666.4A priority Critical patent/CN106648997A/zh
Publication of CN106648997A publication Critical patent/CN106648997A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component

Abstract

本发明公开了一种基于非实时操作系统的主从双机切换方法,所述方法包括:步骤1)主从双机完成时钟及状态同步,对主机和从机进行故障监测;步骤2)若主机监测到自身出现故障,即主机出现非死机类故障时,发送主从切换信息,转入步骤4);步骤3)若从机通过网络监听发现主机无心跳包,发送主从切换信息,转入步骤4);步骤4)改变主从状态标识位;实现主从机的无缝切换。本发明的方法能够有效避免因为主机发生死机,无法发出切换指令导致系统测控任务发生中断这种情况的发生,提高了系统的可靠性。

Description

一种基于非实时操作系统的主从双机切换方法
技术领域
本发明属于计算机测量与控制技术领域,特别涉及一种基于非实时操作系统的主从双机切换方法。
背景技术
随着武器装备系统复杂性的不断提高,对测试可靠性要求日益提高,很多获得高可靠性电子设备的可靠性设计依赖于冗余设计,冗余设计是提高设备可靠性的最常用的有效手段之一,来利用冗余设计,就可以在单个组件或系统发生失效时不影响系统的整体可靠性。
冗余设计是用一台或多台相同单元(系统)构成并联形式,当其中一台发生故障时,其它单元仍能使系统正常工作的设计技术。
冗余技术按特点可分:热冗余/冷冗余;按冗余程度分为:两重冗余/三重冗余/多重冗余;按冗余范围分:元器件冗余/部件冗余/子系统冗余/系统冗余。
其中,热冗余实用价值最高,也是热门研究方向;两重冗余使用最为广泛,具有最好的性价比;系统冗余最为复杂,是减少单点失效,提高可靠性的最佳途经。
目前,在冗余设计的主从机切换方法中,通常都是主机发生故障时,自动切换到从机,然后主机恢复正常后,再切换到主机,该方法适用于数据采集,网络数据通信等任务的冗余备份,但在某些总线系统中,指令的收发只能由主机控制,这种情况下前面提到的双机并行工作的方法并不适用,从而需要一种针对上述场合的主从机切换方法。
发明内容
本发明要解决的技术问题是现有主从机切换方法存在的上述问题,针对从机切换后,需要完成具备主机状态的转换这种情况,提出了一种基于非实时操作系统的主从双机切换方法,该方法从两种情况考虑了主从机切换的条件,并且切换后将从机置为主机状态,进一步还提供了一种手工切换的方案。
为了实现上述目的,本发明提出了一种基于非实时操作系统的主从双机切换方法,所述方法包括:
步骤1)主从双机完成时钟及状态同步,对主机和从机进行故障监测;
步骤2)若主机监测到自身出现故障,即主机出现非死机类故障时,主机将主从机状态标识位更改为从机状态并发送主从切换信息,转入步骤3);若从机通过网络监听发现主机无心跳包,发送主从切换信息,转入步骤3);
步骤3)从机改变主从状态标识位;实现主从机的无缝切换。
上述技术方案中,所述方法进一步包括:步骤4)当接收到手动切换的命令时,根据主从机的运行状态,完成主从机的切换。
上述技术方案中,所述主机非死机类故障是指主机本身能够监测到自身的故障,同时,主机本身的主从切换逻辑未受到影响,由主机通知从机进行切换动作。
上述技术方案中,所述主机死机类故障为主机自身无法对故障进行检测并发起相应的切换动作,这一类故障的检测只能由从机通过网络监听有无主机心跳包来实现。
上述技术方案中,所述步骤3)的具体过程为:
当从机接收到切换信息后,将主从机状态标识位更改为主机状态,写入本机的故障/切换日志,并通知本地应用层切换已发生,由应用层控制总线通信模块板卡行切换;从机作为主从同步的发起者,并获得执行采集指令的自主权,从而确保数据采集工作的顺利执行。
上述技术方案中,所述步骤4)的具体过程为:
当手动切换指令发出时,主从机的运行状态存在如下四种情况:
当手动切换指令发出时,首先判断主从机的运行状态,根据运行状态执行切换指令:
主机正常/从机正常,正常切换;
主机正常/从机故障,不进行切换;
主机故障/从机正常,在主机故障发生后,从机按照切换机制已变更为主机;
主机故障/从机故障,即双机均发生故障,系统失效。
本发明的优势在于:
1、本发明的方法能够有效避免因为主机发生死机,无法发出切换指令导致系统发生中断这种情况的发生,提高了系统的可靠性;
2、本发明的方法针对数据采集及网络通信等并行工作的任务场合也能够兼容;
3、本发明的方法在故障单机并网恢复的基础上,可扩展为两台热备份+一台冷备份的冗余模式,进一步提高系统可靠性。
附图说明
图1为本发明的基于非实时操作系统的主从双机切换方法的流程图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细说明。
主从切换是指当主机发生故障后(或者是接收到后端指挥中心发出的手动切换命令后),立即切换到热备的从机,由其接替主机工作,而热备层中的主从同步模块、故障监测平台则在切换过程中分别发挥不同的作用,协同配合以完成主从间的切换工作,确保在主机故障的情况下完成无缝切换,保障测控任务能继续执行。
如图1所示,一种基于非实时操作系统的主从双机切换方法,所述方法包括:
步骤1)主从双机完成时钟及状态同步,对主机和从机进行故障监测;
步骤2)若主机监测到自身出现故障,即主机出现非死机类故障时,主机将主从机状态标识位更改为从机状态并发送主从切换信息,转入步骤3);若从机通过网络监听发现主机无心跳包,发送主从切换信息,转入步骤3);
主机非死机类故障所引起切换的一个共同特征是,主机本身能够监测到错误,同时,主机本身的主从切换逻辑未受到影响,由主机通知从机需进行切换动作。
主机死机类故障直接表现为主机自身无法对故障进行检测并发起相应的切换动作,这一类故障的检测只能由从机通过网络监听有无主机心跳包来实现。
步骤3)从机改变主从状态标识位;实现主从机的无缝切换;
在系统初始化后,主机的故障监测模块加载针对各种故障模式的故障检测插件,开始监测主机本地发生的故障,当某一时刻主机非死机故障发生后,故障监测模块收到故障插件传来的故障信息,并设置自身的故障状态字,之后一面调用网络传输模块,发送主从切换信息,另一面与本机主从同步模块交互,通知主从同步模块改变主从状态标识位,进而在下一个同步点时更改为从机同步逻辑,当主从状态标识位更改完毕后,写入故障/切换日志。
当从机接收到切换信息后,传递给故障监测模块完成对切换信息的解析,之后,将主从状态标识位更改为主机状态,写入本机的故障/切换日志,并通知本地应用层切换已发生,由应用层控制总线通信模块板卡行切换。
由于原来的从机主从同步模块主从状态位在切换过程中发生了变化,将在之后的时序中作为主从同步的发起者,也即取得了执行采集指令的自主权,从而保证了数据采集工作的顺利执行,另一方面,由于主机的总线通信模块放弃了总线控制权,由从机的总线通信模块接替,从而保证了从机(此处指切换前的从机)也能顺利的向与被测对象通信。
步骤4)当接收到手动切换的命令时,根据主从机的运行状态,完成主从机的切换;
手动切换的本质与主机非死机类故障相同,故障监测模块通过调用相关的网络监听插件获得手动切换命令,并由该插件将切换指令传递给控制器状态监测模块,故障监测模块进入切换流程。
当手动切换指令发出时,主从机的运行状态可能会存在如下四种情况:
主机正常/从机正常;
主机正常/从机故障;
主机故障/从机正常,在主机故障发生后,从机应按照切换机制已变更为主机,即转化到状态2;
主机故障/从机故障,即双机均发生故障,系统失效。
但由于手动切换指令是由后端指挥中心进行的人工干预,所以应具备较高的切换权限,即无论双机的当前运行状态为上面列举出的哪一种,主从状态都需要进行改变(特别是针对状态2的情况)。

Claims (6)

1.一种基于非实时操作系统的主从双机切换方法,所述方法包括:
步骤1)主从双机完成时钟及状态同步,对主机和从机进行故障监测;
步骤2)若主机监测到自身出现故障,即主机出现非死机类故障时,主机将主从机状态标识位更改为从机状态并发送主从切换信息,转入步骤3);若从机通过网络监听发现主机无心跳包,发送主从切换信息,转入步骤3);
步骤3)从机改变主从状态标识位;实现主从机的无缝切换。
2.根据权利要求1所述的基于非实时操作系统的主从双机切换方法,其特征在于,所述方法进一步包括:步骤4)当接收到手动切换的命令时,根据主从机的运行状态,完成主从机的切换。
3.根据权利要求1所述的基于非实时操作系统的主从双机切换方法,其特征在于,所述主机非死机类故障是指主机本身能够监测到自身的故障,同时,主机本身的主从切换逻辑未受到影响,由主机通知从机进行切换动作。
4.根据权利要求1所述的基于非实时操作系统的主从双机切换方法,其特征在于,所述主机死机类故障为主机自身无法对故障进行检测并发起相应的切换动作,这一类故障的检测只能由从机通过网络监听有无主机心跳包来实现。
5.根据权利要求1所述的基于非实时操作系统的主从双机切换方法,其特征在于,所述步骤3)的具体过程为:
当从机接收到切换信息后,将主从机状态标识位更改为主机状态,写入本机的故障/切换日志,并通知本地应用层切换已发生,由应用层控制总线通信模块板卡进行切换;从机作为主从同步的发起者,并获得执行采集指令的自主权,从而确保数据采集工作的顺利执行。
6.根据权利要求2所述的基于非实时操作系统的主从双机切换方法,其特征在于,所述步骤4)的具体过程为:
当手动切换指令发出时,首先判断主从机的运行状态,根据运行状态执行切换指令:
主机正常/从机正常,正常切换;
主机正常/从机故障,不进行切换;
主机故障/从机正常,在主机故障发生后,从机按照切换机制已变更为主机;
主机故障/从机故障,即双机均发生故障,系统失效。
CN201611204666.4A 2016-12-23 2016-12-23 一种基于非实时操作系统的主从双机切换方法 Pending CN106648997A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611204666.4A CN106648997A (zh) 2016-12-23 2016-12-23 一种基于非实时操作系统的主从双机切换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611204666.4A CN106648997A (zh) 2016-12-23 2016-12-23 一种基于非实时操作系统的主从双机切换方法

Publications (1)

Publication Number Publication Date
CN106648997A true CN106648997A (zh) 2017-05-10

Family

ID=58826620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611204666.4A Pending CN106648997A (zh) 2016-12-23 2016-12-23 一种基于非实时操作系统的主从双机切换方法

Country Status (1)

Country Link
CN (1) CN106648997A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107070731A (zh) * 2017-06-22 2017-08-18 迈普通信技术股份有限公司 一种主从仲裁方法及系统
CN107728463A (zh) * 2017-08-31 2018-02-23 北京宇航系统工程研究所 一种基于国产龙芯处理器的测控设备冗余切换单元
CN108650115A (zh) * 2018-04-16 2018-10-12 宁波三星医疗电气股份有限公司 集抄系统多通道级联拓扑结构故障处理方法
CN109062184A (zh) * 2018-08-10 2018-12-21 中国船舶重工集团公司第七〇九研究所 双机应急救援设备、故障切换方法和救援系统
CN109361208A (zh) * 2018-07-31 2019-02-19 全球能源互联网研究院有限公司 一种控保系统的同步控制方法及装置
WO2020076207A1 (en) * 2018-10-08 2020-04-16 Scania Cv Ab Method and control device for configuring a vehicle
CN111030871A (zh) * 2019-12-23 2020-04-17 杭州迪普科技股份有限公司 基于双机热备系统的配置信息同步方法和装置
CN112068991A (zh) * 2020-08-05 2020-12-11 苏州浪潮智能科技有限公司 一种基于主从同步的高可靠的双管理系统
CN113922904A (zh) * 2021-10-10 2022-01-11 广州追梦软件技术有限公司 一种基于双控制器的调音台数据备份、切换方法和系统
US11246039B2 (en) 2017-11-27 2022-02-08 Huawei Technologies Co., Ltd. Method and apparatus for secure multi-terminal cooperative working
CN114115091A (zh) * 2021-01-12 2022-03-01 无锡信捷电气股份有限公司 Plc基于时间同步及有限数据元交互的数据冗余方法
CN114124656A (zh) * 2021-11-01 2022-03-01 北京宇航系统工程研究所 一种运载火箭地面一体化测控系统
US11323854B2 (en) 2017-11-27 2022-05-03 Huawei Technologies Co., Ltd. Multi-terminal cooperative working method, terminal device, and multi-terminal cooperative system
CN115499296A (zh) * 2022-07-29 2022-12-20 天翼云科技有限公司 一种云桌面热备管理方法、装置及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1815908A (zh) * 2006-03-02 2006-08-09 迈普(四川)通信技术有限公司 通信设备主从切换方法及通信设备
CN101667905A (zh) * 2008-09-04 2010-03-10 大唐移动通信设备有限公司 一种时钟板卡的切换方法及设备
US20130058444A1 (en) * 2011-09-06 2013-03-07 Cisco Technology, Inc. Fault Tolerant Communications Over a Two-Wire Interface
CN203027276U (zh) * 2012-12-10 2013-06-26 北京交控科技有限公司 双机热备平台
CN103199972A (zh) * 2013-03-25 2013-07-10 成都瑞科电气有限公司 基于soa、rs485总线实现的双机热备份切换方法及热备份系统
CN104571041A (zh) * 2014-12-31 2015-04-29 重庆川仪自动化股份有限公司 基于1:1控制器冗余的数据同步方法
CN104570721A (zh) * 2014-12-31 2015-04-29 重庆川仪自动化股份有限公司 冗余控制器主从状态确定方法
CN105471622A (zh) * 2015-11-12 2016-04-06 武汉噢易云计算有限公司 一种基于Galera的控制节点主备切换的高可用方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1815908A (zh) * 2006-03-02 2006-08-09 迈普(四川)通信技术有限公司 通信设备主从切换方法及通信设备
CN101667905A (zh) * 2008-09-04 2010-03-10 大唐移动通信设备有限公司 一种时钟板卡的切换方法及设备
US20130058444A1 (en) * 2011-09-06 2013-03-07 Cisco Technology, Inc. Fault Tolerant Communications Over a Two-Wire Interface
CN203027276U (zh) * 2012-12-10 2013-06-26 北京交控科技有限公司 双机热备平台
CN103199972A (zh) * 2013-03-25 2013-07-10 成都瑞科电气有限公司 基于soa、rs485总线实现的双机热备份切换方法及热备份系统
CN104571041A (zh) * 2014-12-31 2015-04-29 重庆川仪自动化股份有限公司 基于1:1控制器冗余的数据同步方法
CN104570721A (zh) * 2014-12-31 2015-04-29 重庆川仪自动化股份有限公司 冗余控制器主从状态确定方法
CN105471622A (zh) * 2015-11-12 2016-04-06 武汉噢易云计算有限公司 一种基于Galera的控制节点主备切换的高可用方法及系统

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107070731A (zh) * 2017-06-22 2017-08-18 迈普通信技术股份有限公司 一种主从仲裁方法及系统
CN107728463A (zh) * 2017-08-31 2018-02-23 北京宇航系统工程研究所 一种基于国产龙芯处理器的测控设备冗余切换单元
US11323854B2 (en) 2017-11-27 2022-05-03 Huawei Technologies Co., Ltd. Multi-terminal cooperative working method, terminal device, and multi-terminal cooperative system
US11246039B2 (en) 2017-11-27 2022-02-08 Huawei Technologies Co., Ltd. Method and apparatus for secure multi-terminal cooperative working
CN108650115A (zh) * 2018-04-16 2018-10-12 宁波三星医疗电气股份有限公司 集抄系统多通道级联拓扑结构故障处理方法
CN108650115B (zh) * 2018-04-16 2021-08-24 宁波三星医疗电气股份有限公司 集抄系统多通道级联拓扑结构故障处理方法
CN109361208A (zh) * 2018-07-31 2019-02-19 全球能源互联网研究院有限公司 一种控保系统的同步控制方法及装置
CN109062184B (zh) * 2018-08-10 2021-05-14 中国船舶重工集团公司第七一九研究所 双机应急救援设备、故障切换方法和救援系统
CN109062184A (zh) * 2018-08-10 2018-12-21 中国船舶重工集团公司第七〇九研究所 双机应急救援设备、故障切换方法和救援系统
WO2020076207A1 (en) * 2018-10-08 2020-04-16 Scania Cv Ab Method and control device for configuring a vehicle
CN111030871A (zh) * 2019-12-23 2020-04-17 杭州迪普科技股份有限公司 基于双机热备系统的配置信息同步方法和装置
CN112068991A (zh) * 2020-08-05 2020-12-11 苏州浪潮智能科技有限公司 一种基于主从同步的高可靠的双管理系统
CN114115091A (zh) * 2021-01-12 2022-03-01 无锡信捷电气股份有限公司 Plc基于时间同步及有限数据元交互的数据冗余方法
CN113922904A (zh) * 2021-10-10 2022-01-11 广州追梦软件技术有限公司 一种基于双控制器的调音台数据备份、切换方法和系统
CN114124656A (zh) * 2021-11-01 2022-03-01 北京宇航系统工程研究所 一种运载火箭地面一体化测控系统
CN114124656B (zh) * 2021-11-01 2024-02-09 北京宇航系统工程研究所 一种运载火箭地面一体化测控系统
CN115499296A (zh) * 2022-07-29 2022-12-20 天翼云科技有限公司 一种云桌面热备管理方法、装置及系统
CN115499296B (zh) * 2022-07-29 2024-03-12 天翼云科技有限公司 一种云桌面热备管理方法、装置及系统

Similar Documents

Publication Publication Date Title
CN106648997A (zh) 一种基于非实时操作系统的主从双机切换方法
EP3690657B1 (en) Computer-based interlocking system and redundancy switching method thereof
CN100555234C (zh) 双机冗余容错系统及其冗余切换方法
CN201909961U (zh) 一种冗余控制系统
CN103647781B (zh) 一种基于设备冗余和网络冗余的混合冗余可编程控制系统
CN103955188B (zh) 支持冗余切换功能的控制系统及方法
CN110376876B (zh) 一种双系同步的安全计算机平台
CN106814603A (zh) 一种基于非实时操作系统的双机冗余容错系统
CN104731670B (zh) 一种面向卫星的轮换式星载计算机容错系统
CN110488597B (zh) 机车主处理单元双冗余控制方法
CN108153144A (zh) 一种dcs冗余控制器无扰切换方法
CN104238435A (zh) 一种三冗余控制计算机及容错控制系统
CN103853622A (zh) 一种互为备份的双余度控制方法
US10503166B2 (en) Method of processing data for an automated vehicle
CN101267392B (zh) 一种上行链路状态切换时通知下游设备的实现方法
CN110515295A (zh) 一种动态可配置的冗余io模块的方法
CN101700783B (zh) 一种列控中心系统平台
CN110293999B (zh) 一种安全型lkj制动控制方式
CN110427283B (zh) 一种双余度的燃油管理计算机系统
CN105812161A (zh) 一种控制器故障备份方法和系统
CN108983682B (zh) 一种基于双总线的冗余表决控制方法
WO2020156584A1 (zh) 前端处理器的自动切换系统及方法
CN111045863B (zh) 一种传感器数据分配网络故障容错架构及方法
CN101808091A (zh) 一种支持数据协议保护的控制方法和系统
US9003067B2 (en) Network and method for operating the network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170510

RJ01 Rejection of invention patent application after publication