CN114337944B - 一种系统级主备冗余通用控制方法 - Google Patents

一种系统级主备冗余通用控制方法 Download PDF

Info

Publication number
CN114337944B
CN114337944B CN202210256252.5A CN202210256252A CN114337944B CN 114337944 B CN114337944 B CN 114337944B CN 202210256252 A CN202210256252 A CN 202210256252A CN 114337944 B CN114337944 B CN 114337944B
Authority
CN
China
Prior art keywords
computer
ruggedized
standby
computers
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210256252.5A
Other languages
English (en)
Other versions
CN114337944A (zh
Inventor
梁英杰
朱俊杰
芮万智
许金
崔小鹏
韩一
熊又星
张晓平
韩正清
郑欣良
孙兴法
马锐锋
吴延好
钟颖
周凯波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naval University of Engineering PLA
Original Assignee
Naval University of Engineering PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naval University of Engineering PLA filed Critical Naval University of Engineering PLA
Priority to CN202210256252.5A priority Critical patent/CN114337944B/zh
Publication of CN114337944A publication Critical patent/CN114337944A/zh
Application granted granted Critical
Publication of CN114337944B publication Critical patent/CN114337944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明涉及自动控制系统可靠性技术领域,公开了一种系统级主备冗余通用控制方法,计算机系统设有若干台加固计算机和与加固计算机连接的下级设备,加固计算机通过业务信息同步模块同步状态信息,加固计算机基于状态信息进行故障判断并主动进行主机和备机的切换。本发明一种系统级主备冗余通用控制方法,在主用加固计算机发生宕机或系统故障时,备用加固计算机可以升为主用并继续处理业务,确保该系统级主备冗余系统可以不间断的完成相应功能。

Description

一种系统级主备冗余通用控制方法
技术领域
本发明涉及自动控制系统可靠性技术领域,具体涉及一种系统级主备冗余通用控制方法。
背景技术
随着工业自动控制系统应用范围越来越广,并且越来越复杂,对控制系统自身的可靠性和安全性提出了越来越高的要求。系统级主备冗余作为提高系统可靠性的有效方法之一,很多学者和工程技术人员已在工业、电力和军工等行业中开展了广泛的应用研究,其中切换策略以及同步技术一直是研究的核心部分。核心控制系统作为工业生产的重要组成部分,是信息综合管理的核心,在高可靠性的前提下,需要采用了系统级主备冗余通用控制方法的容错技术,利用硬件冗余和软件冗余来应对故障宕机,提高系统可靠性。从某种意义上说,系统级主备冗余其设计质量决定了整个系统性能的好坏甚至成功与否,如何准确地进行双机/多机仲裁、逻辑切换、保持双机/多机软件任务同步运行,将对整个系统起到至关重要的作用。
系统级主备冗余就是对于重要的服务,使用两台加固计算机,互为备份,由主用机执行服务,即在同一时间内只有一台加固计算机提供服务。当其中主用的一台加固计算机出现故障宕机无法继续提供服务时,另一台热备加固计算机会自动替换主用加固计算机并继续提供服务,热备加固计算机自动切换为主用,从而在不需要人工干预的情况下,保证控制系统能持续提供服务。自动切换由软件控制,切换的延时取决于热备加固计算机软件何时检测到主用加固计算机出现宕机故障并升级或主用加固计算机检测到自身的系统故障而主动降级,并执行相应的切换策略。
为保证双机/多机热备份系统进行切换后业务程序不间断运行,还需要定时同步业务信息,这样,在热备加固计算机升为主用后才可继续执行业务,而不会因主备切换而引起业务处理中断。
发明内容
本发明的目的就是针对上述技术的不足,提供一种系统级主备冗余通用控制方法,在主用加固计算机发生宕机或系统故障时,备用加固计算机可以升为主用并继续处理业务,确保该系统级主备冗余系统可以不间断的完成相应功能。
为实现上述目的,本发明所涉及的一种系统级主备冗余通用控制方法,计算机系统设有若干台加固计算机和与所述加固计算机连接的下级设备,所述加固计算机通过业务信息同步模块同步状态信息,所述加固计算机基于所述状态信息进行故障判断并主动进行主机和备机的切换。
优选地,多台所述加固计算机启动时,均默认为备机,当其中一台所述加固计算机满足所述计算机系统最小工作单元时,进行故障判断,若本加固计算机无故障,其它加固计算机均不是主机时,本加固计算机切换为主机,可以极大提高处于主机和备机状态的加固计算机的角色稳定性和减少角色切换的时延,避免在各下级设备通信正常的情况下,同一时刻出现双主机、双备机和主机备机乒乓切换的问题。
优选地,计算机系统在运行时,任意一台所述加固计算机通过所述状态信息监测到其它加固计算机均不是主机,进行故障判断,若本加固计算机无故障,并满足所述计算机系统最小工作单元,本加固计算机切换为主机,在处于主机状态的加固计算机故障后,处于备机状态的加固计算机可以快速升为主机,接管原处于主机状态的加固计算机的职责,实现用户体验不间断,提高切换速度。
优选地,计算机系统在运行时,任意一台所述加固计算机通过所述状态信息监测到其它任意一台加固计算机为主机时,本加固计算机切换为备机。
优选地,计算机系统在运行时,任意一台所述加固计算机通过故障判断判定本加固计算机发生故障时,本加固计算机切换为备机。
优选地,所述加固计算机切换自身状态后,对外发布本加固计算机的自身状态信息。
优选地,所述加固计算机的状态信息包括主机、备机、开机初始化及故障。
优选地,所述故障判断还包括下级设备上报的通信连接数检查、逻辑通信连接状态检查和本加固计算机RedisServer的读写检查。
优选地,所述业务信息同步模块对所述加固计算机外发布流程信息,处于备机状态的加固计算机只保留未执行的流程信息,处于主机状态的加固计算机每执行一步,删掉执行过的流程信息的节点,同时同步其他加固计算机进行删除,处于备机状态的加固计算机切换为主机时,重新解析、加载并执行剩余的流程信息。
优选地,在需要时,人为手动切换所述加固计算机为备机或主机,可以平衡加固计算机的工作强度,提高加固计算机的使用寿命。
本发明与现有技术相比,具有以下优点:
1、能够满足复杂大系统对系统可靠性和容错性的需求,实现动态判断并更新主备加固计算机工作状态;
2、能够在不重启的前提下动态完成故障机未完成的工作;
3、提供主备角色的人工控制,达到提高设备使用寿命的效果;
4、处于主机状态的加固计算机发生故障时系统依然可以正常的运行,实现相应的业务功能,从而提高系统的可靠性。
附图说明
图1为本发明系统级主备冗余通用控制方法中加固计算机启动时的控制流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明。
本发明一种系统级主备冗余通用控制方法,计算机系统设有若干台加固计算机和与加固计算机连接的下级设备,加固计算机通过业务信息同步模块同步状态信息,加固计算机基于状态信息进行故障判断并主动进行主机和备机的切换。
如图1所示,其中,多台加固计算机启动时,均默认为备机,当其中一台加固计算机满足计算机系统最小工作单元时,进行故障判断,若本加固计算机无故障,其它加固计算机均不是主机时,本加固计算机切换为主机。
当计算机系统在运行时,任意一台加固计算机通过状态信息监测到其它加固计算机均不是主机,进行故障判断,若本加固计算机无故障,并满足计算机系统最小工作单元,本加固计算机切换为主机。
当计算机系统在运行时,任意一台加固计算机通过状态信息监测到其它任意一台加固计算机为主机时,本加固计算机切换为备机。
当计算机系统在运行时,任意一台加固计算机通过故障判断判定本加固计算机发生故障时,本加固计算机切换为备机。
加固计算机切换自身状态后,对外发布本加固计算机的自身状态信息,加固计算机的状态信息包括主机、备机、开机初始化及故障。
其中,故障判断还包括下级设备上报的通信连接数检查、逻辑通信连接状态检查和本加固计算机RedisServer的读写检查。
另外,业务信息同步模块对加固计算机发布流程信息,处于备机状态的加固计算机只保留未执行的流程信息,处于主机状态的加固计算机每执行一步,删掉执行过的流程信息的节点,同时同步其他加固计算机进行删除,处于备机状态的加固计算机切换为主机时,重新解析、加载并执行剩余的流程信息。
最后,计算机系统在需要时,可人为手动切换加固计算机为备机或主机。
下面以某一台加固计算机为例,如图1所示,启动时,本加固计算机设为备机,此时,采用启动策略,即:所有加固计算机中,最早满足计算机系统最小工作单元的加固计算机进行故障判断,若该加固计算机无故障,且其它加固计算机均不是主机时,该本加固计算机切换为主机,本加固计算机若满足上述条件,切换为主机,否则保持备机状态,然后进入运行状态,切换自身状态后,对外发布本加固计算机的自身状态信息。
若本加固计算机为主机,在运行过程中,本加固计算机进行故障判断,若通过状态信息监测到其它任意一台加固计算机为主机时,本加固计算机切换为备机,若判定本加固计算机发生故障,本加固计算机切换为备机。
若本加固计算机为备机,在运行过程中,通过状态信息监测到其它加固计算机均不是主机,进行故障判断,若本加固计算机无故障,并满足计算机系统最小工作单元,本加固计算机切换为主机。
在上述故障判断中,其包括下级设备上报的通信连接数检查、逻辑通信连接状态检查和本加固计算机RedisServer的读写检查,例如:故障判断在定时中断中执行,接收下级设备周期发送的通信连接数信息并保存通信连接数,同时进行超时计时,超时未收到信息,则对应下级设备的通信连接数清为0;逻辑通信连接状态由通信连接数确定,通信连接数为1或2时,逻辑通信连接状态为1,当通信连接数为0时,逻辑通信连接状态为0;接收其它加固计算机周期发布的状态信息并保存,同时进行超时计时,超时未收到信息,则该加固计算机的状态信息为故障。
在上述过程中,业务信息同步模块对加固计算机发布流程信息,处于备机状态的加固计算机只保留未执行的流程信息,处于主机状态的加固计算机每执行一步,删掉执行过的流程信息的节点,同时同步其他加固计算机进行删除,处于备机状态的加固计算机切换为主机时,重新解析、加载并执行剩余的流程信息,保证计算机系统不会因为准备切换而引起业务处理中断。
本发明系统级主备冗余通用控制方法,能够满足复杂大系统对系统可靠性和容错性的需求,实现动态判断并更新主备加固计算机工作状态;能够在不重启的前提下动态完成故障机未完成的工作;提供主备角色的人工控制,达到提高设备使用寿命的效果;处于主机状态的加固计算机发生故障时系统依然可以正常的运行,实现相应的业务功能,从而提高系统的可靠性。

Claims (4)

1.一种系统级主备冗余通用控制方法,其特征在于:计算机系统设有若干台加固计算机和与所述加固计算机连接的下级设备,所述加固计算机通过业务信息同步模块同步状态信息,所述加固计算机基于所述状态信息进行故障判断并主动进行主机和备机的切换,所述故障判断还包括下级设备上报的通信连接数检查、逻辑通信连接状态检查和本加固计算机RedisServer的读写检查;
多台所述加固计算机启动时,均默认为备机,当其中一台所述加固计算机满足所述计算机系统最小工作单元时,进行故障判断,若本加固计算机无故障,其它加固计算机均不是主机时,本加固计算机切换为主机;
计算机系统在运行时,任意一台所述加固计算机通过所述状态信息监测到其它加固计算机均不是主机,进行故障判断,若本加固计算机无故障,并满足所述计算机系统最小工作单元,本加固计算机切换为主机;
计算机系统在运行时,任意一台所述加固计算机通过所述状态信息监测到其它任意一台加固计算机为主机时,本加固计算机切换为备机;
计算机系统在运行时,任意一台所述加固计算机通过故障判断判定本加固计算机发生故障时,本加固计算机切换为备机;
所述加固计算机切换自身状态后,对外发布本加固计算机的自身状态信息。
2.根据权利要求1所述一种系统级主备冗余通用控制方法,其特征在于:所述加固计算机的状态信息包括主机、备机、开机初始化及故障。
3.根据权利要求1所述一种系统级主备冗余通用控制方法,其特征在于:所述业务信息同步模块对所述加固计算机外发布流程信息,处于备机状态的加固计算机只保留未执行的流程信息,处于主机状态的加固计算机每执行一步,删掉执行过的流程信息的节点,同时同步其他加固计算机进行删除,处于备机状态的加固计算机切换为主机时,重新解析、加载并执行剩余的流程信息。
4.根据权利要求1所述一种系统级主备冗余通用控制方法,其特征在于:在需要时,人为手动切换所述加固计算机为备机或主机。
CN202210256252.5A 2022-03-16 2022-03-16 一种系统级主备冗余通用控制方法 Active CN114337944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210256252.5A CN114337944B (zh) 2022-03-16 2022-03-16 一种系统级主备冗余通用控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210256252.5A CN114337944B (zh) 2022-03-16 2022-03-16 一种系统级主备冗余通用控制方法

Publications (2)

Publication Number Publication Date
CN114337944A CN114337944A (zh) 2022-04-12
CN114337944B true CN114337944B (zh) 2023-04-14

Family

ID=81033524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210256252.5A Active CN114337944B (zh) 2022-03-16 2022-03-16 一种系统级主备冗余通用控制方法

Country Status (1)

Country Link
CN (1) CN114337944B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115257890A (zh) * 2022-06-23 2022-11-01 卡斯柯信号有限公司 一种ats系统关键冗余设备主备机异常检测方法
CN117215859B (zh) * 2023-11-07 2024-02-09 苏州元脑智能科技有限公司 主备bios自动切换方法、自动切换装置和计算机

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731670A (zh) * 2015-03-25 2015-06-24 北京空间飞行器总体设计部 一种面向卫星的轮换式星载计算机容错系统
CN112433979A (zh) * 2020-11-20 2021-03-02 北京交大微联科技有限公司 多操作机间的切换方法、装置、电子设备及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455005B (zh) * 2013-09-06 2015-07-22 北京四方继保自动化股份有限公司 一种控制器冗余及切换方法
CN103617104B (zh) * 2013-12-01 2017-01-04 中国船舶重工集团公司第七一六研究所 一种基于ipmi的冗余计算机系统节点故障主被动检测方法
CN107992382B (zh) * 2017-10-24 2020-12-29 北京全路通信信号研究设计院集团有限公司 一种计算机联锁系统及其冗余切换方法
CN109194514B (zh) * 2018-09-11 2021-12-14 上海思源弘瑞自动化有限公司 一种双机监测方法、装置、服务器及存储介质
CN110361979B (zh) * 2019-07-19 2022-08-16 北京交大思诺科技股份有限公司 一种铁路信号领域的安全计算机平台
CN110351174B (zh) * 2019-07-19 2021-11-12 北京交大思诺科技股份有限公司 一种模块冗余的安全计算机平台
CN110971462A (zh) * 2019-12-09 2020-04-07 深信服科技股份有限公司 一种设备切换方法、装置、设备及存储介质
CN111371680B (zh) * 2020-03-04 2022-04-29 深信服科技股份有限公司 双机热备的路由管理方法、装置、设备及存储介质
CN111767244A (zh) * 2020-07-10 2020-10-13 中国船舶重工集团公司第七一六研究所 基于国产龙芯平台的双冗余计算机设备
CN112015150A (zh) * 2020-07-31 2020-12-01 唐山钢铁集团微尔自动化有限公司 一种实现工业控制计算机双机热切的方法
CN112198788B (zh) * 2020-09-16 2024-02-27 中国铁道科学研究院集团有限公司通信信号研究所 一种基于第三态的双机热备系统的实现方法
CN112201378A (zh) * 2020-10-21 2021-01-08 中国核动力研究设计院 基于核电厂dcs平台的热备切换方法、系统、终端及介质
CN113325689B (zh) * 2021-08-02 2021-12-28 中国人民解放军海军工程大学 一种基于数据同步的控制系统全时域热备方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731670A (zh) * 2015-03-25 2015-06-24 北京空间飞行器总体设计部 一种面向卫星的轮换式星载计算机容错系统
CN112433979A (zh) * 2020-11-20 2021-03-02 北京交大微联科技有限公司 多操作机间的切换方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN114337944A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN114337944B (zh) 一种系统级主备冗余通用控制方法
US5129080A (en) Method and system increasing the operational availability of a system of computer programs operating in a distributed system of computers
CN202798798U (zh) 基于云计算技术的高可用系统
CN103199972B (zh) 基于soa、rs485总线实现的双机热备份切换方法及热备份系统
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
CN102916825A (zh) 一种双机热备系统的管理设备、管理方法及双机热备系统
US7685461B2 (en) Method, apparatus and program storage device for performing fault tolerant code upgrade on a fault tolerant system by determining when functional code reaches a desired state before resuming an upgrade
CN101916217A (zh) 多控制器切换的方法、控制装置及系统
CN105915391B (zh) 基于单阶段提交并具备自恢复功能的分布式键值存储方法
US7373542B2 (en) Automatic startup of a cluster system after occurrence of a recoverable error
CN113254275A (zh) 一种基于分布式块设备的MySQL高可用架构方法
CN103186348B (zh) 存储系统及其数据读写方法
CN105959145B (zh) 一种适用高可用性集群的并行管理服务器的方法及系统
CN100461646C (zh) 通信设备中主备板倒换的方法
CN102487332B (zh) 故障处理方法、装置和系统
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
CN112069018B (zh) 一种数据库高可用方法及系统
CN107181608B (zh) 一种恢复服务及性能提升的方法及运维管理系统
CN101557307A (zh) 调度自动化系统应用状态管理方法
US20130290651A1 (en) Computer system and computer system information storage method
CN115694748A (zh) 一种基于分层系统实时数据同步的冗余框架设计方法
CN112702206B (zh) 一种主备集群部署方法及系统
CN105007293A (zh) 双主控网络系统及该系统中业务请求的双写方法
CN117827544B (zh) 热备份系统、方法、电子设备及存储介质
CN116760693B (zh) 一种数据库主备节点倒换的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant