CN115037674B - 一种中央控制系统单机及多设备冗余备份方法 - Google Patents

一种中央控制系统单机及多设备冗余备份方法 Download PDF

Info

Publication number
CN115037674B
CN115037674B CN202210528436.2A CN202210528436A CN115037674B CN 115037674 B CN115037674 B CN 115037674B CN 202210528436 A CN202210528436 A CN 202210528436A CN 115037674 B CN115037674 B CN 115037674B
Authority
CN
China
Prior art keywords
standby
software
node
control card
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210528436.2A
Other languages
English (en)
Other versions
CN115037674A (zh
Inventor
衡炎炎
郑永帅
吴昊
王辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Bird Information Technology Co ltd
Original Assignee
Zhengzhou Bird Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Bird Information Technology Co ltd filed Critical Zhengzhou Bird Information Technology Co ltd
Priority to CN202210528436.2A priority Critical patent/CN115037674B/zh
Publication of CN115037674A publication Critical patent/CN115037674A/zh
Application granted granted Critical
Publication of CN115037674B publication Critical patent/CN115037674B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/58Association of routers
    • H04L45/586Association of routers of virtual routers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Abstract

本发明公开了一种中央控制系统单机及多设备冗余备份方法,涉及设备冗余备份技术领域,解决现有技术仅能解决单台设备上单个控制卡故障的技术问题,方法包括:同一台设备的控制卡之间通过内部网口通信并基于VRRP协议实现形成一个虚拟路由的一级硬件集群,自动选举形成一主多备的关系;不同设备之间通过外部网口通信并形成一个虚拟路由的二级硬件集群,自动选举形成一主多备的关系,不同设备之间通过各自的主控制卡进行网络通信;各控制卡均额外运行有软件系统,各软件系统跟随控制卡路由节点的主备状态,软件系统之间均通过multicast的方式进行心跳检测,实现用户会话存储和同步的能力。

Description

一种中央控制系统单机及多设备冗余备份方法
技术领域
本发明涉及设备冗余备份技术领域,更具体地说,它涉及一种中央控制系统单机及多设备冗余备份方法。
背景技术
在专利申请文件CN105550076A《图像拼接控制系统及其冗余热备份方法》:中,主备控制卡位于同一台设备,控制卡的主备状态是由硬件驱动主导,仅能解决单台设备上单个控制卡故障的问题,即已有技术仅仅对于单个控制卡故障的情况提供了一定的系统统稳定性的保障。
在专利申请文件CN109698775A《一种基于实时状态检测的双机冗余备份系统》:在该专利中,主备节点位于同一设备,每个节点都需要重复计算当前节点及对端节点状态,且存在节点状态冲突的可能,错误率较高,系统中需要额外进行状态冲突监测,该过程需要消耗一定的时间,造成系统反应较慢。
已有技术仅仅对于单个控制卡故障的情况提供了一定的系统统稳定性的保障;当控制卡所在机器发生故障时,不能提供相应的系统稳定性,即不能解决单点故障的问题。同时,已有技术的解决方案还存在错误率高,耗时多等问题。
发明内容
本发明要解决的技术问题是针对现有技术的上述不足,本发明的目的是提供一种中央控制系统单机及多设备冗余备份方法,可以实现单机多卡以及多机冗余备份。
本发明的技术方案是:一种中央控制系统单机及多设备冗余备份方法,包括:
将同一台设备的所有控制卡基于VRRP协议实现形成一个虚拟路由的一级硬件集群,一级硬件集群中各个节点自动选举形成一主多备的关系;
同一台设备的控制卡之间通过内部网口通信,各控制卡进行相同的服务配置,各控制卡之间通过心跳监测实现自动选举;
不同设备之间通过外部网口通信,不同设备基于VRRP协议实现形成一个虚拟路由的二级硬件集群,二级硬件集群中各个节点自动选举形成一主多备的关系,不同设备之间通过各自的主控制卡进行网络通信;
各控制卡均额外运行有软件系统,同一台设备的软件系统形成一级软件集群;不同设备的主控制卡的软件系统之间形成二级软件集群。
作为进一步地改进,设备上电后启动,软件系统启动后,读取控制卡上的虚拟路由配置及主备状态信息,同时在软件系统之间会通过multicast的方式持续发送和接收数据包达到心跳发送和监测的目的,结合虚拟路由状态和软件系统之间的心跳监测结果,判断得出当前软件系统的主备状态,软件系统中主备状态决定内存数据同步的方向和时机,从而达到业务数据,网络配置等数据同步的目的。
进一步地,软件系统中存在三种状态,分别是SINGLE、MASTER、SALVE,SINGLE表示当前节点为主节点且其他节点系统未正常运行,MASTER表示当前节点为主节点且其他备节点软件系统运行正常,SALVE表示当前节点为备节点且主节点软件系统运行正常,当软件系统的状态为MASTER时,该软件系统发起同步内存数据到其他软件系统。
进一步地,内存数据包括业务数据、网络配置数据。
进一步地,在同一台设备中,当备控制卡未能监测到主控制卡的心跳时,在其余备控制卡中选出一个作为新的主控制卡。
进一步地,在不同设备之间,当备设备的主控制卡未能监测到主设备的主控制卡的心跳时,在其余备设备中选出一个作为新的主设备。
有益效果
本发明与现有技术相比,具有的优点为:
本发明通过各控制卡形成硬件集群,各控制卡之间通过心跳监测实现自动选举,可以实现一重防护;各控制卡额外运行有软件系统,所有软件系统形成软件集群,软件集群间通过multicast的方式进行心跳检测,实现用户会话存储和同步的能力,可以实现双重防护,即在各控制卡硬件之间通过心跳监测实现切换,再通过软件系统之间进行心跳监测并进行数据同步,可以实现单机多卡以及多机冗余备份,提高系统稳定性。
附图说明
图1为本发明中同一台设备的两个控制卡的冗余备份示意图;
图2为本发明中软件系统的三种状态的示意图。
具体实施方式
下面结合附图中的具体实施例对本发明做进一步的说明。
参阅图1、2,一种中央控制系统单机及多设备冗余备份方法,包括:
将同一台设备的所有控制卡基于VRRP协议实现形成一个虚拟路由的一级硬件集群,一级硬件集群中各个节点自动选举形成一主多备的关系;即一个主控制卡,多个备控制卡,对应的节点为主控制节点、备控制节点;如图1所示,同一台设备上运行的两张控制卡,在两张控制卡上进行相同的服务配置,形成集群后,控制卡1为主控制卡,控制卡2为备控制卡;
同一台设备的控制卡之间通过内部网口通信,各控制卡进行相同的服务配置,各控制卡之间通过心跳监测实现自动选举,当备控制卡监测不到主控制卡的心跳,则认为主控制卡出现故障,备控制卡自动切换变成主控制卡,可以实现一重防护;
不同设备之间通过外部网口通信,不同设备基于VRRP协议实现形成一个虚拟路由的二级硬件集群,二级硬件集群中各个节点自动选举形成一主多备的关系,不同设备之间通过各自的主控制卡进行网络通信;当备设备监测不到主设备的心跳,则认为主设备出现故障,备设备自动切换变成主设备,以保证中央控制系统正常工作。
各控制卡均额外运行有软件系统,软件系统即软件系统运行在控制卡之上,同一台设备的软件系统形成一级软件集群;不同设备的主控制卡的软件系统之间形成二级软件集群;
各软件系统跟随控制卡路由节点的主备状态,同一台设备中,主控制卡对应的软件系统为一级软件集群的主控制节点,备控制卡对应的软件系统为一级软件集群的备控制节点;不同设备之间,主设备的主控制卡对应的软件系统为二级软件集群的主控制节点,备设备的主控制卡对应的软件系统为二级软件集群的备控制节点,一级软件集群之间、二级软件集群之间均通过multicast的方式进行心跳检测,实现用户会话存储和同步的能力。
具体的,设备上电后启动,软件系统启动后,读取控制卡上的虚拟路由配置及主备状态信息,同时在软件系统之间会通过multicast的方式持续发送和接收数据包达到心跳发送和监测的目的,结合虚拟路由状态和软件系统之间的心跳监测结果,判断得出当前软件系统的主备状态,软件系统中主备状态决定内存数据同步的方向和时机,从而达到业务数据,网络配置等数据同步的目的。
同一台设备的各软件系统之间通过持续发送和接受数据包达到心跳发送和监测的目的,相应的,不同设备的主控制卡的软件系统之间通过持续发送和接受数据包达到心跳发送和监测的目的。这里的心跳与各控制卡之间的心跳为两种心跳,即各控制卡之间监测卡的心跳,软件系统之间监测程序的心跳。
软件系统中存在三种状态,分别是SINGLE、MASTER、SALVE,SINGLE表示当前节点为主节点且其他节点系统未正常运行,MASTER表示当前节点为主节点且其他备节点软件系统运行正常,SALVE表示当前节点为备节点且主节点软件系统运行正常,当软件系统的状态为MASTER时,该软件系统发起同步内存数据到其他软件系统。内存数据包括业务数据、网络配置数据。
以图1为例,当控制卡1正常,控制卡2故障时,控制卡1的软件系统为SINGLE状态,不能发起数据同步;当控制卡1、控制卡2均正常时,控制卡1为MASTER状态,控制卡1发起数据同步到控制卡2;当控制卡1、控制卡2均正常时,控制卡2为SALVE状态,控制卡2不能发起数据同步到控制卡1。
在同一台设备中,当备控制卡未能监测到主控制卡的心跳时,在其余备控制卡中选出一个作为新的主控制卡。在不同设备之间,当备设备的主控制卡未能监测到主设备的主控制卡的心跳时,在其余备设备中选出一个作为新的主设备。
软件系统启动后,首先识别当前控制卡归属的路由节点的主备状态(该状态通过标志文件判断),再监测软件之间的业务心跳,根据上述逻辑,进入相应的状态。当软件状态为MASTER时,触发相应的业务数据同步流程。
本发明可以增强系统稳定性和容灾性,单个控制卡发生故障时,可在用户无感知的情况下实现节点自动切换,保证服务的持续可用性。并且可以提高数据安全性,数据库异地备份(备份到不同的设备),避免在极端情况下可能出现的备份数据丢失的情况。
以上仅是本发明的优选实施方式,应当指出对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些都不会影响本发明实施的效果和专利的实用性。

Claims (5)

1.一种中央控制系统单机及多设备冗余备份方法,其特征在于,包括:
将同一台设备的所有控制卡基于VRRP协议实现形成一个虚拟路由的一级硬件集群,一级硬件集群中各个节点自动选举形成一主多备的关系;
同一台设备的控制卡之间通过内部网口通信,各控制卡进行相同的服务配置,各控制卡之间通过心跳监测实现自动选举;
不同设备之间通过外部网口通信,不同设备基于VRRP协议实现形成一个虚拟路由的二级硬件集群,二级硬件集群中各个节点自动选举形成一主多备的关系,不同设备之间通过各自的主控制卡进行网络通信;
各控制卡均额外运行有软件系统,同一台设备的软件系统形成一级软件集群,主控制卡对应的软件系统为一级软件集群的主控制节点,备控制卡对应的软件系统为一级软件集群的备控制节点;不同设备的主控制卡的软件系统之间形成二级软件集群,不同设备之间,主设备的主控制卡对应的软件系统为二级软件集群的主控制节点,备设备的主控制卡对应的软件系统为二级软件集群的备控制节点;
设备上电后启动,软件系统启动后,读取控制卡上的虚拟路由配置及主备状态信息,同时在软件系统之间会通过multicast的方式持续发送和接收数据包达到心跳发送和监测的目的,结合虚拟路由状态和软件系统之间的心跳监测结果,判断得出当前软件系统的主备状态,软件系统中主备状态决定内存数据同步的方向和时机,从而达到业务数据,网络配置数据同步的目的。
2.根据权利要求1所述的一种中央控制系统单机及多设备冗余备份方法,其特征在于,软件系统中存在三种状态,分别是SINGLE、MASTER、SALVE,SINGLE表示当前节点为主节点且其他节点系统未正常运行,MASTER表示当前节点为主节点且其他备节点软件系统运行正常,SALVE表示当前节点为备节点且主节点软件系统运行正常,当软件系统的状态为MASTER时,该软件系统发起同步内存数据到其他软件系统。
3.根据权利要求2所述的一种中央控制系统单机及多设备冗余备份方法,其特征在于,内存数据包括业务数据、网络配置数据。
4.根据权利要求1所述的一种中央控制系统单机及多设备冗余备份方法,其特征在于,在同一台设备中,当备控制卡未能监测到主控制卡的心跳时,在其余备控制卡中选出一个作为新的主控制卡。
5.根据权利要求4所述的一种中央控制系统单机及多设备冗余备份方法,其特征在于,在不同设备之间,当备设备的主控制卡未能监测到主设备的主控制卡的心跳时,在其余备设备中选出一个作为新的主设备软件系统。
CN202210528436.2A 2022-05-16 2022-05-16 一种中央控制系统单机及多设备冗余备份方法 Active CN115037674B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210528436.2A CN115037674B (zh) 2022-05-16 2022-05-16 一种中央控制系统单机及多设备冗余备份方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210528436.2A CN115037674B (zh) 2022-05-16 2022-05-16 一种中央控制系统单机及多设备冗余备份方法

Publications (2)

Publication Number Publication Date
CN115037674A CN115037674A (zh) 2022-09-09
CN115037674B true CN115037674B (zh) 2023-08-22

Family

ID=83120153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210528436.2A Active CN115037674B (zh) 2022-05-16 2022-05-16 一种中央控制系统单机及多设备冗余备份方法

Country Status (1)

Country Link
CN (1) CN115037674B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101447858A (zh) * 2008-01-17 2009-06-03 中兴通讯股份有限公司 双机热备份系统中实现虚拟路由冗余协议同步倒换的方法
CN102239665A (zh) * 2010-12-13 2011-11-09 华为技术有限公司 管理业务的方法及装置
CN102792287A (zh) * 2010-03-08 2012-11-21 日本电气株式会社 计算机系统、现用系统计算机和待机系统计算机
CN104753710A (zh) * 2013-12-30 2015-07-01 北京大唐高鸿软件技术有限公司 双wan口网络设备的主备切换系统及方法
CN105119822A (zh) * 2015-09-08 2015-12-02 烽火通信科技股份有限公司 基于vrrp的备份组管理方法及系统
CN105550076A (zh) * 2015-12-03 2016-05-04 北京小鸟科技发展有限责任公司 图像拼接控制系统及其冗余热备份方法
CN105808391A (zh) * 2016-04-05 2016-07-27 浪潮电子信息产业股份有限公司 一种热替换cpu节点的方法及装置
CN107819617A (zh) * 2017-11-01 2018-03-20 京信通信系统(中国)有限公司 一种通信设备的监控方法和通信设备
CN110380911A (zh) * 2019-08-14 2019-10-25 北京交大思诺科技股份有限公司 一种冗余系统主备识别的方法
WO2019227401A1 (zh) * 2018-05-31 2019-12-05 西门子股份公司 冗余热备控制系统、方法、控制设备及计算机可读存储介质
CN111767244A (zh) * 2020-07-10 2020-10-13 中国船舶重工集团公司第七一六研究所 基于国产龙芯平台的双冗余计算机设备
CN112477919A (zh) * 2020-12-11 2021-03-12 交控科技股份有限公司 一种适用于列车控制系统平台的动态冗余备份方法及系统
CN114020835A (zh) * 2021-10-25 2022-02-08 浙江中控软件技术有限公司 实时数据库系统组态数据的同步方法、系统、设备及介质
US11258700B1 (en) * 2021-03-30 2022-02-22 Versa Networks, Inc. Enhanced messaging for backup state status notifications in communications networks
CN114143175A (zh) * 2021-10-15 2022-03-04 湖南麒麟信安科技股份有限公司 主备集群实现方法及系统
CN114237990A (zh) * 2021-11-18 2022-03-25 通号万全信号设备有限公司 一种基于fpga芯片的二乘冗余切换方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3806417A1 (en) * 2011-05-31 2021-04-14 Huawei Technologies Co., Ltd. Method, device, and system for realizing disaster tolerance backup
EP2813912B1 (en) * 2013-06-14 2019-08-07 ABB Schweiz AG Fault tolerant industrial automation control system

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101447858A (zh) * 2008-01-17 2009-06-03 中兴通讯股份有限公司 双机热备份系统中实现虚拟路由冗余协议同步倒换的方法
CN102792287A (zh) * 2010-03-08 2012-11-21 日本电气株式会社 计算机系统、现用系统计算机和待机系统计算机
CN102239665A (zh) * 2010-12-13 2011-11-09 华为技术有限公司 管理业务的方法及装置
CN104753710A (zh) * 2013-12-30 2015-07-01 北京大唐高鸿软件技术有限公司 双wan口网络设备的主备切换系统及方法
CN105119822A (zh) * 2015-09-08 2015-12-02 烽火通信科技股份有限公司 基于vrrp的备份组管理方法及系统
CN105550076A (zh) * 2015-12-03 2016-05-04 北京小鸟科技发展有限责任公司 图像拼接控制系统及其冗余热备份方法
CN105808391A (zh) * 2016-04-05 2016-07-27 浪潮电子信息产业股份有限公司 一种热替换cpu节点的方法及装置
CN107819617A (zh) * 2017-11-01 2018-03-20 京信通信系统(中国)有限公司 一种通信设备的监控方法和通信设备
WO2019227401A1 (zh) * 2018-05-31 2019-12-05 西门子股份公司 冗余热备控制系统、方法、控制设备及计算机可读存储介质
CN110380911A (zh) * 2019-08-14 2019-10-25 北京交大思诺科技股份有限公司 一种冗余系统主备识别的方法
CN111767244A (zh) * 2020-07-10 2020-10-13 中国船舶重工集团公司第七一六研究所 基于国产龙芯平台的双冗余计算机设备
CN112477919A (zh) * 2020-12-11 2021-03-12 交控科技股份有限公司 一种适用于列车控制系统平台的动态冗余备份方法及系统
US11258700B1 (en) * 2021-03-30 2022-02-22 Versa Networks, Inc. Enhanced messaging for backup state status notifications in communications networks
CN114143175A (zh) * 2021-10-15 2022-03-04 湖南麒麟信安科技股份有限公司 主备集群实现方法及系统
CN114020835A (zh) * 2021-10-25 2022-02-08 浙江中控软件技术有限公司 实时数据库系统组态数据的同步方法、系统、设备及介质
CN114237990A (zh) * 2021-11-18 2022-03-25 通号万全信号设备有限公司 一种基于fpga芯片的二乘冗余切换方法及装置

Also Published As

Publication number Publication date
CN115037674A (zh) 2022-09-09

Similar Documents

Publication Publication Date Title
CN103199972B (zh) 基于soa、rs485总线实现的双机热备份切换方法及热备份系统
US7639605B2 (en) System and method for detecting and recovering from virtual switch link failures
CN100534024C (zh) 基于工业以太网的故障处理方法、系统及一种交换设备
US9385944B2 (en) Communication system, path switching method and communication device
CN101594383B (zh) 一种双控制器存储系统的服务和控制器状态监控方法
CN103532753B (zh) 一种基于内存换页同步的双机热备方法
CN110677282B (zh) 一种分布式系统的热备份方法及分布式系统
WO2007048319A1 (fr) Systeme et procede de recuperation sur sinistre de dispositif de commande de service dans un reseau intelligent
CN106850255A (zh) 一种多机备份的实现方法
CN113127270A (zh) 一种基于云计算的3取2安全计算机平台
CN101267392A (zh) 一种上行链路状态切换时通知下游设备的实现方法
CN102932118B (zh) 一种双机主备裁决的方法及系统
CN102487332B (zh) 故障处理方法、装置和系统
WO2014060465A1 (en) Control system and method for supervisory control and data acquisition
CN115037674B (zh) 一种中央控制系统单机及多设备冗余备份方法
KR20110046897A (ko) 서브넷에서 마스터 노드를 선출하는 방법
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
JP2002136000A (ja) 無停電電源システム
CN107888491A (zh) Hsb备份系统及基于二层组网vrrp协议的ac双机热备方法
Kim et al. SAFE: Scalable autonomous fault-tolerant Ethernet
CN111628891A (zh) 一种基于qnx的双以太网冗余的实现方法
CN110716827A (zh) 适用于分布式系统的热备份方法及分布式系统
CN217037201U (zh) 一种用于存储产品的管理网络装置及存储系统
JPH05304528A (ja) 多重化通信ノード
JPH1165867A (ja) 負荷分散形システムにおけるシステム二重化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant