CN105306256A - 一种基于VxWorks设备的双机热备实现方法 - Google Patents

一种基于VxWorks设备的双机热备实现方法 Download PDF

Info

Publication number
CN105306256A
CN105306256A CN201510611192.4A CN201510611192A CN105306256A CN 105306256 A CN105306256 A CN 105306256A CN 201510611192 A CN201510611192 A CN 201510611192A CN 105306256 A CN105306256 A CN 105306256A
Authority
CN
China
Prior art keywords
equipment
board
monitoring
software
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510611192.4A
Other languages
English (en)
Other versions
CN105306256B (zh
Inventor
郝建波
董江涛
刘翔
孙悦
牛力耕
贾世达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 54 Research Institute
Original Assignee
CETC 54 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 54 Research Institute filed Critical CETC 54 Research Institute
Priority to CN201510611192.4A priority Critical patent/CN105306256B/zh
Publication of CN105306256A publication Critical patent/CN105306256A/zh
Application granted granted Critical
Publication of CN105306256B publication Critical patent/CN105306256B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/22Arrangements for detecting or preventing errors in the information received using redundant apparatus to increase reliability

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种基于VxWorks设备的双机热备实现方法,它应用于某个板卡或某一组板卡发生故障时,为了保障其上运行的软件的可靠性和自动性,启动另一个板卡或另一组板卡中运行的热备份软件,来完成主设备软件的功能的情况。特别是当故障板卡中运行的软件要求高实时性的情况下,本方法可以快速的切换到备用软件,并完成主设备软件的功能。

Description

一种基于VxWorks设备的双机热备实现方法
技术领域
本发明涉及于嵌入式系统(VxWorks)控制领域中的一种基于设备故障的双机热备实现方法,特别适用于故障板卡中运行的软件要求高实时性的情况下。
背景技术
双机热备软件针对的是服务器的故障。服务器的故障可能由各种原因引起,比如设备故障、操作系统故障、软件系统故障等等。一般来讲,在技术人员在现场的情况下,恢复服务的时间相对较短,如果技术人员不在现场,则恢复时间较长。
对于一些重要的系统而言,用户很难忍受长时间服务中断。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠地服务。
目前市场上的双机热备软件大多是基于Windows和Linux主流操作系统,真正能适合基于VxWorks嵌入式系统的双机热备软件确实少之又少。本发明提出一种基于VxWorks设备的双机热备实现方法。
发明内容
本发明公开了一种基于VxWorks设备的双机热备实现方法,它应用于某个板卡或某一组板卡发生故障时,为了保障其上运行的软件的可靠性和自动性,启动另一个板卡或另一组板卡中运行的热备份软件,来完成主设备软件的功能的情况。特别是当故障板卡中运行的软件要求高实时性的情况下,本方法可以快速的切换到备用软件,并完成主设备软件的功能。
本发明解决的技术问题主要由以下技术方案实现:
一种基于VxWorks设备的双机热备实现方法,其特征在于,包括以下步骤:
A、启动运行于Windows端的设备监控软件,用于监控设备1各板卡状态和设备2各板卡状态以及管理设备1中软件和设备2中软件的配置信息;
B、启动设备1和设备2各板卡的VxWorks嵌入式系统,同时加载驱动;
C、启动设备1和设备2初始化程序,向设备监控软件请求配置信息;
D、启动设备1和设备2内部板卡异常诊断程序;
E、设备1的主业务程序和设备2的主业务程序均基于UDP组播协议接收外部信息;
F、设备1的主业务程序和设备2的主业务程序收到信息后同时进行业务处理,生成待发送数据;
G、设备监控软件定时轮询设备1和设备2的状态,若设备1和设备2的状态均正常,则执行L;若设备1和设备2中有一个设备的状态出现异常,则执行H;
H、通过设备监控软件查看异常设备是否为主用设备,若是主用设备,则执行I,否则执行K;
I、设备监控软件停掉该异常的主用设备,将另一台设备切换为新的主用设备,执行J;
J、设备管理软件报警提示设备故障,新的主用设备启动发送程序,发送待发送数据,完成业务需求,结束;
K、设备管理软件报警提示设备故障,主用设备启动发送程序,发送待发送数据,完成业务需求,结束;
L、通过主备状态查看本设备是否为主用设备,若是主用设备,启动发送程序,发送待发送数据,完成业务需求;若本设备为备用设备,则不发送数据,结束。
其中,步骤G中的设备监控软件定时轮询设备1和设备2的状态,具体包括以下步骤:
G1、设备监控软件定时向设备1和设备2发送设备状态监测信息;
G2、设备1的控制板卡收到设备状态监测信息后,向设备1的三块计算板卡发送板卡状态监测信息;设备2的控制板卡收到设备状态监测信息后,向设备2的三块计算板卡发送板卡状态监测信息;
G3、若设备1或设备2的控制板卡在指定的时间段内未收到与其相对应的某一块计算板卡的板卡状态监测响应,则判定该计算板卡产生异常;否则,判定该计算板卡正常;
G4、设备1和设备2的控制板卡向设备监控软件汇报三块计算板卡的状态;
G7、在指定的时间段内,若设备监控软件未收到设备的设备状态监测响应,则判定此设备异常;若收到设备的设备状态监测响应,响应中显示某块板卡异常,则判定此设备异常;若收到设备的设备状态监测响应,且响应显示全部正常,则设备状态正常。
通过上述步骤可以完成基于VxWorks设备的双机热备实现。
和现有基于Windows和Linux的双机热备软件相比,本发明的方法有以下几个优势:
1、首先,一个根本的区别是本方法是基于VxWorks设备的双机热备实现方法;
2、当主用设备发生故障时,现有双机热备软件需要启动备机并初始化开始环境,在此时间段内的业务需求不能按时完成。而本发明中两套设备的状态始终保持一致,所以可以更快的实现主备切换;
3、本发明的方法实现相对简单;
4、本发明的方法成本远远低于现有双机热备软件,能够有效地减少资本的投入,节省投资。
附图说明
图1是本发明中设备1、设备2与设备监控软件的网络拓扑图。
图2是设备1和设备2的启动运行流程图。
具体实施方式
下面结合图1、图2和具体实施例对本发明进一步说明。
一种基于VxWorks设备的双机热备实现方法,其特征在于,包括以下步骤:
A、启动运行于Windows端的设备监控软件,用于监控设备1各板卡状态和设备2各板卡状态以及管理设备1中软件和设备2中软件的配置信息;
如图1所示,描述了设备1、设备2和设备监控软件的网络拓扑关系,其中配置信息包括业务软件的配置和当前主用设备的IP地址;
B、启动设备1和设备2各板卡的VxWorks嵌入式系统,同时加载驱动;
C、启动设备1和设备2初始化程序,向设备监控软件请求配置信息;
设备1和设备2中存储配置信息,包括当前主用设备的IP地址;
D、启动设备1和设备2内部板卡异常诊断程序;
E、设备1的主业务程序和设备2的主业务程序均基于UDP组播协议接收外部信息;
主业务程序基于UDP组播协议接收外部信息,可以保证两套设备同时接收同样的信息;
F、设备1的主业务程序和设备2的主业务程序收到信息后同时进行业务处理,生成待发送数据;
G、设备监控软件定时轮询设备1和设备2的状态,若设备1和设备2的状态均正常,则执行L;若设备1和设备2中有一个设备的状态出现异常,则执行H;
设备1和设备2中有一个设备的状态出现异常时,报警提示设备故障,若异常设备为当前主用设备,则还需双机热备切换;
H、通过设备监控软件查看异常设备是否为主用设备,若是主用设备,则执行I,否则执行K;
I、设备监控软件停掉该异常的主用设备,将另一台设备切换为新的主用设备,执行J;
J、设备管理软件报警提示设备故障,新的主用设备启动发送程序,发送待发送数据,完成业务需求,结束;
K、设备管理软件报警提示设备故障,主用设备启动发送程序,发送待发送数据,完成业务需求,结束;
L、通过主备状态查看本设备是否为主用设备,若是主用设备,启动发送程序,发送待发送数据,完成业务需求;若本设备为备用设备,则不发送数据,结束。
通过将本设备IP地址和设备中存储的当前主用设备的IP地址进行比对,若相同,则发送待发送数据;否则,不发送。
其中,步骤G中的设备监控软件定时轮询设备1和设备2的状态,具体包括以下步骤:
G1、设备监控软件定时向设备1和设备2发送设备状态监测信息;
G2、设备1的控制板卡收到设备状态监测信息后,向设备1的三块计算板卡发送板卡状态监测信息;设备2的控制板卡收到设备状态监测信息后,向设备2的三块计算板卡发送板卡状态监测信息;
G3、若设备1或设备2的控制板卡在指定的时间段内未收到与其相对应的某一块计算板卡的板卡状态监测响应,则判定该计算板卡产生异常;否则,判定该计算板卡正常;
G4、设备1和设备2的控制板卡向设备监控软件汇报三块计算板卡的状态;
G5、在指定的时间段内,若设备监控软件未收到设备的设备状态监测响应,则判定此设备异常;若收到设备的设备状态监测响应,响应中显示某块板卡异常,则判定此设备异常;若收到设备的设备状态监测响应,且响应显示全部正常,则设备状态正常。
本发明工作原理如下:
本发明的原理是,设备1和设备2同时启动,初始化开机环境,设备1中的软件和设备2中的软件同时运行,这样当主用设备出现故障时,可以迅速切换到备用设备;另外软件是基于UDP组播协议来接收信息,这样两台设备可以同时接收信息,同时处理业务逻辑,即接收信息和业务处理可以同步进行,只是在发控阶段,根据设备中存储的主备状态信息,只有主用设备发送业务信息。

Claims (2)

1.一种基于VxWorks设备的双机热备实现方法,其特征在于,包括以下步骤:
A、启动运行于Windows端的设备监控软件,用于监控设备1各板卡状态和设备2各板卡状态以及管理设备1中软件和设备2中软件的配置信息;
B、启动设备1和设备2各板卡的VxWorks嵌入式系统,同时加载驱动;
C、启动设备1和设备2初始化程序,向设备监控软件请求配置信息;
D、启动设备1和设备2内部板卡异常诊断程序;
E、设备1的主业务程序和设备2的主业务程序均基于UDP组播协议接收外部信息;
F、设备1的主业务程序和设备2的主业务程序收到信息后同时进行业务处理,生成待发送数据;
G、设备监控软件定时轮询设备1和设备2的状态,若设备1和设备2的状态均正常,则执行L;若设备1和设备2中有一个设备的状态出现异常,则执行H;
H、通过设备监控软件查看异常设备是否为主用设备,若是主用设备,则执行I,否则执行K;
I、设备监控软件停掉该异常的主用设备,将另一台设备切换为新的主用设备,执行J;
J、设备管理软件报警提示设备故障,新的主用设备启动发送程序,发送待发送数据,完成业务需求,结束;
K、设备管理软件报警提示设备故障,主用设备启动发送程序,发送待发送数据,完成业务需求,结束;
L、通过主备状态查看本设备是否为主用设备,若是主用设备,启动发送程序,发送待发送数据,完成业务需求;若本设备为备用设备,则不发送数据,结束。
2.根据权利要求一所述的一种基于VxWorks设备的双机热备实现方法,其特征在于:步骤G中的设备监控软件定时轮询设备1和设备2的状态,具体包括以下步骤:
G1、设备监控软件定时向设备1和设备2发送设备状态监测信息;
G2、设备1的控制板卡收到设备状态监测信息后,向设备1的三块计算板卡发送板卡状态监测信息;设备2的控制板卡收到设备状态监测信息后,向设备2的三块计算板卡发送板卡状态监测信息;
G3、若设备1或设备2的控制板卡在指定的时间段内未收到与其相对应的某一块计算板卡的板卡状态监测响应,则判定该计算板卡产生异常;否则,判定该计算板卡正常;
G4、设备1和设备2的控制板卡向设备监控软件汇报三块计算板卡的状态;
G7、在指定的时间段内,若设备监控软件未收到设备的设备状态监测响应,则判定此设备异常;若收到设备的设备状态监测响应,响应中显示某块板卡异常,则判定此设备异常;若收到设备的设备状态监测响应,且响应显示全部正常,则设备状态正常。
通过上述步骤可以完成基于VxWorks设备的双机热备实现。
CN201510611192.4A 2015-09-23 2015-09-23 一种基于VxWorks设备的双机热备实现方法 Active CN105306256B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510611192.4A CN105306256B (zh) 2015-09-23 2015-09-23 一种基于VxWorks设备的双机热备实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510611192.4A CN105306256B (zh) 2015-09-23 2015-09-23 一种基于VxWorks设备的双机热备实现方法

Publications (2)

Publication Number Publication Date
CN105306256A true CN105306256A (zh) 2016-02-03
CN105306256B CN105306256B (zh) 2018-09-14

Family

ID=55203040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510611192.4A Active CN105306256B (zh) 2015-09-23 2015-09-23 一种基于VxWorks设备的双机热备实现方法

Country Status (1)

Country Link
CN (1) CN105306256B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062184A (zh) * 2018-08-10 2018-12-21 中国船舶重工集团公司第七〇九研究所 双机应急救援设备、故障切换方法和救援系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101150458A (zh) * 2007-11-10 2008-03-26 华为技术有限公司 检测单板的方法和设备
WO2010079091A1 (en) * 2009-01-07 2010-07-15 Abb Research Ltd Substation automation device and system
CN201699729U (zh) * 2010-05-05 2011-01-05 大唐移动通信设备有限公司 一种监测控制设备
CN101989903A (zh) * 2010-12-03 2011-03-23 国电南瑞科技股份有限公司 综合监控前置通信控制器双机冗余按口切换方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101150458A (zh) * 2007-11-10 2008-03-26 华为技术有限公司 检测单板的方法和设备
WO2010079091A1 (en) * 2009-01-07 2010-07-15 Abb Research Ltd Substation automation device and system
CN201699729U (zh) * 2010-05-05 2011-01-05 大唐移动通信设备有限公司 一种监测控制设备
CN101989903A (zh) * 2010-12-03 2011-03-23 国电南瑞科技股份有限公司 综合监控前置通信控制器双机冗余按口切换方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵泽荣,刘志勇,林琳: "基于vxWorks的ADS-B地面站热备份设计与实现", 《微型机与应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062184A (zh) * 2018-08-10 2018-12-21 中国船舶重工集团公司第七〇九研究所 双机应急救援设备、故障切换方法和救援系统
CN109062184B (zh) * 2018-08-10 2021-05-14 中国船舶重工集团公司第七一九研究所 双机应急救援设备、故障切换方法和救援系统

Also Published As

Publication number Publication date
CN105306256B (zh) 2018-09-14

Similar Documents

Publication Publication Date Title
CN105607590B (zh) 用于在过程控制系统中提供冗余性的方法和装置
CN102708018B (zh) 一种异常处理方法及系统、代理设备与控制装置
US10671498B2 (en) Method and apparatus for redundancy in active-active cluster system
US9838245B2 (en) Systems and methods for improved fault tolerance in solicited information handling systems
US10268484B2 (en) Redundant PC system
US20180115457A1 (en) High availability input/output management nodes
US10069709B2 (en) Communication apparatus and vehicle transmission system
US9231779B2 (en) Redundant automation system
KR20150088559A (ko) 네트워크의 장애를 복구하는 방법 및 장치
CN103036719A (zh) 一种基于主备集群服务器的跨地区服务容灾方法及装置
CN105652851A (zh) 冗余自动化系统和运行方法
CN105554074A (zh) 一种基于rpc通信的nas资源监控系统及监控方法
CN103916226A (zh) 基于嵌入式设备冗余备份的方法
JP6007849B2 (ja) ネットワーク中継装置
CN104079442A (zh) 基于实时以太网的冗余控制装置、设备冗余系统和方法
CN110457176A (zh) 用于分布式系统的监控方法、装置、存储介质及电子设备
CN104503861A (zh) 一种异常处理方法及系统、代理设备与控制装置
CN103905247A (zh) 一种基于多客户裁决的双机备份方法及系统
CN103441987A (zh) 双机防火墙系统的管理方法和装置
CN204406385U (zh) 计算机系统的管理装置
CN106027313B (zh) 网络链路容灾系统及方法
CN102355371A (zh) 一种拼接墙控制系统双机热冗余的实现方法
CN105306256A (zh) 一种基于VxWorks设备的双机热备实现方法
CN102983997A (zh) 主控服务迁移方法及装置
CN105337781A (zh) 网络管理系统、方法及网络系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant