CN110532132B - 热备服务器安全控制方法、介质及设备 - Google Patents

热备服务器安全控制方法、介质及设备 Download PDF

Info

Publication number
CN110532132B
CN110532132B CN201910225949.4A CN201910225949A CN110532132B CN 110532132 B CN110532132 B CN 110532132B CN 201910225949 A CN201910225949 A CN 201910225949A CN 110532132 B CN110532132 B CN 110532132B
Authority
CN
China
Prior art keywords
hot standby
standby
server
hot
platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910225949.4A
Other languages
English (en)
Other versions
CN110532132A (zh
Inventor
魏臻
程磊
黄鹏
孙中成
王刚
潘冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Gocom Information &technology Co ltd
Original Assignee
Hefei Gocom Information &technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Gocom Information &technology Co ltd filed Critical Hefei Gocom Information &technology Co ltd
Priority to CN201910225949.4A priority Critical patent/CN110532132B/zh
Publication of CN110532132A publication Critical patent/CN110532132A/zh
Application granted granted Critical
Publication of CN110532132B publication Critical patent/CN110532132B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

一种热备服务器安全控制方法、介质及设备,包括:启动热备服务器,并生成主备设定信息,用以确定各热备服务器的主备状态信息;利用主备状态信息控制热备服务器运行;利用热备服务器通过局域网络获取在线状态数据,用以结合线程监控信息获取主备状态控制数据;根据主备状态控制数据计算切换指令数据,用以切换热备服务器的主备状态。本发明解决了现有技术中的通用性安全性低的问题。

Description

热备服务器安全控制方法、介质及设备
技术领域
本发明涉及一种热备系统控制方法,特别是涉及一种热备服务器安全控制方法、介质及设备。
背景技术
在很多监控系统中有些设备需要双机热备,特别的对于其中有些安全相关的系统,要求涉及的设备要具有相应的安全等级,为保证安全,相应的热备软件也应是安全相关的。目前很多此类系统的双机热备功能是与监控应用程序写在一起的,不具有通用性;也有些系统是采用了具有安全等级认证的硬件设备,成本高,功能也受限制,使用范围狭窄。
综上所述,现有技术中热备服务器存在通用性及安全性低的技术问题。
发明内容
鉴于以上现有技术的缺点,本发明的目的在于提供一种热备服务器安全控制方法、介质及设备,本发明提供热备服务器安全控制方法、介质及设备,一种热备服务器安全控制方法,包括:启动两两个热备服务器中的应用服务器和热备平台,并生成主备设定信息,用以确定各热备服务器的主备状态信息;利用主备状态信息控制热备服务器运行;利用热备服务器通过局域网络获知在线状态,热备平台通过对自身监测获取热备平台故障信息;根据主备状态控制数据计算切换指令数据;应用服务器根据切换指令数据切换主备状态。
于本发明的一实施方式中,状态控制数据的步骤,包括:热备平台获取线程监测数据;分析在线状态数据得到主备状态控制数据。
于本发明的一实施方式中,获取线程监测数据的步骤,包括:在每一热备服务器中预设一双机热备控制线程和一安全监测线程;利用双机热备控制线程与安全监测线程相互监测运行周期和内存状态,以获取互检数据;根据互检数据,判定热备服务器的线程监测数据。
于本发明的一实施方式中,切换主备状态的步骤,包括:获取在线状态数据和平台状态信息;热备平台根据平台状态信息,判断当前热备服务器是否为主机平台;若否,则根据在线状态数据控制热备服务器的转主机过程;若是,则根据在线状态数据控制热备服务器转备机过程;应用服务器获取预设锁定期信息,据以锁定所有热备服务器的主备状态。
于本发明的一实施方式中,锁定主备状态的步骤,还包括:应用服务器读取模式信息;热备平台根据模式信息,控制热备服务器的主备状态。
于本发明的一实施方式中,一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现热备服务器控制类方法。
于本发明的一实施方式中,一种热备服务器安全控制设备,包括:处理器及存储器;存储器用于存储计算机程序,处理器用于执行存储器存储的计算机程序,以使热备服务器安全控制设备执行热备服务器安全控制方法。
如上所述,本发明提供的一种热备服务器安全控制方法、介质及设备,具有以下有益效果:本发明提供的一种热备服务器安全控制方法、介质及设备,避免了现有技术中通用性及安全性低的技术问题。本发明提供的一种热备服务器安全控制方法、介质及设备采用了安全自检技术和双机热备控制技术,能够在通用计算机、服务器上实现可靠的双机热备控制功能;热备平台软件与应用服务软件分开,通用性好;同时热备平台能够进行设备自检,在出现设备故障时自动导向安全状态,符合安全相关设备的要求。
综上,本发明解决了现有技术中存在的通用性及安全性低的技术问题。
附图说明
图1显示本发明的热备服务器安全控制方法步骤示意图。
图2显示为本发明的双机热备服务器连接示意图。
图3显示为图1中步骤S4在一实施例中的具体流程图。
图4显示为图3中步骤S41在一实施例中的具体流程图。
图5显示为图1中步骤S6在一实施例中的具体流程图。
图6显示为图5中步骤S65在一实施例中的具体流程图。
图7显示为本发明的线程互检示意图。
步骤标号说明
图1 S1~S6
图3 S41~S42
图4 S411~S413
图5 S61~S65
图6 S651~S652
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效。
请参阅图1至图7,须知,本说明书所附图式所绘示的结构,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容所能涵盖的范围内。同时,本说明书中所引用的如”上”、”下”、”左”、”右”、”中间”及”一”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
请参阅图1和图2,显示为本发明的热备服务器安全控制方法步骤示意图及双机热备服务器连接示意图,如图1和图2所示,一种热备服务器安全控制方法,包括:
S1、启动两个热备服务器中的应用服务器和热备平台,并生成主备设定信息,用以确定各热备服务器的主备状态信息,可选的,在双机热备平台刚启动时,热备的两台服务器采用竞争机制竞争主机状态,可选的,(1)HP启动后设置自己为维护态;(2)检测对方发来的状态,收到对方发来状态后,切换为相反的状态,竞争结束;没有收到状态时,启动竞争机制;(3)延时一个随机时间(要足够长,0--60秒,精度为200ms),进入下一周期(4)再次检测对方发来的状态,如果没有收到对方的状态,向外发出主机状态;如果收到对方的状态,就不发任何状态,根据对方发来状态,切换为相反的状态,竞争结束;(5)进入下一周期,再次检测对方发来的状态,已发出主机状态竞争信号的一方如果仍没有收到对方的状态,就将自己设为主机状态,竞争结束;(6)进入正常循环周期;
S2、利用主备状态信息控制热备服务器运行;
S3、利用热备服务器通过局域网络获知在线状态;
S4、热备平台通过对自身监测获取热备平台故障信息,可选的,其中,双机热备的服务器A机、服务器B机、系统中其它计算机PC;其中服务器A机、服务器B机中分别各布置一套业务应用服务软件AS、一套双机热备平台软件HP;两台服务器以及系统中其它计算机之间通过以太网连接;两台服务器之间的同步线采用以太网直接连接;
S5、根据主备状态控制数据计算切换指令数据;
S6、应用服务器根据切换指令数据切换主备状态,可选的,本机热备平台软件HP(HotStanby Platform),根据本机的主备状态、应用服务器AS(Application Server)的在线状态、另一台热备服务器的主备状态或高优先级的人工切换指令进行主备状态的切换。
请参阅图3,显示为图1中步骤S4在一实施例中的具体流程图,如图3所示,状态控制数据的步骤S4,包括:
S41、热备平台获取线程监测数据,可选的,热备服务器中双机热备平台软件HP中预设双线程,以互相监测的方式获取该热备服务器的实时维护状态信息和故障异常信息;
S42、分析线程监测数据得到热备平台故障信息。
请参阅图4和图7,显示为图3中步骤S41在一实施例中的具体流程图和线程互检示意图,如图4和图7所示,获取线程数据的步骤S41,包括:
S411、在每一热备服务器中预设一双机热备控制线程和一安全监测线程,可选的,双机热备平台软件HP具备2个线程,一个是双机热备控制线程,一个是安全监测线程;
S412、利用双机热备控制线程与安全监测线程相互监测运行周期和内存状态,以获取互检数据,可选的,安全监测线程与双机热备控制线程相互进行如下监测:被监测线程是否出现线程周期超时;定时对被监测线程的关键内存区域通过CRC校验进行监测。两个线程同时各自进行运行时序自检;
S413、根据互检数据,判定热备服务器的线程监测数据,可选的,当以上监测与自检中任意一种发现异常时,均认为设备出现故障,触发安全状态,终止HP对外的通信,以保证HP不发送错误信息。
请参阅图5,显示为图1中步骤S6在一实施例中的具体流程图,如图5所示,切换主备状态的步骤S6,包括:
S61、获取在线状态数据和平台状态信息,可选的,在线状态数据为AS连接状态数据在本实施例中,系统中存在以下通信连接:第一通信连接:服务器本机(以下“本机”均指本台服务器)内HP与AS之间的通信;第二通信连接:本机HP与另一机(以下“另一机”均指双机热备中的另一台服务器)HP的通信;第三通信连接:本机AS与局域网络中其它设备的通信;第四通信连接:本机HP与另一机AS的通信,可选的,本机AS判定自我是否在线:本机AS通过第三通信连接判断,当本机与ATS(Automatic Train Superversion,中央控制自动列车监督系统)中的至少一台设备有心跳通信时,自我判定为本机AS在线;反之认为不在线;本机HP判定本机AS是否在线:本机HP通过第一通信连接判断,HP检测第一通信连接是否正常,当HP收到本机AS报送的自己在线信息时,判定为本机AS在线;反之认为不在线,本机HP判定另一机AS是否在线:本机HP通过第四通信连接判断,当本机与另一机AS有心跳通信时,判定为另一机AS在线;反之认为不在线;本机HP判定另一机HP是否在线:本机HP通过通信第二通信连接判断,本机HP检测到通信第二通信连接正常时,判定另一机HP在线;反之认为不在线;
S62、热备平台根据平台状态信息,判断当前热备服务器是否为主机平台;
S63、若否,则根据在线状态数据控制热备服务器的转主机过程,可选的,本机HP切换为主机的时机:本机AS在线的情况下,对方机AS不在线或对方机HP为备机或维护模式时;或人工下达主机命令;
S64、若是,则根据在线状态数据控制热备服务器转备机过程,可选的,HP切换为备机的时机:本机AS不在线;或两机AS均在线,且对方机HP为主机;或人工下达备机命令。双机热备平台软件HP进行主备切换的具体决策机制见表1。
表1双机热备平台主备切换决策表
Figure GDA0002249229770000051
HP每次进行主备切换后,发生切换的HP进入主备切换锁定期,维持切换后的状态保持3个周期。3个周期结束后再恢复主备自动切换功能。避免主备状态发生来回振荡切换;
S65、应用服务器获取预设锁定期信息,据以锁定所有热备服务器的主备状态,可选的,HP每次进行主备切换后,发生切换的HP进入主备切换锁定期,维持切换后的状态保持两个周期例如3个周期。预设周期结束后再恢复主备自动切换功能。避免主备状态发生来回振荡切换。
请参阅图6,显示为图5中步骤S65在一实施例中的具体流程图,如图6所示,锁定主备状态的步骤S65,还包括:
S651、应用服务器读取模式信息,可选的,应用服务软件AS可设单机模式与双机模式。
S652、热备平台根据模式信息,控制热备服务器的主备状态,可选的,AS设置为主机的条件:单机模式;接到本机HP发来的主机命令;AS设置为备机的条件:在双机模式下未接到本机HP发来的主机命令,表2服务器应用服务软件AS设置本软件主备状态的决策机制
Figure GDA0002249229770000061
上述设备与软件中,所述双机热备平台软件HP具备2个线程,如图7所示,一个是双机热备控制线程,一个是安全监测线程。安全监测线程与双机热备控制线程相互进行如下监测:被监测线程是否出现线程周期超时;定时对被监测线程的关键内存区域通过CRC校验进行监测。两个线程同时各自进行运行时序自检。当以上监测与自检种任意一种发现异常时,均认为设备出现故障,触发安全状态,终止HP对外的通信,以保证HP不发送错误信息。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现热备服务器安全控制方法,本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
一种热备服务器安全控制设备,包括:处理器及存储器;存储器用于存储计算机程序,处理器用于执行存储器存储的计算机程序,以使热备服务器安全控制设备执行热备服务器安全控制方法,存储器可能包含随机存取存储器(RandomAccessMemory,简称RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DigitalSignalProcessing,简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,简称FPGA)或其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。方法,本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本发明提供的一种热备服务器安全控制方法、介质及设备,具有以下有益效果:本发明避免了现有技术中通用性及安全性低的技术问题。本发明热备服务器安全控制方法采用了安全自检技术和双机热备控制技术,能够在通用计算机、服务器上实现可靠的双机热备控制功能;热备平台软件与应用服务软件分开,通用性好;同时热备平台能够进行设备自检,在出现设备故障时自动导向安全状态,符合安全相关设备的要求。
综上,本发明解决了现有技术中存在的通用性及安全性低的技术问题,具有很高的商业价值和实用性。

Claims (7)

1.一种热备服务器安全控制方法,其特征在于,所述方法包括:
启动两个热备服务器中的应用服务器和热备平台,并生成主备设定信息,用以确定各所述热备服务器的主备状态信息;
利用所述主备状态信息控制所述热备服务器运行;
利用所述热备服务器通过局域网络获知在线状态;
所述热备平台通过对自身监测获取热备平台故障信息;
所述热备平台根据主备状态控制数据计算切换指令数据;
所述应用服务器根据所述切换指令数据切换主备状态;
其中,获取热备平台故障信息的步骤包括所述热备平台获取线程监测数据;
所述热备平台获取线程监测数据的步骤包括在每一所述热备服务器的热备平台中预设一双机热备控制线程和一安全监测线程;
安全监测线程与双机热备控制线程相互进行如下监测:被监测线程是否出现线程周期超时;定时对被监测线程的关键内存区域通过CRC校验进行监测,两个线程同时各自进行运行时序自检;
根据互检数据,判定热备服务器的线程监测数据,当以上监测与自检中任意一种发现异常时,均认为设备出现故障,触发安全状态。
2.根据权利要求1所述的方法,其特征在于,所述获取热备平台故障信息的步骤,还包括:
分析所述线程监测数据得到所述热备平台故障信息。
3.根据权利要求2所述的方法,其特征在于,所述获取线程监测数据的步骤,还包括:
利用所述双机热备控制线程与所述安全监测线程相互监测运行周期和内存状态,以获取互检数据;
根据所述互检数据,判定所述热备服务器的线程监测数据。
4.根据权利要求1所述的方法,其特征在于,切换主备状态的步骤,包括:
获取所述应用服务器的在线状态数据和平台状态信息;
所述热备平台根据所述平台状态信息,判断当前所述热备服务器是否为主机平台;
若否,则根据所述在线状态数据控制所述热备服务器的转主机过程;
若是,则根据所述在线状态数据控制所述热备服务器转备机过程;
所述应用服务器获取预设锁定期信息,据以锁定所有所述热备服务器的所述主备状态。
5.根据权利要求4所述的方法,其特征在于,应用服务器获取预设锁定期信息,据以锁定所有所述热备服务器的所述主备状态的步骤,包括:
应用服务器读取模式信息;
所述热备平台根据模式信息,控制所述热备服务器的所述主备状态;
其中,所述模式信息包括单机模式与双机模式。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至5中任一项所述热备服务器安全控制方法。
7.一种热备服务器安全控制设备,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述热备服务器安全控制设备执行如权利要求1至5中任一项所述热备服务器安全控制方法。
CN201910225949.4A 2019-03-22 2019-03-22 热备服务器安全控制方法、介质及设备 Active CN110532132B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910225949.4A CN110532132B (zh) 2019-03-22 2019-03-22 热备服务器安全控制方法、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910225949.4A CN110532132B (zh) 2019-03-22 2019-03-22 热备服务器安全控制方法、介质及设备

Publications (2)

Publication Number Publication Date
CN110532132A CN110532132A (zh) 2019-12-03
CN110532132B true CN110532132B (zh) 2022-04-12

Family

ID=68659287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910225949.4A Active CN110532132B (zh) 2019-03-22 2019-03-22 热备服务器安全控制方法、介质及设备

Country Status (1)

Country Link
CN (1) CN110532132B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136921A (zh) * 2010-01-22 2011-07-27 总装备部工程设计研究总院 一种快速检测计算机宕机的方法及含有该方法的计算机系统
CN108009056A (zh) * 2017-12-28 2018-05-08 合肥工大高科信息科技股份有限公司 一种安全计算机平台双机热备切换与故障检测系统及方法
CN109117323A (zh) * 2018-08-31 2019-01-01 中国电子科技集团公司第二十研究所 一种双机热备系统中的主备切换方法
CN109189600A (zh) * 2018-08-17 2019-01-11 四川航天系统工程研究所 一种基于多模冗余嵌入式软件的计算机系统及设计方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190007302A1 (en) * 2017-06-29 2019-01-03 Cisco Technology, Inc. Mechanism for Dual Active Detection Link Monitoring in Virtual Switching System with Hardware Accelerated Fast Hello

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136921A (zh) * 2010-01-22 2011-07-27 总装备部工程设计研究总院 一种快速检测计算机宕机的方法及含有该方法的计算机系统
CN108009056A (zh) * 2017-12-28 2018-05-08 合肥工大高科信息科技股份有限公司 一种安全计算机平台双机热备切换与故障检测系统及方法
CN109189600A (zh) * 2018-08-17 2019-01-11 四川航天系统工程研究所 一种基于多模冗余嵌入式软件的计算机系统及设计方法
CN109117323A (zh) * 2018-08-31 2019-01-01 中国电子科技集团公司第二十研究所 一种双机热备系统中的主备切换方法

Also Published As

Publication number Publication date
CN110532132A (zh) 2019-12-03

Similar Documents

Publication Publication Date Title
US20070288585A1 (en) Cluster system
US9223309B2 (en) Plant monitoring and control system and plant monitoring and control method
EP2637102A1 (en) Cluster system with network node failover
CN109062184B (zh) 双机应急救援设备、故障切换方法和救援系统
US20220100607A1 (en) Method and system for managing fault recovery in system-on-chips
CN110532132B (zh) 热备服务器安全控制方法、介质及设备
US11223515B2 (en) Cluster system, cluster system control method, server device, control method, and non-transitory computer-readable medium storing program
US7266462B2 (en) System, method and computer program product for configuring power supply apparatus
US8917609B2 (en) Line monitoring apparatus and line monitoring method
JP2003345620A (ja) 多ノードクラスタシステムのプロセス監視方法
CN112822039B (zh) 双机热备系统主备模式切换的方法
JP2000020336A (ja) 二重化通信システム
KR20080084360A (ko) 통신 장애 처리 시스템 및 방법
JP6428273B2 (ja) コマンド処理システム及びコマンド処理方法
US9787532B2 (en) Module, system and method of switching modules
CN115858222B (zh) 一种虚拟机故障处理方法、系统及电子设备
JP2007026038A (ja) パス監視システム,パス監視方法,およびパス監視プログラム
CN108153195B (zh) 一种控制器切换方法、装置、设备及计算机可读存储介质
CN115882501A (zh) 一种阀控系统切换控制方法、阀控系统和存储介质
JP2020197825A (ja) 三重化並列処理装置および並列処理方法
JPH06222944A (ja) 二重化電子計算機システムの切替制御方式
JPH02310755A (ja) ヘルスチェック方式
CN114816824A (zh) 一种dma管理方法、系统、装置及存储介质
CN115903450A (zh) 控制器状态的处理方法、相关设备以及计算机可读介质
JPS61169036A (ja) システム監視装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant