CN117667531A - 四机热备冗余处理方法、系统、电子设备及存储介质 - Google Patents

四机热备冗余处理方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN117667531A
CN117667531A CN202410133177.2A CN202410133177A CN117667531A CN 117667531 A CN117667531 A CN 117667531A CN 202410133177 A CN202410133177 A CN 202410133177A CN 117667531 A CN117667531 A CN 117667531A
Authority
CN
China
Prior art keywords
integrity
standby
host
target unit
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410133177.2A
Other languages
English (en)
Other versions
CN117667531B (zh
Inventor
吴正中
张辉
任海潇
刘二荣
张文博
杨永鑫
王晓东
邓能文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Urban Construction Intelligent Control Technology Co ltd
Original Assignee
Beijing Urban Construction Intelligent Control Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Urban Construction Intelligent Control Technology Co ltd filed Critical Beijing Urban Construction Intelligent Control Technology Co ltd
Priority to CN202410133177.2A priority Critical patent/CN117667531B/zh
Publication of CN117667531A publication Critical patent/CN117667531A/zh
Application granted granted Critical
Publication of CN117667531B publication Critical patent/CN117667531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • Computing Systems (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明涉及系统冗余技术领域,提供一种四机热备冗余处理方法、系统、电子设备及存储介质,该方法首先获取本机的主备状态及服务运行完整度,并接收热备组中其他主机的主备状态及服务运行完整度;然后基于热备组中各主机的服务运行完整度,调整本机所处的目标机组以及热备组中非目标机组的主备状态;最后基于目标机组的主备状态及目标机组中各主机的服务运行完整度,确定目标机组中各主机的主备状态,并基于非目标机组的主备状态及非目标机组中各主机的服务运行完整度,确定非目标机组中各主机的主备状态。该方法引入各主机的服务运行完整度的概念,可以实现对各主机的性能进行综合评价,并可以分层次实现主备状态的切换。

Description

四机热备冗余处理方法、系统、电子设备及存储介质
技术领域
本发明涉及系统冗余技术领域,尤其涉及一种四机热备冗余处理方法、系统、电子设备及存储介质。
背景技术
应用服务作为列车自动监控系统(Automatic Train Supervision,ATS)中的业务逻辑处理模块,分为中心应用和车站分机。其中,中心应用因其作用于全线调度监控操作,在整体业务逻辑中的使用率极高。由于硬件设备无法保证不会出现异常,所以对于需要长时间不间断提供服务的应用,普遍通过热备冗余的方式提供服务,以便服务不会停止,并且给用户更多的故障处理时间。
目前中心应用的热备冗余中普遍采用四机冗余方式来保障系统的稳定性和高可用性。四机热备是使用互为备份的四台服务器共同执行同一服务,其中一台主机为工作机,其他的三台主机为备份机。在系统正常情况下,工作机用于为应用系统提供服务,承担向行调工作站发送数据的任务,备份机用于监视工作机的运行情况,工作机同时也用于检测备份机的运行情况。当工作机出现异常不能支持应用系统运营时,备份机主动接管工作机的工作,继续支持关键应用服务,保证系统不间断的运行。
现有的四机热备冗余技术,通常是通过监测各台机器的心跳状态判断各台机器的运行情况,进而确定工作机和备用机。然而,受环境和网络的影响,可能导致当前的工作机不适于继续作为工作机,需要将性能更优的备份机接管工作机的工作。此时,仅仅通过监测各台机器的心跳状态判断各台主机的运行情况将会导致所选的工作机性能不佳,无法支持应用系统运营。
发明内容
本发明提供一种四机热备冗余处理方法、系统、电子设备及存储介质,用以解决现有技术中存在的缺陷。
本发明提供一种四机热备冗余处理方法,包括:
获取本机的主备状态及服务运行完整度,并接收热备组中其他主机的主备状态及服务运行完整度;所述本机的服务运行完整度基于所述本机的设备使用状态、网络状态及部署有所述热备组的目标应用的业务逻辑信息确定,所述其他主机的服务运行完整度基于所述其他主机的设备使用状态、网络状态及所述业务逻辑信息确定;
基于所述热备组中各主机的服务运行完整度,调整所述本机所处的目标机组以及所述热备组中非目标机组的主备状态;
基于所述目标机组的主备状态及所述目标机组中各主机的服务运行完整度,确定所述目标机组中各主机的主备状态,并基于所述非目标机组的主备状态及所述非目标机组中各主机的服务运行完整度,确定所述非目标机组中各主机的主备状态。
根据本发明提供的一种四机热备冗余处理方法,还包括:
若接收到第三方设备发送的处理指令;所述处理指令基于所述热备组中各主机的服务运行完整度确定;
基于所述处理指令,调整所述本机的主备状态。
根据本发明提供的一种四机热备冗余处理方法,获取本机的服务运行完整度,包括:
基于所述本机的设备使用状态,计算第一完整度;
基于所述本机的网络状态,计算第二完整度;
基于所述业务逻辑信息,计算第三完整度;
基于所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度。
根据本发明提供的一种四机热备冗余处理方法,基于所述本机的设备使用状态,计算第一完整度,包括:
若所述本机的中央处理器利用率和/或所述本机的内存利用率超过第一阈值,确定所述第一完整度为第一取值;
若所述本机的中央处理器利用率和/或所述本机的内存利用率超过第二阈值,确定所述第一完整度为第二取值;
其中,所述第一阈值小于所述第二阈值,所述第一取值大于所述第二取值。
根据本发明提供的一种四机热备冗余处理方法,所述目标应用基于双网冗余技术进行通信;
基于所述本机的网络状态,计算第二完整度,包括:
基于所述本机的双网连接状态,计算所述第二完整度。
根据本发明提供的一种四机热备冗余处理方法,基于所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度,包括:
接收所述热备组的应用场景信息,并基于所述应用场景信息确定对应的计算策略;
基于所述计算策略,应用所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度。
根据本发明提供的一种四机热备冗余处理方法,基于所述热备组中各主机的服务运行完整度,调整所述本机所处的目标机组以及所述热备组中非目标机组的主备状态,包括:
在所述目标机组为主控机组的条件下,若所述目标机组内存在服务运行完整度大于等于所述非目标机组中各主机的服务运行完整度的主机,则保持所述目标机组与所述非目标机组的主备状态不变;否则,切换所述目标机组和所述非目标机组的主备状态;
在所述目标机组为备用机组的条件下,若所述目标机组内存在服务运行完整度大于所述非目标机组中各主机的服务运行完整度的主机,则切换所述目标机组和所述非目标机组的主备状态;否则,保持所述目标机组与所述非目标机组的主备状态不变。
根据本发明提供的一种四机热备冗余处理方法,基于所述目标机组的主备状态及所述目标机组中各主机的服务运行完整度,确定所述目标机组中各主机的主备状态,并基于所述非目标机组的主备状态及所述非目标机组中各主机的服务运行完整度,确定所述非目标机组中各主机的主备状态,包括:
在所述目标机组为主控机组的条件下,若所述目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则切换所述目标机组中各主机的主备状态;否则,保持所述目标机组中各主机的主备状态不变;
在所述非目标机组为主控机组的条件下,若所述非目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则切换所述非目标机组中各主机的主备状态;否则,保持所述非目标机组中各主机的主备状态不变。
本发明还提供一种四机热备冗余处理方法,包括:
接收热备组中各主机的主备状态及服务运行完整度;
若确定所述热备组中存在多个主控主机,则基于各主控主机的服务运行完整度,生成对应于各主控主机的处理指令,所述处理指令用于调整各主控主机的主备状态。
本发明还提供一种四机热备冗余处理系统,包括:
第一数据获取模块,用于获取本机的主备状态及服务运行完整度,并接收热备组中其他主机的主备状态及服务运行完整度;所述本机的服务运行完整度基于所述本机的设备使用状态、网络状态及部署有所述热备组的目标应用的业务逻辑信息确定,所述其他主机的服务运行完整度基于所述其他主机的设备使用状态、网络状态及所述业务逻辑信息确定;
机组状态调整模块,用于基于所述热备组中各主机的服务运行完整度,调整所述本机所处的目标机组以及所述热备组中非目标机组的主备状态;
主机状态调整模块,用于基于所述目标机组的主备状态及所述目标机组中各主机的服务运行完整度,确定所述目标机组中各主机的主备状态,并基于所述非目标机组的主备状态及所述非目标机组中各主机的服务运行完整度,确定所述非目标机组中各主机的主备状态。
本发明还提供一种四机热备冗余处理系统,包括:
第二数据获取模块,用于接收热备组中各主机的主备状态及服务运行完整度;
指令生成模块,用于若确定所述热备组中存在多个主控主机,则基于各主控主机的服务运行完整度,生成对应于各主控主机的处理指令,所述处理指令用于调整各主控主机的主备状态。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述的四机热备冗余处理方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的四机热备冗余处理方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的四机热备冗余处理方法。
本发明提供的四机热备冗余处理方法、系统、电子设备及存储介质,该方法首先获取本机的主备状态及服务运行完整度,并接收热备组中其他主机的主备状态及服务运行完整度;然后基于热备组中各主机的服务运行完整度,调整本机所处的目标机组以及热备组中非目标机组的主备状态;最后基于目标机组的主备状态及目标机组中各主机的服务运行完整度,确定目标机组中各主机的主备状态,并基于非目标机组的主备状态及非目标机组中各主机的服务运行完整度,确定非目标机组中各主机的主备状态。该方法引入各主机的服务运行完整度的概念,可以实现对各主机的性能进行综合评价。该方法借助于各主机的服务运行完整度,先调整各机组的主备状态,再调整各机组内主机的主备状态,可以分层次实现主备状态的切换,有助于各主机的主备状态的管理和维护,还可以使最新的主控主机的性能更优,能够支持应用系统运营。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的四机热备冗余处理方法的流程示意图之一;
图2是本发明提供的四机热备冗余处理方法中热备组的各主机的连接关系示意图;
图3是本发明提供的四机热备冗余处理方法中热备组的各主机确定服务运行完整度的流程示意图;
图4是本发明提供的四机热备冗余处理方法的流程示意图之二;
图5是本发明提供的四机热备冗余处理方法的流程示意图之三;
图6是本发明提供的四机热备冗余处理系统的结构示意图之一;
图7是本发明提供的四机热备冗余处理系统的结构示意图之二;
图8是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书中的术语“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
由于现有的四机热备冗余技术,工作机受环境和网络的影响,可能导致当前的工作机不适于继续作为工作机,需要将性能更优的备份机接管工作机的工作。此时,仅仅通过监测各台机器的心跳状态判断各台主机的运行情况将会导致所选的工作机性能不佳,无法支持应用系统运营。为此,本发明实施例中提供了一种四机热备冗余处理方法。
图1为本发明实施例中提供的一种四机热备冗余处理方法的流程示意图,如图1所示,该方法包括:
S11,获取本机的主备状态及服务运行完整度,并接收热备组中其他主机的主备状态及服务运行完整度;所述本机的服务运行完整度基于所述本机的设备使用状态、网络状态及部署有所述热备组的目标应用的业务逻辑信息确定,所述其他主机的服务运行完整度基于所述其他主机的设备使用状态、网络状态及所述业务逻辑信息确定;
S12,基于所述热备组中各主机的服务运行完整度,调整所述本机所处的目标机组以及所述热备组中非目标机组的主备状态;
S13,基于所述目标机组的主备状态及所述目标机组中各主机的服务运行完整度,确定所述目标机组中各主机的主备状态,并基于所述非目标机组的主备状态及所述非目标机组中各主机的服务运行完整度,确定所述非目标机组中各主机的主备状态。
具体地,本发明实施例中提供的四机热备冗余处理方法,其执行主体为四机热备冗余处理系统,该系统可以配置于热备组中的任意一个主机上,该热备组可以包括四个主机,通过四机热备冗余的方式为目标应用提供服务,该目标应用可以是列车自动监控系统(Automatic Train Supervision,ATS)中的中心应用,此处不作具体限定。
四个主机中包括一个主控主机以及三个备用主机,其中主控主机是指处于主控状态的主机,备用主机是指处于备用状态的主机。四个主机可以分为两个机组,每个机组中包含有两个主机,包含有主控主机的机组为主控机组,即处于主控状态的机组,仅包含有备用主机的机组为备用机组,即处于备用状态的机组。
该热备组中各主机均可以包括一个服务端和多个客户端,通过服务端-客户端的模式进行通讯,如图2所示。该热备组的四个主机分别为1-4号主机,每个主机中的服务端不仅与自己的各客户端连接,还与其他主机中的服务端和各客户端连接。
每个主机可以创建三个线程,分别为发送线程、接收线程以及冗余处理线程,发送线程用于将自身的主备状态及服务运行完整度以心跳包的方式发送至其他主机;接收线程用于接收其他主机发送的心跳包;冗余处理线程用于执行本发明实施例中提供的四机热备冗余处理方法。
首先执行步骤S11,四机热备冗余处理系统可以获取本机的主备状态及服务运行完整度,本机可以是配置有该四机热备冗余处理系统的主机,该主机可以是热备组中的任意一个主机。
本机可以通过热备组中各主机之间的心跳连接关系,接收其他主机发送的心跳包,并通过解析该心跳包得到其他主机的主备状态及服务运行完整度。
特别地,可以设置接收时长,若在接收时长内本机未接收到某一其他主机发送的心跳包,则认为该其他主机的服务运行完整度为0。其中,该接收时长可以根据需要进行设置,此处不作具体限定。
同时,本机也会将自身的主备状态及服务运行完整度以心跳包的方式发送至其他主机,实现热备组中各主机的主备状态及服务运行度的共享。
其中,各主机的服务运行完整度的计算方法均相同,均是通过自身的设备使用状态、网络状态以及部署有热备组的目标应用的业务逻辑信息确定。各主机的服务运行完整度用于表征对应主机的综合性能。
对于本机来说,本机的服务运行完整度可以通过本机的设备使用状态、网络状态及部署有热备组的目标应用的业务逻辑信息确定。此处,设备使用状态、网络状态以及业务逻辑信息与服务运行完整度之间存在对应关系,可以通过该对应关系,结合本机的设备使用状态、网络状态及业务逻辑信息的不同情况的组合,确定不同的服务运行完整度的取值。
其他主机包括热备组中除本机外的剩余三个主机,剩余三个主机中的每个主机的服务运行完整度也均可以通过自身的设备使用状态、网络状态和业务逻辑信息确定,例如通过上述对应关系,结合自身的设备使用状态、网络状态和业务逻辑信息的不同情况的组合,确定自身不同的服务运行完整度的取值。
其中,主机的设备使用状态可以包括中央处理器(Central Processing Unit,CPU)利用率、内存利用率等状态信息。主机的网络状态可以表征与目标应用连接的各主机的网络连接状态,不仅可以包括与热备组中各主机之间的连接状态,还可以表征与除热备组外与目标应用连接的其他主机的连接状态。部署有热备组的目标应用的业务逻辑信息可以包括是否出现队列攒包情况、是否出现与外部设备断开连接的情况等。
然后执行步骤S12,利用热备组中各主机的服务运行完整度,调整本机所处的目标机组以及热备组中非目标机组的主备状态。可以理解的是,目标机组和非目标机组均包括两个主机,目标机组中包含有本机和另一个主机。机组的主备状态是由机组内是否存在主控主机而定,若机组内存在主控主机,则该机组为主控机组,否则若机组内不存在主控主机,即该机组内的主机均为备用主机,则该机组为备用机组。
机组的主备状态的调整标准可以是:只有在主控机组内不存在服务运行完整度大于等于备用机组内各主机的服务运行完整度的主机时,才需要切换两个机组的主备状态,即将主控机组切换为备用机组,将备用机组切换为主控机组。
最后执行步骤S13,在调整各机组的主备状态之后,可以根据各机组的主备状态,以及各机组中主机的服务运行完整度,确定目标机组中各主机的主备状态。例如,对于主控机组来说,需要根据其内各主机的服务运行完整度,确定目标机组中各主机的主备状态。对于备用机组来说,不需要根据其内各主机的服务运行完整度,确定目标机组中各主机的主备状态。
而且,对于主控机组内各主机的主备状态,可以将服务运行完整度高的主机作为主控主机,将服务运行完整度低的主机作为备用主机。
本发明实施例中提供的四机热备冗余处理方法,首先获取本机的主备状态及服务运行完整度,并接收热备组中其他主机的主备状态及服务运行完整度;然后基于热备组中各主机的服务运行完整度,调整本机所处的目标机组以及热备组中非目标机组的主备状态;最后基于目标机组的主备状态及目标机组中各主机的服务运行完整度,确定目标机组中各主机的主备状态,并基于非目标机组的主备状态及非目标机组中各主机的服务运行完整度,确定非目标机组中各主机的主备状态。该方法引入各主机的服务运行完整度的概念,可以实现对各主机的性能进行综合评价。该方法借助于各主机的服务运行完整度,先调整各机组的主备状态,再调整各机组内主机的主备状态,可以分层次实现主备状态的切换,有助于各主机的主备状态的管理和维护,还可以使最新的主控主机的性能更优,能够支持应用系统运营。
现有的四机热备冗余技术,在各主机之间的心跳连接意外断开,会出现多主状态。当多主状态出现时,如果作为工作机的多个主机中出现处理时间上的误差,则会导致向行调工作站发送的数据不一致,导致其出现车次窗来回跳变、轨道占压闪烁等问题。
在上述实施例的基础上,还包括:
若接收到第三方设备发送的处理指令;所述处理指令基于所述热备组中各主机的服务运行完整度确定;
基于所述处理指令,调整所述本机的主备状态。
具体地,四机热备冗余处理系统若接收到第三方设备发送的处理指令,则说明本机为主控主机,且热备组中出现了多主状态,即热备组中存在多个主控主机,此时第三方设备需要通过各主控主机的服务运行完整度,重新确定各主控主机的主备状态,以保证热备组中仅有一个主控主机。该第三方设备可以是除热备组外的其他主机设备。
此时,第三方设备在重新确定各主控主机的主备状态之后,可以通过向各主控主机发送对应的处理指令,调整各主控主机的主备状态。
本发明实施例中,通过第三方设备的决策,可以解决多主问题,避免出现向行调工作站发送的数据不一致的问题。
在上述实施例的基础上,获取本机的服务运行完整度,包括:
基于所述本机的设备使用状态,计算第一完整度;
基于所述本机的网络状态,计算第二完整度;
基于所述业务逻辑信息,计算第三完整度;
基于所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度。
具体地,在确定本机的服务运行完整度时,可以分别利用本机的设备使用状态,计算第一完整度,利用本机的网络状态,计算第二完整度,利用业务逻辑信息,计算第三完整度。
其中,可以预先确定不同设备使用状态与完整度的对应关系,根据该对应关系,结合本机的设备使用状态,得到第一完整度。
同样地,可以预先确定不同网络状态与完整度的对应关系,根据该对应关系,结合本机的网络状态,得到第二完整度。
可以预先确定不同业务逻辑信息与完整度的对应关系,根据该对应关系,结合目标应用的业务逻辑信息,得到第三完整度。
此后,利用所得的第一完整度、第二完整度以及第三完整度,计算本机的服务运行完整度。本机的服务运行完整度可以通过对第一完整度、第二完整度以及第三完整度的加权求和得到,也可以从第一完整度、第二完整度以及第三完整度中选取最小值作为本机的服务运行完整度,可以根据热备组实际的应用场景,选择合适的计算方式,此处不作具体限定。
本发明实施例中,通过分别利用本机的设备使用状态、网络状态以及业务逻辑信息计算的完整度,综合确定本机的服务运行完整度,可以使该服务运行完整度更加准确。
在上述实施例的基础上,基于所述本机的设备使用状态,计算第一完整度,包括:
若所述本机的中央处理器利用率和/或所述本机的内存利用率超过第一阈值,确定所述第一完整度为第一取值;
若所述本机的中央处理器利用率和/或所述本机的内存利用率超过第二阈值,确定所述第一完整度为第二取值;
其中,所述第一阈值小于所述第二阈值,所述第一取值大于所述第二取值。
具体地,在计算第一完整度时,若本机的CPU利用率和/或本机的内存利用率超过第一阈值,则确定第一完整度为第一取值。
第一阈值以及第一取值均可以根据需要进行设置,例如,该第一阈值可以是30%,若完整度按百分制进行表征,则第一取值可以60,如果完整度按概率值进行表征,则第一取值可以是0.6。
若CPU利用率和/或本机的内存利用率超过第二阈值,则确定第一完整度为第二取值。该第二阈值大于第一阈值,第一取值大于第二取值,第二阈值以及第二取值均可以根据需要进行设置,例如,第二阈值可以是50,若完整度按百分制进行表征,则第二取值可以20,如果完整度按概率值进行表征,则第一取值可以是0.2。第二取值还可以为0。
本发明实施例中,通过第一阈值和第二阈值,确定第一完整度的具体取值,可以使第一完整度的计算更加快速简便。
在上述实施例的基础上,目标应用基于双网冗余技术进行通信;
基于所述本机的网络状态,计算第二完整度,包括:
基于所述本机的双网连接状态,计算所述第二完整度。
具体地,本发明实施例中,配置有热备组的目标应用可以通过双网冗余技术进行通信,双网冗余技术是目标应用和所连硬件设备之间建立两个网络的冗余连接的技术。在服务器上,它安装两块网卡,一块为主网卡,另一块作为备用网卡。这两块网卡被当作一个网卡工作组来对待,其中一块为主网卡,另一块为备用网卡。
因此在计算第二完整度时,可以利用本机的双网连接状态实现,例如当其中一个网络断开时,第二完整度可以有第三取值,当两个网络均断开时,第二完整度可以有第四取值。此处,第三取值可以大于第四取值,例如若完整度按百分制进行表征,则第三取值可以是80,第四取值可以为20,若完整度按概率值进行表征,则第三取值可以是0.8,第三取值可以为0.2。此外,第四取值还可以为0。
本发明实施例中,通过本机的双网连接状态,确定第二完整度的具体取值,可以使第二完整度的计算更加快速简便。
在上述实施例的基础上,基于所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度,包括:
接收所述热备组的应用场景信息,并基于所述应用场景信息确定对应的计算策略;
基于所述计算策略,应用所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度。
具体地,在计算本机的服务运行完整度时,可以引入热备组的应用场景信息。该应用场景信息是指热备组的应用场景的标识信息,热备组的应用场景可以包括企业网络、防火墙和安全设备、服务器和存储系统、应用程序和数据库以及客户端软件等。
热备组的应用场景信息可以通过用户输入,此时用户可以根据热备组的应用场景选择对应的应用场景信息进行输入,四机热备冗余处理装置在接收到热备组的应用场景信息后,可以利用该应用场景信息确定对应的计算策略。
计算策略是指通过第一完整度、第二完整度以及第三完整度计算本机的服务运行完整度的具体方法,可以包括加权求和法、最小值法、单选法、从中选取若干完整度进行加权求和或最小值计算的方法等。
可以理解的是,四机热备冗余处理装置内可以预先存储有应用场景信息与计算策略之间的对应关系,该对应关系可以预先根据热备组的各应用场景对设备使用状态、网络状态以及业务逻辑信息的要求进行设定。例如,对于任一应用场景,若该应用场景对设备使用状态、网络状态以及业务逻辑信息的要求均较严格,则可以确定对应的计算策略可以是最小值法;若该应用场景对设备使用状态、网络状态以及业务逻辑信息的要求均较宽松,则可以确定对应的计算策略可以是加权求和法;若该应用场景仅对设备使用状态有要求,对网络状态以及业务逻辑信息的要求可以忽略不计,则可以确定对应的计算策略为将第一完整度作为本机的服务运行完整度。
此后,利用得到的计算策略,可以对第一完整度、第二完整度以及第三完整度进行计算,最终得到本机的服务运行完整度。
本发明实施例中,通过热备组的应用场景信息确定计算策略进而计算本机的服务运行完整度,可以提高服务运行完整度对当前应用场景的适用性,使最终的处理结果更加符合实际的场景需求。
在上述实施例的基础上,基于所述热备组中各主机的服务运行完整度,调整所述本机所处的目标机组以及所述热备组中非目标机组的主备状态,包括:
在所述目标机组为主控机组的条件下,若所述目标机组内存在服务运行完整度大于等于所述非目标机组中各主机的服务运行完整度的主机,则保持所述目标机组与所述非目标机组的主备状态不变;否则,切换所述目标机组和所述非目标机组的主备状态;
在所述目标机组为备用机组的条件下,若所述目标机组内存在服务运行完整度大于所述非目标机组中各主机的服务运行完整度的主机,则切换所述目标机组和所述非目标机组的主备状态;否则,保持所述目标机组与所述非目标机组的主备状态不变。
具体地,在调整本机所处的目标机组以及热备组中非目标机组的主备状态时,在目标机组为主控机组的条件下,若目标机组内存在服务运行完整度大于等于非目标机组中各主机的服务运行完整度的主机,则说明非目标机组中各主机的综合性能并未优于目标机组,此时无需进行主备切换,该目标机组可以继续作为主控机组,因此可以保持目标机组与非目标机组的主备状态不变。否则,若目标机组内各主机的服务运行完整度均小于非目标机组中最大的服务运行完整度的主机,则说明非目标机组中最大服务运行完整度的主机的综合性能优于目标机组中的各主机,此时需要进行主备切换,将目标机组切换为备用机组,将非目标机组切换为主控机组。
同样地,在目标机组为备用机组的条件下,若目标机组内存在服务运行完整度大于非目标机组中各主机的服务运行完整度的主机,则说明目标机组中存在综合性能优于非目标机组中各主机的服务运行完整度,此时需要进行主备切换,将目标机组切换为主控机组,将非目标机组切换为备用机组。否则,若目标机组内各主机的服务运行完整度均小于等于非目标机组中最大的服务运行完整度的主机,则说明目标机组中各主机的综合性能并未优于非目标机组,此时无需进行主备切换,该目标机组可以继续作为备用机组,可以保持目标机组与非目标机组的主备状态不变。
本发明实施例中,在目标机组为主控机组和备用机组的两种条件下,分别给出调整策略,可以实现调整的精确化。
在上述实施例的基础上,基于所述目标机组的主备状态及所述目标机组中各主机的服务运行完整度,确定所述目标机组中各主机的主备状态,并基于所述非目标机组的主备状态及所述非目标机组中各主机的服务运行完整度,确定所述非目标机组中各主机的主备状态,包括:
在所述目标机组为主控机组的条件下,若所述目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则切换所述目标机组中各主机的主备状态;否则,保持所述目标机组中各主机的主备状态不变;
在所述非目标机组为主控机组的条件下,若所述非目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则切换所述非目标机组中各主机的主备状态;否则,保持所述非目标机组中各主机的主备状态不变。
具体地,在确定目标机组以及非目标机组中各主机的主备状态时,在目标机组为主控机组的条件下,若目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则说明当前的主控主机的综合性能劣于备用主机的综合性能,因此需要切换目标机组中各主机的主备状态,将当前的主控主机切换为备用主机,将当前的备用主机切换为主控主机。否则,若目标机组中主控主机的服务运行完整度大于等于备用主机的服务运行完整度,则说明当前的主控主机的综合性能不劣于备用主机的综合性能,可以保持目标机组中各主机的主备状态不变。
同样地,在非目标机组为主控机组的条件下,若非目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则说明当前的主控主机的综合性能劣于备用主机的综合性能,因此需要切换非目标机组中各主机的主备状态,将当前的主控主机切换为备用主机,将当前的备用主机切换为主控主机。否则,若非目标机组中主控主机的服务运行完整度大于等于备用主机的服务运行完整度,则说明当前的主控主机的综合性能不劣于备用主机的综合性能,可以保持非目标机组中各主机的主备状态不变。
本发明实施例中,在非目标机组为主控机组和备用机组的两种条件下,分别给出调整策略,可以实现调整的精确化。
如图3所示,为本发明实施例中提供的各主机计算服务运行完整度的流程示意图。对于任意一个主机来说,该流程包括:
获取本机的设备使用状态、网络状态以及部署有热备组的目标应用的业务逻辑信息;
对于本机的设备使用状态,获取本机的CPU使用率和/或内存使用率,若CPU使用率以及内存使用率中的任意一个小于第一阈值,则确定第一完整度为100;若CPU使用率以及内存使用率均大于等于第一阈值,则继续判断是否大于等于第二阈值,若大于等于第二阈值,则确定第一完整度为0;若小于第二阈值,则确定第一完整度为60。
对于本机的网络状态,判断本机的A网络是否连接,在A网络连接的情况下,若B网络连接,则第二完整度的取值为100,若B网络未连接,则第二完整度的取值为80。
在A网络未连接的情况下,若B网络连接,则第二完整度的取值为80,若B网络未连接的情况下,第二完整度的取值为0。
对于业务逻辑信息,若本机出现队列攒包现象,则第三完整度为20;若本机出现与重要外部设备断开连接现象,则第三完整度降为40。
最终,取第一完整度、第二完整度以及第三完整度中的最小值作为本机的服务运行完整度。
如图4所示,在上述实施例的基础上,本发明实施例中还提供了一种四机热备冗余处理方法,包括:
S21,接收热备组中各主机的主备状态及服务运行完整度;
S22,若确定所述热备组中存在多个主控主机,则基于各主控主机的服务运行完整度,生成对应于各主控主机的处理指令,所述处理指令用于调整各主控主机的主备状态。
具体地,本发明实施例中提供的四机热备冗余处理方法,其执行主体为第三方设备,该第三方设备可以是除热备组外的其他主机设备。
首先,执行步骤S21,该第三方设备可以分别于热备组中各主机连接,以接收热备组中各主机的主备状态及服务运行完整度。
然后,执行步骤S22,第三方设备通过判断热备组中是否存在多个主控主机,在存在多个主控主机的情况下,利用各主控主机的服务运行完整度,生成对应于各主控主机的处理指令,以使各主控主机在接收到处理指令之后,调整自身的主备状态。
第三方设备的处理标准是:保证热备组内同一时刻仅存在一个主控主机。当各主机的服务运行完整度不同时,则可以从中选取服务运行完整度最大的主机作为最终的主控主机,其他主机均作为备用主机。当各主机的服务运行完整度相同时,则可以根据预先设置的优先级,选取优先级最高的主机作为最终的主控主机,其他主机均作为备用主机。当存在最大服务运行完整度的多个主机,则也可以选取优先级最高的主机作为最终的主控主机,其他主机均作为备用主机。
本发明实施例中提供的四机热备冗余处理方法,首先接收热备组中各主机的主备状态及服务运行完整度;然后在确定热备组中存在多个主控主机的情况下,利用各主控主机的服务运行完整度,生成对应于各主控主机的处理指令。该方法可以避免出现解决热备组中存在多主状态。
如图5所示,为本发明实施例中提供的四机热备冗余处理方法的完整流程示意图。该流程包括:
首先,进行设备模块初始化,创建发送线程、冗余处理线程以及接收线程。
通过冗余处理线程执行本发明实施例中提供的四机热备冗余处理方法,计算本机服务运行完整度;通过发送线程以心跳包的方式向其他主机发送本机的主备状态及服务运行完整度;通过接收线程接收其他主机发送的主备状态及服务运行完整度。
此后,通过冗余处理线程将本机的服务运行完整度与其他主机的服务运行完整度进行对比,先判断本机说出的目标机组是否为主控机组,在目标机组为主控机组的条件下,若目标机组内存在服务运行完整度大于等于非目标机组中各主机的服务运行完整度的主机,则保持目标机组与所述非目标机组的主备状态不变;否则,切换目标机组和非目标机组的主备状态。
在目标机组为备用机组的条件下,若目标机组内存在服务运行完整度大于非目标机组中各主机的服务运行完整度的主机,则切换目标机组和非目标机组的主备状态;否则,保持目标机组与非目标机组的主备状态不变。
此后,进行组内双机冗余处理,即在目标机组为主控机组的条件下,若目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则切换目标机组中各主机的主备状态;否则,保持目标机组中各主机的主备状态不变。
在非目标机组为主控机组的条件下,若非目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则切换非目标机组中各主机的主备状态;否则,保持非目标机组中各主机的主备状态不变。
特别地,若接收线程超时未接收到心跳的主机则认为该主机的服务运行完整度为0。
可以理解的,该完整过程可以按周期循环执行,以保证当前的主控主机的综合性能持续较优。
综上所述,本发明实施例中提供的一种四机热备冗余处理方法,引入了服务运行完整度的概念以及第三方设备的决策机制,从多个角度确保四机热备冗余的一主三备的准确性和有效性,保证了中心应用服务724小时稳定的运行,为一些上层服务提供了稳定的环境。
对于企业重要的应用系统而言,保证系统能持续、可靠地提供服务是非常重要的,因此就出现了对高可用性的需求和高可用性的解决方案。基于云平台的四机热备冗余的处理方法为系统高可用提供了解决方案。
如图6所示,在上述实施例的基础上,本发明实施例中提供了一种四机热备冗余处理系统,包括:
第一数据获取模块61,用于获取本机的主备状态及服务运行完整度,并接收热备组中其他主机的主备状态及服务运行完整度;所述本机的服务运行完整度基于所述本机的设备使用状态、网络状态及部署有所述热备组的目标应用的业务逻辑信息确定,所述其他主机的服务运行完整度基于所述其他主机的设备使用状态、网络状态及所述业务逻辑信息确定;
机组状态调整模块62,用于基于所述热备组中各主机的服务运行完整度,调整所述本机所处的目标机组以及所述热备组中非目标机组的主备状态;
主机状态调整模块63,用于基于所述目标机组的主备状态及所述目标机组中各主机的服务运行完整度,确定所述目标机组中各主机的主备状态,并基于所述非目标机组的主备状态及所述非目标机组中各主机的服务运行完整度,确定所述非目标机组中各主机的主备状态。
在上述实施例的基础上,本发明实施例中提供的四机热备冗余处理系统,还包括指令接收模块,用于:
若接收到第三方设备发送的处理指令;所述处理指令基于所述热备组中各主机的服务运行完整度确定;
基于所述处理指令,调整所述本机的主备状态。
在上述实施例的基础上,本发明实施例中提供的四机热备冗余处理系统,第一数据获取模块具体用于:
基于所述本机的设备使用状态,计算第一完整度;
基于所述本机的网络状态,计算第二完整度;
基于所述业务逻辑信息,计算第三完整度;
基于所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度。
在上述实施例的基础上,本发明实施例中提供的四机热备冗余处理系统,第一数据获取模块具体用于:
若所述本机的中央处理器利用率和/或所述本机的内存利用率超过第一阈值,确定所述第一完整度为第一取值;
若所述本机的中央处理器利用率和/或所述本机的内存利用率超过第二阈值,确定所述第一完整度为第二取值;
其中,所述第一阈值小于所述第二阈值,所述第一取值大于所述第二取值。
在上述实施例的基础上,本发明实施例中提供的四机热备冗余处理系统,所述目标应用基于双网冗余技术进行通信;
第一数据获取模块具体用于:
基于所述本机的双网连接状态,计算所述第二完整度。
在上述实施例的基础上,本发明实施例中提供的四机热备冗余处理系统,第一数据获取模块具体用于:
接收所述热备组的应用场景信息,并基于所述应用场景信息确定对应的计算策略;
基于所述计算策略,应用所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度。
在上述实施例的基础上,本发明实施例中提供的四机热备冗余处理系统,机组状态调整模块具体用于:
在所述目标机组为主控机组的条件下,若所述目标机组内存在服务运行完整度大于等于所述非目标机组中各主机的服务运行完整度的主机,则保持所述目标机组与所述非目标机组的主备状态不变;否则,切换所述目标机组和所述非目标机组的主备状态;
在所述目标机组为备用机组的条件下,若所述目标机组内存在服务运行完整度大于所述非目标机组中各主机的服务运行完整度的主机,则切换所述目标机组和所述非目标机组的主备状态;否则,保持所述目标机组与所述非目标机组的主备状态不变。
在上述实施例的基础上,本发明实施例中提供的四机热备冗余处理系统,主机状态调整模块具体用于:
在所述目标机组为主控机组的条件下,若所述目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则切换所述目标机组中各主机的主备状态;否则,保持所述目标机组中各主机的主备状态不变;
在所述非目标机组为主控机组的条件下,若所述非目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则切换所述非目标机组中各主机的主备状态;否则,保持所述非目标机组中各主机的主备状态不变。
具体地,本发明实施例中提供的四机热备冗余处理系统中各模块的作用与上述以热备组中各主机为执行主体的方法类实施例中各步骤的操作流程是一一对应的,实现的效果也是一致的,具体参见上述实施例,本发明实施例中对此不再赘述。
如图7所示,在上述实施例的基础上,本发明实施例中提供了一种四机热备冗余处理系统,包括:
第二数据获取模块71,用于接收热备组中各主机的主备状态及服务运行完整度;
指令生成模块72,用于若确定所述热备组中存在多个主控主机,则基于各主控主机的服务运行完整度,生成对应于各主控主机的处理指令,所述处理指令用于调整各主控主机的主备状态。
具体地,本发明实施例中提供的四机热备冗余处理系统中各模块的作用与上述以第三方设备为执行主体的方法类实施例中各步骤的操作流程是一一对应的,实现的效果也是一致的,具体参见上述实施例,本发明实施例中对此不再赘述。
图8示例了一种电子设备的实体结构示意图,如图8所示,该电子设备可以包括:处理器(Processor)810、通信接口(Communications Interface)820、存储器(Memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行上述各实施例中提供的四机热备冗余处理方法。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各实施例中提供的四机热备冗余处理方法。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例中提供的四机热备冗余处理方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (13)

1.一种四机热备冗余处理方法,其特征在于,包括:
获取本机的主备状态及服务运行完整度,并接收热备组中其他主机的主备状态及服务运行完整度;所述本机的服务运行完整度基于所述本机的设备使用状态、网络状态及部署有所述热备组的目标应用的业务逻辑信息确定,所述其他主机的服务运行完整度基于所述其他主机的设备使用状态、网络状态及所述业务逻辑信息确定;
基于所述热备组中各主机的服务运行完整度,调整所述本机所处的目标机组以及所述热备组中非目标机组的主备状态;
基于所述目标机组的主备状态及所述目标机组中各主机的服务运行完整度,确定所述目标机组中各主机的主备状态,并基于所述非目标机组的主备状态及所述非目标机组中各主机的服务运行完整度,确定所述非目标机组中各主机的主备状态。
2.根据权利要求1所述的四机热备冗余处理方法,其特征在于,还包括:
若接收到第三方设备发送的处理指令;所述处理指令基于所述热备组中各主机的服务运行完整度确定;
基于所述处理指令,调整所述本机的主备状态。
3.根据权利要求1所述的四机热备冗余处理方法,其特征在于,获取本机的服务运行完整度,包括:
基于所述本机的设备使用状态,计算第一完整度;
基于所述本机的网络状态,计算第二完整度;
基于所述业务逻辑信息,计算第三完整度;
基于所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度。
4.根据权利要求3所述的四机热备冗余处理方法,其特征在于,基于所述本机的设备使用状态,计算第一完整度,包括:
若所述本机的中央处理器利用率和/或所述本机的内存利用率超过第一阈值,确定所述第一完整度为第一取值;
若所述本机的中央处理器利用率和/或所述本机的内存利用率超过第二阈值,确定所述第一完整度为第二取值;
其中,所述第一阈值小于所述第二阈值,所述第一取值大于所述第二取值。
5.根据权利要求3所述的四机热备冗余处理方法,其特征在于,所述目标应用基于双网冗余技术进行通信;
基于所述本机的网络状态,计算第二完整度,包括:
基于所述本机的双网连接状态,计算所述第二完整度。
6.根据权利要求3所述的四机热备冗余处理方法,其特征在于,基于所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度,包括:
接收所述热备组的应用场景信息,并基于所述应用场景信息确定对应的计算策略;
基于所述计算策略,应用所述第一完整度、所述第二完整度以及所述第三完整度,计算所述本机的服务运行完整度。
7.根据权利要求1-6中任一项所述的四机热备冗余处理方法,其特征在于,基于所述热备组中各主机的服务运行完整度,调整所述本机所处的目标机组以及所述热备组中非目标机组的主备状态,包括:
在所述目标机组为主控机组的条件下,若所述目标机组内存在服务运行完整度大于等于所述非目标机组中各主机的服务运行完整度的主机,则保持所述目标机组与所述非目标机组的主备状态不变;否则,切换所述目标机组和所述非目标机组的主备状态;
在所述目标机组为备用机组的条件下,若所述目标机组内存在服务运行完整度大于所述非目标机组中各主机的服务运行完整度的主机,则切换所述目标机组和所述非目标机组的主备状态;否则,保持所述目标机组与所述非目标机组的主备状态不变。
8.根据权利要求1-6中任一项所述的四机热备冗余处理方法,其特征在于,基于所述目标机组的主备状态及所述目标机组中各主机的服务运行完整度,确定所述目标机组中各主机的主备状态,并基于所述非目标机组的主备状态及所述非目标机组中各主机的服务运行完整度,确定所述非目标机组中各主机的主备状态,包括:
在所述目标机组为主控机组的条件下,若所述目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则切换所述目标机组中各主机的主备状态;否则,保持所述目标机组中各主机的主备状态不变;
在所述非目标机组为主控机组的条件下,若所述非目标机组中主控主机的服务运行完整度小于备用主机的服务运行完整度,则切换所述非目标机组中各主机的主备状态;否则,保持所述非目标机组中各主机的主备状态不变。
9.一种四机热备冗余处理方法,其特征在于,包括:
接收热备组中各主机的主备状态及服务运行完整度;
若确定所述热备组中存在多个主控主机,则基于各主控主机的服务运行完整度,生成对应于各主控主机的处理指令,所述处理指令用于调整各主控主机的主备状态。
10.一种四机热备冗余处理系统,其特征在于,包括:
第一数据获取模块,用于获取本机的主备状态及服务运行完整度,并接收热备组中其他主机的主备状态及服务运行完整度;所述本机的服务运行完整度基于所述本机的设备使用状态、网络状态及部署有所述热备组的目标应用的业务逻辑信息确定,所述其他主机的服务运行完整度基于所述其他主机的设备使用状态、网络状态及所述业务逻辑信息确定;
机组状态调整模块,用于基于所述热备组中各主机的服务运行完整度,调整所述本机所处的目标机组以及所述热备组中非目标机组的主备状态;
主机状态调整模块,用于基于所述目标机组的主备状态及所述目标机组中各主机的服务运行完整度,确定所述目标机组中各主机的主备状态,并基于所述非目标机组的主备状态及所述非目标机组中各主机的服务运行完整度,确定所述非目标机组中各主机的主备状态。
11.一种四机热备冗余处理系统,其特征在于,包括:
第二数据获取模块,用于接收热备组中各主机的主备状态及服务运行完整度;
指令生成模块,用于若确定所述热备组中存在多个主控主机,则基于各主控主机的服务运行完整度,生成对应于各主控主机的处理指令,所述处理指令用于调整各主控主机的主备状态。
12.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9中任一项所述的四机热备冗余处理方法。
13.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-9中任一项所述的四机热备冗余处理方法。
CN202410133177.2A 2024-01-31 2024-01-31 四机热备冗余处理方法、系统、电子设备及存储介质 Active CN117667531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410133177.2A CN117667531B (zh) 2024-01-31 2024-01-31 四机热备冗余处理方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410133177.2A CN117667531B (zh) 2024-01-31 2024-01-31 四机热备冗余处理方法、系统、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN117667531A true CN117667531A (zh) 2024-03-08
CN117667531B CN117667531B (zh) 2024-06-07

Family

ID=90064541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410133177.2A Active CN117667531B (zh) 2024-01-31 2024-01-31 四机热备冗余处理方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117667531B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0341524A (ja) * 1989-07-07 1991-02-22 Nec Corp ホットスタンバイシステム
CN101741532A (zh) * 2008-11-07 2010-06-16 北京广利核系统工程有限公司 一种用于冗余服务器切换的双机切换装置
CN111371625A (zh) * 2020-03-18 2020-07-03 北京佳讯飞鸿电气股份有限公司 一种双机热备的实现方法
CN112477919A (zh) * 2020-12-11 2021-03-12 交控科技股份有限公司 一种适用于列车控制系统平台的动态冗余备份方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0341524A (ja) * 1989-07-07 1991-02-22 Nec Corp ホットスタンバイシステム
CN101741532A (zh) * 2008-11-07 2010-06-16 北京广利核系统工程有限公司 一种用于冗余服务器切换的双机切换装置
CN111371625A (zh) * 2020-03-18 2020-07-03 北京佳讯飞鸿电气股份有限公司 一种双机热备的实现方法
CN112477919A (zh) * 2020-12-11 2021-03-12 交控科技股份有限公司 一种适用于列车控制系统平台的动态冗余备份方法及系统

Also Published As

Publication number Publication date
CN117667531B (zh) 2024-06-07

Similar Documents

Publication Publication Date Title
US10075329B2 (en) Customizable high availability switchover control of application delivery controllers
US9141491B2 (en) Highly available server system based on cloud computing
CN111385107B (zh) 一种服务器的主备切换处理方法及装置
CN105099793A (zh) 热备方法、装置及系统
CN107948063B (zh) 一种建立聚合链路的方法和接入设备
EP2224341A1 (en) Node system, server switching method, server device, and data transfer method
WO2016029440A1 (en) Virtual machine service availability
CN105812161B (zh) 一种控制器故障备份方法和系统
CN114265753A (zh) 消息队列的管理方法、管理系统和电子设备
CN114844809A (zh) 基于网络心跳和内核磁盘心跳的多因子仲裁方法、装置
CN117667531B (zh) 四机热备冗余处理方法、系统、电子设备及存储介质
CN115514698A (zh) 协议计算方法、交换机、跨设备链路聚合系统及存储介质
WO2016206433A1 (zh) 服务器负载均衡的方法及装置
CN116545840A (zh) 通信方式的确定方法和装置
KR20200113995A (ko) 엣지 인공지능 서비스에 대한 고가용성 보장을 위한 삼중화 이상 다중화 구조 및 방법
CN112564968B (zh) 故障处理方法、装置及存储介质
CN115086203A (zh) 数据发送方法、装置、电子设备及计算机可读存储介质
CN113435782A (zh) 业务变更方法及装置
CN102420716B (zh) 主机冲突的检测处理方法、装置和网络设备
CN112134734A (zh) 一种网络设备的配置方法及装置
CN115276710B (zh) 应答器传输系统、应答器定位补偿方法、设备及介质
CN115460217B (zh) 一种基于强化学习的云服务高可用决策方法
AU2012307047A1 (en) High availability system, replicator and method
CN114157585B (zh) 一种业务资源监测的方法和装置
CN112671905B (zh) 服务调度方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant