CN110572292A - 基于单向传输链路的高可用系统及方法 - Google Patents
基于单向传输链路的高可用系统及方法 Download PDFInfo
- Publication number
- CN110572292A CN110572292A CN201911045488.9A CN201911045488A CN110572292A CN 110572292 A CN110572292 A CN 110572292A CN 201911045488 A CN201911045488 A CN 201911045488A CN 110572292 A CN110572292 A CN 110572292A
- Authority
- CN
- China
- Prior art keywords
- end equipment
- heartbeat signal
- transmission link
- unidirectional transmission
- core service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 118
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000002955 isolation Methods 0.000 claims abstract description 49
- 230000007246 mechanism Effects 0.000 claims abstract description 40
- 230000008569 process Effects 0.000 claims description 42
- 230000002159 abnormal effect Effects 0.000 claims description 23
- 238000011084 recovery Methods 0.000 claims description 21
- 230000001960 triggered effect Effects 0.000 claims description 7
- 230000005856 abnormality Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 7
- 230000008439 repair process Effects 0.000 description 12
- 238000001514 detection method Methods 0.000 description 4
- 238000012800 visualization Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0659—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
- H04L41/0661—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种基于单向传输链路的高可用系统及方法,系统包括第一节点、单向传输链路的网络隔离设备和第二节点;单向传输链路的网络隔离设备包括入口端设备和出口端设备;第一节点与入口端设备相耦接,用于发送数据至入口端设备;入口端设备设有心跳机制和第一高可用程序,出口端设备预设时间差阈值和人工干预的预警机制,设有第二高可用程序,第二节点与出口端设备相耦接,用于接收出口端设备发送的数据并处理。本申请提供的基于单向传输协议的基于单向传输链路的高可用系统可以利用高可用程序和具有标识的心跳信号实时监测单向传输链路的网络隔离设备,可以明确故障点的位置,以及在相应位置出进行自我修复。
Description
技术领域
本发明涉及数据传输技术领域,尤其涉及一种基于单向传输协议的基于单向传输链路的高可用系统及方法。
背景技术
合法节点A和合法节点C之间通过网络隔离设备进行数据传输,合法节点A与网络隔离设备的入口端设备双向连接,通过FTP服务或者NFS服务将待发送数据或文件发送到入口端设备上,入口端设备接收到数据或文件后,进行必要的处理后,将数据或文件通过设备提供的文件摆渡服务通过单向光纤链路发送到出口端设备。出口端设备接收到该数据或文件后,将其进行必要的处理后,将该数据或文件发送到与出口端设备连接的合法节点C。在这过程中,入口端设备与出口端设备通过单向传输链路连接,无法进行双向通讯,如果入口端或出口端一方出了问题,就会导致整个网络隔离设备出现问题,且无法判断问题所在,降低服务质量和可靠性。需要设计一种基于单向传输链路的高可用系统,可以判断故障点,以及提供相应的解决途径。
发明内容
有鉴于此,本发明公开了一种基于单向传输链路的高可用系统,包括第一节点、单向传输链路的网络隔离设备和第二节点;
所述单向传输链路的网络隔离设备包括入口端设备和出口端设备;
所述第一节点,与所述入口端设备相耦接,用于发送数据至所述入口端设备;
所述入口端设备,分别与所述第一节点和所述出口端设备相耦接,用于接收所述第一节点发送的所述数据,并将所述数据发送至所述出口端设备,其中,
所述入口端设备设有心跳机制,发送预设标识的心跳信号至所述出口端设备;
所述入口端设备设有第一高可用程序,用于系统后台监控所述入口端设备的核心服务进程的状态:当所述入口端设备的核心服务进程的状态异常时,利用所述第一高可用程序执行对所述入口端设备的核心服务程序重启操作,当所述入口端设备的核心服务程序重启操作失败时,重启所述入口端设备;
所述出口端设备,分别与所述入口端设备和所述第二节点相耦接,用于接收所述入口端设备发送的所述数据,并将所述数据发送至所述第二节点,其中,
所述出口端设备预设时间差阈值和人工干预的预警机制,接收所述入口端设备发送的所述心跳信号,同时判断所述标识是否一致,判断所述心跳信号是否为空字节,并记录接收所述心跳信号的时间戳,判断每个所述时间戳之间的时间差与所述时间差阈值是否一致;
当所述标识一致和所述心跳信号是空字节时,所述心跳信号为所述入口端设备发送的所述心跳信号;
当所述时间差与所述时间差阈值时不一致时,通过所述高可用程序对所述出口端设备的核心服务程序的自我恢复操作,或者触发所述人工干预的预警机制;
所述出口端设备设有第二高可用程序,用于系统后台监控所述出口端设备的核心服务进程的状态:当所述出口端设备的核心服务进程的状态异常时,利用所述第二高可用程序执行对所述出口端设备的核心服务程序重启操作,当所述出口端设备的核心服务程序重启操作失败时,重启所述出口端设备;
所述第二节点,与所述出口端设备相耦接,用于接收所述出口端设备发送的所述数据并处理。
优选的,所述入口端设备设有传输目录,
所述入口端设备将所述心跳信号放置在所述传输目录中后,将所述传输目录中的所述心跳信号发送至所述出口端,当所述心跳信号发送至所述出口端时,所述传输目录中的所述心跳信号被删除处理;
当所述单向传输链路的网络隔离设备存在异常时,所述心跳信号未发送至所述出口端,或者所述心跳信号发送至所述出口端后,所述传输目录中的所述心跳信号未被删除处理。
优选的,所述单向传输链路的网络隔离设备还包括单向传输链路,所述单向传输链路,分别与所述入口端设备和所述出口端设备相耦接,用于接收所述入口端发送的所述数据,并将所述数据发送至所述出口端设备。
优选的,截取所述单向传输链路接收的所述入口端设备发送的所述心跳信号,当所述单向传输链路的网络隔离设备存在异常时,所述心跳信号的标识与所述入口端设备预设标识不同。
优选的,预设所述出口端设备的核心服务程序的自我恢复操作的阈值次数,当所述出口端设备的核心服务程序的自我恢复操作的次数大于所述阈值次数时,触发所述人工干预的预警机制。
本发明还公开了一种基于单向传输链路的高可用方法,包括步骤:
提供第一节点、第二节点和单向传输链路的网络隔离设备,所述网络隔离设备包括入口端和出口端;
所述第一节点发送数据至所述入口端设备;
所述入口端设备接收所述第一节点发送的所述数据,并将所述数据发送至所述出口端设备,其中,
所述入口端设备设有心跳机制,发送预设标识的心跳信号至所述出口端设备;
所述入口端设备设有第一高可用程序,用于系统后台监控所述入口端设备的核心服务进程的状态:当所述入口端设备的核心服务进程的状态异常时,利用所述第一高可用程序执行对所述入口端设备的核心服务程序重启操作,当所述入口端设备的核心服务程序重启操作失败时,重启所述入口端设备;
所述出口端设备接收所述入口端设备发送的所述数据,并将所述数据发送至所述第二节点,其中,
所述出口端设备预设时间差阈值和人工干预的预警机制,接收所述入口端设备发送的所述心跳信号,同时判断所述标识是否一致,判断所述心跳信号是否为空字节,并记录接收所述心跳信号的时间戳,判断每个所述时间戳之间的时间差与所述时间差阈值是否一致;
当所述标识一致和所述心跳信号是空字节时,所述心跳信号为所述入口端设备发送的所述心跳信号;
当所述时间差与所述时间差阈值时不一致时,通过所述高可用程序对所述出口端设备的核心服务程序的自我恢复操作,或者触发所述人工干预的预警机制;
所述出口端设备设有第一高可用程序,用于系统后台监控所述出口端设备的核心服务进程的状态:当所述出口端设备的核心服务进程的状态异常时,利用所述第一高可用程序执行对所述出口端设备的核心服务程序重启操作,当所述出口端设备的核心服务程序重启操作失败时,重启所述出口端设备;
所述第二节点接收所述出口端设备发送的所述数据并处理。
优选的,所述入口端设备设有传输目录,
所述入口端设备将所述心跳信号放置在所述传输目录中后,将所述传输目录中的所述心跳信号发送至所述出口端,当所述心跳信号发送至所述出口端时,所述传输目录中的所述心跳信号被删除处理;
当所述单向传输链路的网络隔离设备存在异常时,所述心跳信号未发送至所述出口端,或者所述心跳信号发送至所述出口端后,所述传输目录中的所述心跳信号未被删除处理。
优选的,所述单向传输链路的网络隔离设备还包括单向传输链路,所述单向传输链路接收所述入口端发送的所述数据,并将所述数据发送至所述出口端设备。
优选的,截取所述单向传输链路接收的所述入口端设备发送的所述心跳信号,当所述单向传输链路的网络隔离设备存在异常时,所述心跳信号的标识与所述入口端设备预设标识不同。
优选的,预设所述出口端设备的核心服务程序的自我恢复操作的阈值次数,当所述出口端设备的核心服务程序的自我恢复操作的次数大于所述阈值次数时,触发所述人工干预的预警机制。
与现有技术相比,本发明提供的基于单向传输协议的基于单向传输链路的高可用系统及方法,达到如下有益效果:
本申请提供的基于单向传输协议的基于单向传输链路的高可用系统可以利用高可用程序和具有标识的心跳信号实时监测单向传输链路的网络隔离设备,可以明确故障点的位置,以及在相应位置处进行自我修复。同时还可以提供设置自我修复次数阈值,可以在故障点难以通过自我修复时,提供进行人工故障修复的预警能力,可通过出口端发送预警邮件或告警短信。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明提供的一种基于单向传输链路的高可用系统的模块框图;
图2为本发明提供的一种基于单向传输链路的高可用系统的实现方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。应注意到,所描述的实施例实际上仅仅是本发明一部分实施例,而不是全部的实施例,且实际上仅是说明性的,决不作为对本发明及其应用或使用的任何限制。本申请的保护范围当视所附权利要求所界定者为准。
实施例1:参见图1,图1为本发明提供的一种基于单向传输链路的高可用系统的模块框图;本发明提供的一种基于单向传输链路的高可用系统100,包括第一节点1、单向传输链路的网络隔离设备2、和第二节点3;
单向传输链路的网络隔离设备2包括入口端设备4和出口端设备5;
第一节点1,与入口端设备4相耦接,用于发送数据至入口端设备4;
入口端设备4,分别与第一节点1和出口端设备5相耦接,用于接收第一节点1发送的数据,并将数据发送至出口端设备5,其中,
入口端设备4设有心跳机制,发送预设标识的心跳信号至出口端设备5;其中,心跳机制是定时发送一个自定义的结构体,让对方知道自己还活着,以确保连接的有效性的机制。同时,心跳信号是每隔一段时间向互联的另一方发送一个很小的数据包,通过对方回复情况判断互联的双方之间的通讯链路是否已经断开的方法。
入口端设备4设有传输目录,
入口端设备4将心跳信号放置在传输目录中后,将传输目录中的心跳信号发送至出口端,当心跳信号发送至出口端时,传输目录中的心跳信号被删除处理;
当单向传输链路的网络隔离设备2存在异常时,心跳信号未发送至出口端,或者心跳信号发送至出口端后,传输目录中的心跳信号未被删除处理。
入口端设备4设有第一高可用程序,用于系统后台监控入口端设备4的核心服务进程的状态:当入口端设备4的核心服务进程的状态异常时,利用第一高可用程序执行对入口端设备4的核心服务程序重启操作,当入口端设备4的核心服务程序重启操作失败时,重启入口端设备4;可以得出单向传输链路21的网络隔离设备2的入口端出现问题,并对其进行修复。
可以理解的是,核心服务包括NFS服务、文件摆渡服务、可视化服务、主核心服务进程等,默认启动后,会在操作系统后台创建多个对应名称的进程,如果高可用程序轮询查看后台进程时发现注册的核心服务进程为创建或默认数量不正确,则要启动修复操作。
计算机系统的可用性用平均无故障时间(MTTF)来度量,即计算机系统平均能够正常运行多长时间,才发生一次故障。系统的可用性越高,平均无故障时间越长。可维护性用平均维修时间(MTTR)来度量,即系统发生故障后维修和重新恢复正常运行平均花费的时间。系统的可维护性越好,平均维修时间越短。计算机系统的可用性定义为:MTTF/(MTTF+MTTR)*100%。计算机系统的可用性定义为系统保持正常运行时间的百分比。高可用性通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性;高可用程序为可以达到计算机的高可用性的程序。
单向传输链路的网络隔离设备2还包括单向传输链路21,单向传输链路21,分别与入口端设备4和出口端设备5相耦接,用于接收入口端发送的数据,并将数据发送至出口端设备5。
截取单向传输链路21接收的入口端设备4发送的心跳信号,当单向传输链路21的网络隔离设备2存在异常时,心跳信号的标识与入口端设备4预设标识不同,可以得出单向传输链路21的网络隔离设备2的入口端出现问题,以便后续对其进行修复。
出口端设备5,分别与入口端设备4和第二节点3相耦接,用于接收入口端设备4发送的数据,并将数据发送至第二节点3,其中,
出口端设备5预设时间差阈值和人工干预的预警机制,接收入口端设备4发送的心跳信号,同时判断标识是否一致,判断心跳信号是否为空字节,并记录接收心跳信号的时间戳,判断每个时间戳之间的时间差与时间差阈值是否一致;
当标识一致和心跳信号是空字节时,心跳信号为入口端设备4发送的心跳信号;
当时间差与时间差阈值时不一致时,通过高可用程序对出口端设备5的核心服务程序的自我恢复操作,或者触发人工干预的预警机制;
出口端设备5设有第二高可用程序,用于系统后台监控出口端设备5的核心服务进程的状态:当出口端设备5的核心服务进程的状态异常时,利用第二高可用程序执行对出口端设备5的核心服务程序重启操作,当出口端设备5的核心服务程序重启操作失败时,重启出口端设备5;
预设出口端设备5的核心服务程序的自我恢复操作的阈值次数,当出口端设备5的核心服务程序的自我恢复操作的次数大于阈值次数时,触发人工干预的预警机制。出口端设备5设有短信服务模块,人工干预的预警机制通过短信服务模块通过出口端发送预警邮件或告警短信,提供进行人工故障修复的预警能力,可以及时对系统进行修复。
第二节点3,与出口端设备5相耦接,用于接收出口端设备5发送的数据并处理。
可以理解的是,通过以上的高可用机制,实现了一种基于单向传输链路的网络隔离系统的自我修复及基于心跳信号的网络隔离设备的心跳发送与检测的高可用机制。可以通过心跳文件确保出口端能够获取到入口端服务的状态。同时,通过基于信号的高可用心跳机制,可以确保出口端重新启动规定次数后仍然无法获取到心跳信号时,说明单向传输链路物理故障或者入口端、出口端无法通过高可用自我恢复,则可通过出口端发送预警邮件或告警短信,提供进行人工故障修复的预警能力。
实施例2:
参见图2,图2为本发明提供的一种基于单向传输链路的高可用方法流程图;本实施例提供的一种基于单向传输链路的高可用方法包括步骤:
步骤201,提供第一节点、第二节点和单向传输链路的网络隔离设备,网络隔离设备包括入口端和出口端;
步骤202,第一节点发送数据至入口端设备;
步骤203,入口端设备接收第一节点发送的数据,并将数据发送至出口端设备,其中,
入口端设备设有第一高可用程序,用于系统后台监控入口端设备的核心服务进程的状态:当入口端设备的核心服务进程的状态异常时,利用第一高可用程序执行对入口端设备的核心服务程序重启操作,当入口端设备的核心服务程序重启操作失败时,重启入口端设备;
在步骤203中,入口端设备设有心跳机制,发送预设标识的心跳信号至出口端设备;入口端设备设有传输目录,
入口端设备将心跳信号放置在传输目录中后,将传输目录中的心跳信号发送至出口端,当心跳信号发送至出口端时,传输目录中的心跳信号被删除处理;
当单向传输链路的网络隔离设备存在异常时,心跳信号未发送至出口端,或者心跳信号发送至出口端后,传输目录中的心跳信号未被删除处理。
同时,在步骤203中,单向传输链路的网络隔离设备还包括单向传输链路,单向传输链路接收入口端发送的数据,并将数据发送至出口端设备。
可以理解的是,核心服务包括NFS服务、文件摆渡服务、可视化服务、主核心服务进程等,默认启动后,会在操作系统后台创建多个对应名称的进程,如果高可用程序轮询查看后台进程时发现注册的核心服务进程为创建或默认数量不正确,则要启动修复操作。
在步骤203中,还可以截取单向传输链路接收的入口端设备发送的心跳信号,当单向传输链路的网络隔离设备存在异常时,心跳信号的标识与入口端设备预设标识不同。
步骤204,出口端设备接收入口端设备发送的数据,并将数据发送至第二节点,其中,
出口端设备预设时间差阈值和人工干预的预警机制,接收入口端设备发送的心跳信号,同时判断标识是否一致,判断心跳信号是否为空字节,并记录接收心跳信号的时间戳,判断每个时间戳之间的时间差与时间差阈值是否一致;
当标识一致和心跳信号是空字节时,心跳信号为入口端设备发送的心跳信号;
当时间差与时间差阈值时不一致时,通过高可用程序对出口端设备的核心服务程序的自我恢复操作,或者触发人工干预的预警机制;
出口端设备设有第二高可用程序,用于系统后台监控出口端设备的核心服务进程的状态:当出口端设备的核心服务进程的状态异常时,利用第二高可用程序执行对出口端设备的核心服务程序重启操作,当出口端设备的核心服务程序重启操作失败时,重启出口端设备;
在步骤204中,预设出口端设备的核心服务程序的自我恢复操作的阈值次数,当出口端设备的核心服务程序的自我恢复操作的次数大于阈值次数时,触发人工干预的预警机制。
步骤205,第二节点接收出口端设备发送的数据并处理。
可以理解的是,通过以上的高可用机制,实现了一种基于单向传输链路的网络隔离系统的自我修复及基于心跳信号的网络隔离设备的心跳发送与检测的高可用机制。可以通过心跳文件确保出口端能够获取到入口端服务的状态。同时,通过基于信号的高可用心跳机制,可以确保出口端重新启动规定次数后仍然无法获取到心跳信号时,说明单向传输链路物理故障或者入口端、出口端无法通过高可用自我恢复,则可通过出口端发送预警邮件或告警短信,提供进行人工故障修复的预警能力。
实施例3:
本实施例为应用实施例:
本发明提供的又一种基于单向传输链路的高可用方法,包括步骤:
步骤301,提供第一节点、单向传输链路的网络隔离设备、和第二节点,单向传输链路的网络隔离设备包括入口端设备和出口端设备;
步骤302,第一节点与单向传输链路的网络隔离设备的入口端设备双向连接,通过FTP服务或者NFS服务将待发送数据或文件发送到入口端设备上;
步骤303,入口端设备接收到数据或文件后,进行必要的处理,如格式检查、文件类型检查、可视化处理或者扫描病毒、生成校验码等后,将数据或文件通过设备提供的文件摆渡服务通过单向光纤链路发送到出口端设备。
步骤304,出口端设备接收到该数据或文件后,将其进行必要的处理,如可视化数据还原、文件完整性校验等后,将该数据或文件发送到与出口端设备连接的第二节点。
步骤305,设置基于单向传输链路的高可用机制,在入口端设备和出口端设备分别部署高可用程序,通过对硬件状态探测、核心应用服务数量/状态探测、通过服务探针获取服务状态等,如NFS进程后台僵死也是可以查到进程及其数量,但如果进一步通过探针测试是否服务正常时能够获取到更为真实的服务状态,以确保对服务检测的准确性,
步骤306,如果核心服务程序出现异常,则通过自动调用启动和关闭程序脚本进行程序的自我恢复,如果无法正常修复或者硬件故障,可以通过重新启动对应设备方式进行自我修复,如果修复次数达到上限依然无法恢复,则可以调用预警机制进行人工干预。
步骤307,入口端与出口端采用心跳文件方式,主要是通过单向的心跳文件让出口端可以获取到入口端的设备运行状态,以便在入口端出现异常导致单向传输链路服务异常的情况下,可以让出口端获取到入口端的设备状态,以便采取有效的处理措施进行服务恢复。
可以理解的是,通过以上的高可用机制,实现了一种基于单向传输链路的网络隔离系统的自我修复及基于心跳信号的网络隔离设备的心跳发送与检测的高可用机制。可以通过心跳文件确保出口端能够获取到入口端服务的状态。同时,通过基于信号的高可用心跳机制,可以确保出口端重新启动规定次数后仍然无法获取到心跳信号时,说明单向传输链路物理故障或者入口端、出口端无法通过高可用自我恢复,则可通过出口端发送预警邮件或告警短信,提供进行人工故障修复的预警能力。
通过以上各实施例可知,本申请存在的有益效果是:
本申请提供的基于单向传输协议的基于单向传输链路的高可用系统及方法可以利用高可用程序和具有标识的心跳信号实时监测单向传输链路的网络隔离设备,可以明确故障点的位置,以及在相应位置处进行自我修复。同时还可以提供设置自我修复次数阈值,可以在故障点难以通过自我修复时,提供进行人工故障修复的预警能力,可通过出口端发送预警邮件或告警短信。
上面通过附图和实施例,对本发明的技术方案做虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。本发明的范围由所附权利要求来限定。
Claims (10)
1.一种基于单向传输链路的高可用系统,其特征在于,包括第一节点、单向传输链路的网络隔离设备、和第二节点;
所述单向传输链路的网络隔离设备包括入口端设备和出口端设备;
所述第一节点,与所述入口端设备相耦接,用于发送数据至所述入口端设备;
所述入口端设备,分别与所述第一节点和所述出口端设备相耦接,用于接收所述第一节点发送的所述数据,并将所述数据发送至所述出口端设备,其中,
所述入口端设备设有心跳机制,发送预设标识的心跳信号至所述出口端设备;
所述入口端设备设有第一高可用程序,用于系统后台监控所述入口端设备的核心服务进程的状态:当所述入口端设备的核心服务进程的状态异常时,利用所述第一高可用程序执行对所述入口端设备的核心服务程序重启操作,当所述入口端设备的核心服务程序重启操作失败时,重启所述入口端设备;
所述出口端设备,分别与所述入口端设备和所述第二节点相耦接,用于接收所述入口端设备发送的所述数据,并将所述数据发送至所述第二节点,其中,
所述出口端设备预设时间差阈值和人工干预的预警机制,接收所述入口端设备发送的所述心跳信号,同时判断所述标识是否一致,判断所述心跳信号是否为空字节,并记录接收所述心跳信号的时间戳,判断每个所述时间戳之间的时间差与所述时间差阈值是否一致;
当所述标识一致和所述心跳信号是空字节时,所述心跳信号为所述入口端设备发送的所述心跳信号;
当所述时间差与所述时间差阈值时不一致时,通过所述高可用程序对所述出口端设备的核心服务程序的自我恢复操作,或者触发所述人工干预的预警机制;
所述出口端设备设有第二高可用程序,用于系统后台监控所述出口端设备的核心服务进程的状态:当所述出口端设备的核心服务进程的状态异常时,利用所述第二高可用程序执行对所述出口端设备的核心服务程序重启操作,当所述出口端设备的核心服务程序重启操作失败时,重启所述出口端设备;
所述第二节点,与所述出口端设备相耦接,用于接收所述出口端设备发送的所述数据并处理。
2.根据权利要求1所述的基于单向传输链路的高可用系统,其特征在于,所述入口端设备设有传输目录,
所述入口端设备将所述心跳信号放置在所述传输目录中后,将所述传输目录中的所述心跳信号发送至所述出口端,当所述心跳信号发送至所述出口端时,所述传输目录中的所述心跳信号被删除处理;
当所述单向传输链路的网络隔离设备存在异常时,所述心跳信号未发送至所述出口端,或者所述心跳信号发送至所述出口端后,所述传输目录中的所述心跳信号未被删除处理。
3.根据权利要求1所述的基于单向传输链路的高可用系统,其特征在于,所述单向传输链路的网络隔离设备还包括单向传输链路,所述单向传输链路,分别与所述入口端设备和所述出口端设备相耦接,用于接收所述入口端发送的所述数据,并将所述数据发送至所述出口端设备。
4.根据权利要求3所述的基于单向传输链路的高可用系统,其特征在于,截取所述单向传输链路接收的所述入口端设备发送的所述心跳信号,当所述单向传输链路的网络隔离设备存在异常时,所述心跳信号的标识与所述入口端设备预设标识不同。
5.根据权利要求1所述的基于单向传输链路的高可用系统,其特征在于,预设所述出口端设备的核心服务程序的自我恢复操作的阈值次数,当所述出口端设备的核心服务程序的自我恢复操作的次数大于所述阈值次数时,触发所述人工干预的预警机制。
6.一种基于单向传输链路的高可用方法,其特征在于,包括步骤:
提供第一节点、第二节点和单向传输链路的网络隔离设备,所述网络隔离设备包括入口端和出口端;
所述第一节点发送数据至所述入口端设备;
所述入口端设备接收所述第一节点发送的所述数据,并将所述数据发送至所述出口端设备,其中,
所述入口端设备设有心跳机制,发送预设标识的心跳信号至所述出口端设备;
所述入口端设备设有第一高可用程序,用于系统后台监控所述入口端设备的核心服务进程的状态:当所述入口端设备的核心服务进程的状态异常时,利用所述第一高可用程序执行对所述入口端设备的核心服务程序重启操作,当所述入口端设备的核心服务程序重启操作失败时,重启所述入口端设备;
所述出口端设备接收所述入口端设备发送的所述数据,并将所述数据发送至所述第二节点,其中,
所述出口端设备预设时间差阈值和人工干预的预警机制,接收所述入口端设备发送的所述心跳信号,同时判断所述标识是否一致,判断所述心跳信号是否为空字节,并记录接收所述心跳信号的时间戳,判断每个所述时间戳之间的时间差与所述时间差阈值是否一致;
当所述标识一致和所述心跳信号是空字节时,所述心跳信号为所述入口端设备发送的所述心跳信号;
当所述时间差与所述时间差阈值时不一致时,通过所述高可用程序对所述出口端设备的核心服务程序的自我恢复操作,或者触发所述人工干预的预警机制;
所述出口端设备设有第一高可用程序,用于系统后台监控所述出口端设备的核心服务进程的状态:当所述出口端设备的核心服务进程的状态异常时,利用所述第一高可用程序执行对所述出口端设备的核心服务程序重启操作,当所述出口端设备的核心服务程序重启操作失败时,重启所述出口端设备;
所述第二节点接收所述出口端设备发送的所述数据并处理。
7.根据权利要求6所述基于单向传输链路的高可用方法,其特征在于,所述入口端设备设有传输目录,
所述入口端设备将所述心跳信号放置在所述传输目录中后,将所述传输目录中的所述心跳信号发送至所述出口端,当所述心跳信号发送至所述出口端时,所述传输目录中的所述心跳信号被删除处理;
当所述单向传输链路的网络隔离设备存在异常时,所述心跳信号未发送至所述出口端,或者所述心跳信号发送至所述出口端后,所述传输目录中的所述心跳信号未被删除处理。
8.根据权利要求6所述基于单向传输链路的高可用方法,其特征在于,所述单向传输链路的网络隔离设备还包括单向传输链路,所述单向传输链路接收所述入口端发送的所述数据,并将所述数据发送至所述出口端设备。
9.根据权利要求8所述基于单向传输链路的高可用方法,其特征在于,截取所述单向传输链路接收的所述入口端设备发送的所述心跳信号,当所述单向传输链路的网络隔离设备存在异常时,所述心跳信号的标识与所述入口端设备预设标识不同。
10.根据权利要求6所述基于单向传输链路的高可用方法,其特征在于,预设所述出口端设备的核心服务程序的自我恢复操作的阈值次数,当所述出口端设备的核心服务程序的自我恢复操作的次数大于所述阈值次数时,触发所述人工干预的预警机制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911045488.9A CN110572292B (zh) | 2019-10-30 | 2019-10-30 | 基于单向传输链路的高可用系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911045488.9A CN110572292B (zh) | 2019-10-30 | 2019-10-30 | 基于单向传输链路的高可用系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110572292A true CN110572292A (zh) | 2019-12-13 |
CN110572292B CN110572292B (zh) | 2022-04-15 |
Family
ID=68786021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911045488.9A Active CN110572292B (zh) | 2019-10-30 | 2019-10-30 | 基于单向传输链路的高可用系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110572292B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111768884A (zh) * | 2020-06-08 | 2020-10-13 | 核动力运行研究所 | 一种核电厂机组运行状态监测系统及方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090328027A1 (en) * | 2007-03-30 | 2009-12-31 | Fujitsu Limited | Cluster system, process for updating software, service provision node, and computer-readable medium storing service provision program |
US20100195489A1 (en) * | 2009-02-03 | 2010-08-05 | Google Inc. | Interface monitoring for link aggregation |
CN104052620A (zh) * | 2014-06-03 | 2014-09-17 | 广州杰赛科技股份有限公司 | 主备系统的维护方法和系统 |
CN104391777A (zh) * | 2014-11-12 | 2015-03-04 | 中标软件有限公司 | 基于Linux操作系统的云平台及其运行监控方法和装置 |
CN107454094A (zh) * | 2017-08-23 | 2017-12-08 | 北京明朝万达科技股份有限公司 | 一种数据交互方法和系统 |
US20170366983A1 (en) * | 2016-06-15 | 2017-12-21 | Time Warner Cable Enterprises Llc | Apparatus and methods for monitoring and diagnosing a wireless network |
CN108427616A (zh) * | 2017-02-14 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 后台程序监控方法及监控装置 |
CN108924195A (zh) * | 2018-06-20 | 2018-11-30 | 郑州云海信息技术有限公司 | 一种单向心跳机制实现方法、装置、设备及系统 |
CN109697117A (zh) * | 2017-10-20 | 2019-04-30 | 中国电信股份有限公司 | 终端控制方法、装置以及计算机可读存储介质 |
CN110032487A (zh) * | 2018-11-09 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 保活监控方法、装置及电子设备 |
-
2019
- 2019-10-30 CN CN201911045488.9A patent/CN110572292B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090328027A1 (en) * | 2007-03-30 | 2009-12-31 | Fujitsu Limited | Cluster system, process for updating software, service provision node, and computer-readable medium storing service provision program |
US20100195489A1 (en) * | 2009-02-03 | 2010-08-05 | Google Inc. | Interface monitoring for link aggregation |
CN104052620A (zh) * | 2014-06-03 | 2014-09-17 | 广州杰赛科技股份有限公司 | 主备系统的维护方法和系统 |
CN104391777A (zh) * | 2014-11-12 | 2015-03-04 | 中标软件有限公司 | 基于Linux操作系统的云平台及其运行监控方法和装置 |
US20170366983A1 (en) * | 2016-06-15 | 2017-12-21 | Time Warner Cable Enterprises Llc | Apparatus and methods for monitoring and diagnosing a wireless network |
CN108427616A (zh) * | 2017-02-14 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 后台程序监控方法及监控装置 |
CN107454094A (zh) * | 2017-08-23 | 2017-12-08 | 北京明朝万达科技股份有限公司 | 一种数据交互方法和系统 |
CN109697117A (zh) * | 2017-10-20 | 2019-04-30 | 中国电信股份有限公司 | 终端控制方法、装置以及计算机可读存储介质 |
CN108924195A (zh) * | 2018-06-20 | 2018-11-30 | 郑州云海信息技术有限公司 | 一种单向心跳机制实现方法、装置、设备及系统 |
CN110032487A (zh) * | 2018-11-09 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 保活监控方法、装置及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111768884A (zh) * | 2020-06-08 | 2020-10-13 | 核动力运行研究所 | 一种核电厂机组运行状态监测系统及方法 |
CN111768884B (zh) * | 2020-06-08 | 2023-02-21 | 核动力运行研究所 | 一种核电厂机组运行状态监测系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110572292B (zh) | 2022-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10491671B2 (en) | Method and apparatus for switching between servers in server cluster | |
US10592330B2 (en) | Systems and methods for automatic replacement and repair of communications network devices | |
KR100898339B1 (ko) | 홈 네트워크 환경을 위한 자율적인 오류 처리 시스템 및 그방법 | |
US7281040B1 (en) | Diagnostic/remote monitoring by email | |
CN110377469B (zh) | 一种pcie设备的检测系统以及方法 | |
CN112506702B (zh) | 数据中心容灾方法、装置、设备及存储介质 | |
US20030069959A1 (en) | Alarm lists synchronization in an alarm management system | |
CN103414916A (zh) | 一种故障诊断系统及方法 | |
JP2013130901A (ja) | 監視サーバおよびそれを用いたネットワーク機器復旧システム | |
CN111953542B (zh) | 一种保障网关稳定运行的系统 | |
US7278048B2 (en) | Method, system and computer program product for improving system reliability | |
CN110572292B (zh) | 基于单向传输链路的高可用系统及方法 | |
CN105630647A (zh) | 一种设备检测方法及检测设备 | |
CN106411643B (zh) | Bmc检测方法以及装置 | |
CN114884803B (zh) | 多重冗余状态的处理方法、装置、设备和介质 | |
CN103532748B (zh) | 一种drbd脑裂的处理方法及装置 | |
CN107959595B (zh) | 一种异常检测的方法、装置及系统 | |
US20080310314A1 (en) | Method for Detecting a Message Interface Fault in a Communication Device | |
CN117076229A (zh) | 一种数据备份检查方法、装置及电子设备 | |
US7446665B1 (en) | Method for automatically detecting and isolating a power outage in a communication network | |
CN107864057B (zh) | 一种基于联网状态的联机自动检查及告警方法 | |
KR20170127876A (ko) | 로그 결함 분석 기반 장애 대응 시스템 및 방법 | |
CN110557295A (zh) | 网络设备的告警定位方法和装置 | |
KR100570835B1 (ko) | 통신망에서의 장애정보 관리 방법 | |
CN115729782A (zh) | 一种芯片运行状态监控及自愈方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CB03 | Change of inventor or designer information |
Inventor after: Zhang Yanshun Inventor after: Diao Luhong Inventor after: Sun Jing Inventor before: Zhang Yanshun Inventor before: Diao Luhong Inventor before: Li Kun Inventor before: Sun Jing |
|
CB03 | Change of inventor or designer information |