CN114338369B - 一种环形两地三中心的故障诊断方法、系统及装置 - Google Patents

一种环形两地三中心的故障诊断方法、系统及装置 Download PDF

Info

Publication number
CN114338369B
CN114338369B CN202111656267.2A CN202111656267A CN114338369B CN 114338369 B CN114338369 B CN 114338369B CN 202111656267 A CN202111656267 A CN 202111656267A CN 114338369 B CN114338369 B CN 114338369B
Authority
CN
China
Prior art keywords
data
site
disaster recovery
management software
recovery management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111656267.2A
Other languages
English (en)
Other versions
CN114338369A (zh
Inventor
李俭
刘文志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111656267.2A priority Critical patent/CN114338369B/zh
Publication of CN114338369A publication Critical patent/CN114338369A/zh
Application granted granted Critical
Publication of CN114338369B publication Critical patent/CN114338369B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提出的一种环形两地三中心的故障诊断方法、系统及装置,所述方法包括:当容灾管理软件接收不到任一站点状态数据时,通过其他站点获取该故障站点状态信息顺序为:先通过启用的远程复制关系对端所在的站点获取故障站点的状态信息,如果能正常获取并反馈给容灾管理软件,则认为通过其他站点获取故障站点信息获取成功;如果未获取到,则通过备份的远程关系的对端所在的站点获取故障站点的状态信息,如果能正常获取并反馈给容灾管理软件,则认为通过其他站点获取故障站点信息获取成功;如果两次都未获取到,则认为故障站点真的发生故障。本发明降低了环形两地三中心的误故障判定率,减少了误故障切换处理,进而提高了环形3DC的容灾业务处理效率。

Description

一种环形两地三中心的故障诊断方法、系统及装置
技术领域
本发明涉及计算机技术领域,更具体的说是涉及一种环形两地三中心的故障诊断方法、系统及装置。
背景技术
近年来,为了保障系统工作的连续性,由一个生产数据中心、一个同城容灾数据中心和一个异地容灾数据中心组成的两地三中心(three data center in two sites,3dc)容灾解决方案逐渐的被业界认可并重视。现有的环形两地三中心(环形3DC)主要通过第三方容灾管理软件实现对3个数据中心的统一容灾管理。容灾管理软件可以展示环形两地三中心容灾方案物理拓扑和业务逻辑拓扑,并且支持一键式容灾故障切换或者自动故障切换。
具体来说,如图1所示的A、B、C为三数据站点,A站点是生产数据中心,B站点是同城容灾数据中心,C站点是异地容灾数据中心。A、B站点之间通过RCx(同步远程复制关系或者双活),实现A、B两站点数据同步;B、C站点之间通过RCy(周期异步远程复制关系),实现B、C两站点数据同步;A、C站点之间通过RCz(周期异步远程复制关系),实现A、C两站点数据同步。其中初始部署时RCy与RCz只有一个是正常使用的远程复制关系、一个是备份不使用的远程复制关系,只有在需要进行故障切换的时候两个远程复制关系才会进行切换,原来备份不使用的远程复制关系启用,原来启用的远程复制关系成为备份不使用的远程复制关系。这里以最初部署RCy为启用状态、RCz为备份不启用状态为例进行介绍。容灾管理软件对三个站点实现统一管理,对三站点进行故障诊断,当满足故障条件实现自动或者一键式故障切换。
但是,现有的容灾管理软件只是根据三站点分别上报的各自站点状态数据进行判断是否故障,这种模式容易造成误判断,比如A站点只是与容灾管理软件之间链路故障,容灾管理软件由于获取不到A站点数据而误判断A站点故障而进行故障切换。可见,一旦发生诊断错误就会造成容灾误切换,影响业务的正常处理,降低容灾效率。
发明内容
针对以上问题,本发明的目的在于提供一种环形两地三中心的故障诊断方法、系统及装置,降低了环形两地三中心的误故障判定率,减少了误故障切换处理,进而提高了环形3DC的容灾业务处理效率。
本发明为实现上述目的,通过以下技术方案实现:一种环形两地三中心的故障诊断方法,包括:
进行环形3DC策略初始化,并将故障计数n初始化为0;
通过容灾管理软件定时接收三个站点的数据;
判断A站点数据是否正常接收,若A站点数据接收异常,通过其它站点收集A站点的数据并存放在数组data[0]中;
若A站点数据接收正常,判断B站点数据是否正常接收,若B站点数据接收异常,通过其它站点收集B站点的数据并存放在数组data[1]中;
若B站点数据接收正常,判断C站点数据是否正常接收,若C站点数据接收异常,通过其它站点收集C站点的数据并存放在数组data[2]中;
通过容灾管理软件读取数组data[0]、数组data[1]和数组data[2],以获取A、B、C站点的状态数据;
将A、B、C站点的状态数据与已有的状态集进行比较,以判断环形两地三中心是否有故障发生,若有,则将故障计数n的值加1;
当故障计数n大于等于预设阈值时,进行相应的故障处理。
进一步,所述通过其它站点收集A站点的数据并存放在数组data[0]中,包括:
通过与A站点的连接处于启用状态中的远程复制关系对端获取A站点数据并反馈给容灾管理软件;
通过容灾管理软件判断是否接收到反馈的A站点数据;
若否,则首先通过与A站点的连接处于备用状态中的远程复制关系对端获取A站点数据并反馈给容灾管理软件,然后将反馈的A站点数据存放在数组data[0]中;若是,则直接将反馈的A站点数据存放在数组data[0]中。
进一步,所述通过其它站点收集B站点的数据并存放在数组data[1]中,包括:
通过与B站点的连接处于启用状态中的远程复制关系对端获取B站点数据并反馈给容灾管理软件;
通过容灾管理软件判断是否接收到反馈的B站点数据;
若否,则首先通过与B站点的连接处于备用状态中的远程复制关系对端获取B站点数据并反馈给容灾管理软件,然后将反馈的B站点数据存放在数组data[1]中;若是,则直接将反馈的B站点数据存放在数组data[1]中。
进一步,所述通过其它站点收集C站点的数据并存放在数组data[2]中,包括:
通过与C站点的连接处于启用状态中的远程复制关系对端获取C站点数据并反馈给容灾管理软件;
通过容灾管理软件判断是否接收到反馈的C站点数据;
若否,则首先通过与C站点的连接处于备用状态中的远程复制关系对端获取C站点数据并反馈给容灾管理软件,然后将反馈的C站点数据存放在数组data[2]中;若是,则直接将反馈的C站点数据存放在数组data[2]中。
进一步,所述将A、B、C站点的状态数据与已有的状态集进行比较后,若判断出环形两地三中心没有故障发生,则将故障计数n初始化为0,并继续通过容灾管理软件定时接收三个站点的数据。
进一步,当所述故障计数n小于预设阈值时,继续通过容灾管理软件定时接收三个站点的数据。
进一步,当所述故障处理完成后,将故障计数n初始化为0,并继续通过容灾管理软件定时接收三个站点的数据。
进一步,所述预设阈值为10。
相应的,本发明还公开了一种环形两地三中心的故障诊断系统,包括:初始化单元,用于进行环形3DC策略初始化,并将故障计数n初始化为0;
定时采集单元,用于通过容灾管理软件定时接收三个站点的数据;
数据接收判定单元,用于判断A站点、B站点和C站点数据是否正常接收;
第一异常处理单元,用于当A站点数据接收异常时,通过其它站点收集A站点的数据并存放在数组data[0]中;
第二异常处理单元,用于当B站点数据接收异常时,通过其它站点收集B站点的数据并存放在数组data[1]中;
第三异常处理单元,用于当C站点数据接收异常时,通过其它站点收集C站点的数据并存放在数组data[2]中;
状态数据获取单元,用于通过容灾管理软件读取数组data[0]、数组data[1]和数组data[2],以获取A、B、C站点的状态数据;
状态数据比较单元,用于将A、B、C站点的状态数据与已有的状态集进行比较,以判断环形两地三中心是否有故障发生,若有,则将故障计数n的值加1;
故障处理单元,用于当故障计数n大于等于预设阈值时,进行相应的故障处理。
相应的,本发明公开了一种环形两地三中心的故障诊断装置,包括:
存储器,用于存储环形两地三中心的故障诊断程序;
处理器,用于执行所述环形两地三中心的故障诊断程序时实现如上文任一项所述环形两地三中心的故障诊断方法的步骤。
对比现有技术,本发明有益效果在于:本发明公开了一种环形两地三中心的故障诊断方法、系统及装置,通过容灾管理软件收集的各自站点数据进行分析,当都能获取到三个站点的数据时,按照原有故障流程进行判断;当容灾管理软件接收不到某个站点的数据时,尝试通过其他站点收集相关信息,根据间接获取到的站点数据判断是否真的存在故障需要进行切换。本发明能够有效降低环形两地三中心的误故障判定率,减少误故障切换处理,进而提高环形3DC的容灾业务处理效率。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
附图1是本发明的现有技术的环形两地三中心的结构示意图。
附图2是本发明具体实施方式的方法流程图。
附图3是本发明具体实施方式的系统结构图。
图中,1为初始化单元;2为定时采集单元;3为数据接收判定单元;4为第一异常处理单元;5为第二异常处理单元;6为第三异常处理单元;7为状态数据获取单元;8为状态数据比较单元;9为故障处理单元。
具体实施方式
本发明的核心是提供一种环形两地三中心的故障诊断方法,现有技术中,容灾管理软件只是根据三站点分别上报的各自站点状态数据进行判断是否故障,这种模式容易造成误判断,比如A站点只是与容灾管理软件之间链路故障,容灾管理软件由于获取不到A站点数据而误判断A站点故障而进行故障切换。可见,一旦发生诊断错误就会造成容灾误切换,影响业务的正常处理,降低容灾效率。
而本发明提供的环形两地三中心的故障诊断方法,首先,通过容灾管理软件定时接收三个站点的数据。然后,判断A站点数据是否正常接收,若A站点数据接收异常,通过其它站点收集A站点的数据并存放在数组data[0]中;若A站点数据接收正常,判断B站点数据是否正常接收,若B站点数据接收异常,通过其它站点收集B站点的数据并存放在数组data[1]中;若B站点数据接收正常,判断C站点数据是否正常接收,若C站点数据接收异常,通过其它站点收集C站点的数据并存放在数组data[2]中。最后,将A、B、C站点的状态数据与已有的状态集进行比较,以判断环形两地三中心是否有故障发生。由此可见,本发明降低了环形两地三中心的误故障判定率,减少了误故障切换处理,进而提高了环形3DC的容灾业务处理效率。
为了使本技术领域的人员更好地理解本发明方案,对本发明的环形两地三中心的故障类型解释如下:
本发明采用同步+异步环形3DC,其中A、B两站点间是同步复制。本架构能够处理的故障类型包括A站点故障、B站点故障、C站点故障、A站点与B站点故障、A站点与C站点故障、B站点与C站点故障、AB链路故障、AC链路故障、BC链路故障等情况;对于双活+异步环形3DC(A、B两站点间是双活)能够处理的故障类型包括A站点故障、B站点故障、C站点故障、A站点与B站点故障、A站点与C站点故障、AB链路故障、AC链路故障、BC链路故障、AB与AC链路故障、AC与BC链路故障等情况。
下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
如图1所示,本实施例提供了一种环形两地三中心的故障诊断方法,包括:
1、通过容灾管理软件定时接收三个站点的数据。
2、判断A站点数据是否正常接收,若A站点数据接收异常,通过其它站点收集A站点的数据并存放在数组data[0]中。
作为示例的,若A站点数据接收异常,首先通过与A站点的连接处于启用状态中的远程复制关系对端获取A站点数据并反馈给容灾管理软件,然后通过容灾管理软件判断是否接收到反馈的A站点数据。
若无法反馈,则首先通过与A站点的连接处于备用状态中的远程复制关系对端获取A站点数据并反馈给容灾管理软件,然后将反馈的A站点数据存放在数组data[0]中。若能够正常反馈,则直接将反馈的A站点数据存放在数组data[0]中。
3、若A站点数据接收正常,判断B站点数据是否正常接收,若B站点数据接收异常,通过其它站点收集B站点的数据并存放在数组data[1]中。
作为示例的,若B站点数据接收异常,首先通过与B站点的连接处于启用状态中的远程复制关系对端获取B站点数据并反馈给容灾管理软件,然后通过容灾管理软件判断是否接收到反馈的B站点数据。
若无法反馈,则首先通过与B站点的连接处于备用状态中的远程复制关系对端获取B站点数据并反馈给容灾管理软件,然后将反馈的B站点数据存放在数组data[1]中。若能够正常反馈,则直接将反馈的B站点数据存放在数组data[1]中。
4、若B站点数据接收正常,判断C站点数据是否正常接收,若C站点数据接收异常,通过其它站点收集C站点的数据并存放在数组data[2]中。
作为示例的,若C站点数据接收异常,首先通过与C站点的连接处于启用状态中的远程复制关系对端获取C站点数据并反馈给容灾管理软件,然后通过容灾管理软件判断是否接收到反馈的C站点数据。
若无法反馈,则首先通过与C站点的连接处于备用状态中的远程复制关系对端获取C站点数据并反馈给容灾管理软件,然后将反馈的C站点数据存放在数组data[2]中。若能够正常反馈,则直接将反馈的C站点数据存放在数组data[2]中。
5、通过容灾管理软件读取数组data[0]、数组data[1]和数组data[2],以获取A、B、C站点的状态数据。
6、将A、B、C站点的状态数据与已有的状态集进行比较,以判断环形两地三中心是否有故障发生,若有,则将故障计数n的值加1。
若判断出环形两地三中心没有故障发生,则将故障计数n初始化为0,并继续通过容灾管理软件定时接收三个站点的数据。
7、当故障计数n大于等于预设阈值N时,进行相应的故障处理。
其中,N=10。当n<10时,继续通过容灾管理软件定时接收三个站点的数据。
另外,当所述故障处理完成后,将故障计数n初始化为0,并继续通过容灾管理软件定时接收三个站点的数据。
由此可见,本实施例提供的环形两地三中心的故障诊断方法运行后,当容灾管理软件接收不到某一个站点状态数据时,通过其他站点获取该故障站点状态信息顺序为:先通过启用的远程复制关系对端所在的站点获取故障站点的状态信息,如果能正常获取并反馈给容灾管理软件,则认为通过其他站点获取故障站点信息获取成功;如果没有获取到,则通过备份的远程关系的对端所在的站点获取故障站点的状态信息,如果能正常获取并反馈给容灾管理软件,则认为通过其他站点获取故障站点信息获取成功;如果两次都没有获取到,则认为故障站点真的发生故障。
实施例二:
基于实施例一,本发明还公开了一种环形两地三中心的故障诊断方法。
其中,环形两地三中心的数据传输关系具体如下:A站点、B站点之间为同步远程复制关系,B站点、C站点之间异步远程复制关系RCy启用,以A站点、C站点之间异步远程复制关系RCz备用。
本发明具体如下:
当容灾管理软件接收不到A站点状态信息时举例说明。容灾软件在要求时间内未接收到A站点状态信息,则容灾软件会发消息给B站点,通知B站点发送A站点的状态信息。当B站点获取到A站点的数据并发送给容灾管理软件;如果容灾管理软件获取不到B站点的信息或者B站点获取不到A站点的信息,则容灾软件通知C站点获取A站点的信息;当B、C站点都获取不到A站点的信息时或者通过B站点或者C站点获取到的A站点信息表示A站点故障,则容灾软件才会最终认为A站点故障,进行故障切换。
将容灾管理软件接收到三站点A、B、C状态数据分别存放在数组data[0]、data[1]、data[2]中,每次循环接收数据接收后对存放站点数据的数组data进行清空,下次接收到数据再重新存放。
容灾管理软件存有已知的状态集,通过获取到的最终的三站点状态数据与状态集作比较得出是否发生故障,当连续N次均判定发生相同的故障则认为确实发生故障需要进行进行故障处理,执行故障切换操作;当不足N次检测(此处默认值为10次,通过界面用户可以设置修改)到状态数据正常则重新累计判定同样故障次数;如果状态数据正常,则容灾软件管理继续获取三站点状态数据。
实施例三:
基于实施例一,如图2所示,本发明还公开了一种环形两地三中心的故障诊断系统,包括:初始化单元1、定时采集单元2、数据接收判定单元3、第一异常处理单元4、第二异常处理单元5、第三异常处理单元6、状态数据获取单元7、状态数据比较单元8和故障处理单元9。
初始化单元1,用于进行环形3DC策略初始化,并将故障计数n初始化为0。
定时采集单元2,用于通过容灾管理软件定时接收三个站点的数据。
数据接收判定单元3,用于判断A站点、B站点和C站点数据是否正常接收。
第一异常处理单元4,用于当A站点数据接收异常时,通过其它站点收集A站点的数据并存放在数组data[0]中。
第二异常处理单元5,用于当B站点数据接收异常时,通过其它站点收集B站点的数据并存放在数组data[1]中。
第三异常处理单元6,用于当C站点数据接收异常时,通过其它站点收集C站点的数据并存放在数组data[2]中。
状态数据获取单元7,用于通过容灾管理软件读取数组data[0]、数组data[1]和数组data[2],以获取A、B、C站点的状态数据。
状态数据比较单元8,用于将A、B、C站点的状态数据与已有的状态集进行比较,以判断环形两地三中心是否有故障发生,若有,则将故障计数n的值加1。
故障处理单元9,用于当故障计数n大于等于预设阈值时,进行相应的故障处理。
本实施例提供了一种环形两地三中心的故障诊断系统,通过容灾管理软件收集的各自站点数据进行分析,当都能获取到三个站点的数据时,按照原有故障流程进行判断;当容灾管理软件接收不到某个站点的数据时,尝试通过其他站点收集相关信息,根据间接获取到的站点数据判断是否真的存在故障需要进行切换。本系统能够有效降低环形两地三中心的误故障判定率,减少误故障切换处理,进而提高环形3DC的容灾业务处理效率。
实施例四:
本实施例公开了一种环形两地三中心的故障诊断装置,包括处理器和存储器;其中,所述处理器执行所述存储器中保存的环形两地三中心的故障诊断程序时实现以下步骤:
1、通过容灾管理软件定时接收三个站点的数据。
2、判断A站点数据是否正常接收,若A站点数据接收异常,通过其它站点收集A站点的数据并存放在数组data[0]中。
3、若A站点数据接收正常,判断B站点数据是否正常接收,若B站点数据接收异常,通过其它站点收集B站点的数据并存放在数组data[1]中。
4、若B站点数据接收正常,判断C站点数据是否正常接收,若C站点数据接收异常,通过其它站点收集C站点的数据并存放在数组data[2]中。
5、通过容灾管理软件读取数组data[0]、数组data[1]和数组data[2],以获取A、B、C站点的状态数据。
6、将A、B、C站点的状态数据与已有的状态集进行比较,以判断环形两地三中心是否有故障发生,若有,则将故障计数n的值加1。
7、当故障计数n大于等于预设阈值N时,进行相应的故障处理。
进一步的,本实施例中的环形两地三中心的故障诊断装置,还可以包括:
输入接口,用于获取外界导入的环形两地三中心的故障诊断程序,并将获取到的环形两地三中心的故障诊断程序保存至所述存储器中,还可以用于获取外界终端设备传输的各种指令和参数,并传输至处理器中,以便处理器利用上述各种指令和参数展开相应的处理。本实施例中,所述输入接口具体可以包括但不限于USB接口、串行接口、语音输入接口、指纹输入接口、硬盘读取接口等。
输出接口,用于将处理器产生的各种数据输出至与其相连的终端设备,以便于与输出接口相连的其他终端设备能够获取到处理器产生的各种数据。本实施例中,所述输出接口具体可以包括但不限于USB接口、串行接口等。
通讯单元,用于在环形两地三中心的故障诊断装置和外部服务器之间建立远程通讯连接,以便于环形两地三中心的故障诊断装置能够将镜像文件挂载到外部服务器中。本实施例中,通讯单元具体可以包括但不限于基于无线通讯技术或有线通讯技术的远程通讯单元。
键盘,用于获取用户通过实时敲击键帽而输入的各种参数数据或指令。
显示器,用于运行服务器供电线路短路定位过程的相关信息进行实时显示。
鼠标,可以用于协助用户输入数据并简化用户的操作。
综上所述,本发明降低了环形两地三中心的误故障判定率,减少了误故障切换处理,进而提高了环形3DC的容灾业务处理效率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的方法而言,由于其与实施例公开的系统相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
同理,在本发明各个实施例中的各处理单元可以集成在一个功能模块中,也可以是各个处理单元物理存在,也可以两个或两个以上处理单元集成在一个功能模块中。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的环形两地三中心的故障诊断方法方法、系统及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (7)

1.一种环形两地三中心的故障诊断方法,其特征在于,包括:
进行环形3DC策略初始化,并将故障计数n初始化为0;
通过容灾管理软件定时接收三个站点的数据;
判断A站点数据是否正常接收,若A站点数据接收异常,通过其它站点收集A站点的数据并存放在数组data[0]中;
若A站点数据接收正常,判断B站点数据是否正常接收,若B站点数据接收异常,通过其它站点收集B站点的数据并存放在数组data[1]中;
若B站点数据接收正常,判断C站点数据是否正常接收,若C站点数据接收异常,通过其它站点收集C站点的数据并存放在数组data[2]中;
通过容灾管理软件读取数组data[0]、数组data[1]和数组data[2],以获取A、B、C站点的状态数据;
将A、B、C站点的状态数据与已有的状态集进行比较,以判断环形两地三中心是否有故障发生,若有,则将故障计数n的值加1;
当故障计数n大于等于预设阈值时,进行相应的故障处理;
所述通过其它站点收集A站点的数据并存放在数组data[0]中,包括:
通过与A站点的连接处于启用状态中的远程复制关系对端获取A站点数据并反馈给容灾管理软件;
通过容灾管理软件判断是否接收到反馈的A站点数据;
若否,则首先通过与A站点的连接处于备用状态中的远程复制关系对端获取A站点数据并反馈给容灾管理软件,然后将反馈的A站点数据存放在数组data[0]中;若是,则直接将反馈的A站点数据存放在数组data[0]中;
所述通过其它站点收集B站点的数据并存放在数组data[1]中,包括:
通过与B站点的连接处于启用状态中的远程复制关系对端获取B站点数据并反馈给容灾管理软件;
通过容灾管理软件判断是否接收到反馈的B站点数据;
若否,则首先通过与B站点的连接处于备用状态中的远程复制关系对端获取B站点数据并反馈给容灾管理软件,然后将反馈的B站点数据存放在数组data[1]中;若是,则直接将反馈的B站点数据存放在数组data[1]中;
所述通过其它站点收集C站点的数据并存放在数组data[2]中,包括:
通过与C站点的连接处于启用状态中的远程复制关系对端获取C站点数据并反馈给容灾管理软件;
通过容灾管理软件判断是否接收到反馈的C站点数据;
若否,则首先通过与C站点的连接处于备用状态中的远程复制关系对端获取C站点数据并反馈给容灾管理软件,然后将反馈的C站点数据存放在数组data[2]中;若是,则直接将反馈的C站点数据存放在数组data[2]中。
2.根据权利要求1所述的环形两地三中心的故障诊断方法,其特征在于,所述将A、B、C站点的状态数据与已有的状态集进行比较后,若判断出环形两地三中心没有故障发生,则将故障计数n初始化为0,并继续通过容灾管理软件定时接收三个站点的数据。
3.根据权利要求1所述的环形两地三中心的故障诊断方法,其特征在于,当所述故障计数n小于预设阈值时,继续通过容灾管理软件定时接收三个站点的数据。
4.根据权利要求1所述的环形两地三中心的故障诊断方法,其特征在于,当所述故障处理完成后,将故障计数n初始化为0,并继续通过容灾管理软件定时接收三个站点的数据。
5.根据权利要求1所述的环形两地三中心的故障诊断方法,其特征在于,所述预设阈值为10。
6.一种环形两地三中心的故障诊断系统,其特征在于,包括:
初始化单元,用于进行环形3DC策略初始化,并将故障计数n初始化为0;
定时采集单元,用于通过容灾管理软件定时接收三个站点的数据;
数据接收判定单元,用于判断A站点、B站点和C站点数据是否正常接收;
第一异常处理单元,用于当A站点数据接收异常时,通过其它站点收集A站点的数据并存放在数组data[0]中;
第二异常处理单元,用于当B站点数据接收异常时,通过其它站点收集B站点的数据并存放在数组data[1]中;
第三异常处理单元,用于当C站点数据接收异常时,通过其它站点收集C站点的数据并存放在数组data[2]中;
状态数据获取单元,用于通过容灾管理软件读取数组data[0]、数组data[1]和数组data[2],以获取A、B、C站点的状态数据;
状态数据比较单元,用于将A、B、C站点的状态数据与已有的状态集进行比较,以判断环形两地三中心是否有故障发生,若有,则将故障计数n的值加1;
故障处理单元,用于当故障计数n大于等于预设阈值时,进行相应的故障处理;
所述第一异常处理单元具体用于:
当A站点数据接收异常时,通过与A站点的连接处于启用状态中的远程复制关系对端获取A站点数据并反馈给容灾管理软件;
通过容灾管理软件判断是否接收到反馈的A站点数据;
若否,则首先通过与A站点的连接处于备用状态中的远程复制关系对端获取A站点数据并反馈给容灾管理软件,然后将反馈的A站点数据存放在数组data[0]中;若是,则直接将反馈的A站点数据存放在数组data[0]中;
所述第二异常处理单元具体用于:
当B站点数据接收异常时,通过与B站点的连接处于启用状态中的远程复制关系对端获取B站点数据并反馈给容灾管理软件;
通过容灾管理软件判断是否接收到反馈的B站点数据;
若否,则首先通过与B站点的连接处于备用状态中的远程复制关系对端获取B站点数据并反馈给容灾管理软件,然后将反馈的B站点数据存放在数组data[1]中;若是,则直接将反馈的B站点数据存放在数组data[1]中;
所述第三异常处理单元具体用于:
当C站点数据接收异常时,通过与C站点的连接处于启用状态中的远程复制关系对端获取C站点数据并反馈给容灾管理软件;
通过容灾管理软件判断是否接收到反馈的C站点数据;
若否,则首先通过与C站点的连接处于备用状态中的远程复制关系对端获取C站点数据并反馈给容灾管理软件,然后将反馈的C站点数据存放在数组data[2]中;若是,则直接将反馈的C站点数据存放在数组data[2]中。
7.一种环形两地三中心的故障诊断装置,其特征在于,包括:
存储器,用于存储环形两地三中心的故障诊断程序;
处理器,用于执行所述环形两地三中心的故障诊断程序时实现如权利要求1至5任一项权利要求所述的环形两地三中心的故障诊断方法的步骤。
CN202111656267.2A 2021-12-30 2021-12-30 一种环形两地三中心的故障诊断方法、系统及装置 Active CN114338369B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111656267.2A CN114338369B (zh) 2021-12-30 2021-12-30 一种环形两地三中心的故障诊断方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111656267.2A CN114338369B (zh) 2021-12-30 2021-12-30 一种环形两地三中心的故障诊断方法、系统及装置

Publications (2)

Publication Number Publication Date
CN114338369A CN114338369A (zh) 2022-04-12
CN114338369B true CN114338369B (zh) 2023-08-08

Family

ID=81018748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111656267.2A Active CN114338369B (zh) 2021-12-30 2021-12-30 一种环形两地三中心的故障诊断方法、系统及装置

Country Status (1)

Country Link
CN (1) CN114338369B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874593A (zh) * 2018-06-21 2018-11-23 郑州云海信息技术有限公司 一种两地三中心容灾方法、装置、设备及系统
CN111858170A (zh) * 2020-07-10 2020-10-30 苏州浪潮智能科技有限公司 一种配置管理方法、系统及可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5352115B2 (ja) * 2008-04-25 2013-11-27 株式会社日立製作所 ストレージシステム及びその監視条件変更方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874593A (zh) * 2018-06-21 2018-11-23 郑州云海信息技术有限公司 一种两地三中心容灾方法、装置、设备及系统
CN111858170A (zh) * 2020-07-10 2020-10-30 苏州浪潮智能科技有限公司 一种配置管理方法、系统及可读存储介质

Also Published As

Publication number Publication date
CN114338369A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
US20090086620A1 (en) Method and apparatus for preventing network conflict
CN110581852A (zh) 一种高效型拟态防御系统及方法
US20140372805A1 (en) Self-healing managed customer premises equipment
CN110825768B (zh) 一种基于云分析的远程电视异常处理方法及系统
WO2019128670A1 (zh) 用于在分布式系统中使管理能力自恢复的方法和装置
CN109391691B (zh) 一种单节点故障下nas服务的恢复方法及相关装置
MXPA04006830A (es) Deteccion remota de estados de suministro de energia.
CN106936896A (zh) Kafka集群的数据传送方法和装置
CN110677282A (zh) 一种分布式系统的热备份方法及分布式系统
CN114338369B (zh) 一种环形两地三中心的故障诊断方法、系统及装置
CN104158843B (zh) 分布式文件存储系统的存储单元失效检测方法及装置
CN111309515B (zh) 一种容灾控制方法、装置及系统
CN116540856A (zh) 一种供电模块故障恢复后更正状态的装置、方法和服务器
JP2009025971A (ja) 情報処理装置、ログデータ収集システム
CN114650211B (zh) 故障修复方法、装置、电子设备和计算机可读存储介质
CN111654401B (zh) 监控系统的网段切换方法、装置、终端和存储介质
CN113900855B (zh) 一种交换机异常状态的主动热启动方法、系统及装置
KR100279721B1 (ko) 교환기와과금센터간의인터페이스유지보수방법
CN111901174B (zh) 一种服务状态通知的方法、相关装置及存储介质
CN113472566A (zh) 一种联盟区块链的状态监控方法及主节点状态监控系统
CN110716827A (zh) 适用于分布式系统的热备份方法及分布式系统
CN114257500B (zh) 一种超融合集群内部网络的故障切换方法、系统及装置
CN112801769B (zh) 账务数据处理方法、装置及系统
CN108650115A (zh) 集抄系统多通道级联拓扑结构故障处理方法
CN116048859B (zh) 分布式数据库故障诊断方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant