CN112231142B - 系统备份恢复方法、装置、计算机设备和存储介质 - Google Patents

系统备份恢复方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112231142B
CN112231142B CN202011000994.9A CN202011000994A CN112231142B CN 112231142 B CN112231142 B CN 112231142B CN 202011000994 A CN202011000994 A CN 202011000994A CN 112231142 B CN112231142 B CN 112231142B
Authority
CN
China
Prior art keywords
recovery
path
node
abnormal
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011000994.9A
Other languages
English (en)
Other versions
CN112231142A (zh
Inventor
朱磊
陈黎
钟建栩
余少锋
马一宁
于国际
魏莱
李婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Communication Branch of Peak Regulation and Frequency Modulation Power Generation of China Southern Power Grid Co Ltd
Original Assignee
Information Communication Branch of Peak Regulation and Frequency Modulation Power Generation of China Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Communication Branch of Peak Regulation and Frequency Modulation Power Generation of China Southern Power Grid Co Ltd filed Critical Information Communication Branch of Peak Regulation and Frequency Modulation Power Generation of China Southern Power Grid Co Ltd
Priority to CN202011000994.9A priority Critical patent/CN112231142B/zh
Publication of CN112231142A publication Critical patent/CN112231142A/zh
Application granted granted Critical
Publication of CN112231142B publication Critical patent/CN112231142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请涉及应用系统技术领域,提供了一种系统备份恢复方法、装置、计算机设备和存储介质。该方法包括:通过获取系统的网络拓扑结构、正常节点集合以及相邻异常节点集合,将正常节点集合、相邻异常节点集合输入到最优路径恢复算法模型,得到各个异常节点的恢复路径列表,根据恢复路径列表,向异常节点发出对应的恢复命令,其中最优路径恢复算法模型用于根据节点恢复的路径和成本确定待恢复的异常节点的最优恢复路径,通过围绕正常节点的相邻异常节点作为一个恢复阶段进行恢复,减少系统恢复阶段的数量,同时通过节点的路径和成本确定异常节点集合的最优恢复路径,提高了系统恢复的效率。

Description

系统备份恢复方法、装置、计算机设备和存储介质
技术领域
本申请涉及应用系统技术领域,特别是涉及一种系统备份恢复方法、装置、计算机设备和存储介质。
背景技术
为了提高应用系统的可靠性,通常需要在异地建立相同的应用系统,对当前系统进行健康状态监视和功能切换。当发生灾难性事件时,整个应用系统可以切换到另一处,实现系统的灾备恢复,以确保应用系统可以继续正常工作。
目前技术中,在进行灾备恢复时,通常通过备份路径进行恢复,灾备恢复的效率较低,影响系统的可用性。
发明内容
基于此,有必要针对目前技术中存在的灾备恢复效率低的技术问题,提供一种系统备份恢复方法、装置、计算机设备和存储介质。
一种系统备份恢复方法,所述方法包括:
获取系统的网络拓扑结构以及正常节点集合;所述正常节点集合为系统中当前为正常状态的节点的集合;
根据所述系统的网络拓扑结构,获得与所述正常节点相邻的异常节点,得到相邻异常节点集合;
将所述正常节点集合、相邻异常节点集合输入到预先设置的最优路径恢复算法模型,得到恢复路径列表;所述最优路径恢复算法模型用于根据节点恢复的路径和成本确定待恢复的异常节点的最优恢复路径;
根据所述恢复路径列表,向所述相邻异常节点集合中的异常节点发出对应的恢复命令。
在其中一个实施例中,所述获取系统的网络拓扑结构,包括:
获取所述系统的节点的恢复时间和网络传输时间;
根据所述系统的节点的恢复时间、网络传输时间和节点类型,获得所述系统的网络拓扑结构。
在其中一个实施例中,所述最优路径恢复算法模型包括查找最短路径函数和路径成本函数,所述方法还包括:
获取所述系统中各个异常节点的独立成本,以及所述各个异常节点分别对应的可选灾备管理器;所述独立成本表征包含所述异常节点的链路的数量;
运行所述查找最短路径函数,从所述各个异常节点的所述可选灾备管理器中确定满足路径阈值的灾备管理器;
根据所述各个异常节点到各自对应的所述满足路径阈值的灾备管理器的路径,以及所述各个异常节点的独立成本,运行所述路径成本函数,获得所述各个异常节点的最低成本路径;
根据所述各个异常节点的最低成本路径,获得所述系统的恢复路径列表。
在其中一个实施例中,所述获取所述系统中各个异常节点的独立成本,包括:
获取所述系统的各个链路和所述各个链路上的异常节点;
根据所述各个链路和异常节点的对应关系,获取所述各个异常节点的独立成本。
在其中一个实施例中,所述运行所述路径成本函数,获得所述各个异常节点的最低成本路径,包括:
将所述各个异常节点按照独立成本降序排列,获取排行在先的异常节点的最低成本路径;
若所述排行在先的异常节点存在相邻的异常节点,增加所述相邻的异常节点的独立成本后,将未计算最低成本路径的异常节点继续按照独立成本降序排列以计算最低成本路径,直到获得所述各个异常节点的最低成本路径。
在其中一个实施例中,所述根据所述各个异常节点的最低成本路径,获得所述系统的恢复路径列表,包括:
根据按照独立成本降序排列的所述各个异常节点分别对应的最低成本路径,获得所述系统的恢复路径列表。
在其中一个实施例中,所述根据所述恢复路径列表,向所述相邻异常节点集合中的异常节点发出对应的恢复命令之后,所述方法还包括:
根据所述系统的各个节点的测试恢复耗时,获取所述相邻异常节点集合的理论恢复耗时;
获取所述相邻异常节点集合的实际恢复耗时;
若所述实际恢复耗时大于所述理论恢复耗时,调整所述最优路径恢复算法模型的参数后,重新获得所述系统的恢复路径列表。
一种系统备份恢复装置,所述装置包括:
拓扑获取模块,用于获取系统的网络拓扑结构以及正常节点集合;所述正常节点集合为系统中当前为正常状态的节点的集合;
相邻异常节点获取模块,用于根据所述系统的网络拓扑结构,获得与所述正常节点相邻的异常节点,得到相邻异常节点集合;
模型输入模块,用于将所述正常节点集合、相邻异常节点集合输入到预先设置的最优路径恢复算法模型,得到恢复路径列表;所述最优路径恢复算法模型用于根据节点恢复的路径和成本确定待恢复的异常节点的最优恢复路径;
恢复命令模块,用于根据所述恢复路径列表,向所述相邻异常节点集合中的异常节点发出对应的恢复命令。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例的系统备份恢复方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例的系统备份恢复方法的步骤。
上述系统备份恢复方法、装置、计算机设备和存储介质,通过获取系统的网络拓扑结构、正常节点集合以及相邻异常节点集合,将正常节点集合、相邻异常节点集合输入到最优路径恢复算法模型,得到各个异常节点的恢复路径列表,根据恢复路径列表,向异常节点发出对应的恢复命令,其中最优路径恢复算法模型用于根据节点恢复的路径和成本确定待恢复的异常节点的最优恢复路径,通过围绕正常节点的相邻异常节点作为一个恢复阶段进行恢复,减少系统恢复阶段的数量,同时通过节点的路径和成本确定异常节点集合的最优恢复路径,提高了系统恢复的效率。
附图说明
图1为一个实施例中系统备份恢复方法的流程示意图;
图2为一个实施例中大型灾备系统的应用环境示意图;
图3为另一个实施例中大型灾备系统的应用环境示意图;
图4为一个实施例中大型灾备系统备份恢复的流程示意图;
图5为一个实施例中系统备份恢复装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种系统备份恢复方法,以该方法应用于服务器为例进行说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤S101,获取系统的网络拓扑结构以及正常节点集合。
其中,网络拓扑结构可以是用传输媒体互连各种设备的物理布局。待恢复系统可以包含多种类型的节点,例如灾备管理节点、主机服务器、数据库、业务系统等,服务器可以根据各个类型的节点,以及节点的物理布局,确定系统的网络拓扑结构。在系统宕机恢复时,其中可能存在有正常状态的节点,正常节点集合可以是系统中当前为正常状态的节点的集合。
具体实现中,服务器可以根据待恢复系统的各种设备的物理布局以及连接关系,获得系统的网络拓扑结构,并确定其中的正常节点集合。
步骤S102,根据系统的网络拓扑结构,获得与正常节点相邻的异常节点,得到相邻异常节点集合。
其中,系统的网络拓扑结构中,可以包含节点之间的连接关系,当确定了正常节点之后,可以确定与正常节点相邻的异常节点。相邻异常节点集合可以是根据与正常节点相邻的异常节点得到的节点集合,可以作为一个系统恢复阶段。相邻异常节点集合可以随着系统异常节点的恢复而进行更新,服务器可以获得已经恢复的异常节点,并遍历与已经恢复的异常节点的相邻的异常节点,作为新的相邻异常节点集合。因此,系统可以包括多个恢复阶段,每个恢复阶段可以包括与当前阶段现存的正常节点相邻的异常节点,在每个系统恢复阶段,可以恢复该阶段的异常节点,在该阶段的异常节点恢复结束后,再进行下一个阶段的相邻异常节点集合的获取和恢复。
具体实现中,服务器可以根据网络拓扑结构确定节点之间的连接关系,获得每个正常节点相邻的异常节点,作为相邻异常节点集合。
步骤S103,将正常节点集合、相邻异常节点集合输入到预先设置的最优路径恢复算法模型,得到恢复路径列表。
其中,节点的恢复需要借助灾备管理器,节点与灾备管理器之间的路径距离,影响节点恢复指令的网络传输时间。节点与节点之间的依赖关系和交叉连接关系,也会影响节点的恢复成本。最优路径恢复算法模型可以用于根据节点恢复的路径和成本确定待恢复的异常节点的最优恢复路径,最优路径恢复算法模型可以根据节点与灾备管理器的距离关系确定待恢复节点的可选灾备管理器,以及根据节点与节点之间的连接关系确定最低成本路径,进而得到最优恢复路径。最优恢复路径的呈现形式可以是恢复路径列表,包含每个异常节点对应的灾备管理器和最低成本路径。
具体实现中,服务器可以将获得的正常节点集合、相邻异常节点集合输入到最优路径恢复算法模型,确定每个待恢复的异常节点对应的灾备管理器和最低成本路径。
步骤S104,根据恢复路径列表,向相邻异常节点集合中的异常节点发出对应的恢复命令。
其中,恢复命令可以包括异常节点对应的恢复操作的内容,相邻异常节点集合中的异常节点的恢复可以同时进行,提高当前恢复阶段的恢复效率。
具体实现中,服务器可以根据恢复路径列表确定的异常节点对应的灾备管理器和最低成本路径,向异常节点发出恢复命令,以启动异常节点的恢复。
上述系统备份恢复方法中,通过获取系统的网络拓扑结构、正常节点集合以及相邻异常节点集合,将正常节点集合、相邻异常节点集合输入到最优路径恢复算法模型,得到恢复路径列表,根据恢复路径列表,向异常节点发出对应的恢复命令,其中最优路径恢复算法模型用于根据节点恢复的路径和成本确定待恢复的异常节点的最优恢复路径,通过围绕正常节点的相邻异常节点作为一个恢复阶段进行恢复,减少系统恢复阶段的数量,同时通过节点的路径和成本确定异常节点的最优恢复路径,提高了系统恢复的效率。
在一个实施例中,步骤S101中确定获取系统的网络拓扑结构的步骤包括:
获取系统的节点的恢复时间和网络传输时间;根据系统的节点的恢复时间、网络传输时间和节点类型,获得系统的网络拓扑结构。
本实施例中,节点的恢复时间可以包括节点的恢复时间和网络传输时间。对于单个节点n在路径p上的恢复时间tn可以表示为:tn=networkp+networkn,其中,networkp是路径p信号从灾备管理器到达节点n的网络传输时间,可以包括节点状态确认时间和下达恢复命令的耗时,networkn是节点n的恢复耗时。服务器可以通过灾备管理器,对各个节点发起网络传输时间测试,获得网络传输时间结果并进行记录,也可以在系统正常运行过程中,定时发起网络传输时间测试,以更新网络传输时间记录。节点恢复时间可以根据同类节点的恢复时间或者该节点的历史恢复时间来确定。系统的节点类型可以包括灾备管理节点、主机服务器、数据库、业务系统等,其中,灾备管理节点可以安装在需要恢复的主机服务器上,可以用于对其他节点进行恢复操作。服务器可以根据节点类型生成系统的网络拓扑结构,并将节点的恢复时间和网络传输时间参数在该网络拓扑结构上标注,有用于计算系统的每个恢复阶段的理论恢复耗时,该理论恢复耗时可以与实际恢复耗时进行对比,以评价恢复路径的优劣,并及时进行最优路径恢复算法模型的调整和优化。
在一些实施例中,服务器在每个恢复阶段可以同时恢复多个异常节点,例如在阶段i,该阶段i的理论恢复耗时应当为:Ti=max(tn),其中,Ti是在阶段i中恢复的所有异常节点中的最长恢复时耗时。因此,该系统所有的异常节点的路径恢复总耗时可以是每个恢复阶段的最长恢复耗时的和,其中,j是恢复路径的恢复阶段数量,可以为1以上的整数,T为系统的路径p从0到j阶段的总恢复耗时:
在一些实施例中,当系统的某一恢复阶段包含多个节点,其中一个节点的网络传输时间为networkp=100ms,节点的恢复时间为networkn=10000ms,那么该节点的tn=networkp+networkn=100+10000=10100ms。如果该阶段同时有3个节点恢复,节恢复时间分别为10100ms、20100ms和55000ms,那么本恢复阶段的理论恢复耗时可以是:Ti=max(tn)=max(10100,20110,55000)=55000ms。
上述实施例的方案,通过获取节点的恢复时间和网络传输时间,并结合节点类型,获得系统的包含恢复时间和网络传输时间的网络拓扑结构,提高了获得的网络拓扑结构的实用性。
在一个实施例中,最优路径恢复算法模型包括查找最短路径函数和路径成本函数,上述方法还包括:
获取系统中各个异常节点的独立成本,以及各个异常节点分别对应的可选灾备管理器;运行查找最短路径函数,从各个异常节点的可选灾备管理器中确定满足路径阈值的灾备管理器;根据各个异常节点到各自对应的满足路径阈值的灾备管理器的路径,以及各个异常节点的独立成本,运行路径成本函数,获得各个异常节点的最低成本路径;根据各个异常节点的最低成本路径,获得系统的恢复路径列表。
本实施例中,系统可以是树形或网络结构。系统的恢复路径可以包括多个链路,链路上存在多个节点,基于系统结构中节点的连通性,同一个节点可以分布在多个链路上。独立成本可以用来表征在恢复路径中包含某一异常节点的链路的数量,异常节点所在的链路越多,说明将其从相邻节点的恢复路径中独立出来的进行路径规划影响因素更多,则独立成本越高。在进行备份恢复时,独立成本高的异常节点可以优先设置恢复路径。系统可以存在有包含一个以上的灾备管理器的集合Cv,可以用于管理节点v,服务器可以预先设置距离节点v在一定距离范围内的灾备管理器集合,作为节点v的可选灾备管理器,进而从中确定恢复路径对应的灾备管理器。
最短路径函数可以用于从灾备管理器集合Cv中,确定灾备管理器到待恢复的异常节点的路径列表,并根据设定的路径阈值,从各个路径中输出满足路径阈值要求的一个以上灾备管理器,其中路径阈值可以包括网络传输时间,也可以包括灾备管理器到待恢复的异常节点的途径节点数量,以避免不必要的长路径。服务器可以根据模型输出的结果,对模型的阈值等函数参数进行调整,以提高每个恢复阶段的备份恢复的效率。
服务器可以通过路径成本函数,将最短路径函数输出的满足路径阈值的灾备管理器的路径,以及每个异常节点的独立成本,通过计算,确定每个异常节点的最低成本路径。异常节点的最低成本路径可以是异常节点所在的多个链路上的异常节点的独立成本之和最小的链路,使得最终得到的各个异常节点的恢复路径具有最低的分离成本。最低成本路径至少包括管理异常节点的节点管理器、异常节点所在的链路以及在该链路上的各个异常节点的独立成本之和。由此获得服务器可以根据各个异常节点的最低成本路径,得到系统的恢复路径列表。
上述实施例的方案,通过获取系统中异常节点的独立成本和可选的灾备管理器,通过查找最短路径函数确定满足路径阈值的灾备管理器,以及通过路径成本函数,获得最低成本路径,最终得到恢复路径列表,通过异常节点的对应的灾备管理器以及对应的最低成本路径,确定该异常节点的恢复链路,提升了获得恢复路径列表的准确性。
在一个实施例中,获取系统中各个异常节点的独立成本,包括:
获取系统的各个链路和各个链路上的异常节点;根据各个链路和异常节点的对应关系,获取各个异常节点的独立成本。
本实施例中,系统的恢复路径可以包括多条链路,每个链路上可以包含多个节点。服务器可以遍历系统的节点,以确定系统的各个链路,以及链路上的异常节点。服务器可以根据异常节点所在的链路的数量确定异常节点的独立成本,进而确定异常节点的恢复路径。
上述实施例的方案,通过系统的链路上的异常节点,确定异常节点的独立成本,提高了模型输入数据的获取效率和准确性。
在一个实施例中,运行路径成本函数,获得各个异常节点的最低成本路径,包括:
将各个异常节点按照独立成本降序排列,获取排行在先的异常节点的最低成本路径;若排行在先的异常节点存在相邻的异常节点,增加相邻的异常节点的独立成本后,将未计算最低成本路径的异常节点继续按照独立成本降序排列以计算最低成本路径,直到获得各个异常节点的最低成本路径。
本实施例中,服务器可以根据各个异常节点的独立成本的大小,将独立成本按照降序排列,排行在先的异常节点,如果存在排行在后的相邻的异常节点,在计算完最低成本路径之后,可以将该排行在后的相邻的异常节点的独立成本进行扩大处理,例如增加1,并将未计算最低成本路径的异常节点的排序进行调整后,计算排行在先的异常节点的最低成本路径,以此类推,直到获得各个异常节点的最低成本路径。充分考虑异常节点出现在同一链路上时对该链路的整体独立成本的影响,提高了同一链路上的异常节点的路径规划优先级,进而提高了获得最低成本路径的准确性。
在一个实施例中,根据各个异常节点的最低成本路径,获得系统的恢复路径列表,包括:
根据按照独立成本降序排列的各个异常节点分别对应的最低成本路径,获得系统的恢复路径列表。
本实施例中,服务器可以按照各个异常节点独立成本的降序,确定各个异常节点进行最低成本路径计算的优先级,并依次获得各个异常节点的最低成本路径,添加到路径列表中,以得到系统的当前恢复阶段的恢复路径列表,提高了获得恢复路径列表的效率。服务器可以根据恢复路径列表,向各个异常节点发送恢复指令。
在一个实施例中,步骤S204确定的根据恢复路径列表,向相邻异常节点集合中的异常节点发出对应的恢复命令之后,上述方法还包括:
根据系统的各个节点的测试恢复耗时,获取相邻异常节点集合的理论恢复耗时;获取相邻异常节点集合的实际恢复耗时;若实际恢复耗时大于所述理论恢复耗时,调整最优路径恢复算法模型的参数后,重新获得系统的恢复路径列表。
本实施例中,因系统的复杂性,以及对模型输入阈值设置精度要求不同,可能出现实际恢复耗时大于理论恢复耗时的情形,服务器可以调整最优路径恢复算法模型的参数,例如可选灾备管理器的路径阈值、单条链路的节点数量的最大值等,重新将节点信息输入模型,以获得新的恢复路径列表。测试恢复耗时和理论恢复耗时可以包括网络传输时间和节点恢复时间,其中服务器可以通过灾备管理器,对各个节点发起网络传输时间测试,获得网络传输时间结果并进行记录,也可以在系统正常运行过程中,定时发起网络传输时间测试,以更新网络传输时间记录。节点恢复时间可以根据同类节点的恢复时间或者该节点的历史恢复时间来确定。实际恢复耗时可以根据节点恢复过程实时监测获得。
在一些实施例中,服务器也可以对模型进行训练,以确定模型的参数数量与输入节点信息之间的对应关系,以提高确定备份恢复路径的效率。
在一些实施例中,服务器也可以设定参考指标,当实际恢复耗时超出理论恢复耗时一定百分比时,提示模型参数调整建议。也可以输出实际恢复耗时明显大于理论恢复耗时的链路和节点,提高模型交互效率以及备份恢复的效率。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
为了更清晰的阐述上述各方法实施例的方案,将系统备份恢复方法应用于大型灾备系统进行说明。图2是大型灾备系统的应用环境示意图,需恢复的系统,涵盖本地系统灾备、本地跨局域网系统灾备、异地系统灾备、副中心灾备等跨网络容灾环境,可以包括本地机房;被局域网分割开的跨局域网系统灾备;通过外网连接的异地机房灾备或者副中心机房灾备等。图3是大型灾备系统的应用环境示意图,链路中存在四种节点单元,分别是灾备管理节点、主机服务器、数据库、业务系统。灾备管理节点可以安装在需要恢复的主机上,灾备管理系统自身也需要数据库的支持。进行节点恢复时,需要考虑节点的恢复时间、链路的传输延迟以及确认节点的处理时间。
图4是大型灾备系统的系统备份恢复流程图,包括:
步骤1:收集和录入各个节点的恢复时间耗时,通过灾备管理节点,对各个节点发起网络传输时间测试,并把测试的时间结果进行保存记录;灾备管理节点定时也会发起时间网络传输时间测试,以更新网络传输时间记录。
步骤2:通过收集,录入或者测试的结果,获取各个节点的拓扑结构,节点类型等,构建灾备网络拓扑图。
步骤3:一旦发生了宕机需要恢复,服务器首先判断哪些节点是正常的,定义为正常节点集合;需要采用正常的节点来辅助进行,逐步对相邻的异常节点进行恢复,根据灾备网络拓扑图,得到正常节点的相邻的异常节点集合,统计出其他未相邻的异常节点,定义为未相邻异常节点集合。
步骤4:把定义为正常节点集合、相邻的异常节点集合和未相邻异常节点集合,输入给最优路径恢复算法;运行最优路径恢复算法;根据结果得到恢复路径列表清单,按照列表清单,在每个恢复阶段对需要恢复的节点下达恢复命令,并且实时检查本阶段需要恢复的节点恢复情况,等完毕后进行下一恢复阶段的恢复,以此类推,直到整个系统恢复正常。
独立成本可以用于将节点的恢复路径与其相邻节点的恢复路径独立处理,节点v的链路e的不相交性代价,表示为表示v的相邻节点穿过链路e的恢复路径的数量。由于每个节点遍历链路的邻居节点的恢复路径的数量可能不同。一条路径的成本是相关节点在该路径上每个链路的独立成本的总和。服务器可以根据节点的独立成本或节点的连通性按照降序对所有待恢复的节点进行排序,高独立代价节点的恢复路径优先于低独立代价节点的恢复路径,邻域信息作为模型的输入,可以表示为/>其中v是异常节点集合V中的一个节点,w是集合V中与v相邻的异常节点。如果节点v∈V是节点w∈V的邻居,则为服务器可以为每一个链路分配一个节点数量或路径长度的值,以避免不必要的长路径。可以管理节点v的一组灾备管理器可以表示为Cv。严格的灾备管理器分配可以通过在集合Cv中仅管理节点v的灾备管理器来调节。此外,灾备管理器可以设置通过仅包括位于距离节点v一定距离内的灾备管理器来确保节点管理的效率。服务器可以从一组灾备管理器中选择最优解决方案,即选择灾备管理器以使恢复路径具有最低的路径成本和独立成本。最短路径可以是系统的路径p上的一组链路。服务器可以查找节点到所有可能恢复该节点的灾备管理器之间的可能最短路径,然后,从中选择选择独立成本最低的最短路径,并在其上设置恢复路径,对该恢复阶段进行恢复。恢复过程中可以按照恢复路径列表的路径,进行一个个阶段的恢复。服务器恢复完成一个阶段后,可以进入下一个恢复阶段,重新获得与当前系统中正常节点和与正常节点相邻的异常节点,执行最优路径恢复算法,得到新的最优路径来进行恢复,依次类推,直到系统中不存在异常节点。上述方案,根据系统的每个恢复阶段的具体情况得出最优的恢复路径,不同的异常节点和恢复阶段有与之相对应的最优恢复路径,适合灾备系统的恢复要求,当面对大规模复杂环境的灾备恢复时,有最优路径可更供采纳,节省恢复时间,减少系统宕机时间,提高系统可用性。
在一个实施例中,如图5所示,提供了一种系统备份恢复装置,该装置500包括:
拓扑获取模块501,用于获取系统的网络拓扑结构以及正常节点集合;正常节点集合为系统中当前为正常状态的节点的集合;
相邻异常节点获取模块502,用于根据系统的网络拓扑结构,获得与正常节点相邻的异常节点,得到相邻异常节点集合;
模型输入模块503,用于将正常节点集合、相邻异常节点集合输入到预先设置的最优路径恢复算法模型,得到恢复路径列表;最优路径恢复算法模型用于根据节点恢复的路径和成本确定待恢复的异常节点的最优恢复路径;
恢复命令模块504,用于根据恢复路径列表,向相邻异常节点集合中的异常节点发出对应的恢复命令。
在一个实施例中,拓扑获取模块501进一步用于获取系统的节点的恢复时间和网络传输时间;根据系统的节点的恢复时间、网络传输时间和节点类型,获得系统的网络拓扑结构。
在一个实施例中,最优路径恢复算法模型包括查找最短路径函数和路径成本函数,上述装置500还包括:成本和管理器获取单元,用于获取系统中各个异常节点的独立成本,以及各个异常节点分别对应的可选灾备管理器;独立成本表征包含异常节点的链路的数量;最短路径处理单元,用于运行查找最短路径函数,从各个异常节点的可选灾备管理器中确定满足路径阈值的灾备管理器;最低成本路径获取单元,用于根据各个异常节点到各自对应的满足路径阈值的灾备管理器的路径,以及各个异常节点的独立成本,运行路径成本函数,获得各个异常节点的最低成本路径;恢复路径列表获取单元,用于根据各个异常节点的最低成本路径,获得系统的恢复路径列表。
在一个实施例中,成本和管理器获取单元进一步用于获取系统的各个链路和各个链路上的异常节点;根据各个链路和异常节点的对应关系,获取各个异常节点的独立成本。
在一个实施例中,最低成本路径获取单元进一步用于将各个异常节点按照独立成本降序排列,获取排行在先的异常节点的最低成本路径;若排行在先的异常节点存在相邻的异常节点,增加相邻的异常节点的独立成本后,将未计算最低成本路径的异常节点继续按照独立成本降序排列以计算最低成本路径,直到获得各个异常节点的最低成本路径。
在一个实施例中,恢复路径列表获取单元进一步用于根据按照独立成本降序排列的各个异常节点分别对应的最低成本路径,获得系统的恢复路径列表。
在一个实施例中,上述装置500还包括:模型调优模块,用于根据系统的各个节点的测试恢复耗时,获取相邻异常节点集合的理论恢复耗时;获取相邻异常节点集合的实际恢复耗时;若实际恢复耗时大于理论恢复耗时,调整最优路径恢复算法模型的参数后,重新获得系统的恢复路径列表。
关于系统备份恢复装置的具体限定可以参见上文中对于系统备份恢复方法的限定,在此不再赘述。上述系统备份恢复装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本申请提供的系统备份恢复方法,可以应用于计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储获取到的最优路径恢复算法模型以及网络拓扑结构。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种系统备份恢复方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种系统备份恢复方法,其特征在于,所述方法包括:
获取系统的网络拓扑结构以及正常节点集合;所述正常节点集合为系统中当前为正常状态的节点的集合;
根据所述系统的网络拓扑结构,获得与所述正常节点相邻的异常节点,得到相邻异常节点集合;
将所述正常节点集合、相邻异常节点集合输入到预先设置的最优路径恢复算法模型,得到恢复路径列表;所述最优路径恢复算法模型包含查找最短路径函数和路径成本函数,所述最优路径恢复算法模型用于获取所述系统中各个异常节点的独立成本,以及所述各个异常节点分别对应的可选灾备管理器;所述独立成本表征包含所述异常节点的链路的数量;运行所述查找最短路径函数,从所述各个异常节点的所述可选灾备管理器中确定满足路径阈值的灾备管理器;根据所述各个异常节点到各自对应的所述满足路径阈值的灾备管理器的路径,以及所述各个异常节点的独立成本,运行所述路径成本函数,获得所述各个异常节点的最低成本路径;根据所述各个异常节点的最低成本路径,获得所述恢复路径列表;
根据所述恢复路径列表,向所述相邻异常节点集合中的异常节点发出对应的恢复命令。
2.根据权利要求1所述的方法,其特征在于,所述获取系统的网络拓扑结构,包括:
获取所述系统的节点的恢复时间和网络传输时间;
根据所述系统的节点的恢复时间、网络传输时间和节点类型,获得所述系统的网络拓扑结构。
3.根据权利要求1所述的方法,其特征在于,所述获取所述系统中各个异常节点的独立成本,包括:
获取所述系统的各个链路和所述各个链路上的异常节点;
根据所述各个链路和异常节点的对应关系,获取所述各个异常节点的独立成本。
4.根据权利要求1所述的方法,其特征在于,所述运行所述路径成本函数,获得所述各个异常节点的最低成本路径,包括:
将所述各个异常节点按照独立成本降序排列,获取排行在先的异常节点的最低成本路径;
若所述排行在先的异常节点存在相邻的异常节点,增加所述相邻的异常节点的独立成本后,将未计算最低成本路径的异常节点继续按照独立成本降序排列以计算最低成本路径,直到获得所述各个异常节点的最低成本路径。
5.根据权利要求4所述的方法,其特征在于,所述根据所述各个异常节点的最低成本路径,获得所述系统的恢复路径列表,包括:
根据按照独立成本降序排列的所述各个异常节点分别对应的最低成本路径,获得所述系统的恢复路径列表。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据所述恢复路径列表,向所述相邻异常节点集合中的异常节点发出对应的恢复命令之后,所述方法还包括:
根据所述系统的各个节点的测试恢复耗时,获取所述相邻异常节点集合的理论恢复耗时;
获取所述相邻异常节点集合的实际恢复耗时;
若所述实际恢复耗时大于所述理论恢复耗时,调整所述最优路径恢复算法模型的参数后,重新获得所述系统的恢复路径列表。
7.一种系统备份恢复装置,其特征在于,所述装置包括:
拓扑获取模块,用于获取系统的网络拓扑结构以及正常节点集合;所述正常节点集合为系统中当前为正常状态的节点的集合;
相邻异常节点获取模块,用于根据所述系统的网络拓扑结构,获得与所述正常节点相邻的异常节点,得到相邻异常节点集合;
模型输入模块,用于将所述正常节点集合、相邻异常节点集合输入到预先设置的最优路径恢复算法模型,得到恢复路径列表;所述最优路径恢复算法模型用于包含查找最短路径函数和路径成本函数,所述最优路径恢复算法模型用于获取所述系统中各个异常节点的独立成本,以及所述各个异常节点分别对应的可选灾备管理器;所述独立成本表征包含所述异常节点的链路的数量;运行所述查找最短路径函数,从所述各个异常节点的所述可选灾备管理器中确定满足路径阈值的灾备管理器;根据所述各个异常节点到各自对应的所述满足路径阈值的灾备管理器的路径,以及所述各个异常节点的独立成本,运行所述路径成本函数,获得所述各个异常节点的最低成本路径;根据所述各个异常节点的最低成本路径,获得所述系统的恢复路径列表;
恢复命令模块,用于根据所述恢复路径列表,向所述相邻异常节点集合中的异常节点发出对应的恢复命令。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202011000994.9A 2020-09-22 2020-09-22 系统备份恢复方法、装置、计算机设备和存储介质 Active CN112231142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011000994.9A CN112231142B (zh) 2020-09-22 2020-09-22 系统备份恢复方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011000994.9A CN112231142B (zh) 2020-09-22 2020-09-22 系统备份恢复方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112231142A CN112231142A (zh) 2021-01-15
CN112231142B true CN112231142B (zh) 2024-04-05

Family

ID=74107329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011000994.9A Active CN112231142B (zh) 2020-09-22 2020-09-22 系统备份恢复方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112231142B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113934573A (zh) * 2021-09-17 2022-01-14 南方电网深圳数字电网研究院有限公司 一种内存数据库的数据恢复方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007053793A (ja) * 2003-02-21 2007-03-01 Nippon Telegr & Teleph Corp <Ntt> 通信ネットワークにおけるパスの故障救済を行うための装置及び方法
EP2713556A1 (en) * 2012-09-28 2014-04-02 NTT DoCoMo, Inc. Mapping a network topology request to a physical network
CN106973018A (zh) * 2011-03-25 2017-07-21 华为技术有限公司 一种在网络通信中实现拓扑透明区的系统和方法
WO2019011338A1 (zh) * 2017-07-13 2019-01-17 华为技术有限公司 一种最短路径确定方法及控制器
CN110380960A (zh) * 2019-07-31 2019-10-25 迈普通信技术股份有限公司 一种备份路径确定方法、装置、网络设备及存储介质
CN111682962A (zh) * 2020-05-19 2020-09-18 南方电网调峰调频发电有限公司信息通信分公司 一种电力数据网故障恢复方法、系统及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9178799B2 (en) * 2013-02-01 2015-11-03 TELEFONAKTIEBOLAGET L M ERRICSSON (publ) Method and system of shortest path bridging (SPB) enhanced resilience with loop mitigation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007053793A (ja) * 2003-02-21 2007-03-01 Nippon Telegr & Teleph Corp <Ntt> 通信ネットワークにおけるパスの故障救済を行うための装置及び方法
CN106973018A (zh) * 2011-03-25 2017-07-21 华为技术有限公司 一种在网络通信中实现拓扑透明区的系统和方法
EP2713556A1 (en) * 2012-09-28 2014-04-02 NTT DoCoMo, Inc. Mapping a network topology request to a physical network
WO2019011338A1 (zh) * 2017-07-13 2019-01-17 华为技术有限公司 一种最短路径确定方法及控制器
CN110380960A (zh) * 2019-07-31 2019-10-25 迈普通信技术股份有限公司 一种备份路径确定方法、装置、网络设备及存储介质
CN111682962A (zh) * 2020-05-19 2020-09-18 南方电网调峰调频发电有限公司信息通信分公司 一种电力数据网故障恢复方法、系统及存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DHT抖动处理代价的分析;黄庆凤等;《计算机研究与发展》(第S1期);第409-414页 *
Lowest-cost network node identification for data caching for information centric networks;Zhengqi Jiang等;《2016 IEEE 37th Sarnoff Symposium》;第193-198页 *
基于多路由配置的IP网络快速恢复机制的研究;张莉敏;《中国优秀硕士学位论文全文数据库 信息科技辑》(第12期);I139-29 *
异常链路分析在电力网络恢复中的应用;郭婷婷等;《电子科技大学学报》;第45卷(第5期);第854-859页 *
无线Mesh网络恢复方案的一种通用替代路径算法;吕磊等;《中国科技信息》(第06期);第138-140+143页 *

Also Published As

Publication number Publication date
CN112231142A (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
US20040225697A1 (en) Storage operation management program and method and a storage management computer
EP3015998B1 (en) Zoning balance subtask delivering method, apparatus and system
JP2003114811A (ja) 自動障害復旧方法及びシステム並びに装置とプログラム
JP4405511B2 (ja) 複数のサービス・ポイントを有する自律コンピューティングにおける動的に構成可能な耐障害性
CN110740054B (zh) 一种基于强化学习的数据中心虚拟化网络故障诊断方法
US11221935B2 (en) Information processing system, information processing system management method, and program thereof
CN108319618B (zh) 一种分布式存储系统的数据分布控制方法、系统及装置
CN109710586B (zh) 一种集群节点配置文件同步方法及装置
CN110190991B (zh) 一种多应用场景下的分布式流处理系统的容错方法
CN110737924B (zh) 一种数据保护的方法和设备
CN113193996B (zh) 一种电力光传输网优化方法、装置、设备及存储介质
CN112231142B (zh) 系统备份恢复方法、装置、计算机设备和存储介质
CN114091610A (zh) 智能决策方法及装置
CN110175070B (zh) 分布式数据库的管理方法、装置、系统、介质及电子设备
US11695856B2 (en) Scheduling solution configuration method and apparatus, computer readable storage medium thereof, and computer device
CN113079427A (zh) 基于网络演化模型的ason网络业务可用性评估方法
CN108763312B (zh) 一种基于负载的从数据节点筛选方法
CN106534262A (zh) 一种网络信息系统故障的切换方法
CN113472891B (zh) 一种sdn控制器集群数据处理方法、设备及介质
CN111324513B (zh) 一种人工智能开发平台的监控管理方法及系统
CN115686368A (zh) 区块链网络的节点的存储扩容的方法、系统、装置和介质
CN115858250A (zh) 数据恢复方法、装置、存储介质及电子装置
CN113361054B (zh) 电力信息物理系统路由优化方法及系统
CN115687019A (zh) 数据库集群的故障处理方法、智能监控平台、设备和介质
CN114610545A (zh) 减少私有云计算的单点故障的方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant