CN114490565A - 数据库故障处理方法和装置 - Google Patents

数据库故障处理方法和装置 Download PDF

Info

Publication number
CN114490565A
CN114490565A CN202011167074.6A CN202011167074A CN114490565A CN 114490565 A CN114490565 A CN 114490565A CN 202011167074 A CN202011167074 A CN 202011167074A CN 114490565 A CN114490565 A CN 114490565A
Authority
CN
China
Prior art keywords
database
upstream
downstream
data
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011167074.6A
Other languages
English (en)
Inventor
朱绍辉
董俊峰
强群力
刘超千
赵彤
周欢
陈瑛绮
余星
韦鹏程
孟令银
王鹏
陈飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NetsUnion Clearing Corp
Original Assignee
NetsUnion Clearing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NetsUnion Clearing Corp filed Critical NetsUnion Clearing Corp
Priority to CN202011167074.6A priority Critical patent/CN114490565A/zh
Priority to PCT/CN2021/113235 priority patent/WO2022088861A1/zh
Publication of CN114490565A publication Critical patent/CN114490565A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques

Abstract

本发明公开了一种数据库故障处理方法和装置,数据库故障处理方法包括:检测到目标备用数据库出现故障时,获取与目标备用数据库对应的服务器地址标识;根据服务器地址标识,确定与目标备用数据库对应的上游节点地址标识和下游节点地址标识;检测上游节点地址标识对应的上游业务数据库是否正常,和检测下游节点地址标识对应的下游业务数据库是否正常;如果上游业务数据库和下游业务数据库都正常,则对上游业务数据库和下游业务数据库进行链路恢复配置操作。由此,实现在目标备用数据库出现故障时,根据上游业务数据库和下游业务数据库的连通来自动恢复链路,确保整个链路的正常,避免因中间的备用数据库中断而导致无法向下游进行数据备份传输。

Description

数据库故障处理方法和装置
技术领域
本发明涉及网络技术领域,尤其涉及一种数据库故障处理方法和装置。
背景技术
为了保障业务系统的容灾能力,大多数公司通常采用多地容灾部署服务的架构。即针对一套数据库会有本地,同城及异地几个备份数据库。这样就保证了一个数据库故障或一个城市发生灾害,业务服务快速的故障转移恢复的可能。另外,所有业务的读写操作都集中在本地主数据库,会导致主数据库的压力过大,同时容灾库会有很大的资源浪费,因此对一些读操作可以放到同城及异地容灾库上。这就要求一套数据库的链路中断时,需要尽快恢复同步链路,确保整个链路的正常,不会因中间中断而导致下游所有的数据传输业务都不可能。
在相关技术中,使用MySQL数据库,在本地的备用数据库或是同城的备用数据库故障的场景下,数据库管理人员需要手动将下游数据库修改同步关系,校验主备间数据一致性,从架构中剔除故障库,建立新的拓扑架构,操作效率较低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种数据库故障处理方法,以实现在目标备用数据库故障时,根据上游业务数据库和下游业务数据库的连通来自动恢复链路,确保整个链路的正常的效果。
本发明的第二个目的在于提出一种数据库故障处理装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本发明第一方面实施例提出了一种数据库故障处理方法,包括:
检测到目标备用数据库出现故障时,获取与所述目标备用数据库对应的服务器地址标识;
根据所述服务器地址标识,确定与所述目标备用数据库对应的上游节点地址标识和下游节点地址标识;
检测所述上游节点地址标识对应的上游业务数据库是否正常,和检测所述下游节点地址标识对应的下游业务数据库是否正常;
如果所述上游业务数据库和所述下游业务数据库都正常,则对所述上游业务数据库和所述下游业务数据库进行链路恢复配置操作。
为达上述目的,本发明第二方面实施例提出了一种数据库故障处理装置,包括:
获取模块,用于检测到目标备用数据库出现故障,获取与所述目标备用数据库对应的服务器地址标识;
确定模块,用于根据所述服务器地址标识,确定与所述目标备用数据库对应的上游节点地址标识和下游节点地址标识;检测模块,用于检测所述上游节点地址标识对应的上游业务数据库是否正常,和检测所述下游节点地址标识对应的下游业务数据库是否正常;修复模块,用于在所述上游业务数据库和所述下游业务数据库都正常时,则对所述上游业务数据库和所述下游业务数据库进行链路恢复配置操作。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为实现如前述方法实施例所述的数据库故障处理方法。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由计算机设备处理器被执行时,使得计算机设备能够执行一种数据库故障处理方法。
本发明实施例提供的技术方案可以包含如下的有益效果:
检测到目标备用数据库出现故障时,获取与目标备用数据库对应的服务器地址标识,进而,根据服务器地址标识,确定与目标备用数据库对应的上游节点地址标识和下游节点地址标识,最后,检测上游节点地址标识对应的上游业务数据库是否正常,和检测下游节点地址标识对应的下游业务数据库是否正常,如果上游业务数据库和下游业务数据库都正常,则对上游业务数据库和下游业务数据库进行链路恢复配置操作。由此,实现在目标备用数据库出现故障时,根据上游业务数据库和下游业务数据库的连通来自动恢复链路,确保整个链路的正常,避免因中间的备用数据库中断而导致无法向下游进行数据传输。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种数据库故障处理方法的流程示意图;
图2为本发明实施例所提供的一种检测目标备用数据库出现故障的方法的流程示意图;
图3为本发明实施例所提供的一种检测上游业务数据库与下游业务数据库是否出现故障的方法的流程示意图;
图4为本发明实施例所提供的一种目标备用数据库进行数据同步修复的方法的流程图;
图5为本发明实施例所提供的另一种目标备用数据库进行数据同步修复的方法的流程图;以及
图6为本发明实施例所提供的一种的数据库故障处理装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的数据库故障处理方法和装置。
图1为本发明实施例所提供的一种数据库故障处理方法的流程示意图。
针对上述技术背景中提到的数据库故障时,链路中断,需要花费时间较长且人工操作容易出错,同时会有一定的人力资源浪费的技术问题,本发明实施例提供了数据库故障处理方法,以实现在目标备用数据库出现故障的实时,主动检测、主动修复数据库数据的功能与主动恢复上下游链路的功能,如图1所示,该方法包括以下步骤:
步骤101,检测到目标备用数据库出现故障,获取与目标备用数据库对应的服务器地址标识;
其中,目标备用数据库的故障可以理解为由各种原因引起的不同类型的目标备用数据库故障的任意一种,包括但不限于网络故障、数据丢失、数据溢出等。
在本实施例中,各个目标备用数据库处于不间断的被监视状态中,当有监测到任意目标备用数据库出现故障的时候,可以通过向目标备用数据库服务器申请,获得其对应的地址标识,也可以通过查询目标备用数据库所对应的服务器地址标识列表,获得其对应的服务器地址标识。
需要说明的是,目标备用数据库的故障问题可能有很多种,检测目标备用数据库出现故障的方法也有所不同,下面解释示例说明,示例如下:
示例一:
在本示例中,如图2所示,分别提取主用数据库和目标备用数据库中对应的数据,进行比较。
步骤201,获取主用数据库准备向目标备用数据库传输的携带数据标识的第一目标数据,根据目标数据生成第一编码;
其中,第一目标数据可以理解为指定的数据或者数据段,也可以理解为指定的程序函数段等。数据标识可以理解为第一目标数据的地址、序号或专属数据或函数的名称等与指定第一目标数据唯一对应的标识。另外,第一编码可以理解为根据第一目标数据进过加密、变形或映射以后生成的唯一与第一数据对应的编码数据,第一编码也可以经过反向运算获得第一目标数据。
在本实施例中,在主用数据库与目标备用数据库通信的过程中,实时或者按照指定的周期采集获取主用数据库准备向目标备用数据库传输的携带数据标识的第一目标数据,然后使用第一目标数据根据指定处理规则,生成对应的第一编码。
步骤202,根据数据标识从目标备用数据库上获取第二目标数据,根据第二目标数据生成第二编码;
在本实施例中,根据从第一目标数据或者第一编码,解析出第一目标数据的数据标识,按照数据标识从目标备用数据库上申请对应的第二目标数据,获得数据标识对应的第二目标数据,使用第二目标数据根据指定处理规则,生成对应的第二编码。其中,生成第二编码所使用的处理规则和生成第一编码所使用的处理规则可以一样,也可以不一样。
步骤203,按照预设算法对第一编码和第二编码进行计算,如果计算结果为预设的第一标识,则确定目标备用数据库故障为应用故障,如果计算结果为预设的第二标识,则确定目标备用数据库故障为服务器故障。
其中,预设算法可以理解为提前训练好的一个神经网络模型,该神经网络模型的输入数据是第一编码和第二编码,输出数据是一类可以判断目标备用数据库故障类型的计算结果。另外,应用故障可以理解为服务器内储蓄的数据、程序或者算法过程等的运行故障。该预设算法也可以是异或等数字逻辑算法等。
在本实施例中,按照预设算法对第一编码和第二编码进行计算,获取计算结果,使用计算结果与预设第一标识和预设第二标识匹配,如果计算结果与第一标识匹配成功,则确定目标备用数据库故障为应用故障,如果计算结果与第二标识匹配成功,则确定目标备用数据库故障为服务器故障。其中,第一标识和第二标识分别用于指示目标备用数据库的应用故障和服务器故障,第一标识和第二标识的具体内容与预设算法有关,比如,当预设算法为数字逻辑运算时,则第一标识可以为“001”,第二标识可以为“010”等。
示例二:
在本示例中,系统会按照指定周期向所有目标备用数据库发送一个第一测试数据,然后再获取各个数据库基于该第一测试数据返回的第二测试数据,比较各个第二测试数据和第一测试数据以确定是否有数据库出现故障,以及出现故障的类型。
在本示例中,系统按照预设的周期,向各个数据库发送第一测试数据,然后在指定的时间内,获取各个数据库经过反馈的接收到的与该第一测试数据对应的第二测试数据,其中,可以基于第一测试数据的时间戳或者签名等来确定与第一测试数据对应的第二测试数据。如果有目标备用数据库在指定的时间内,没有发出第二测试数据,则确定该目标备用数据库出现服务器故障,如果有目标备用数据库发回的第二测试数据与第一测试数据不同,且与主用数据库发回的第二测试数据不同,则确定该目标备用数据库出现应用故障。
步骤102,根据服务器地址标识,确定与目标备用数据库对应的上游节点地址标识和下游节点地址标识;
在一些可能的示例中,可以预先保存业务链中多有节点标识的顺序编号,当获取到服务器地址标识后,根据服务器标识的顺序编号确定上一个顺序编号和下一个顺序编号,根据上一个顺序编号和下一个顺序编号确定出对应的上游节点地址标识和下游节点地址标识。
在另一些可能的示例,节点与节点之间根据业务通信新关系构建了网络拓扑图,该网络拓扑图中的节点与节点之间基于业务关系构建网络拓扑连接。其中,网络拓扑图中的节点可以表示为节点地址标识形式,或者是节点编码等唯一标识节点唯一性的信息。
在本实施例中,根据出现故障的目标备用数据库的服务器地址标识,查询预设的网络拓扑图,获取与出现故障的目标备用数据库对应的上游节点和下游节点的标识节点唯一性的信息,若是该标识节点唯一性的信息为节点地址标识形式,则可以直接获取到对应的上游节点地址标识和下游节点地址标识,若是其他节点地址标识形式,则可以查询预设构建的节点唯一性的信息与节点地址标识的对应关系,获取上游节点地址标识和下游节点地址标识的地址标识。其中,本实施例中的上游节点地址标识和下游节点地址标识可以与节点的物理地址对应等。
在本实施例中,基于多个节点连接成业务链共同备份业务数据,在实际备份过程中,每个下游节点备份其上游节点的业务数据,当上游节点的业务数据备份到下游节点后,即使上游节点故障,由于下游节点存储有上游节点的业务数据,因此,可以代替上游节点提供有关服务等。步骤103,根据上游节点地址标识检测对应的上游业务数据库是否正常,以及根据下游节点地址标识检测对应的下游业务数据库是否正常;
正如以上提到的,本实施例中的上游节点地址标识和下游节点地址标识可以与节点的物理地址对应,因此,在本实施例中,根据上游节点地址标识检测对应的上游业务数据库是否正常,以及根据下游节点地址标识检测对应的下游业务数据库是否正常,容易理解的是,当前目标备用数据库的故障有可能是其本身的故障,也有可能是由于上下游的节点故障导致的,因此,需要基于游节点地址标识检测对应的上游业务数据库是否正常的检测,来定位备份数据库的是否有故障。
需要说明的是,在不同的应用场景下,检测上游业务数据库与下游业务数据库是否出现故障的方法不同,下面示例说明,示例如下:
示例一:
如图3所示,在本示例中,通过预设的监控页面检测上下游业务数据库是否工作正常。其中,监控页面可以理解为监控程序的前端表示。
步骤301,获取与上游节点地址标识对应的上游服务器,以及获取与下游节点地址标识对应的下游服务器;
步骤302,查询预设的业务链路拓扑,在上游服务器获取与备用业务数据库对应的上游业务数据库,以及在下游服务器获取与备用业务数据库对应的下游业务数据库;
在本实施例中,根据与出现故障的当前节点的目标备用数据库对应的上游节点地址标识和下游节点地址标识,获取与上游节点地址标识对应的上游服务器和与下游节点地址标识对应的下游服务器,而服务器的业务支持需要与数据库的业务交互,因此,查询预设的业务链路拓扑,在上游服务器获取与出现故障的备用业务数据库对应的上游业务数据库,在下游服务器获取与出现故障的备用业务数据库对应的下游业务数据库。
步骤303,按照预设第一监控页面检测上游业务数据库的运行状态,以及按照预设第二监控页面检测下游业务数据库的运行状态。
其中,监控页面的前端显示可以包括上游业务数据库与下游业务数据库的运行状态显示的多个显示模块,其中,每个模块用来显示不同的运行状态。另外,系统的各个数据库的运行状态的数据都可以放在此类页面进行显示,包括上述出现故障的目标备用数据库。
在本实施例中,预先设置用于监测上游业务数据库的监测程序,并设置与该检测程序对应的第一监控页面,通过上游业务数据库对应的第一监控页面,检测上游业务数据库的运行状态是否正常,其中,与第一监控页面对应的检测程序用于与上游业务数据库的不同的功能函数进行监测,在具体监测时,可以基于钩子函数的设置等实现,第一监控页面用于显示检测程序的检测结果,该第一监控页面用于显示与第一监控页面对应的检测程序,检测的第一监控页面的各个运行状态是否正常等。
同时通过下游业务数据库对应的第二监控页面,检测下游业务数据库的运行状态是否正常。可以理解的是,如果上、下游业务数据库的运行状态正常,则表明当前备份数据库的故障主要是其本身的故障,不需要对上、下游业务数据库进行修复,在出现故障的目标备用数据库修复之前保持检测即可;如果上、下游业务数据库的运行状态异常,可以通过发送短信,响起警报护着页面抖动等的方式提醒管理人员进行干预。
示例二:
在本示例中,当前节点的目标备用数据库出现故障以后,其所对应的服务器会向上游服务器和下游服务器发送故障报警,上游服务器和下游服务器在收到故障报警以后,开始主动监测其所对应的各个业务数据库的运行状态。在此期间,如果检测到上游服务器或者下游服务器对应的业务数据库出现故障,可以通过发送短信,响起警报护着页面抖动等的方式提醒管理人员进行干预;如果检测到上游服务器和者下游服务器对应的业务数据库运行正常,则保持监测,直到收到当前节点的目标备用数据库所对应的服务器向上游服务器和下游服务器发送恢复正常工作的信息,停止监测。
步骤104,如果上游业务数据库和下游业务数据库都正常,则对上游业务数据库和下游业务数据库进行链路恢复配置操作。
在本实施例中,在检测上游业务数据库和下游业务数据库都正常的情况下,则对当前节点出现故障的目标备用数据库进行数据同步修复,并且,有目标备用数据库故障必然会导致业务链路的故障,因此,在对目标备用数据库进行数据同步修复之后,再对上游业务数据库、目标备用数据库和下游业务数据库进行链路恢复。
需要说明的是,在不同的应用场景下,对上游业务数据库和下游业务数据库进行链路恢复配置操作有不同的方法,下面示例说明,示例如下:
示例一:
如图4所示,在本示例中,使用主用数据库数据对目标备用数据库数据进行恢复。
步骤401,获取目标备用数据库的故障时间段;
应当理解的是,服务器和数据库在完成任意一步操作的时候都会生成操作日志,操作日志会记录任意一步操作的操作时间,操作对象,操作方式等内容。其中,目标备用数据库的故障时间段可以理解为通过操作日志,发现目标备用数据库出现故障以后的时间段,或者是检测到目标备用数据库接收、处理、发送的信息不满足格式要求的时间段。
在本发明的一个实施例中,通过调取操作日志的内容,获得目标备用数据库出现故障的时间段。
步骤402,向与目标备用数据库对应的主用数据库发送携带故障时间段的二次同步指令;
步骤403,获取主用数据库发送的与故障时间段对应的信息,根据信息对目标备用数据库进行数据同步修复。
其中,二次同步指令可以理解为目标备用数据库向主用数据库发送的一类指令,该指令中携带目标备用数据库的地址、出现故障的时间段、数据标识等信息,主用数据库在收到该类指令以后,会根据出现故障的时间段和数据标示调取对应的数据,向二次同步指令携带的目标备用数据库的地址标识对应的目标备用数据库发送该数据。
在本实施例中,目标备用数据库向与其对应的主用数据库发送携带故障时段等信息的二次同步指令,对应的主用数据库在收到该二次同步指令以后,根据其中携带的各种信息,确定需要下发给目标备用数据库的数据并下发,目标备用数据库在收到下发的数据以后,对应的修复需要修复的数据。
当然,上述实施例是建立在与目标备用数据库对应的主用数据库没有发生故障的前提下,在一些可能的示例中,当与目标备用数据库对应的主用数据库故障时,还可以基于上游业务数据库和下游业务数据库与目标备用数据库的数据日志来恢复目标备用数据库。比如,根据上游业务数据库的数据日志发现在故障时间段内的发送给目标备用数据库的数据,则也可以将该数据重新发送给目标备用数据库等。
示例二:
如图5所示,在本示例中,通过使用工作正常的上游业务数据的数据对出现故障的目标备用数据库的数据进行修复。
步骤501,获取上游业务数据库的上游业务数据;
应当理解的是,目标备用数据库根据从上游业务数据库获取到的业务数据进行备份处理,因此,为了确定目标备用数据库对应的服务器是否从上游业务数据库中成功接收数据,获取上游业务数据库的上游业务数据,该上游业务数据包括从上游业务数据库向目标备用数据库对应的节点发送的数据。
步骤502,将上游业务数据与目标备用数据库的业务数据进行比较;
应当理解的是,备用数据中备份了上游业务数据向当前节点发送的数据,因此,在上游业务数据与目标备用数据库对应的节点业务链路正常与否,可以通过将上游业务数据与目标备用数据库的业务数据进行比较获知。
步骤503,如果比较结果不一致,则清除下游业务数据,并复制上游业务数据。
步骤504,根据上游节点地址标识和下游节点地址标识连接上游业务数据库和下游业务数据库。
在本实施例中,若是比较结果不一致,则表明上游业务数据与目标备用数据库对应的节点备份链路不正常,则这种不正常,必然影响了目标备用数据库对应的节点向下游业务数据库进行数据的备份,因而,在比较结果不一致时,则根据上游业务数据对目标备用数据库和下游业务数据库重新进行业务数据的备份。
在一些可能的示例中,重新获取上游业务数据,由于对应的上游业务数据是需要发送给目标备用数据库进行备份,因此,此时复制上游业务数据,并清除下游业务数据,由于下游节点会对上游节点的数据进行备份,因此,在清除下游业务数据后,下游节点重新备份上游节点的数据,实现了链路恢复。
在本实施例中,根据上游节点地址标识和下游节点地址标识连接上游业务数据库和下游业务数据路,因此,可以触发上游业务数据由上游节点重新发送至对应的下游节点,实现了数据的备份链路恢复。显然,即使中间的目标业务数据库故障,也可以快速进行数据备份。
由此,当服务器地址标识在既包含对应的上游节点地址标识,又包含对应的下游节点地址标识时,即服务器地址标识对应的目标数据库不是链路中的首个节点或者是最后一个节点,而是拥有上游节点和下游节点的中间节点时,本公开实施例的数据库故障处理方法,可以根据上游节点地址标识和下游节点地址标识连接上游业务数据库和下游业务数据路,针对中间节点故障的情况,也能够实现数据由上游节点备份到下游节点。
在本公开的一个实施例中,当服务器地址标识仅仅包含了上游节点地址标识,不包含下游节点地址标识时,即故障的节点为业务链路的最后一个节点时,由于其他上游的节点已经备份了有关数据,因此,可以将最后一个节点的有关业务转移到其他上游节点中的任一节点执行。
在本公开的一个实施例中,当服务器地址标识仅仅包含了下游节点地址标识,不包含上游节点地址标识时,即故障的节点为业务链路的第一个节点时,由于其他下游的节点已经备份了有关数据,因此,可以将第一个节点的有关业务转移到其他下游节点中的任一节点执行。
综上所述,根据本公开实施例的数据库故障处理方法,检测到目标备用数据库出现故障时,获取与目标备用数据库对应的服务器地址标识,进而,根据服务器地址标识,确定与目标备用数据库对应的上游节点地址标识和下游节点地址标识,最后,检测上游节点地址标识对应的上游业务数据库是否正常,和检测下游节点地址标识对应的下游业务数据库是否正常,如果上游业务数据库和下游业务数据库都正常,则对上游业务数据库和下游业务数据库进行链路恢复配置操作。由此,实现在目标备用数据库出现故障时,根据上游业务数据库和下游业务数据库的连通来自动恢复链路,确保整个链路的正常,避免因中间的备用数据库中断而导致无法向下游进行数据备份传输。
为了实现上述实施例,本发明还提出一种数据库故障处理装置。
图6为本发明实施例提供的一种数据库故障处理装置的结构示意图。
如图5所示,该数据库故障处理装置包括:获取模块601、确定模块602、检测模块603、修复模块604。
其中,获取模块601,用于检测到目标备用数据库出现故障,获取与目标备用数据库对应的服务器地址标识;
确定模块602,用于根据服务器地址标识,确定与目标备用数据库对应的上游节点地址标识和下游节点地址标识;
检测模块603,用于检测上游节点地址标识对应的上游业务数据库是否正常,和检测下游节点地址标识对应的下游业务数据库是否正常;
修复模块604,用于在上游业务数据库和下游业务数据库都正常时,则对上游业务数据库和下游业务数据库进行链路恢复配置操作。
在本发明的一个实施例中,获取模块601,具体用于:
获取主用数据库准备向所述目标备用数据库传输的携带数据标识的第一目标数据,根据所述目标数据生成第一编码;
根据所述数据标识从所述目标备用数据库上获取第二目标数据,根据所述第二目标数据生成第二编码;
按照预设算法对所述第一编码和所述第二编码进行计算,如果计算结果为预设的第一标识,则确定所述目标备用数据库故障为应用故障,如果计算结果为预设的第二标识,则确定所述目标备用数据库故障为服务器故障。
在本发明的一个实施例中,检测模块603,具体用于:
获取与所述上游节点地址标识对应的上游服务器,以及获取与所述下游节点地址标识对应的下游服务器;
查询预设的业务链路拓扑,在所述上游服务器获取与所述备用业务数据库对应的上游业务数据库,以及在所述下游服务器获取与所述备用业务数据库对应的下游业务数据库;
按照预设第一监控页面检测所述上游业务数据库的运行状态,以及
按照预设第二监控页面检测所述下游业务数据库的运行状态。
本发明在本发明的一个实施例中,修复模块604,具体用于:
获取上游业务数据库的上游业务数据;
将上游业务数据与下游业务数据库的下游业务数据进行比较;
如果比较结果不一致,则清除下游业务数据,并复制上游业务数据;
根据上游节点地址标识和下游节点地址标识连接上游业务数据库和下游业务数据库。
在本发明的一个实施例中,修复模块604,具体用于:
获取目标备用数据库的故障时间段;
向与目标备用数据库对应的主用数据库发送携带故障时间段的二次同步指令;
获取主用数据库发送的与故障时间段对应的信息,根据信息对目标备用数据库进行数据同步修复。
需要说明的是,前述对数据库故障处理方法实施例的解释说明也适用于该实施例的数据库故障处理装置,此处不再赘述。
综上所述,根据本公开实施例的数据库故障处理装置,检测到目标备用数据库出现故障时,获取与目标备用数据库对应的服务器地址标识,进而,根据服务器地址标识,确定与目标备用数据库对应的上游节点地址标识和下游节点地址标识,最后,检测上游节点地址标识对应的上游业务数据库是否正常,和检测下游节点地址标识对应的下游业务数据库是否正常,如果上游业务数据库和下游业务数据库都正常,则对上游业务数据库和下游业务数据库进行链路恢复配置操作。由此,实现在目标备用数据库出现故障时,根据上游业务数据库和下游业务数据库的连通来自动恢复链路,确保整个链路的正常,避免因中间的备用数据库中断而导致无法向下游进行数据备份传输。
为了实现上述实施例,本发明还提出一种计算机设备,包括:处理器,以及用于存储所述处理器可执行指令的存储器。
其中,处理器被配置为实现上述的数据库故障处理方法。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由计算机设备处理器被执行时,使得计算机设备能够执行一种数据库故障处理方法。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种数据库故障处理方法,其特征在于,包括以下步骤:
检测到目标备用数据库出现故障时,获取与所述目标备用数据库对应的服务器地址标识;
根据所述服务器地址标识,确定与所述目标备用数据库对应的上游节点地址标识和下游节点地址标识;
检测所述上游节点地址标识对应的上游业务数据库是否正常,和检测所述下游节点地址标识对应的下游业务数据库是否正常;
如果所述上游业务数据库和所述下游业务数据库都正常,则对所述上游业务数据库和所述下游业务数据库进行链路恢复配置操作。
2.如权利要求1所述的方法,其特征在于,所述检测到目标备用数据库出现故障,包括:
获取主用数据库准备向所述目标备用数据库传输的携带数据标识的第一目标数据,根据所述目标数据生成第一编码;
根据所述数据标识从所述目标备用数据库上获取第二目标数据,根据所述第二目标数据生成第二编码;
按照预设算法对所述第一编码和所述第二编码进行计算,如果计算结果为预设的第一标识,则确定所述目标备用数据库故障为应用故障,如果计算结果为预设的第二标识,则确定所述目标备用数据库故障为服务器故障。
3.如权利要求1所述的方法,其特征在于,所述根据所述上游节点地址标识检测对应的上游业务数据库是否正常,以及根据所述下游节点地址标识检测对应的下游业务数据库是否正常,包括:
获取与所述上游节点地址标识对应的上游服务器,以及获取与所述下游节点地址标识对应的下游服务器;
查询预设的业务链路拓扑,在所述上游服务器获取与所述备用业务数据库对应的上游业务数据库,以及在所述下游服务器获取与所述备用业务数据库对应的下游业务数据库;
按照预设第一监控页面检测所述上游业务数据库的运行状态,以及
按照预设第二监控页面检测所述下游业务数据库的运行状态。
4.如权利要求1所述的方法,其特征在于,对所述上游业务数据库和所述下游业务数据库进行链路恢复配置操作,包括:
获取所述上游业务数据库的上游业务数据;
将所述上游业务数据与所述下游业务数据库的下游业务数据进行比较;
如果比较结果不一致,则清除所述下游业务数据,并复制所述上游业务数据;
根据所述上游节点地址标识和所述下游节点地址标识连接所述上游业务数据库和所述下游业务数据库。
5.如权利要求1所述的方法,其特征在于,在对所述上游业务数据库和所述下游业务数据库进行链路恢复配置操作之后,还包括:
获取所述目标备用数据库的故障时间段;
向与所述目标备用数据库对应的主用数据库发送携带所述故障时间段的二次同步指令;
获取所述主用数据库发送的与所述故障时间段对应的信息,根据所述信息对所述目标备用数据库进行数据同步修复。
6.一种数据库故障处理装置,其特征在于,包括:
获取模块,用于检测到目标备用数据库出现故障,获取与所述目标备用数据库对应的服务器地址标识;
确定模块,用于根据所述服务器地址标识,确定与所述目标备用数据库对应的上游节点地址标识和下游节点地址标识;
检测模块,用于检测所述上游节点地址标识对应的上游业务数据库是否正常,和检测所述下游节点地址标识对应的下游业务数据库是否正常;
修复模块,用于在所述上游业务数据库和所述下游业务数据库都正常时,则对所述上游业务数据库和所述下游业务数据库进行链路恢复配置操作。
7.如权利要求6所述的装置,其特征在于,所述获取模块,具体用于:
获取主用数据库准备向所述目标备用数据库传输的携带数据标识的第一目标数据,根据所述目标数据生成第一编码;
根据所述数据标识从所述目标备用数据库上获取第二目标数据,根据所述第二目标数据生成第二编码;
按照预设算法对所述第一编码和所述第二编码进行计算,如果计算结果为预设的第一标识,则确定所述目标备用数据库故障为应用故障,如果计算结果为预设的第二标识,则确定所述目标备用数据库故障为服务器故障。
8.如权利要求6所述的装置,其特征在于,所述检测模块,具体用于:
获取与所述上游节点地址标识对应的上游服务器,以及获取与所述下游节点地址标识对应的下游服务器;
查询预设的业务链路拓扑,在所述上游服务器获取与所述备用业务数据库对应的上游业务数据库,以及在所述下游服务器获取与所述备用业务数据库对应的下游业务数据库;
按照预设第一监控页面检测所述上游业务数据库的运行状态,以及
按照预设第二监控页面检测所述下游业务数据库的运行状态。
9.如权利要求6所述的装置,其特征在于,所述修复模块,具体用于:
获取所述上游业务数据库的上游业务数据;
将所述上游业务数据与所述下游业务数据库的下游业务数据进行比较;
如果比较结果不一致,则清除所述下游业务数据,并复制所述上游业务数据;
根据所述上游节点地址标识和所述下游节点地址标识连接所述上游业务数据库和所述下游业务数据库。
10.如权利要求6所述的装置,其特征在于,所述修复模块,还用于:
获取所述目标备用数据库的故障时间段;
向与所述目标备用数据库对应的主用数据库发送携带所述故障时间段的二次同步指令;
获取所述主用数据库发送的与所述故障时间段对应的信息,根据所述信息对所述目标备用数据库进行数据同步修复。
11.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-5中任一所述的数据库故障处理方法。
12.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一所述的数据库故障处理方法。
CN202011167074.6A 2020-10-27 2020-10-27 数据库故障处理方法和装置 Pending CN114490565A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011167074.6A CN114490565A (zh) 2020-10-27 2020-10-27 数据库故障处理方法和装置
PCT/CN2021/113235 WO2022088861A1 (zh) 2020-10-27 2021-08-18 数据库故障处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011167074.6A CN114490565A (zh) 2020-10-27 2020-10-27 数据库故障处理方法和装置

Publications (1)

Publication Number Publication Date
CN114490565A true CN114490565A (zh) 2022-05-13

Family

ID=81381826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011167074.6A Pending CN114490565A (zh) 2020-10-27 2020-10-27 数据库故障处理方法和装置

Country Status (2)

Country Link
CN (1) CN114490565A (zh)
WO (1) WO2022088861A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115001952A (zh) * 2022-05-25 2022-09-02 中移互联网有限公司 一种业务接口的故障定位方法及装置
CN115514625A (zh) * 2022-09-23 2022-12-23 深信服科技股份有限公司 数据库集群管理方法、装置及系统
CN116418600A (zh) * 2023-06-09 2023-07-11 安徽华云安科技有限公司 节点安全运维方法、装置、设备以及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000075962A2 (en) * 1999-06-07 2000-12-14 Nortel Networks Limited Mechanism for splicing trees
CN100438447C (zh) * 2006-09-08 2008-11-26 华为技术有限公司 一种光网络lsp发生异常删除的恢复方法和装置
CN101192986A (zh) * 2006-11-28 2008-06-04 中兴通讯股份有限公司 一种自动交换光网络组播业务组播树的恢复方法
CN101945035A (zh) * 2009-07-10 2011-01-12 中兴通讯股份有限公司 基于路径计算元的跨域路径恢复方法和装置
CN105335245B (zh) * 2014-07-31 2019-02-01 华为技术有限公司 故障存储方法和装置、故障查找方法和装置
CN108897806A (zh) * 2018-06-15 2018-11-27 东软集团股份有限公司 数据一致性比对方法、装置、存储介质及电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115001952A (zh) * 2022-05-25 2022-09-02 中移互联网有限公司 一种业务接口的故障定位方法及装置
CN115001952B (zh) * 2022-05-25 2023-09-19 中移互联网有限公司 一种业务接口的故障定位方法及装置
CN115514625A (zh) * 2022-09-23 2022-12-23 深信服科技股份有限公司 数据库集群管理方法、装置及系统
CN116418600A (zh) * 2023-06-09 2023-07-11 安徽华云安科技有限公司 节点安全运维方法、装置、设备以及存储介质
CN116418600B (zh) * 2023-06-09 2023-08-15 安徽华云安科技有限公司 节点安全运维方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
WO2022088861A1 (zh) 2022-05-05

Similar Documents

Publication Publication Date Title
CN114490565A (zh) 数据库故障处理方法和装置
CN105933407B (zh) 一种实现Redis集群高可用的方法及系统
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
CN109726046B (zh) 机房切换方法及切换装置
CN112463448B (zh) 分布式集群数据库同步方法、装置、设备及存储介质
CN110532278B (zh) 声明式的MySQL数据库系统高可用方法
CN112506702B (zh) 数据中心容灾方法、装置、设备及存储介质
CN111857998A (zh) 一种可配置的定时任务调度方法及系统
US7278048B2 (en) Method, system and computer program product for improving system reliability
CN113360579A (zh) 数据库高可用处理方法、装置、电子设备及存储介质
CN104158843B (zh) 分布式文件存储系统的存储单元失效检测方法及装置
CN113055203B (zh) Sdn控制平面的异常恢复方法及装置
CN112202592A (zh) 告警延迟诊断方法、系统及可读存储介质
CN115686368A (zh) 区块链网络的节点的存储扩容的方法、系统、装置和介质
CN111078454A (zh) 一种云平台配置恢复方法及装置
CN113778763B (zh) 一种三方接口服务故障智能切换方法及系统
CN112491633B (zh) 一种多节点集群的故障恢复方法、系统及相关组件
CN107590647A (zh) 船舶管理系统的伺服监管系统
CN113157493A (zh) 基于检票系统的备份方法、装置、系统和计算机设备
CN111786806B (zh) 一种网元异常处理方法及网管系统
US20220342788A1 (en) Anomaly location estimating apparatus, method, and program
CN110569056B (zh) 一种规则服务信息的更新方法及装置
CN101106548A (zh) 实现多媒体消息业务系统存储容灾的装置及方法
CN111427718A (zh) 文件备份方法、恢复方法及装置
CN110278106B (zh) 一种用于Oracle数据库长距双活网络高可用的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination