CN116069605A - 一种数据库故障检测与恢复方法、产品、装置及存储介质 - Google Patents

一种数据库故障检测与恢复方法、产品、装置及存储介质 Download PDF

Info

Publication number
CN116069605A
CN116069605A CN202211695526.7A CN202211695526A CN116069605A CN 116069605 A CN116069605 A CN 116069605A CN 202211695526 A CN202211695526 A CN 202211695526A CN 116069605 A CN116069605 A CN 116069605A
Authority
CN
China
Prior art keywords
instance
node
fault
task flow
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211695526.7A
Other languages
English (en)
Inventor
章清亮
余伦强
刘建平
郑云
严程向
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Cloud Technology Co Ltd
Original Assignee
Tianyi Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Cloud Technology Co Ltd filed Critical Tianyi Cloud Technology Co Ltd
Priority to CN202211695526.7A priority Critical patent/CN116069605A/zh
Publication of CN116069605A publication Critical patent/CN116069605A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/36Software reuse
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据库故障检测与恢复方法、产品、装置及存储介质,涉及数据库故障恢复技术领域。该数据库故障检测与恢复方法,定时扫描MySQL获取实例节点信息,并通过ping命令调用底层接口进行节点实际探活;检测出实例故障并判断实例故障类型;封装任务流及任务流上下文信息;Zookeeper注册任务节点触发任务流执行,消除故障恢复实例状态。在云缓存数据库的管控中心,当检测到实例节点故障时自动触发恢复任务流,可实现对实例服务及其实例底层节点的自恢复处理,增强智能化节约了时间,从而保障服务恢复的时效性及实例节点的高可用性,解决了人工过多介入和哨兵模式的部署复杂、不支持节点恢复等弊端问题。

Description

一种数据库故障检测与恢复方法、产品、装置及存储介质
技术领域
本发明涉及数据库故障恢复技术领域,尤其涉及一种数据库故障检测与恢复方法、产品、装置及存储介质。
背景技术
目前,使用最广泛的云缓存数据库当属开源Redis以及各云厂商基于Redis协议的衍生自研产品,一般支持单机版、主备版、只读版及其集群版等不同规格的实例部署形态,对于故障检测与恢复方案相对单一。其中,对于单机和单纯的主备一般不支持自动故障恢复功能,往往需要人工介入处理;相对常用的支持故障检测恢复功能的是哨兵集群模式,通过哨兵集群来监控实例节点的存活状态,当发现有节点客观下线后对其自动做主备切换处理以实现对应用侧的高可用功能。
但哨兵集群模式存在一定的弊端:除实例节点外还需部署哨兵集群,部署模式相对复杂,资源占用更高;哨兵模式只能实现通过对主备节点的自动切换以实现服务恢复功能而无法实现对故障节点的自动恢复功能;哨兵模式对应用侧客户端有一定兼容性要求。
发明内容
本申请实施例通过提供一种数据库故障检测与恢复方法、产品、装置及存储介质,解决了现有技术中人工过多介入和哨兵模式的部署复杂、不支持节点恢复等弊端问题,实现了对实例服务及其实例底层节点的自恢复处理。
本申请实施例提供了一种数据库故障检测与恢复方法,包括以下步骤:
S1、定时扫描MySQL获取实例节点信息,并通过ping命令调用底层接口进行节点实际探活;
S2、检测出实例故障并判断实例故障类型;
S3、封装任务流及任务流上下文信息;
S4、Zookeeper注册任务节点触发任务流执行,消除故障恢复实例状态。
进一步地,所述S1中定时扫描MySQL获取实例节点信息的具体步骤包括:
S11、保存实例包含的节点信息为MySQL数据表中的实例节点信息表;
S12、定时扫描MySQL实例节点信息表获取实例节点信息。
进一步地,所述S2具体包括以下步骤:
S21、检测到节点实际存活状态异常时,更新节点对应的实例状态为异常;
S22、根据故障节点所属的实例类型和节点类型判断实例故障类型。
进一步地,所述S2中实例故障类型包括:单机版实例节点故障、主备版实例主节点故障、主备版实例备节点故障、主备版实例只读节点故障、集群版实例分片主节点故障、集群版实例分片备节点故障、集群版实例代理节点故障类型。
进一步地,所述S3具体包括以下步骤:
S31、创建实例故障类型对应的恢复处理任务流;
S32、保存任务流上下文信息到MySQL的任务流相关信息表中。
进一步地,所述S32中任务流相关信息表包括:任务流表和任务步骤表,所述任务流表是任务流的整体调度上下文信息,所述任务步骤表是组成任务流中各个任务步骤的上下文信息。
进一步地,所述S4具体包括以下步骤:
S41、Zookeeper注册任务流任务ID到任务调度监听目录节点中;
S42、通过Zookeeper的节点监听机制触发任务流调度执行,实现自动恢复处理实例故障。
一种云缓存数据库MemDB产品,包括Redis实例节点、管控中心服务、统一访问层、MySQL、Zookeeper,其中:
Redis实例节点是产品架构底层,管控中心服务是产品中间层,管控中心服务与MySQL和Zookeeper相连,统一访问层是产品上层;
管控中心服务,负责内部实例节点关系、任务流组织功能的逻辑处理调度;
统一访问层,包含实例节点具体连接信息;
MySQL和Zookeeper,存储实例信息、节点状态、任务流步骤、各任务上下文信息。
一种数据库故障检测与恢复装置,包括巡检探活模块,实例故障模块,任务流模块,调度执行模块,其中:
巡检探活模块,用于定时扫描MySQL获取实例节点信息,并通过ping命令调用底层接口进行节点实际探活;
实例故障模块,用于检测出实例故障并判断实例故障类型;
任务流模块,用于封装任务流及任务流上下文信息;
调度执行模块,用于Zookeeper注册任务节点触发任务流执行,消除故障恢复实例状态。
一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现任一项所述的数据库故障检测与恢复方法。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
保存任务流上下文信息,可以对故障恢复任务流做多重处理,抽象故障恢复处理流程的相同步骤为模块,可以实现代码复用,便于开发实现也便于后期维护,增强了编码的简易性和健壮性;
利用管控中心进行巡检探活、自动触发恢复任务流,使对云缓存数据库产品的故障检测和自恢复处理更加便捷智能,解决了过多的人工干预、传统哨兵集群的复杂部署、额外占用资源的问题;
每种故障类型可梳理出一套恢复处理流程,使可支持和自恢复处理的故障类型更加丰富,产品的故障处理扩展性更强。
附图说明
图1为本发明云缓存数据库故障检测与恢复主流程图;
图2为本发明云缓存数据库故障检测与恢复流程图;
图3为本发明云缓存数据库MemDB产品架构图;
图4为本发明云缓存数据库主备版实例主节点故障恢复流程图。
具体实施方式
本发明专利创造性的提出一种数据库故障检测与恢复方法,通过定时任务利用ping命令机制实现对所有实例节点状态的巡检探活,当检测到实例节点故障时自动触发故障类型对应的恢复任务流,可实现对实例服务及其实例底层节点的自恢复处理,增强智能化节约了时间,从而保障服务恢复的时效性及实例节点的高可用性,解决了人工过多介入和哨兵模式的部署复杂、不支持节点恢复等弊端问题。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一
一种数据库故障检测与恢复方法,包括以下步骤:
S1、定时扫描MySQL获取实例节点信息,并通过ping命令调用底层接口进行节点实际探活;
S2、检测出实例故障并判断实例故障类型;
S3、封装任务流及任务流上下文信息;
S4、Zookeeper注册任务节点触发任务流执行,消除故障恢复实例状态。
在本实施例中,如图1所示,云缓存数据库MemDB开通创建实例时,将实例的基本信息、包含的节点信息保存到MySQL数据表中,通过定时调度任务,定时扫描MySQL数据表获取实例节点信息,并通过ping命令机制对实例节点进行巡检探活,当定时巡检到节点状态异常时,根据故障节点判断实例故障类型,创建对应的恢复处理任务流,通过zookeeper触发任务流调度执行,实现自动恢复实例故障。
S1中定时扫描MySQL获取实例节点信息的具体步骤包括:
S11、保存实例包含的节点信息为MySQL数据表中的实例节点信息表;
S12、定时扫描MySQL实例节点信息表获取实例节点信息。
在本实施例中,产品实例开通创建时,将实例基本信息、包含的节点信息保存到MySQL中,产品的管控中心服务通过维护定时调度任务,定时扫描MySQL实例节点信息表获取正常状态实例节点信息。
S2具体包括以下步骤:
S21、检测到节点实际存活状态异常时,更新节点对应的实例状态为异常;
S22、根据故障节点所属的实例类型和节点类型判断实例故障类型。
S2中实例故障类型包括:单机版实例节点故障、主备版实例主节点故障、主备版实例备节点故障、主备版实例只读节点故障、集群版实例分片主节点故障、集群版实例分片备节点故障、集群版实例代理节点故障类型。
在本实施例中,管控中心服务定时通过ping命令机制调用底层接口对实际节点进行巡检探活,当巡检探测节点实际存活状态异常时会更新对应的实例状态为异常并根据故障节点所属的实例类型和节点类型判断实例故障类型,具体包括单机版实例节点故障、主备版实例主节点故障、主备版实例备节点故障、主备版实例只读节点故障、集群版实例分片主节点故障、集群版实例分片备节点故障、集群版实例代理节点故障类型。
S3具体包括以下步骤:
S31、创建实例故障类型对应的恢复处理任务流;
S32、保存任务流上下文信息到MySQL的任务流相关信息表中。
S32中任务流相关信息表包括:任务流表和任务步骤表,所述任务流表是任务流的整体调度上下文信息,所述任务步骤表是组成任务流中各个任务步骤的上下文信息。
在本实施例中,如图2所示,判断出故障类型之后会创建其对应的恢复处理任务流并将上下文信息保存到MySQL的任务流相关信息表中,具体包括任务流表和任务步骤表,前者是任务流的整体调度上下文信息,后者是组成任务流中各个任务步骤的上下文信息。在具体代码实现层面,每种实例故障类型均可梳理出一套恢复处理任务流,每套任务流包含多个任务步骤,每个任务步骤可抽象出一个操作类或操作函数接口,对于不同故障恢复任务流中的相同步骤就可以在代码实现上做到最大化的复用,通过每个步骤对应保存在MySQL中的上下文信息,可以做到对故障处理任务步骤的中断恢复、重试等流程处理的幂等与接续操作。
S4具体包括以下步骤:
S41、Zookeeper注册任务流任务ID到任务调度监听目录节点中;
S42、通过Zookeeper的节点监听机制触发任务流调度执行,实现自动恢复处理实例故障。
在本实施例中,如图2所示,在MySQL中保存任务流上下文信息后将任务ID注册到zookeeper的任务调度监听目录中,利用zookeeper的节点监听机制进而触发不同任务流的调度执行,从而实现对实例不同故障的自动恢复处理操作。
一种云缓存数据库MemDB产品,包括Redis实例节点、管控中心服务、统一访问层、MySQL、Zookeeper,其中:
Redis实例节点是产品架构底层,管控中心服务是产品中间层,管控中心服务与MySQL和Zookeeper相连,统一访问层是产品上层;
管控中心服务,负责内部实例节点关系、任务流组织功能的逻辑处理调度;
统一访问层,包含实例节点具体连接信息;
MySQL和Zookeeper,存储实例信息、节点状态、任务流步骤、各任务上下文信息。
在本实施例中,如图3所示,整体产品架构模式为,底层是Redis实例节点;上层是封装了实例节点具体连接信息的统一访问层对外提供服务;中间通过一套管控中心服务来负责内部实例节点关系、任务流组织等功能的逻辑处理调度,管控中心服务通过维护定时调度任务,对实例节点进行巡检探活,检测到实例故障判断出实例故障类型后,创建对应的恢复处理任务流;实例信息、节点状态、任务流步骤、各任务上下文等信息存储在MySQL和Zookeeper中。
一种数据库故障检测与恢复装置,包括巡检探活模块,实例故障模块,任务流模块,调度执行模块,其中:
巡检探活模块,用于定时扫描MySQL获取实例节点信息,并通过ping命令调用底层接口进行节点实际探活;
实例故障模块,用于检测出实例故障并判断实例故障类型;
任务流模块,用于封装任务流及任务流上下文信息;
调度执行模块,用于Zookeeper注册任务节点触发任务流执行,消除故障恢复实例状态。
一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现任一项所述的数据库故障检测与恢复方法。
在本实施例中,通过巡检探活模块完成对实例节点的实际探活,寻找存活状态异常的节点,在实例故障模块完成检测判断实例故障,检测到实例故障时触发故障类型对应的恢复任务流,在任务流模块执行故障类型对应的恢复任务流,在调度执行模块完成对实例服务及其底层节点的自恢复处理,实现对实例故障的自动恢复处理操作。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
利用管控中心的巡检探活和任务流机制,通过预置程式化的故障恢复任务处理流程,使对云缓存数据库产品的故障检测和自恢复处理更加便捷智能,避免了过多的人工干预和传统哨兵集群的复杂部署以及对资源的额外占用;
通过对不同故障类型映射构建恢复处理任务流,将每个任务步骤的粒度细化,使自恢复处理操作精准可控,并且借助MySQL对任务流上下文信息的存储,可以实现对自恢复任务流的中断、重试等幂等和接续操作。
实施例二
如图4所示,主备版实例主节点故障检测与自恢复处理过程如下:
在主机资源后台手动将主节点宕掉,通过管控中心服务定时巡检探活判断主节点客观下线,创建对应的故障恢复任务流,通过zookeeper注册监听机制触发执行,执行步骤如下:
更新实例状态为故障恢复中,更新统一访问层Haproxy等配置,备节点信息替换掉故障主节点信息;
切换实例节点角色,断开原来备节点到故障主节点的附属关系,备节点升级为新主节点;
清理原来的故障主节点,在原来的故障主节点所在资源主机上新建一个同规格的实例节点;
将新建的实例节点建立到新升级的主节点的附属关系并等待节点间数据同步完成;
更新实例状态为正常运行状态,完成故障自恢复处理任务流。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
不仅支持对实例节点故障时的主备切换,还支持对故障节点的重建恢复,如主备版实例的主节点发生故障挂掉时,通过任务流恢复机制,借助统一访问层会先将原来的备切换为主并对外提供服务,同时会在原来的资源主机上重新创建一个同规格的节点作为新的备节点并挂载到新主节点(即最初的备节点)上去,最终使实例整体状态恢复如初。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种数据库故障检测与恢复方法,其特征在于,包括以下步骤:
S1、定时扫描MySQL获取实例节点信息,并通过ping命令调用底层接口进行节点实际探活;
S2、检测出实例故障并判断实例故障类型;
S3、封装任务流及任务流上下文信息;
S4、Zookeeper注册任务节点触发任务流执行,消除故障恢复实例状态。
2.如权利要求1所述的一种数据库故障检测与恢复方法,其特征在于,所述S1中定时扫描MySQL获取实例节点信息的具体步骤包括:
S11、保存实例包含的节点信息为MySQL数据表中的实例节点信息表;
S12、定时扫描MySQL实例节点信息表获取实例节点信息。
3.如权利要求1所述的一种数据库故障检测与恢复方法,其特征在于,所述S2具体包括以下步骤:
S21、检测到节点实际存活状态异常时,更新节点对应的实例状态为异常;
S22、根据故障节点所属的实例类型和节点类型判断实例故障类型。
4.如权利要求1所述的一种数据库故障检测与恢复方法,其特征在于,所述S2中实例故障类型包括:单机版实例节点故障、主备版实例主节点故障、主备版实例备节点故障、主备版实例只读节点故障、集群版实例分片主节点故障、集群版实例分片备节点故障、集群版实例代理节点故障类型。
5.如权利要求1所述的一种数据库故障检测与恢复方法,其特征在于,所述S3具体包括以下步骤:
S31、创建实例故障类型对应的恢复处理任务流;
S32、保存任务流上下文信息到MySQL的任务流相关信息表中。
6.如权利要求5所述的一种数据库故障检测与恢复方法,其特征在于,所述S32中任务流相关信息表包括:任务流表和任务步骤表,所述任务流表是任务流的整体调度上下文信息,所述任务步骤表是组成任务流中各个任务步骤的上下文信息。
7.如权利要求1所述的一种数据库故障检测与恢复方法,其特征在于,所述S4具体包括以下步骤:
S41、Zookeeper注册任务流任务ID到任务调度监听目录节点中;
S42、通过Zookeeper的节点监听机制触发任务流调度执行,实现自动恢复处理实例故障。
8.一种云缓存数据库MemDB产品,其特征在于,包括Redis实例节点、管控中心服务、统一访问层、MySQL、Zookeeper,其中:
Redis实例节点是产品架构底层,管控中心服务是产品中间层,管控中心服务与MySQL和Zookeeper相连,统一访问层是产品上层;
管控中心服务,负责内部实例节点关系、任务流组织功能的逻辑处理调度;
统一访问层,包含实例节点具体连接信息;
MySQL和Zookeeper,存储实例信息、节点状态、任务流步骤、各任务上下文信息。
9.一种数据库故障检测与恢复装置,其特征在于,包括巡检探活模块,实例故障模块,任务流模块,调度执行模块,其中:
巡检探活模块,用于定时扫描MySQL获取实例节点信息,并通过ping命令调用底层接口进行节点实际探活;
实例故障模块,用于检测出实例故障并判断实例故障类型;
任务流模块,用于封装任务流及任务流上下文信息;
调度执行模块,用于Zookeeper注册任务节点触发任务流执行,消除故障恢复实例状态。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现权利要求1至7中任一项所述的数据库故障检测与恢复方法。
CN202211695526.7A 2022-12-28 2022-12-28 一种数据库故障检测与恢复方法、产品、装置及存储介质 Pending CN116069605A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211695526.7A CN116069605A (zh) 2022-12-28 2022-12-28 一种数据库故障检测与恢复方法、产品、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211695526.7A CN116069605A (zh) 2022-12-28 2022-12-28 一种数据库故障检测与恢复方法、产品、装置及存储介质

Publications (1)

Publication Number Publication Date
CN116069605A true CN116069605A (zh) 2023-05-05

Family

ID=86175410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211695526.7A Pending CN116069605A (zh) 2022-12-28 2022-12-28 一种数据库故障检测与恢复方法、产品、装置及存储介质

Country Status (1)

Country Link
CN (1) CN116069605A (zh)

Similar Documents

Publication Publication Date Title
CN106713487B (zh) 数据的同步方法和装置
CN109558234B (zh) 一种定时任务调度方法和装置
CN112667362B (zh) Kubernetes上部署Kubernetes虚拟机集群的方法与系统
CN102868736B (zh) 一种云计算监控框架设计及实现方法及云计算处理设备
CN109656742B (zh) 一种节点异常处理方法、装置及存储介质
WO2020248507A1 (zh) 基于容器云的系统资源监控方法及相关设备
CN109286529B (zh) 一种恢复RabbitMQ网络分区的方法及系统
CA2538559A1 (en) Server system and online software update method
CN102681917A (zh) 一种操作系统及其修复方法
CN111984274B (zh) 一种一键自动化部署etcd集群的方法及装置
CN113204353B (zh) 一种大数据平台组件部署方法及装置
US11809276B2 (en) Container-based stateful application resilience to node failure
CN115297124B (zh) 一种系统运维管理方法、装置及电子设备
CN105589756A (zh) 批处理集群系统以及方法
CN117130730A (zh) 面向联邦Kubernetes集群的元数据管理方法
CN114064217B (zh) 一种基于OpenStack的节点虚拟机迁移方法及装置
CN111611048A (zh) 云计算环境中虚拟机的迁移方法、装置和计算机设备
CN112600690B (zh) 一种配置数据同步方法、装置、设备及存储介质
CN113157701A (zh) 一种oracle数据库的双活机制部署方法及装置
CN116069605A (zh) 一种数据库故障检测与恢复方法、产品、装置及存储介质
CN112131188A (zh) 批量文件分发处理方法及装置
CN111897626A (zh) 一种面向云计算场景的虚拟机高可靠系统和实现方法
CN109116818B (zh) 一种scada系统升级时的实时数据转储方法和装置
CN109150596B (zh) 一种scada系统实时数据转储方法和装置
US20150244780A1 (en) System, method and computing apparatus to manage process in cloud infrastructure

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination