CN113778753B - 一种存储恢复后自动修正数据库方法、装置、设备及介质 - Google Patents

一种存储恢复后自动修正数据库方法、装置、设备及介质 Download PDF

Info

Publication number
CN113778753B
CN113778753B CN202111072054.5A CN202111072054A CN113778753B CN 113778753 B CN113778753 B CN 113778753B CN 202111072054 A CN202111072054 A CN 202111072054A CN 113778753 B CN113778753 B CN 113778753B
Authority
CN
China
Prior art keywords
storage
node
disk
program
storage node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111072054.5A
Other languages
English (en)
Other versions
CN113778753A (zh
Inventor
李建辉
严青
张文件
陈栋
罗春
魏兴华
吴炎
臧冰凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Woqu Technology Co ltd
Original Assignee
Hangzhou Woqu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Woqu Technology Co ltd filed Critical Hangzhou Woqu Technology Co ltd
Priority to CN202111072054.5A priority Critical patent/CN113778753B/zh
Publication of CN113778753A publication Critical patent/CN113778753A/zh
Application granted granted Critical
Publication of CN113778753B publication Critical patent/CN113778753B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/24569Query processing with adaptation to specific hardware, e.g. adapted for using GPUs or SSDs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据库技术领域,公开了一种存储恢复后自动修正数据库方法、装置、设备及介质,包括:在存储节点安装通知程序,在计算节点安装自动恢复程序;通知程序用于在存储节点重启时通知到计算节点,对计算节点进行在线检查和恢复oracleasm磁盘组;如果磁盘没有挂载上,则针将该存储节点的磁盘挂载到本地,查出该存储节点在oracle_asm里的所有磁盘组,并对所有磁盘组进行检查是否有offline的磁盘组,如果有,则将offline状态的磁盘组更改为online,直到所有磁盘组online完成。本发明在计算存储分离的架构中,将数据保存在存储节点上,计算节点接受业务并在存储节点上存储数据,存储节点之间各为副本,保证数据库磁盘组的副本完整。保证数据的稳定和安全。

Description

一种存储恢复后自动修正数据库方法、装置、设备及介质
技术领域
本发明涉及数据库技术领域,尤其涉及了一种存储恢复后自动修正数据库方法、装置、设备及介质。
背景技术
目前在计算存储分离的集群中,oracle数据库搭建在计算节点上,对外提供服务,将存储节点的磁盘挂载到计算节点上,作为oracle数据库的磁盘组,每个存储节点的磁盘都相互作为副本存在。
但是,现有的数据在该集群架构下,如果存储节点发生重启,计算节点没有及时的将存储节点的磁盘挂载并加入到oracle asm磁盘组里,存在数据丢失的风险,导致数据不安全。
发明内容
本发明针对现有技术中的缺点,提供了一种存储恢复后自动修正数据库方法、装置、设备及介质。
为解决上述现有技术中存在的缺陷和不足,本申请提供一种保持数据库热点数据方法,包括步骤如下:
一种存储恢复后自动修正数据库方法,包括如下步骤:
在存储节点安装通知程序,在计算节点安装自动恢复程序;
通知程序用于在存储节点重启时通知到计算节点,过程包括:
获取集群内所有计算节点IP信息;
按启动顺序根据IP信息调用计算节点上自动恢复程序并对调用结果进行判断,自动恢复程序用于对计算节点进行在线检查和恢复oracle asm磁盘组,检查过程包括:
计算节点接收存储节点发来重启通知信息,并检查发通知的存储节点磁盘是否已经挂载到本节点;
如果磁盘没有挂载上,则针将该存储节点的磁盘挂载到本地,查出该存储节点在oracle_asm里的所有磁盘组,并对所有磁盘组进行检查是否有offline的磁盘组,如果有,则将offline状态的磁盘组更改为online,直到所有磁盘组online完成。
作为优选,安装通知程序后,存储节点已经完成重启并在后续linux开机自启动流程里加上调用通知程序步骤。
作为优选,安装自动恢复程序后,计算节点提供api接口用于存储节点调用。
作为优选,当存储节点因为异常发生重启后,会自动调用通知程序,分别通知各个计算节点本存储节点发生重启,如果通知失败,则记录调用失败日志并退出程序。
作为优选,步骤按顺序调用计算节点上自动恢复程序并对调用结果进行判断,还包括对调用是否成功进行判断,如果调用不成功,则直接退出程序,并记录相关日志。
作为优选,还包括步骤,自动恢复程序将会自动退出并记录日志,等待下次存储节点发生异常重启后再继续检查和恢复磁盘组。
为解决上述技术问题,本申请还提供一种存储恢复后自动修正数据库装置,包括:
安装模块,用于在存储节点安装通知程序,在计算节点安装自动恢复程序;
通知检查模块,用于在存储节点重启时通知到计算节点,过程包括:
获取集群内所有计算节点IP信息;
按启动顺序根据IP信息调用计算节点上自动恢复程序并对调用结果进行判断,自动恢复程序用于对计算节点进行在线检查和恢复oracle asm磁盘组,检查过程包括:
计算节点接收存储节点发来重启通知信息,并检查发通知的存储节点磁盘是否已经挂载到本节点;
状态检查模块,如果磁盘没有挂载上,则针将该存储节点的磁盘挂载到本地,查出该存储节点在oracle_asm里的所有磁盘组,并对所有磁盘组进行检查是否有offline的磁盘组,如果有,则将offline状态的磁盘组更改为online,直到所有磁盘组online完成。
为解决上述技术问题,本申请还提供一种存储恢复后自动修正数据库设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述的存储恢复后自动修正数据库方法的步骤。
为解决上述技术问题,本申请还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时实现如上述的存储恢复后自动修正数据库方法的步骤。
本发明由于采用了以上技术方案,具有显著的技术效果:本发明在计算存储分离的架构中,将数据保存在存储节点上,计算节点接受业务并在存储节点上存储数据,存储节点之间各为副本。当存储节点如果发生重启,计算节点如果没有及时将存储节点输上来的磁盘进行online,将会有数据丢失的风险。所以本发明为了解决这个业务痛点,在存储节点重启完成后,及时通知到计算节点,计算节点及时将存储节点的磁盘进行online,保证数据库磁盘组的副本完整。保证数据的稳定和安全。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明一种存储恢复后自动修正数据库方法的流程示意图;
图2是本发明一种存储恢复后自动修正数据库方法的状态判断示意图;
图3是本发明一种存储恢复后自动修正数据库装置结构图;
图4是本发明一种存储恢复后自动修正数据库设备结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。
实施例1
如图1至图2所示,其出示了一种存储恢复后自动修正数据库方法,包括如下步骤如下:
一种存储恢复后自动修正数据库方法,包括如下步骤:
在存储节点安装通知程序,在计算节点安装自动恢复程序;
通知程序用于在存储节点重启时通知到计算节点,过程包括:
获取集群内所有计算节点IP信息;
按启动顺序根据IP信息调用计算节点上自动恢复程序并对调用结果进行判断,自动恢复程序用于对计算节点进行在线检查和恢复oracle asm磁盘组,检查过程包括:
计算节点接收存储节点发来重启通知信息,并检查发通知的存储节点磁盘是否已经挂载到本节点;
如果磁盘没有挂载上,则针将该存储节点的磁盘挂载到本地,查出该存储节点在oracle_asm里的所有磁盘组,并对所有磁盘组进行检查是否有offline的磁盘组,如果有,则将offline状态的磁盘组更改为online,直到所有磁盘组online完成。
安装通知程序后,存储节点已经完成重启并在后续linux开机自启动流程里加上调用通知程序步骤。
安装自动恢复程序后,计算节点提供api接口用于存储节点调用。
当存储节点因为异常发生重启后,会自动调用通知程序,分别通知各个计算节点本存储节点发生重启,如果通知失败,则记录调用失败日志并退出程序。
步骤按顺序调用计算节点上自动恢复程序并对调用结果进行判断,还包括对调用是否成功进行判断,如果调用不成功,则直接退出程序,并记录相关日志。
还包括步骤,自动恢复程序将会自动退出并记录日志,等待下次存储节点发生异常重启后再继续检查和恢复磁盘组。
实施例2
在一套2+3(2个计算节点,3个存储节点)的集群架构中。计算节点上安装oraclerac集群以及数据库,提供服务。存储节点提供数据磁盘作为数据存储。3个存储节点作为oracle asm磁盘组的norma冗余模式,如果存储节点发生重启,在计算节点上没有及时将重启的存储节点磁盘挂载并恢复该存储节点所在的asm磁盘组,这样oracle数据库就少了一个副本存在,如果再有一台存储节点发生故障,那么就会造成数据丢失。
为了防止出现以上描述风险,在集群部署完成后,分别在所有存储节点上安装通知程序,所有计算节点安装自动恢复程序。在存储节点因为异常发生重启后,会自动调用通知程序,分别通知各个计算节点本存储节点发生重启。如果通知失败,则记录调用失败日志并退出程序,不会对存储节点运行造成任何影响,计算节点自动恢复程序接收到存储节点的调动通知后,会立马检查该存储节点的磁盘是否已经挂载到本计算节点。如果没有,则先执行挂载磁盘操作。磁盘挂载无误后,继续检查oracle asm磁盘组,查看是否有offline的磁盘组,如果有,则将offline的磁盘组进行online恢复,保证能正常提供数据存储功能。执行完online后或者没有查到有offline的磁盘组,自动恢复程序将会自动退出并记录日志,等待下次存储节点发生异常重启后再继续检查和恢复磁盘组。
实施例3
相应的,本申请实施例还公开了一种存储恢复后自动修正数据库装置,如图3所示,基于功能模块的角度,该装置包括:
安装模块11,用于在存储节点安装通知程序,在计算节点安装自动恢复程序;
通知检查模块12,用于在存储节点重启时通知到计算节点,过程包括:
获取集群内所有计算节点IP信息;
按启动顺序根据IP信息调用计算节点上自动恢复程序并对调用结果进行判断,自动恢复程序用于对计算节点进行在线检查和恢复oracle asm磁盘组,检查过程包括:
计算节点接收存储节点发来重启通知信息,并检查发通知的存储节点磁盘是否已经挂载到本节点;
状态检查模块13,如果磁盘没有挂载上,则针将该存储节点的磁盘挂载到本地,查出该存储节点在oracle_asm里的所有磁盘组,并对所有磁盘组进行检查是否有offline的磁盘组,如果有,则将offline状态的磁盘组更改为online,直到所有磁盘组online完成。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
安装模块11中,通知程序后,存储节点已经完成重启并在后续linux开机自启动流程里加上调用通知程序步骤。
安装模块11中,安装自动恢复程序后,计算节点提供api接口用于存储节点调用。
通知检查模块12中,当存储节点因为异常发生重启后,会自动调用通知程序,分别通知各个计算节点本存储节点发生重启,如果通知失败,则记录调用失败日志并退出程序。
状态检查模块13中,步骤按顺序调用计算节点上自动恢复程序并对调用结果进行判断,还包括对调用是否成功进行判断,如果调用不成功,则直接退出程序,并记录相关日志。
还包括异常日志模块,自动恢复程序将会自动退出并记录日志,等待下次存储节点发生异常重启后再继续检查和恢复磁盘组。
实施例4
本申请实施例还提供一种电子设备,如图4所示,其示出了本申请实施例提供的一种存储恢复后自动修正数据库设备的结构示意图,包括:
存储器21,用于存储计算机程序;
处理器22,用于执行所述计算机程序时实现上述的存储恢复后自动修正数据库方法的步骤:
在存储节点安装通知程序,在计算节点安装自动恢复程序;
通知程序用于在存储节点重启时通知到计算节点,过程包括:
获取集群内所有计算节点IP信息;
按启动顺序根据IP信息调用计算节点上自动恢复程序并对调用结果进行判断,自动恢复程序用于对计算节点进行在线检查和恢复oracle asm磁盘组,检查过程包括:
计算节点接收存储节点发来重启通知信息,并检查发通知的存储节点磁盘是否已经挂载到本节点;
如果磁盘没有挂载上,则针将该存储节点的磁盘挂载到本地,查出该存储节点在oracle_asm里的所有磁盘组,并对所有磁盘组进行检查是否有offline的磁盘组,如果有,则将offline状态的磁盘组更改为online,直到所有磁盘组online完成。
实施例5
本申请实施例还提供了一种计算机可读存储介质,用于存储计算机程序;其中计算机程序被处理器执行时可实现如下步骤:
在存储节点安装通知程序,在计算节点安装自动恢复程序;
通知程序用于在存储节点重启时通知到计算节点,过程包括:
获取集群内所有计算节点IP信息;
按启动顺序根据IP信息调用计算节点上自动恢复程序并对调用结果进行判断,自动恢复程序用于对计算节点进行在线检查和恢复oracle asm磁盘组,检查过程包括:
计算节点接收存储节点发来重启通知信息,并检查发通知的存储节点磁盘是否已经挂载到本节点;
如果磁盘没有挂载上,则针将该存储节点的磁盘挂载到本地,查出该存储节点在oracle_asm里的所有磁盘组,并对所有磁盘组进行检查是否有offline的磁盘组,如果有,则将offline状态的磁盘组更改为online,直到所有磁盘组online完成。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例提供的一种多备份任务动态调度方法、装置、设备及介质中相关部分的说明可以参见本申请实施例提供的一种多备份任务动态调度方法中对应部分的详细说明,在此不再赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种存储恢复后自动修正数据库方法,其特征在于,包括如下步骤:
在存储节点安装通知程序,在计算节点安装自动恢复程序;
通知程序用于在存储节点重启时通知到计算节点,过程包括:
获取集群内所有计算节点IP信息;
按启动顺序根据IP信息调用计算节点上自动恢复程序并对调用结果进行判断,自动恢复程序用于对计算节点进行在线检查和恢复oracle asm磁盘组,检查过程包括:
计算节点接收存储节点发来重启通知信息,并检查发通知的存储节点磁盘是否已经挂载到本节点;
如果磁盘没有挂载上,则将该存储节点的磁盘挂载到本地,查出该存储节点在oracle_asm里的所有磁盘组,并对所有磁盘组进行检查是否有offline的磁盘组,如果有,则将offline状态的磁盘组更改为online,直到所有磁盘组online完成。
2.根据权利要求1所述的一种存储恢复后自动修正数据库方法,其特征在于:安装通知程序后,存储节点已经完成重启并在后续linux开机自启动流程里加上调用通知程序步骤。
3.根据权利要求1所述的一种存储恢复后自动修正数据库方法,其特征在于:安装自动恢复程序后,计算节点提供api接口用于存储节点调用。
4.根据权利要求1所述的一种存储恢复后自动修正数据库方法,其特征在于:当存储节点因为异常发生重启后,会自动调用通知程序,分别通知各个计算节点本存储节点发生重启,如果通知失败,则记录调用失败日志并退出程序。
5.根据权利要求1所述的一种存储恢复后自动修正数据库方法,其特征在于:步骤按顺序调用计算节点上自动恢复程序并对调用结果进行判断,还包括对调用是否成功进行判断,如果调用不成功,则直接退出程序,并记录相关日志。
6.根据权利要求1所述的一种存储恢复后自动修正数据库方法,其特征在于:还包括步骤,自动恢复程序将会自动退出并记录日志,等待下次存储节点发生异常重启后再继续检查和恢复磁盘组。
7.一种存储恢复后自动修正数据库装置,其特征在于,包括:
安装模块,用于在存储节点安装通知程序,在计算节点安装自动恢复程序;
通知检查模块,用于在存储节点重启时通知到计算节点,过程包括:
获取集群内所有计算节点IP信息;
按启动顺序根据IP信息调用计算节点上自动恢复程序并对调用结果进行判断,自动恢复程序用于对计算节点进行在线检查和恢复oracle asm磁盘组,检查过程包括:
计算节点接收存储节点发来重启通知信息,并检查发通知的存储节点磁盘是否已经挂载到本节点;
状态检查模块,如果磁盘没有挂载上,则将该存储节点的磁盘挂载到本地,查出该存储节点在oracle_asm里的所有磁盘组,并对所有磁盘组进行检查是否有offline的磁盘组,如果有,则将offline状态的磁盘组更改为online,直到所有磁盘组online完成。
8.一种存储恢复后自动修正数据库设备,其特征在于,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述的存储恢复后自动修正数据库方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的存储恢复后自动修正数据库方法的步骤。
CN202111072054.5A 2021-09-14 2021-09-14 一种存储恢复后自动修正数据库方法、装置、设备及介质 Active CN113778753B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111072054.5A CN113778753B (zh) 2021-09-14 2021-09-14 一种存储恢复后自动修正数据库方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111072054.5A CN113778753B (zh) 2021-09-14 2021-09-14 一种存储恢复后自动修正数据库方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113778753A CN113778753A (zh) 2021-12-10
CN113778753B true CN113778753B (zh) 2024-05-03

Family

ID=78843420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111072054.5A Active CN113778753B (zh) 2021-09-14 2021-09-14 一种存储恢复后自动修正数据库方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113778753B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102955720A (zh) * 2011-08-25 2013-03-06 北京中科智网科技有限公司 一种提高ext文件系统稳定性的方法
CN103067485A (zh) * 2012-12-25 2013-04-24 曙光信息产业(北京)有限公司 云存储系统的磁盘监控方法
CN105630639A (zh) * 2015-12-25 2016-06-01 北京同有飞骥科技股份有限公司 一种双机集群的节点热替换方法
WO2017162178A1 (zh) * 2016-03-23 2017-09-28 北京书生国际信息技术有限公司 对存储系统的访问控制方法及装置
CN110609813A (zh) * 2019-08-14 2019-12-24 北京华电天仁电力控制技术有限公司 一种数据存储系统及方法
CN111124755A (zh) * 2019-12-06 2020-05-08 中国联合网络通信集团有限公司 集群节点的故障恢复方法、装置、电子设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102955720A (zh) * 2011-08-25 2013-03-06 北京中科智网科技有限公司 一种提高ext文件系统稳定性的方法
CN103067485A (zh) * 2012-12-25 2013-04-24 曙光信息产业(北京)有限公司 云存储系统的磁盘监控方法
CN105630639A (zh) * 2015-12-25 2016-06-01 北京同有飞骥科技股份有限公司 一种双机集群的节点热替换方法
WO2017162178A1 (zh) * 2016-03-23 2017-09-28 北京书生国际信息技术有限公司 对存储系统的访问控制方法及装置
CN110609813A (zh) * 2019-08-14 2019-12-24 北京华电天仁电力控制技术有限公司 一种数据存储系统及方法
CN111124755A (zh) * 2019-12-06 2020-05-08 中国联合网络通信集团有限公司 集群节点的故障恢复方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向磁盘驻留的类Pregel系统的多级容错处理机制;毕亚辉;姜苏洋;王志刚;冷芳玲;鲍玉斌;于戈;钱岭;;计算机研究与发展;20161115(第11期);全文 *

Also Published As

Publication number Publication date
CN113778753A (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
US7730029B2 (en) System and method of fault tolerant reconciliation for control card redundancy
CN111901176B (zh) 故障确定方法、装置、设备及存储介质
CN109165112B (zh) 一种元数据集群的故障恢复方法、系统及相关组件
CN111176900A (zh) 一种分布式存储系统及其数据恢复方法、装置和介质
CN114490565A (zh) 数据库故障处理方法和装置
CN112650624B (zh) 一种集群升级方法、装置、设备及计算机可读存储介质
CN108509296B (zh) 一种处理设备故障的方法和系统
CN113778753B (zh) 一种存储恢复后自动修正数据库方法、装置、设备及介质
CN111078454A (zh) 一种云平台配置恢复方法及装置
JP3551079B2 (ja) 修正ロードモジュール置換後の復旧方法ならびに装置
CN113688021B (zh) 一种负载均衡服务处理方法、装置、设备及可读存储介质
CN113112023B (zh) AIStation推理平台的推理服务管理方法和装置
CN106933545B (zh) 应用系统及其启动保护方法及装置
CN112612652A (zh) 分布式存储系统异常节点重启方法及系统
CN110119400B (zh) 适用于逻辑运算的唯一标识生成方法及装置
CN112491633A (zh) 一种多节点集群的故障恢复方法、系统及相关组件
CN110597609A (zh) 一种集群迁移与自动恢复方法及系统
JP2001005693A (ja) 障害自動復旧システム、障害自動復旧方法および障害自動復旧用プログラムを記録した記録媒体
CN111756562B (zh) 一种集群接管方法、系统及相关组件
JP2015057685A (ja) 監視システム
CN112988469B (zh) 联盟链中的状态备份方法、装置和电子设备
CN115309429A (zh) 一种软件更新方法及装置
CN117112164A (zh) 一种对话流程异常中断的恢复方法及系统
CN117997722A (zh) 多中心集群的故障处理方法、装置、设备及存储介质
CN116260874A (zh) 一种服务调用方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant