CN113778753B

CN113778753B - 一种存储恢复后自动修正数据库方法、装置、设备及介质

Info

Publication number: CN113778753B
Application number: CN202111072054.5A
Authority: CN
Inventors: 李建辉; 严青; 张文件; 陈栋; 罗春; 魏兴华; 吴炎; 臧冰凌
Original assignee: Hangzhou Woqu Technology Co ltd
Current assignee: Hangzhou Woqu Technology Co ltd
Priority date: 2021-09-14
Filing date: 2021-09-14
Publication date: 2024-05-03
Anticipated expiration: 2041-09-14
Also published as: CN113778753A

Abstract

本发明涉及数据库技术领域，公开了一种存储恢复后自动修正数据库方法、装置、设备及介质，包括：在存储节点安装通知程序，在计算节点安装自动恢复程序；通知程序用于在存储节点重启时通知到计算节点，对计算节点进行在线检查和恢复oracleasm磁盘组；如果磁盘没有挂载上，则针将该存储节点的磁盘挂载到本地，查出该存储节点在oracle_asm里的所有磁盘组，并对所有磁盘组进行检查是否有offline的磁盘组，如果有，则将offline状态的磁盘组更改为online，直到所有磁盘组online完成。本发明在计算存储分离的架构中，将数据保存在存储节点上，计算节点接受业务并在存储节点上存储数据，存储节点之间各为副本，保证数据库磁盘组的副本完整。保证数据的稳定和安全。

Description

一种存储恢复后自动修正数据库方法、装置、设备及介质

技术领域

本发明涉及数据库技术领域，尤其涉及了一种存储恢复后自动修正数据库方法、装置、设备及介质。

背景技术

目前在计算存储分离的集群中，oracle数据库搭建在计算节点上，对外提供服务，将存储节点的磁盘挂载到计算节点上，作为oracle数据库的磁盘组，每个存储节点的磁盘都相互作为副本存在。

但是，现有的数据在该集群架构下，如果存储节点发生重启，计算节点没有及时的将存储节点的磁盘挂载并加入到oracle asm磁盘组里，存在数据丢失的风险，导致数据不安全。

发明内容

本发明针对现有技术中的缺点，提供了一种存储恢复后自动修正数据库方法、装置、设备及介质。

为解决上述现有技术中存在的缺陷和不足，本申请提供一种保持数据库热点数据方法，包括步骤如下：

一种存储恢复后自动修正数据库方法，包括如下步骤：

在存储节点安装通知程序，在计算节点安装自动恢复程序；

通知程序用于在存储节点重启时通知到计算节点，过程包括：

获取集群内所有计算节点IP信息；

按启动顺序根据IP信息调用计算节点上自动恢复程序并对调用结果进行判断，自动恢复程序用于对计算节点进行在线检查和恢复oracle asm磁盘组，检查过程包括：

计算节点接收存储节点发来重启通知信息，并检查发通知的存储节点磁盘是否已经挂载到本节点；

如果磁盘没有挂载上，则针将该存储节点的磁盘挂载到本地，查出该存储节点在oracle_asm里的所有磁盘组，并对所有磁盘组进行检查是否有offline的磁盘组，如果有，则将offline状态的磁盘组更改为online，直到所有磁盘组online完成。

作为优选，安装通知程序后，存储节点已经完成重启并在后续linux开机自启动流程里加上调用通知程序步骤。

作为优选，安装自动恢复程序后，计算节点提供api接口用于存储节点调用。

作为优选，当存储节点因为异常发生重启后，会自动调用通知程序，分别通知各个计算节点本存储节点发生重启，如果通知失败，则记录调用失败日志并退出程序。

作为优选，步骤按顺序调用计算节点上自动恢复程序并对调用结果进行判断，还包括对调用是否成功进行判断，如果调用不成功，则直接退出程序，并记录相关日志。

作为优选，还包括步骤，自动恢复程序将会自动退出并记录日志，等待下次存储节点发生异常重启后再继续检查和恢复磁盘组。

为解决上述技术问题，本申请还提供一种存储恢复后自动修正数据库装置，包括：

安装模块，用于在存储节点安装通知程序，在计算节点安装自动恢复程序；

通知检查模块，用于在存储节点重启时通知到计算节点，过程包括：

获取集群内所有计算节点IP信息；

状态检查模块，如果磁盘没有挂载上，则针将该存储节点的磁盘挂载到本地，查出该存储节点在oracle_asm里的所有磁盘组，并对所有磁盘组进行检查是否有offline的磁盘组，如果有，则将offline状态的磁盘组更改为online，直到所有磁盘组online完成。

为解决上述技术问题，本申请还提供一种存储恢复后自动修正数据库设备，包括：存储器，用于存储计算机程序；处理器，用于执行所述计算机程序时实现上述的存储恢复后自动修正数据库方法的步骤。

为解决上述技术问题，本申请还提供一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如上述的存储恢复后自动修正数据库方法的步骤。

本发明由于采用了以上技术方案，具有显著的技术效果：本发明在计算存储分离的架构中，将数据保存在存储节点上，计算节点接受业务并在存储节点上存储数据，存储节点之间各为副本。当存储节点如果发生重启，计算节点如果没有及时将存储节点输上来的磁盘进行online，将会有数据丢失的风险。所以本发明为了解决这个业务痛点，在存储节点重启完成后，及时通知到计算节点，计算节点及时将存储节点的磁盘进行online，保证数据库磁盘组的副本完整。保证数据的稳定和安全。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是本发明一种存储恢复后自动修正数据库方法的流程示意图；

图2是本发明一种存储恢复后自动修正数据库方法的状态判断示意图；

图3是本发明一种存储恢复后自动修正数据库装置结构图；

图4是本发明一种存储恢复后自动修正数据库设备结构图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面结合附图和具体实施方式对本申请作进一步的详细说明。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了使本技术领域的人员更好地理解本申请方案，下面结合附图和具体实施方式对本申请作进一步的详细说明。

实施例1

如图1至图2所示，其出示了一种存储恢复后自动修正数据库方法，包括如下步骤如下：

一种存储恢复后自动修正数据库方法，包括如下步骤：

在存储节点安装通知程序，在计算节点安装自动恢复程序；

获取集群内所有计算节点IP信息；

安装通知程序后，存储节点已经完成重启并在后续linux开机自启动流程里加上调用通知程序步骤。

安装自动恢复程序后，计算节点提供api接口用于存储节点调用。

当存储节点因为异常发生重启后，会自动调用通知程序，分别通知各个计算节点本存储节点发生重启，如果通知失败，则记录调用失败日志并退出程序。

步骤按顺序调用计算节点上自动恢复程序并对调用结果进行判断，还包括对调用是否成功进行判断，如果调用不成功，则直接退出程序，并记录相关日志。

还包括步骤，自动恢复程序将会自动退出并记录日志，等待下次存储节点发生异常重启后再继续检查和恢复磁盘组。

实施例2

在一套2+3(2个计算节点，3个存储节点)的集群架构中。计算节点上安装oraclerac集群以及数据库，提供服务。存储节点提供数据磁盘作为数据存储。3个存储节点作为oracle asm磁盘组的norma冗余模式，如果存储节点发生重启，在计算节点上没有及时将重启的存储节点磁盘挂载并恢复该存储节点所在的asm磁盘组，这样oracle数据库就少了一个副本存在，如果再有一台存储节点发生故障，那么就会造成数据丢失。

为了防止出现以上描述风险，在集群部署完成后，分别在所有存储节点上安装通知程序，所有计算节点安装自动恢复程序。在存储节点因为异常发生重启后，会自动调用通知程序，分别通知各个计算节点本存储节点发生重启。如果通知失败，则记录调用失败日志并退出程序，不会对存储节点运行造成任何影响，计算节点自动恢复程序接收到存储节点的调动通知后，会立马检查该存储节点的磁盘是否已经挂载到本计算节点。如果没有，则先执行挂载磁盘操作。磁盘挂载无误后，继续检查oracle asm磁盘组，查看是否有offline的磁盘组，如果有，则将offline的磁盘组进行online恢复，保证能正常提供数据存储功能。执行完online后或者没有查到有offline的磁盘组，自动恢复程序将会自动退出并记录日志，等待下次存储节点发生异常重启后再继续检查和恢复磁盘组。

实施例3

相应的，本申请实施例还公开了一种存储恢复后自动修正数据库装置，如图3所示，基于功能模块的角度，该装置包括：

安装模块11，用于在存储节点安装通知程序，在计算节点安装自动恢复程序；

通知检查模块12，用于在存储节点重启时通知到计算节点，过程包括：

获取集群内所有计算节点IP信息；

状态检查模块13，如果磁盘没有挂载上，则针将该存储节点的磁盘挂载到本地，查出该存储节点在oracle_asm里的所有磁盘组，并对所有磁盘组进行检查是否有offline的磁盘组，如果有，则将offline状态的磁盘组更改为online，直到所有磁盘组online完成。

由于装置部分的实施例与方法部分的实施例相互对应，因此装置部分的实施例请参见方法部分的实施例的描述，这里暂不赘述。

安装模块11中，通知程序后，存储节点已经完成重启并在后续linux开机自启动流程里加上调用通知程序步骤。

安装模块11中，安装自动恢复程序后，计算节点提供api接口用于存储节点调用。

通知检查模块12中，当存储节点因为异常发生重启后，会自动调用通知程序，分别通知各个计算节点本存储节点发生重启，如果通知失败，则记录调用失败日志并退出程序。

状态检查模块13中，步骤按顺序调用计算节点上自动恢复程序并对调用结果进行判断，还包括对调用是否成功进行判断，如果调用不成功，则直接退出程序，并记录相关日志。

还包括异常日志模块，自动恢复程序将会自动退出并记录日志，等待下次存储节点发生异常重启后再继续检查和恢复磁盘组。

实施例4

本申请实施例还提供一种电子设备，如图4所示，其示出了本申请实施例提供的一种存储恢复后自动修正数据库设备的结构示意图，包括：

存储器21，用于存储计算机程序；

处理器22，用于执行所述计算机程序时实现上述的存储恢复后自动修正数据库方法的步骤：

在存储节点安装通知程序，在计算节点安装自动恢复程序；

获取集群内所有计算节点IP信息；

实施例5

本申请实施例还提供了一种计算机可读存储介质，用于存储计算机程序；其中计算机程序被处理器执行时可实现如下步骤：

在存储节点安装通知程序，在计算节点安装自动恢复程序；

获取集群内所有计算节点IP信息；

该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请实施例提供的一种多备份任务动态调度方法、装置、设备及介质中相关部分的说明可以参见本申请实施例提供的一种多备份任务动态调度方法中对应部分的详细说明，在此不再赘述。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外，本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明，以免过多赘述。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种存储恢复后自动修正数据库方法，其特征在于，包括如下步骤：

在存储节点安装通知程序，在计算节点安装自动恢复程序；

获取集群内所有计算节点IP信息；

如果磁盘没有挂载上，则将该存储节点的磁盘挂载到本地，查出该存储节点在oracle_asm里的所有磁盘组，并对所有磁盘组进行检查是否有offline的磁盘组，如果有，则将offline状态的磁盘组更改为online，直到所有磁盘组online完成。

2.根据权利要求1所述的一种存储恢复后自动修正数据库方法，其特征在于：安装通知程序后，存储节点已经完成重启并在后续linux开机自启动流程里加上调用通知程序步骤。

3.根据权利要求1所述的一种存储恢复后自动修正数据库方法，其特征在于：安装自动恢复程序后，计算节点提供api接口用于存储节点调用。

4.根据权利要求1所述的一种存储恢复后自动修正数据库方法，其特征在于：当存储节点因为异常发生重启后，会自动调用通知程序，分别通知各个计算节点本存储节点发生重启，如果通知失败，则记录调用失败日志并退出程序。

5.根据权利要求1所述的一种存储恢复后自动修正数据库方法，其特征在于：步骤按顺序调用计算节点上自动恢复程序并对调用结果进行判断，还包括对调用是否成功进行判断，如果调用不成功，则直接退出程序，并记录相关日志。

6.根据权利要求1所述的一种存储恢复后自动修正数据库方法，其特征在于：还包括步骤，自动恢复程序将会自动退出并记录日志，等待下次存储节点发生异常重启后再继续检查和恢复磁盘组。

7.一种存储恢复后自动修正数据库装置，其特征在于，包括：

获取集群内所有计算节点IP信息；

状态检查模块，如果磁盘没有挂载上，则将该存储节点的磁盘挂载到本地，查出该存储节点在oracle_asm里的所有磁盘组，并对所有磁盘组进行检查是否有offline的磁盘组，如果有，则将offline状态的磁盘组更改为online，直到所有磁盘组online完成。

8.一种存储恢复后自动修正数据库设备，其特征在于，包括：存储器，用于存储计算机程序；处理器，用于执行所述计算机程序时实现如权利要求1至6任一项所述的存储恢复后自动修正数据库方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的存储恢复后自动修正数据库方法的步骤。