CN111737043A - 数据库容灾方法、设备、服务器和存储介质 - Google Patents

数据库容灾方法、设备、服务器和存储介质 Download PDF

Info

Publication number
CN111737043A
CN111737043A CN201910226219.6A CN201910226219A CN111737043A CN 111737043 A CN111737043 A CN 111737043A CN 201910226219 A CN201910226219 A CN 201910226219A CN 111737043 A CN111737043 A CN 111737043A
Authority
CN
China
Prior art keywords
server
management
instruction
database
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910226219.6A
Other languages
English (en)
Other versions
CN111737043B (zh
Inventor
邬建卫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Cloud Computing Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910226219.6A priority Critical patent/CN111737043B/zh
Publication of CN111737043A publication Critical patent/CN111737043A/zh
Application granted granted Critical
Publication of CN111737043B publication Critical patent/CN111737043B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种数据库容灾方法、设备、服务器和存储介质,方法包括:接收来自多个服务器中第一服务器的通知消息,通知消息用于表示第一服务器已将指定数据存储至第一管控组件;在多个服务器中选取第二服务器,向第一服务器发送第一指令,第一指令用于指示第一管控组件将指定数据备份至第二服务器中的第二管控组件;当第一服务器停止工作时,向第二服务器发送第二指令,第二指令用于指示第二服务器基于备份的指定数据重建数据库,以使目标数据库重新恢复出与之前相同的数据库实例,替代第一服务器继续提供服务,保证跨地域容灾的连续性。

Description

数据库容灾方法、设备、服务器和存储介质
技术领域
本发明涉及信息技术领域,尤其涉及一种数据库容灾方法、设备、服务器和存储介质。
背景技术
随着互联网技术的快速发展,越来越多的数据存储在数据库中。如图1所示,为了保证数据不丢失,数据拥有方通常会跨地域部署多个备用数据库,以使备用数据库搭附到本地域的数据库上,保证数据的同步,当本地域的数据库发生灾难时,进行网络切换到跨地域的备用数据库,保证了业务的连续和数据的完整。
然而,实现上述方案需要根据本地域的数据库和跨地域的备用数据库,不仅需要构建完备的数据同步以及基础设施运维服务,而且在该过程中会占用较多的计算资源,导致成本较高。
发明内容
本发明实施例提供了一种数据库容灾方法、设备、服务器和存储介质,用以解决数据库容灾问题。
根据本发明实施例的第一方面,提供一种数据库容灾方法,该方法可以包括:
接收来自多个服务器中第一服务器的通知消息,通知消息用于表示第一服务器已将指定数据存储至第一管控组件;
在多个服务器中选取第二服务器,向第一服务器发送第一指令,第一指令用于指示第一管控组件将指定数据备份至第二服务器中的第二管控组件;
当第一服务器停止工作时,向第二服务器发送第二指令,第二指令用于指示第二服务器基于备份的指定数据重建数据库。
根据本发明实施例的第二方面,提供一种数据库容灾方法,应用于第一服务器,第一服务器包括数据库和第一管控组件,该方法包括:
将数据库中的指定数据存储至第一管控组件;
存储完成后,向管控中心发送通知消息;
接收管控中心下发的第一指令,第一指令用于指示第一管控组件将指定数据备份至第二服务器中的第二管控组件;
响应于第一指令,将指定数据备份至第二服务器中的第二管控组件。
根据本发明实施例的第三方面,提供一种数据库容灾方法,应用于第二服务器,第二服务器包括数据库和第二管控组件,方法包括:
接收第一服务器备份到第二管控组件中的指定数据;
接收管控中心下发的第二指令;
响应于第二指令,第二管控组件基于指定数据重建数据库。
根据本发明实施例的第四方面,提供一种计算设备,计算设备包括:至少一个处理器、至少一个存储器以及至少一个计算机程序,其中,计算机程序被存储在存储器中,计算机程序包括指令,处理器用于执行计算机程序,以使计算设备实现如第一方面所示的方法。
根据本发明实施例的第五方面,提供一种服务器,服务器包括:处理器、存储器、数据库、第一管控组件以及计算机程序,其中,计算机程序被存储在存储器中,计算机程序包括指令,处理器用于执行存储器的程序,以控制服务器实现如第二方面所示的方法。
根据本发明实施例的第六方面,提供一种服务器,服务器包括:处理器、存储器、数据库、第二管控组件以及计算机程序,其中,计算机程序被存储在存储器中,计算机程序包括指令,处理器用于执行存储器的程序,以控制服务器实现如第三方面所示的方法。
根据本发明实施例的第七方面,提供一种数据库容灾装置,该装置可以包括:
收发模块,用于接收来自多个服务器中第一服务器的通知消息,通知消息用于表示第一服务器已将指定数据存储至第一管控组件;
处理模块,用于在多个服务器中选取第二服务器,向第一服务器发送第一指令,第一指令用于指示第一管控组件将指定数据备份至第二服务器中的第二管控组件;
收发模块还用于,当第一服务器停止工作时,向第二服务器发送第二指令,第二指令用于指示第二服务器基于备份的指定数据重建数据库。
根据本发明实施例的第八方面,提供一种数据库容灾装置,应用于第一服务器,第一服务器包括数据库和第一管控组件,该装置包括:
存储模块,用于将数据库中的指定数据存储至第一管控组件;
收发模块,用于存储完成后,向管控中心发送通知消息;
收发模块还用于,接收管控中心下发的第一指令,第一指令用于指示第一管控组件将指定数据备份至第二服务器中的第二管控组件;
存储模块还用于,响应于第一指令,将指定数据备份至第二服务器中的第二管控组件。
根据本发明实施例的第九方面,提供一种数据库容灾装置,应用于第二服务器,第二服务器包括数据库和第二管控组件,该装置包括:
收发模块,用于接收第一服务器备份到第二管控组件中的指定数据;
收发模块还用于,接收管控中心下发的第二指令;
处理模块,用于响应于第二指令,第二管控组件基于指定数据重建数据库。
根据本发明实施例的第十方面,提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行上述各方面的数据库容灾方法。
根据本发明实施例的第十一方面,提供一种计算机程序产品,当指令在计算机上运行时,使得计算机执行上述各方面的数据库容灾方法。
在本发明实施例中披露的数据库容灾方法,可以在多个服务器中选取第二服务器,并通过下发指令指示第一服务器将第一管控组件中的数据复制到第二服务器的第二管控组件中,当第一服务器发生灾难时,触发第二服务器根据本地存储的第一服务器对应的数据,重新恢复出与之前相同的数据库实例,替代第一服务器继续提供服务。该方法没有主、被服务器或者数据库的限定,无需构建一整套完备的数据同步、基础设施运维服务,无需一直占用运行的计算资源,通过增加一定的重建时间,在保证跨地域容灾的连续性和完整性的同时,以达到降低成本的目的。
附图说明
从下面结合附图对本发明的具体实施方式的描述中可以更好地理解本发明其中,相同或相似的附图标记表示相同或相似的特征。
图1为一种数据库容灾的实际应用场景示意图;
图2为本发明实施例一种数据库容灾的应用场景示意图;
图3为本发明实施例复制数据的结构示意图;
图4为本发明实施例重建数据库的结构示意图;
图5为本发明实施提供的例数据库容灾方法流程图;
图6为本发明实施例的数据库容灾装置示意性框图;
图7为本发明实施例的数据库容灾设备示意性框图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
下面结合附图,对本说明书提供的方案进行详细描述。
图2示出了本发明实施例一种数据库容灾的应用场景示意图。
如图2所示,该场景中,主要将全球按照地域特性划分为多个地理区域(例如:中国地域、新加坡地域等),每个地理区域中包括至少一个行政区域。行政区域可以划分出至少一个可用区域(例如:中国地域可以包括:上海区域、杭州区域等)。其中,划分可用区域的方式可以是通过独立网络划分,或者以机房的数目进行划分(例如:在中国地域中设置两个机房,一个机房设置在上海某地,另一个设置在杭州某地,由此,可以将中国地域划分为上海区域、杭州区域)。需要说明的是,当地理区域中仅包含一个可用区域时,可以理解地理区域和可用区域在范围上相同(例如:在新加坡设置一个机房,则可以将新加坡地域划分为新加坡区域)。
基于上述可用区域,如图3所示,本发明实施例涉及的数据库容灾的系统可以包括至少两个可用区域对应的服务器(例如:图2所示,杭州区域对应的第一服务器和上海区域对应的第二服务器;或者,第二服务器可以为多个,其中,第二服务器可以包括上海区域对应的服务器和新加坡区域对应的服务器),以及管控中心。
其中,每个服务器中均包含管控组件,用于存储多种类型的数据(例如:配置信息、用户数据等)。其中,第一服务器包含第一管控组件,第二服务器包含第二管控组件。进一步地,第一服务器将数据库中的数据存储到在第一管控组件中。数据可以包括全量数据、增量数据;增量数据用于表示第一服务器数据库中数据的修改操作记录。
管控组件还用于,将其他服务器的指定数据备份到本地的管控组件中(或者,将本地的指定数据备份到其他服务器的管控组件中)。进一步地,指定数据包括全量数据和增量数据,备份时,针对全量数据实施异步复制,针对增量数据实施同步复制。
在本发明的一种实施方式中,管控组件包括代理agent模块,当第一服务器已将指定数据存储至agent模块后,向管控中心发送通知消息。
管控中心,用于提供全球地域的数据库实例、数据库容灾的配置、生命周期管理和数据库容灾恢复。进一步的,主要用于接收来自多个服务器中第一服务器的通知消息,通知消息用于表示第一服务器已将指定数据存储至第一管控组件;在多个服务器中选取第二服务器,向第一服务器发送第一指令,第一指令用于指示第一管控组件将指定数据备份至第二服务器中的第二管控组件;当第一服务器停止工作时,向第二服务器发送第二指令,第二指令用于指示第二服务器基于备份的指定数据重建数据库。
在一种实例中,管控中心还可以用于定期检测(例如:每一天中的固定时间周期性检测)第一服务器中的备份情况,判断该备份情况是否满足预设条件,当满足预设条件时,可以执行在多个服务器中选取第二服务器,向第一服务器发送第一指令的步骤。
其次,管控中心还用于,在多个服务器中选取第二服务器之后,还可以记录第一服务器与所述第二服务器的关联关系,关联关系为第二服务器中备份有来自第一服务器的指定数据。
另外,管控中心还用于,接收用户的操作指令;根据操作指令在多个目标服务器中选取至少一个第二服务器。这里,管控中心还用于,判断用户指定的第二服务器中的第二管控组件是否已完成对指定数据的备份;若第二管控组件已完成对指定数据的备份,则向第二服务器发送第二指令;反之,若第二管控组件未完成对指定数据的备份,则向第二服务器发送第三指令,第三指令用于指示第二管控组件从第三服务器中备份指定数据,第三服务器中的第三管控组件中存储有指定数据。
图4示出了本发明实施例重建数据库的结构示意图,基于图3涉及到的备份数据的内容,对应的,详细说明一下重建数据库的过程。
在一种可能的实例中,当第一服务器(例如:杭州区域对应的服务器)停止工作时(造成的原因可能是,该服务器发生大规模的瘫痪,或者该服务器所在可用区域或者行政区域发生人为或者自然灾害),管控中心用于触发第二服务器(例如:上海服务器)根据存储的指定数据重建数据库。其中,指定数据为第一服务器中数据库中的数据,为重建数据库提供数据源。
进一步的,管控中心,用于触发第二服务器(例如:上海区域对应的服务器)中的第二管控组件进行容灾恢复,其中,第二管控组件调用第二管控组件中存储的指定数据,根据指定数据进行数据库的恢复重建,以使第二服务器利用该重建之后的数据库替代第一服务器,重新为指定数据对应的用户提供服务。
需要说明的是,该第二服务器的数量可以为多个,当优先级较高的第二服务器也停止工作时,可以采用第二服务器中的其他服务器进行恢复重建。举例说明,如图3所示,上海区域对应的服务器和新加坡区域对应的服务器均可以为第二服务器。当杭州区域对应的第一服务器和上海区域对应的第二服务器均停止工作时,管控中心触发新加坡区域对应的管控组件,以使新加坡区域对应的第二服务器进行数据库的恢复重建。或者,通过选择其他区域的服务器进行数据库的恢复重建。
在另一种可能的实例中,管控中心接收用户的操作指令,该操作指令用于指示在多个第二服务器中选择至少一个第二服务器。这里,在触发其他服务器进行恢复重建之前,管控中心还可以判断用户指定的第二服务器中的第二管控组件是否已完成对指定数据的备份;若第二管控组件已完成对指定数据的备份,则向第二服务器发送第二指令;反之,若第二管控组件未完成对指定数据的备份,则向第二服务器发送第三指令,第三指令用于指示第二管控组件从第三服务器中备份指定数据,第三服务器中的第三管控组件中存储有指定数据。
举例说明,当操作指令中指定上海区域的服务器重建杭州区域的服务器所对应的数据库,但是,若上海区域的服务器的管控组件中没有存储杭州区域的服务器中的数据(或者,数据丢失)时,管控中心向上海区域的服务器发送新加坡区域的服务器的标识信息,上海区域的服务器根据标识信息到新加坡区域的服务器处备份杭州区域的服务器中的数据,以使上海区域的服务器重建杭州区域对应的数据库,让上海区域的服务器重新提供服务。
基于上述数据库容灾的架构(即复制数据和重建数据库的两个过程),结合图5对本发明实施例提供的数据库容灾方法进行详细说明。
如图5所示,该方法流程可以包括,首先,步骤510:接收来自多个服务器中第一服务器的通知消息,通知消息用于表示第一服务器已将指定数据存储至第一管控组件;接着,步骤520:在多个服务器中选取第二服务器,向第一服务器发送第一指令,第一指令用于指示第一管控组件将指定数据备份至第二服务器中的第二管控组件;然后,步骤530:当第一服务器停止工作时,向第二服务器发送第二指令,第二指令用于指示第二服务器基于备份的指定数据重建数据库。
首先,涉及步骤510,第一服务器包括第一管控组件。可通过两种方式确定第一服务器完成指定数据在第一管控组件中的备份。
其中,第一种方式为:当第一服务器已完成指定数据从第一服务器的数据库中到第一管控组件中的备份时,第一服务器向管控中心发送通知消息,以继续执行步骤S520。
举例说明,在第一服务器中部署第二管控组件(例如:agent模块),该模块用于完成第一服务器的指定数据在第一管控组件中的备份。进一步的,当agent模块完成指定数据在第一管控组件中的备份时,向管控中心发送通知消息。
第二种方式为,管控中心定期检测(例如:每一天中的固定时间周期性检测)第一服务器中的备份情况,判断该备份情况是否满足预设条件,当满足预设条件时,可以继续执行步骤520;反之,当不满足预设条件时,进入下一次的检测。
举例说明,基于第一种方式涉及到的agent模块,管控中心定期检测agent模块中记录的备份情况,当满足备份进度超过80%时,为满足预设条件;反之,则为不满足预设条件。
其次,涉及步骤520,在一种可能的实例中,在该步骤之前,还可以包括记录第一服务器与第二服务器的关联关系。
其中,方式1:根据关联关系,确定与第一服务器关联的多个第二服务器。
方式2:根据第一服务器随机关联多个对应的第二服务器,这里,管控中心记录关联列表,该记录列表用于记录第一服务器与至少一个第二服务器的关联关系,关联关系为第二服务器中备份有来自第一服务器的指定数据。
方式3:接收用户指令,用户指令用于指示在多个第二服务器中选择与第一服务器对应的第二服务器。
需要说明的是第一服务器和第二服务器的位置关系,其中,在一种可能的实例中,第一服务器(例如:杭州区域对应的服务器)和第二服务器(例如:上海区域对应的服务器)分别处于不同的行政区域。
在另一种可能的实例中,第二服务器的数量为多个,多个第二服务器中每个第二服务器分别处于不同的地域,例如:上海区域对应的服务器和新加坡区域对应的服务器,具体描述如上述图2中涉及的内容,请参照图2的描述,在此不再赘述。
另外,上述涉及到的指定数据具体可以包括下述中的至少一种:全量数据、增量数据;其中,增量数据(例如:日志数据)用于表示第一服务器数据库中数据的修改操作记录。
在一个实例中,当数据为全量数据时,第一管控组件异步复制全量数据到第二管控组件中。举例说明,agent模块定时复制(即异步复制)全量数据到第二管控组件中。
在另一个实例中,当数据为增量数据时,第一管控组件在预设时间段内(例如:0-1毫秒对应的时间段)对增量数据进行监控,确定修改后的增量数据;同步复制修改后的增量数据到第二管控组件中。举例说明,agent模块实时监控第一服务器中数据库的增量数据的变化,根据增量数据的变化确定修改后的增量数据;同步复制修改后的增量数据到第二管控组件中。
在又一种实例中,是当数据既包括全量数据,又包括增量数据时,异步复制全量数据到第二管控组件中;在预设时间段内对增量数据进行监控,确定修改后的增量数据;同步复制修改后的增量数据到第二管控组件中;分别记录异步复制全量数据的结果和同步复制修改后的增量数据的结果。
需要说明的是,当指定数据仅包括任一个子数据时(即全量数据或者增量数据),在复制之后,管控中心也要对应记录异步复制全量数据的结果或者同步复制修改后的增量数据的结果。
然后,涉及步骤530,一种可能的实施方式中,在该步骤之前还可以包括如下步骤:
可以基于步骤520中涉及的确定第一服务器和第二服务器的对应关系的三种方式,分别实现在多个第二服务器中选择第二服务器,并向第二服务器发送第二指令。
其中,对应S520中的方式1:根据预设关联关系中的优先级顺序进行选择,进一步地,优先级高的优先发送第二指令,当优先级高的第二服务器发生故障时,按照优先级顺序发送第二指令。
对应S520中的方式2:根据记录第一服务器与第二服务器的关联关系,根据行政区域的距离触发第二服务器。进一步的,分别获取第一服务器与多个第二服务器中每个第二服务器的距离值,依据多个距离值由小到大进行触发。
对应S520中的方式3:接收操作指令,操作指令用于指示在多个第二服务器中选择至少一个第二服务器。
响应操作指令,分别触发至少一个第二服务器,重建与指定数据对应的目标数据库,以便目标数据库重新提供服务。
举例说明,当杭州区域对应的第一服务器发生灾难时,触发第二服务器中的agent模块进行容灾恢复,agent模块将第二服务器中存储的第一服务器中的数据导出,进行目标数据库重建恢复重建,以便目标数据库重新提供服务。其中,该目标数据库在第二服务器中。
进一步地,当操作指令中涉及的第二服务器停止工作时,管控中心进行告警,以提示用户更换下一个指定的第二服务器。其中,发出告警的方式可以包括下述中的至少一种:声音报警、文字显示报警、文字图片显示报警。
此外,在S530之前,还可能出现至少一个第二服务器中的任一个服务器的管控组件中出现丢失数据(第一服务器对应的数据)或者无存储数据(第一服务器对应的数据)的情况,基于该情况,还可以包括如下步骤:
判断第二服务器中的第二管控组件是否已完成对指定数据的备份;若第二管控组件已完成对指定数据的备份,则向第二服务器发送第二指令;若第二管控组件未完成对指定数据的备份,则向第二服务器发送第三指令,第三指令用于指示第二管控组件从第三服务器中备份指定数据,第三服务器中的第三管控组件中存储有指定数据。
此外,上述方法还可以包括:定期(例如:1年)检测第二管控组件中的数据;当数据满足预设条件时,删除数据中的过期数据。
举例说明,管控中心管理全球各个地域中管控组件的容灾数据,定时检测管控组件中的数据,当数据存储时间超过5年时,删除数据中的过期数据;反之,则保留。该方式可以适量减少管控组件的存储承载量。
综上,本发明实施例中通过部署全球管控中心,可以在多个服务器中选取第二服务器,并通过下发指令指示第一服务器将第一管控组件中的数据复制到第二服务器的第二管控组件中,当第一服务器发生灾难时,触发第二服务器根据本地存储的第一服务器对应的数据,重新恢复出与之前相同的数据库实例,替代第一服务器继续提供服务,该方法没有主、被服务器或者数据库的限定,无需构建一整套完备的数据同步、基础设施运维服务,无需一直占用运行的计算资源,通过增加一定的重建时间,在保证跨地域容灾的连续性和完整性的同时,以达到降低成本的目的。
此外,该实施例提供的方法因没有地域的限制,没有主、被服务器或者数据库的限定,所以能支持指定任意地域容灾恢复。这种低成本的容灾方式非常适合绝大部分用户使用以及那些有跨地域数据监管需求的用户(例如:金融产业只需要数据监管的需求)。
图6示出了本发明实施例的数据库容灾装置示意性框图,该数据库容灾装置60可以包括:
收发模块601,用于接收来自多个服务器中第一服务器的通知消息,通知消息用于表示第一服务器已将指定数据存储至第一管控组件;
处理模块602,用于在多个服务器中选取第二服务器,向第一服务器发送第一指令,第一指令用于指示第一管控组件将指定数据备份至第二服务器中的第二管控组件;
收发模块601还用于,当第一服务器停止工作时,向第二服务器发送第二指令,第二指令用于指示第二服务器基于备份的指定数据重建数据库。
其中,第二服务器与第一服务器处于不同的行政区域。或者,多个服务器中的各个服务器分别处于不同的行政区域。
上述装置60还可以包括:判断模块603,用于判断第二服务器中的第二管控组件是否已完成对指定数据的备份。
若第二管控组件已完成对指定数据的备份,则指示收发模块601向第二服务器发送第二指令。或者,若第二管控组件未完成对指定数据的备份,则指示收发模块601向第二服务器发送第三指令,第三指令用于指示第二管控组件从第三服务器中备份指定数据,第三服务器中的第三管控组件中存储有指定数据。
处理模块602还用于,记录第一服务器与第二服务器的关联关系,关联关系为第二服务器中备份有来自第一服务器的指定数据。其中,指定数据包括全量数据和增量数据,备份时,针对全量数据实施异步复制,针对增量数据实施同步复制。
图7示出了本发明实施例的数据库容灾设备示意性框图,能够实现根据本发明实例提供的数据库容灾方法和装置的计算设备的示例性硬件架构的结构图。
计算设备700包括输入设备701、输入接口702、中央处理器703、存储器704、输出接口705、以及输出设备706。其中,输入接口702、中央处理器703、存储器704、以及输出接口705通过总线710相互连接,输入设备701和输出设备706分别通过输入接口702和输出接口705与总线710连接,进而与计算设备700的其他组件连接。
具体地,输入设备701接收来自外部的输入信息,并通过输入接口702将输入信息传送到中央处理器703;中央处理器703基于存储器704中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器704中,然后通过输出接口705将输出信息传送到输出设备706;输出设备706将输出信息输出到计算设备700的外部供用户使用。
图7所示的计算设备也可以被实现为包括:存储有计算机可执行指令的存储器;以及处理器,该处理器在执行计算机可执行指令时可以实现结合图2至图6描述的数据库容灾方法和装置。
根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以从网络上被下载和安装,和/或从可拆卸存储介质被安装。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令,当其在计算机上运行时,使得计算机执行上述各个实施例中描述的方法。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘)等。
以上所描述的装置实例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
需要明确的是,本发明并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁,这里省略了对已知方法的详细描述,并且上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域的技术人员可以清楚地了解到,本发明的方法过程并不限于所描述和示出的具体步骤,任何熟悉本技术领域的技术人员在领会本发明的精神后,在本发明揭露的技术范围内作出各种改变、修改和添加,或者等效替换以及改变步骤之间的顺序,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (13)

1.一种数据库容灾方法,所述方法包括:
接收来自多个服务器中第一服务器的通知消息,所述通知消息用于表示所述第一服务器已将指定数据存储至第一管控组件;
在所述多个服务器中选取第二服务器,向所述第一服务器发送第一指令,所述第一指令用于指示所述第一管控组件将所述指定数据备份至所述第二服务器中的第二管控组件;
当所述第一服务器停止工作时,向所述第二服务器发送第二指令,所述第二指令用于指示所述第二服务器基于备份的所述指定数据重建数据库。
2.根据权利要求1所述的方法,其中,所述第二服务器与所述第一服务器处于不同的行政区域。
3.根据权利要求1所述的方法,其中,所述多个服务器中的各个服务器分别处于不同的行政区域。
4.根据权利要求1所述的方法,其中,在向所述第二服务器发送第二指令之前,所述方法还包括:
判断所述第二服务器中的所述第二管控组件是否已完成对所述指定数据的备份;
若所述第二管控组件已完成对所述指定数据的备份,则向所述第二服务器发送所述第二指令;
若所述第二管控组件未完成对所述指定数据的备份,则向所述第二服务器发送第三指令,所述第三指令用于指示所述第二管控组件从第三服务器中备份所述指定数据,所述第三服务器中的第三管控组件中存储有所述指定数据。
5.根据权利要求1所述的方法,其中,还包括:
记录所述第一服务器与所述第二服务器的关联关系,所述关联关系为所述第二服务器中备份有来自所述第一服务器的所述指定数据。
6.根据权利要求1所述的方法,其中,所述指定数据包括全量数据和增量数据,备份时,针对全量数据实施异步复制,针对增量数据实施同步复制。
7.一种数据库容灾方法,应用于第一服务器,所述第一服务器包括数据库和第一管控组件,所述方法包括:
将所述数据库中的指定数据存储至第一管控组件;
存储完成后,向管控中心发送通知消息;
接收所述管控中心下发的第一指令;
响应于所述第一指令,将所述指定数据备份至所述第二服务器中的所述第二管控组件。
8.一种数据库容灾方法,应用于第二服务器,所述第二服务器包括数据库和第二管控组件,所述方法包括:
接收第一服务器备份到所述第二管控组件中的指定数据;
接收管控中心下发的第二指令;
响应于所述第二指令,所述第二服务器基于所述指定数据重建数据库。
9.一种计算设备,所述计算设备包括:至少一个处理器、至少一个存储器以及至少一个计算机程序,其中,所述计算机程序被存储在所述存储器中,所述计算机程序包括指令,所述处理器用于执行所述计算机程序,以使所述计算设备实现如权利要求1-6中任意一项所述的方法的步骤。
10.一种服务器,所述服务器包括:处理器、存储器、数据库、第一管控组件以及计算机程序,其中,所述计算机程序被存储在所述存储器中,所述计算机程序包括指令,所述处理器用于执行所述存储器的所述程序,以控制所述服务器实现如权利要求7所述的方法的步骤。
11.一种服务器,所述服务器包括:处理器、存储器、数据库、第二管控组件以及计算机程序,其中,所述计算机程序被存储在所述存储器中,所述计算机程序包括指令,所述处理器用于执行所述存储器的所述程序,以控制所述服务器实现如权利要求8所述的方法的步骤。
12.一种计算机可读存储介质,所述存储介质包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-8中任意一项所述的方法的步骤。
13.一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如权利要求1-8中任意一项所述的方法的步骤。
CN201910226219.6A 2019-03-25 2019-03-25 数据库容灾方法、设备、服务器和存储介质 Active CN111737043B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910226219.6A CN111737043B (zh) 2019-03-25 2019-03-25 数据库容灾方法、设备、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910226219.6A CN111737043B (zh) 2019-03-25 2019-03-25 数据库容灾方法、设备、服务器和存储介质

Publications (2)

Publication Number Publication Date
CN111737043A true CN111737043A (zh) 2020-10-02
CN111737043B CN111737043B (zh) 2024-06-21

Family

ID=72646216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910226219.6A Active CN111737043B (zh) 2019-03-25 2019-03-25 数据库容灾方法、设备、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN111737043B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269690A (zh) * 2020-11-17 2021-01-26 珠海大横琴科技发展有限公司 一种数据备份的方法和装置
CN113704024A (zh) * 2021-08-27 2021-11-26 腾讯科技(上海)有限公司 数据处理方法、装置、相关设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160224434A1 (en) * 2013-10-16 2016-08-04 Axxana (Israel) Ltd. Zero-transaction-loss recovery for database systems
CN106502823A (zh) * 2016-09-29 2017-03-15 北京许继电气有限公司 数据云备份方法和系统
CN106776126A (zh) * 2016-11-30 2017-05-31 郑州云海信息技术有限公司 一种容灾系统及方法
CN107038192A (zh) * 2016-11-17 2017-08-11 阿里巴巴集团控股有限公司 数据库容灾方法和装置
CN107135097A (zh) * 2017-04-14 2017-09-05 北京金融资产交易所有限公司 基于簿记建档的容灾系统及容灾方法
CN108776670A (zh) * 2018-05-11 2018-11-09 阿里巴巴集团控股有限公司 一种异地容灾方法、系统和电子设备
CN108984335A (zh) * 2017-06-02 2018-12-11 伊姆西Ip控股有限责任公司 备份和恢复数据的方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160224434A1 (en) * 2013-10-16 2016-08-04 Axxana (Israel) Ltd. Zero-transaction-loss recovery for database systems
CN106502823A (zh) * 2016-09-29 2017-03-15 北京许继电气有限公司 数据云备份方法和系统
CN107038192A (zh) * 2016-11-17 2017-08-11 阿里巴巴集团控股有限公司 数据库容灾方法和装置
CN106776126A (zh) * 2016-11-30 2017-05-31 郑州云海信息技术有限公司 一种容灾系统及方法
CN107135097A (zh) * 2017-04-14 2017-09-05 北京金融资产交易所有限公司 基于簿记建档的容灾系统及容灾方法
CN108984335A (zh) * 2017-06-02 2018-12-11 伊姆西Ip控股有限责任公司 备份和恢复数据的方法和系统
CN108776670A (zh) * 2018-05-11 2018-11-09 阿里巴巴集团控股有限公司 一种异地容灾方法、系统和电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张弛;刘晓洁;李涛;卢正添;: "一种基于数据库容灾的服务保障体系", 计算机安全, no. 10, 15 October 2008 (2008-10-15) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269690A (zh) * 2020-11-17 2021-01-26 珠海大横琴科技发展有限公司 一种数据备份的方法和装置
CN112269690B (zh) * 2020-11-17 2024-05-24 珠海大横琴科技发展有限公司 一种数据备份的方法和装置
CN113704024A (zh) * 2021-08-27 2021-11-26 腾讯科技(上海)有限公司 数据处理方法、装置、相关设备及存储介质
CN113704024B (zh) * 2021-08-27 2023-05-09 腾讯科技(上海)有限公司 数据处理方法、装置、相关设备及存储介质

Also Published As

Publication number Publication date
CN111737043B (zh) 2024-06-21

Similar Documents

Publication Publication Date Title
US8423821B1 (en) Virtual recovery server
CA2655911C (en) Data transfer and recovery process
US7194487B1 (en) System and method for recording the order of a change caused by restoring a primary volume during ongoing replication of the primary volume
US8938638B2 (en) Recovery service location for a service
CN106776130B (zh) 一种日志恢复方法、存储装置和存储节点
US20150213100A1 (en) Data synchronization method and system
US9015520B2 (en) Data transfer and recovery
CN111078667B (zh) 一种数据迁移的方法以及相关装置
JP2008059583A (ja) クラスタ・システムならびにクラスタ・システム内でレプリカをバックアップする方法およびプログラム製品
CN104750573B (zh) 分布式数据系统数据节点的全局一致性备份和还原方法
US10169166B2 (en) Real-time fault-tolerant architecture for large-scale event processing
US20120324285A1 (en) Method, apparatus and system for data disaster tolerance
CN110825562B (zh) 数据备份方法、装置、系统和存储介质
CN113688035B (zh) 一种基于沙箱环境的数据库双活中心验证方法及系统
CN111966467A (zh) 基于kubernetes容器平台灾备的方法及装置
CN114064374A (zh) 一种基于分布式块存储的故障检测方法和系统
CN111737043A (zh) 数据库容灾方法、设备、服务器和存储介质
CN110209526A (zh) 一种存储层同步系统、及存储介质
CN110647425A (zh) 一种数据库恢复方法及装置
US11042454B1 (en) Restoration of a data source
US9880776B1 (en) Content-driven data protection method for multiple storage devices
CN116389233B (zh) 容器云管理平台主备切换系统、方法、装置和计算机设备
CN112948484A (zh) 分布式数据库系统和数据灾备演练方法
CN113986450A (zh) 一种虚拟机备份方法及装置
CN110389863A (zh) 一种数据恢复方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210914

Address after: Room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: Grand Cayman Islands

Applicant before: ALIBABA GROUP HOLDING Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211118

Address after: 310000 No. 12, Zhuantang science and technology economic block, Xihu District, Hangzhou City, Zhejiang Province

Applicant after: Aliyun Computing Co.,Ltd.

Address before: 310052 room 508, 5th floor, building 4, No. 699 Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant before: Alibaba (China) Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant