CN106294008B

CN106294008B - 一种数据恢复方法和装置

Info

Publication number: CN106294008B
Application number: CN201610638176.9A
Authority: CN
Inventors: 黄群; 俞毅
Original assignee: Zhejiang Uniview Technologies Co Ltd
Current assignee: Zhejiang Uniview Technologies Co Ltd
Priority date: 2016-08-05
Filing date: 2016-08-05
Publication date: 2019-06-11
Anticipated expiration: 2036-08-05
Also published as: CN106294008A

Abstract

本发明提供一种数据恢复方法和装置，该方法包括：数据备份阶段：获取服务器列表和region信息列表；针对region信息列表内的每个region信息，从服务器列表内为region信息分配至少两个服务器，指定region信息在分配的每个服务器的备份优先级；针对服务器列表内的每个服务器，为服务器生成节点信息结构，以使所述服务器利用所述节点信息结构对该region信息对应的数据进行备份；数据恢复阶段：针对region信息列表内的每个region信息，从所述数据备份阶段备份的所有数据中，选择该region信息对应的一份数据进行恢复。通过本发明的技术方案，减轻对Hbase集群的压力，避免对现有业务产生影响，不依赖于HDFS集群环境的稳定性。加快备份的速度，提高数据恢复的效率。

Description

一种数据恢复方法和装置

技术领域

本发明涉及通信技术领域，尤其涉及一种数据恢复方法和装置。

背景技术

随着Hbase(一个分布式的、面向列的开源数据库)在重要商业系统中的大量应用，许多企业通过对Hbase建立健壮的备份和故障恢复机制，来保证企业资产/企业数据资产。HBase是一个基于LSM(Log Structured Merge，日志结构合并)树的分布式数据存储系统，它使用复杂的内部机制确保数据准确性、一致性、多版本等，而且，Hbase中需要备份的数据可以位于大量服务器上。

目前，为了对Hbase中的数据进行备份，则需要使用Hbase内置的导出工具，将大量服务器上的数据导出，从而完成数据备份。其中，该导出工具可以启动一个mapreduce(映射化简)任务，并通过一系列Hbase的API(Application Programming Interface，应用程序编程接口)来调用Hbase集群内的数据，并将这些数据写入到指定的HDFS(HadoopDistributed File System，Hadoop分布式文件系统)文件中，然后将HDFS文件备份到本地，从而完成数据备份过程。

由于导出工具启动了mapreduce任务，并通过Hbase的API来调用Hbase集群内的数据，从而对Hbase集群产生了一定压力，也会对现有业务产生影响。由于备份数据需要存储在HDFS文件上，因此依赖于HDFS集群环境的稳定性。

发明内容

本发明提供一种数据恢复方法，所述方法包括以下步骤：

数据备份阶段：获取服务器列表和region信息列表；针对region信息列表内的每个region信息，从服务器列表内为region信息分配至少两个服务器，并指定所述region信息在分配的每个服务器的备份优先级；针对服务器列表内的每个服务器，为服务器生成节点信息结构，所述节点信息结构包括需要由所述服务器进行备份的region信息以及该region信息在所述服务器上的备份优先级，以使所述服务器利用所述节点信息结构对该region信息对应的数据进行备份；

数据恢复阶段：针对所述region信息列表内的每个region信息，从所述数据备份阶段备份的所有数据中，选择该region信息对应的一份数据进行恢复。

所述服务器利用所述节点信息结构对该region信息对应的数据进行备份的过程，具体包括：所述服务器从所述节点信息结构中解析出需要由所述服务器进行备份的region信息以及该region信息在所述服务器上的备份优先级；

所述服务器按照备份优先级从高到低的顺序，对需要由所述服务器进行备份的region信息进行排序，并按照排序结果，从第一个region信息开始，依次对每个region信息对应的数据进行备份；或者，按照备份优先级从低到高的顺序，对需要由所述服务器进行备份的region信息进行排序，并按照排序结果，从最后一个region信息开始，依次对每个region信息对应的数据进行备份。

所述方法进一步包括：

当有服务器发生异常时，获取迁移的目的服务器，并将发生异常的服务器的备份任务迁移到所述目的服务器，由所述目的服务器对备份任务进行处理；

其中，所述目的服务器对所述备份任务进行处理包括：所述目的服务器对需要由发生异常的服务器进行备份的region信息对应的数据进行备份；若当前存在已经备份完成的服务器，所述目的服务器为已经备份完成的服务器；若当前不存在已经备份完成的服务器，所述目的服务器为备份数据最快的服务器。

所述方法进一步包括：

在从所述服务器列表内为所述region信息列表内的每个region信息分配至少两个服务器的过程中，每个服务器上被分配的region信息的数量均衡；

在指定所述region信息在分配的每个服务器的备份优先级的过程中，指定所述region信息在不同的服务器上的备份优先级不同。

所述方法进一步包括：

在所述服务器对该region信息对应的数据进行备份时，所述数据的命名格式为：该region信息和该region信息在所述服务器上的备份优先级标识；

所述数据恢复阶段，具体包括：从数据备份阶段备份的所有数据中，查询到具有最高优先级别的备份优先级标识对应的所有数据，并对查询到的数据进行恢复；判断当前是否存在未查询到的数据；如果否，则完成数据恢复阶段；如果是，则查询到具有下一级优先级别的备份优先级标识对应的所有数据，针对所述所有数据中的每个数据，判断该数据是否已经存在对应的已恢复数据；如果有，则丢弃该数据，如果没有，则对该数据进行恢复；如果所述所有数据均完成处理，则返回判断当前是否存在未查询到的数据的步骤。

本发明提供一种数据恢复装置，所述装置具体包括：

数据备份模块，用于执行数据备份阶段，所述数据备份模块具体用于：获取服务器列表和region信息列表；针对所述region信息列表内的每个region信息，从所述服务器列表内为region信息分配至少两个服务器，并指定所述region信息在分配的每个服务器的备份优先级；针对所述服务器列表内的每个服务器，为服务器生成节点信息结构，所述节点信息结构包括需要由所述服务器进行备份的region信息以及该region信息在所述服务器上的备份优先级，以使所述服务器利用所述节点信息结构对该region信息对应的数据进行备份；

数据恢复模块，用于执行数据恢复阶段，所述数据恢复模块具体用于：针对所述region信息列表内的每个region信息，从所述数据备份阶段备份的所有数据中，选择该region信息对应的一份数据进行恢复。

所述数据备份模块为所述服务器生成的节点信息结构，用于使所述服务器从所述节点信息结构中解析出需要由所述服务器进行备份的region信息以及该region信息在所述服务器上的备份优先级，按照备份优先级从高到低的顺序，对需要由所述服务器进行备份的region信息进行排序，并按照排序结果，从第一个region信息开始，依次对每个region信息对应的数据进行备份，或者，按照备份优先级从低到高的顺序，对需要由所述服务器进行备份的region信息进行排序，并按照排序结果，从最后一个region信息开始，依次对每个region信息对应的数据进行备份。

所述数据备份模块，还用于当有服务器发生异常时，获取迁移的目的服务器，并将发生异常的服务器的备份任务迁移到所述目的服务器，由所述目的服务器对备份任务进行处理；其中，所述目的服务器对所述备份任务进行处理包括：所述目的服务器对需要由发生异常的服务器进行备份的region信息对应的数据进行备份；若当前存在已经备份完成的服务器，所述目的服务器为已经备份完成的服务器；若当前不存在已经备份完成的服务器，所述目的服务器为备份数据最快的服务器。

所述数据备份模块，进一步用于在从所述服务器列表内为所述region信息列表内的每个region信息分配至少两个服务器的过程中，每个服务器上被分配的region信息的数量均衡；在指定所述region信息在分配的每个服务器的备份优先级的过程中，指定所述region信息在不同的服务器上的备份优先级不同。

所述数据恢复模块，具体用于从数据备份阶段备份的所有数据中，查询到具有最高优先级别的备份优先级标识对应的所有数据，并对查询到的数据进行恢复；判断当前是否存在未查询到的数据；如果否，则完成数据恢复阶段；如果是，则查询到具有下一级优先级别的备份优先级标识对应的所有数据，针对所述所有数据中的每个数据，判断该数据是否已经存在对应的已恢复数据；如果有，则丢弃该数据，如果没有，则对该数据进行恢复；如果所述所有数据均完成处理，则返回判断当前是否存在未查询到的数据的步骤。

基于上述技术方案，本发明实施例中，可以由各服务器对region信息对应的数据进行备份，即通过文件拷贝方式对region信息对应的数据进行备份，不需要通过导出工具将服务器上的数据导出，不需要通过API来调用Hbase集群内的数据，减轻对Hbase集群的压力，避免对现有业务产生影响。而且，备份数据可以保存在服务器本地，不需要依赖其它备份服务器，备份数据不需要存储在HDFS文件上，不依赖于HDFS集群环境的稳定性。而且，多个服务器可以并发备份数据，可以冗余备份数据，解决单一服务器本地存储空间不足、数据本地容灾备份等问题，并降低了对每个服务器本地备份空间的要求，加快备份的速度，提高数据恢复的效率。而且，通过使用至少两个服务器对每个region信息对应的数据进行备份，可以保证数据备份的完整性、数据恢复的完整性。

附图说明

为了更加清楚地说明本发明实施例或者现有技术中的技术方案，下面将对本发明实施例或者现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本发明一种实施方式中的数据恢复方法的流程图；

图2是本发明一种实施方式中的数据备份阶段的处理流程图；

图3是本发明一种实施方式中的节点信息结构集合的示意图；

图4是本发明一种实施方式中的迁移备份任务的示意图；

图5是本发明一种实施方式中的数据恢复阶段的处理流程图；

图6是本发明一种实施方式中的数据恢复的节点信息结构集合的示意图；

图7是本发明一种实施方式中的控制设备的硬件结构图；

图8是本发明一种实施方式中的数据恢复装置的结构图。

具体实施方式

在本发明使用的术语仅仅是出于描述特定实施例的目的，而非限制本发明。本发明和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其它含义。还应当理解，本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本发明可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本发明范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，此外，所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

本发明实施例中提出了一种数据恢复方法，以对Hbase中的数据进行备份，并在另一数据库集群中对备份的数据进行恢复，从而对Hbase建立健壮的备份和故障恢复机制，以保证企业资产/企业数据资产。为了对Hbase中的数据进行备份，本发明实施例中，以Hbase中的region为单位来备份数据。其中，region是Hbase的子集，是Hbase中数据存储和管理的基本单位，Hbase中可以包含多个region，region按照Rowkey(行键)区间划分，作为分布到集群的基本单位。

在一个例子中，该数据恢复方法可以包括数据备份阶段以及数据恢复阶段。在数据备份阶段中，需要将源数据库中的数据进行备份。而在数据恢复阶段中，需要将数据备份阶段备份的数据恢复到目标数据库中。源数据库可以为Hbase，而对于目标数据库的存储结构，可以根据实际需要进行选择，在此不再赘述。

在一个例子中，该数据恢复方法可以应用于控制设备上，该控制设备可以为一个逻辑意义上的设备，可以包含多个功能模块，这些功能模块可以分布在相同的物理设备上，也可以分布在不同的物理设备上。以这些功能模块分布在不同的物理设备上为例，即这些功能模块是分布式部署的。其中，这些功能模块可以包含至少两个功能模块，一个功能模块部署在源数据库系统的管理设备上，执行数据备份阶段的操作，另一个功能模块部署在目标数据库系统的管理设备上，执行数据恢复阶段的操作，本发明实施例对此执行主体不做限制。

参见图1所示，为数据恢复方法的流程图，该方法可以包括以下步骤：

步骤101，数据备份阶段：获取服务器列表和region信息列表；针对region信息列表内的每个region信息，从服务器列表内为该region信息分配至少两个服务器，并指定该region信息在分配的每个服务器的备份优先级；针对服务器列表内的每个服务器，为该服务器生成节点信息结构，该节点信息结构包括需要由该服务器进行备份的region信息以及该region信息在该服务器上的备份优先级，以使该服务器利用该节点信息结构对该region信息对应的数据进行备份。

步骤102，数据恢复阶段：针对region信息列表内的每个region信息，从数据备份阶段备份的所有数据中，选择该region信息对应的一份数据进行恢复。

参见图2所示，为针对步骤101的数据备份阶段的处理流程图，其包括：

步骤201，获取服务器列表和region信息列表。

步骤202，针对region信息列表内的每个region信息，从服务器列表内为该region信息分配至少两个服务器(即从服务器列表内选择至少两个服务器，并分配给该region信息)，并指定该region信息在分配的每个服务器的备份优先级。

步骤203，针对服务器列表内的每个服务器，为该服务器生成节点信息结构，以使该服务器利用该节点信息结构对该region信息对应的数据进行备份。

在一个例子中，该节点信息结构具体可以包括但不限于：需要由该服务器进行备份的region信息以及该region信息在该服务器上的备份优先级。

针对步骤201，在一个例子中，由于源数据库系统中的服务器和region信息都是已知的，因此可以直接获取到服务器列表和region信息列表。例如，在源数据库系统中，假设由服务器1-服务器5来存储region信息对应的数据，则服务器列表中可以包括服务器1-服务器5。在源数据库系统中，假设服务器上可以存储region1-region10的数据，则region信息列表中可以包括region1-region10。

在一个例子中，可以通过如下“hadoop fs–ls/hbase/data/defaule/表名”命令，得到该表名对应的所有region信息，并且得到的这些region信息已经按照ASCII(AmericanStandard Code for Information Interchange，美国信息交换标准代码)进行排序，例如，排序后的region信息为region1-region10。进一步的，还可以将region1-region10添加到region信息列表中，从而得到上述region信息列表。

针对步骤202，考虑到集群备份的容灾性，在任意一个服务器的硬盘发生故障，并造成备份数据丢失的情况下，依然能够确保备份数据的完整性，则可以从服务器列表内为每个region信息分配至少两个服务器，这样，当一个服务器的硬盘发生故障时，还可以由其它服务器进行数据备份，从而确保备份数据的完整性。在一个例子中，可以从服务器列表内为每个region信息分配3个服务器，也就是说，同一个region信息对应的数据会被3个服务器进行数据备份。

在一个例子中，针对region信息列表内的每个region信息，在从服务器列表内为各region信息分配至少两个服务器的过程中，则每个服务器上被分配的region信息的数量均衡。每个服务器上被分配的region信息的数量均衡是指：每个服务器上被分配的region信息的数量可以相同，也可以不同。其中，当region信息的数量可以平均分配到所有服务器时，每个服务器上被分配的region信息的数量相同，如region信息的数量为15，服务器的数量为5，则可以将15个region信息平均分配到5个服务器上，每个服务器分配3个region信息。当region信息的数量无法平均分配到所有服务器时，则每个服务器上被分配的region信息的数量不同，但是其是均衡的，如region信息的数量为14，服务器的数量为5，则有4个服务器上分配3个region信息，另一个服务器上分配2个region信息。在后续过程中，以每个服务器上被分配的region信息的数量相同为例进行说明。

在一个例子中，在指定该region信息在分配的每个服务器的备份优先级的过程中，可以指定该region信息在不同的服务器上的备份优先级不同。

为了阐述上述过程，以服务器列表包括服务器1-服务器5，region信息列表包括region1-region10为例进行说明。为region1分配服务器1、服务器2和服务器3，且指定region1在服务器1、服务器2和服务器3上的备份优先级分别为1、2、3，优先级数值越小，优先级越大。为region2分配服务器2、服务器3和服务器4，且指定region2在服务器2、服务器3和服务器4上的备份优先级分别为1、2、3。为region3分配服务器3、服务器4和服务器5，且指定region3在服务器3、服务器4和服务器5上的备份优先级分别为1、2、3。为region4分配服务器4、服务器5和服务器1，且指定region4在服务器4、服务器5和服务器1上的备份优先级分别为1、2、3。以此类推，最终分配结果可以如表1所示。

表1

在一个例子中，考虑到后续数据还原时，避免重复恢复的问题，以及为了标示出region信息在每个服务器上的备份优先级，则最终分配结果还可以如表2所示，即每个region信息在不同服务器上有备份优先级之分，其命名格式还可以为：region信息+“_”+序号，该序号表示该region信息在服务器上的备份优先级标识，如其中的1表示备份优先级为1，其中的2表示备份优先级为2，其中的3表示备份优先级为3，而且，优先级数值越小，则优先级越大。

表2

	服务器1	服务器2	服务器3	服务器4	服务器5
						region1	region1_1	region1_2	region1_3
region2		region2_1	region2_2	region2_3
						region3			region3_1	region3_2	region3_3
region4	region4_3			region4_1	region4_2
						region5	region5_2	region5_3			region5_1
region6	region6_1	region6_2	region6_3
						region7		region7_1	region7_2	region7_3
region8			region8_1	region8_2	region8_3
						region9	region9_3			region9_1	region9_2
region10	region10_2	region10_3			region10_1

从表2可以看出，region1-region10均被分配给三个服务器，且每个region信息在不同服务器上的备份优先级不同。每个服务器被分配了6个region信息，且每个服务器上被分配的具有备份优先级1的region信息的数量为2，具有备份优先级2的region信息的数量为2，具有备份优先级3的region信息的数量为2。

针对步骤203，在一个例子中，基于表1或者表2所示的最终分配结果，可以为每个服务器生成节点信息结构。例如，需要由服务器1进行备份的region信息为region1、region4、region5、region6、region9、region10，因此，为该服务器1生成的节点信息结构可以具体包括：region1+备份优先级1、region4+备份优先级3、region5+备份优先级2、region6+备份优先级1、region9+备份优先级3、region10+备份优先级2。此外，对于其它服务器的节点信息结构的生成方式，与服务器1的节点信息结构的生成方式类似，在此不再重复赘述。

在一个例子中，在为服务器生成该节点信息结构之后，则该服务器可以直接利用该节点信息结构对该region信息对应的数据进行备份。其中，服务器利用该节点信息结构对该region信息对应的数据进行备份的过程，具体可以包括但不限于如下方式：服务器从该节点信息结构中解析出需要由该服务器进行备份的region信息以及该region信息在该服务器上的备份优先级。进一步的，服务器可以按照备份优先级从高到低的顺序，对需要由该服务器进行备份的region信息进行排序，并按照排序结果，从第一个region信息开始，依次对每个region信息对应的数据进行备份；或者，服务器还可以按照备份优先级从低到高的顺序，对需要由该服务器进行备份的region信息进行排序，并按照排序结果，从最后一个region信息开始，依次对每个region信息对应的数据进行备份。

例如，服务器1可以从节点信息结构中解析出需要由服务器1进行备份的region信息为：region1、region4、region5、region6、region9、region10，且region1在服务器1上的备份优先级为1、region4在服务器1上的备份优先级为3、region5在服务器1上的备份优先级为2、region6在服务器1上的备份优先级为1、region9在服务器1上的备份优先级为3、region10在服务器1上的备份优先级为2。

之后，服务器1按照备份优先级从高到低的顺序，对需要由服务器1进行备份的region信息进行排序，则排序结果为region1、region6、region5、region10、region4、region9。其中，对于备份优先级相同的region信息，对于其顺序可以根据实际需要任意选择，例如，region1可以在region6之前，region6也可以在region1之前，对此不做限制。或者，服务器1按照备份优先级从低到高的顺序进行排序时，排序结果为region9、region4、region10、region5、region6、region1。

之后，服务器1对region1对应的数据进行备份，待备份完成后，服务器1对region6对应的数据进行备份，待备份完成后，服务器1对region5对应的数据进行备份，待备份完成后，服务器1对region10对应的数据进行备份，待备份完成后，服务器1对region4对应的数据进行备份，待备份完成后，服务器1对region9对应的数据进行备份。其中，对于数据备份方式，在此不再赘述。

在一个例子中，在为服务器生成节点信息结构之后，为了使服务器可以利用该节点信息结构对region信息对应的数据进行备份，则可以有如下两种方式：

方式一、为每个服务器生成独立的节点信息结构，并将该节点信息结构下发给该服务器。其中，该节点信息结构中只包含针对该服务器的信息，即需要由该服务器进行备份的region信息以及该region信息在该服务器上的备份优先级。基于此，服务器在接收到该节点信息结构后，就可以利用该节点信息结构对region信息对应的数据进行备份。而且每个服务器均按照上述方式进行处理。

方式二、为所有服务器生成一个节点信息结构集合，该节点信息结构集合中包含了每个服务器的节点信息结构，且每个服务器的节点信息结构中包含需要由该服务器进行备份的region信息以及该region信息在该服务器上的备份优先级。基于此，服务器可以从该节点信息结构集合中查询到本服务器的节点信息结构，并可以利用查询到的节点信息结构对region信息对应的数据进行备份。

其中，可以在集群的zookeeper上创建图3的节点信息结构集合，BackData表示该结构是针对备份数据的节点信息结构集合，DomainName为服务器的域名，即以服务器的域名作为节点名称，而且表示DomainName下挂的内容是针对该服务器的节点信息结构，例如，DomainName1下挂的内容是针对服务器1的节点信息结构，对于其它DomainName，在图3中并没有显示其下挂的内容，但是其下挂的内容可以与DomainName1下挂的内容类似，在此不再赘述。

tbName表示以待备份的Hbase表名作为节点名称，即tbName的内容为当前待备份的Hbase表名。Status表示服务器对备份任务的进展情况，如0表示初始化，1表示任务进行中，2表示任务备份完成，3表示备份任务异常，当然，还可以使用其它数值表示这四种情况，如4表示备份任务异常，对此不做限制。

Back1用于保存服务器的第一优先备份的region信息，即备份优先级为1的region信息，如针对服务器1的region1和region6。Back2用于保存服务器的第二优先备份的region信息，即备份优先级为2的region信息，如针对服务器1的region5和region10。Back3用于保存服务器的第三优先备份的region信息，即备份优先级为3的region信息，如针对服务器1的region4和region9。

当有服务器发生异常时，如服务器2发生异常时，如果需要将服务器2的备份任务迁移到服务器1，则subBack1用于保存服务器2上的第一优先备份的region信息，如服务器2上的备份优先级为1的region信息，如针对服务器2的region2和region7。subBack2用于保存服务器2上的第二优先备份的region信息，如服务器2上的备份优先级为2的region信息，如针对服务器2的region1和region6。subBack3用于保存服务器2上的第三优先备份的region信息，如服务器2上的备份优先级为3的region信息，如针对服务器2的region5和region10。

在一个例子中，zookeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Hadoop和Hbase的重要组件，是一个为分布式应用提供一致性服务的组件，提供的功能可以包括：配置维护、域名服务、分布式同步、组服务等。基于此，通过在zookeeper上创建表3所示的节点信息结构集合，使得各服务器可以从zookeeper上获取到该节点信息结构集合，并利用本服务器的域名，从该节点信息结构集合中解析出该域名对应的节点信息结构，即可以解析出tbName、Status、Back1、Back2、Back3、subBack1、subBack2、subBack3等内容。

服务器在解析出tbName、Status、Back1、Back2、Back3、subBack1、subBack2、subBack3等内容后，在进行数据备份时，优先备份Back1下的region信息对应的数据，待Back1下的region信息对应的数据备份完成后，从Back1下清空其记录的region信息，并备份Back2下的region信息对应的数据。待Back2下的region信息对应的数据备份完成后，从Back2下清空其记录的region信息，并备份Back3下的region信息对应的数据。待Back3下的region信息对应的数据备份完成后，从Back3下清空其记录的region信息，并将Status下的值修改为2。

进一步的，假设在subBack1、subBack2、subBack3下均存在了region信息，则服务器还可以备份subBack1下的region信息对应的数据，待subBack1下的region信息对应的数据备份完成后，则可以从subBack1下清空其记录的region信息，并备份subBack2下的region信息对应的数据。待subBack2下的region信息对应的数据备份完成后，则可以从subBack2下清空其记录的region信息，并备份subBack3下的region信息对应的数据。待subBack3下的region信息对应的数据备份完成后，则可以从subBack3下清空其记录的region信息。

在一个例子中，当有服务器发生异常时，则获取迁移的目的服务器，并将发生异常的服务器的备份任务迁移到目的服务器，由目的服务器对该备份任务进行处理。其中，目的服务器对备份任务进行处理，可以包括：目的服务器对需要由发生异常的服务器进行备份的region信息对应的数据进行备份。若当前存在已经备份完成的服务器，则目的服务器为已经备份完成的服务器；若当前不存在已经备份完成的服务器，则目的服务器为备份数据最快的服务器。

例如，在数据备份过程中，如果获知某个服务器发生异常(如服务器离线等)，则可以将发生异常的服务器的备份任务迁移到目的服务器。其备份迁移流程可以包括：查找所有Status为2(分配的备份任务已经完成)的服务器，如果存在Status为2的服务器，则将Status为2的服务器确定为目的服务器，并将发生异常的服务器的备份任务迁移到目的服务器，如果不存在Status为2的服务器，则将备份数据最快的服务器确定为目的服务器，并将发生异常的服务器的备份任务迁移到目的服务器。将发生异常的服务器的备份任务迁移到目的服务器是指：将发生异常的服务器的Back1中的内容迁移到目的服务器的subBack1下，将发生异常的服务器的Back2中的内容迁移到目的服务器的subBack2下，将发生异常的服务器的Back3中的内容迁移到目的服务器的subBack3下。

其中，备份数据最快的服务器是指：当服务器1的Back1下的备份任务完成，且Back2下的备份任务完成(Back1、Back2下的内容为空)，而服务器2的Back1下的备份任务完成(Back1下的内容为空)时，则说明服务器1备份数据的速度比服务器2备份数据的速度快，若服务器1备份数据的速度比其它所有服务器备份数据的速度都快，则说明服务器1是备份数据最快的服务器。

如图4所示，为将服务器2(出现异常的服务器)的备份任务迁移到服务器1(目的服务器)上的一个示例，此时，服务器1本身的备份任务已经处理完成，即Back1下的region信息、Back2下的region信息、Back3下的region信息均已经为清除，Back1、Back2、Back3下的内容均为空。服务器1在检测到存在备份任务时，重新启动备份流程，在进行数据备份时，服务器1优先备份subBack1下的region2对应的数据，待region2对应的数据备份完成后，备份subBack1下的region7对应的数据，待region7对应的数据备份完成后，从subBack1下清空其记录的region信息，并备份subBack2下的region1对应的数据，待region1对应的数据备份完成后，备份subBack2下的region6对应的数据，待region6对应的数据备份完成后，从subBack2下清空其记录的region信息，并备份subBack3下的region5对应的数据，待region5对应的数据备份完成后，备份subBack3下的region10对应的数据，待region10对应的数据备份完成后，从subBack3下清空其记录的region信息，至此，服务器1完成备份任务的处理，结束流程。

综上所述，在数据备份过程中，可以由各服务器对region信息对应的数据进行备份，即通过文件拷贝方式对region信息对应的数据进行备份，不需要通过导出工具将服务器上的数据导出，不需要通过API来调用Hbase集群内的数据，减轻对Hbase集群的压力，避免对现有业务产生影响。而且，以region为单位进行备份时，通过事先将region信息进行合理分配，使得每个服务器只备份一部分数据，大大降低了对每个服务器的本地备份空间的要求，如每个服务器备份的数据总量是N/M，N为region需要备份的数量，M为服务器的总数量。而且，备份数据可以保存在服务器本地，不需要依赖其它备份服务器，备份数据不需要存储在HDFS文件上，不依赖于HDFS集群环境的稳定性。而且，多个服务器可以并发备份数据，可以冗余备份数据，解决单一服务器本地存储空间不足、数据本地容灾备份等问题，并降低了对每个服务器本地备份空间的要求，加快备份的速度，提高数据恢复的效率。而且，通过使用至少两个服务器对每个region信息对应的数据进行备份，可以保证数据备份的完整性、数据恢复的完整性。而且，当备份任务执行过程中，有服务器发生异常时，则region对应的数据依然可以在多台服务器上进行备份，充分考虑了备份过程中异常情况的处理，保证备份数据的完整性，同时，还充分考虑了部分服务器异常情况下备份任务的迁移，保证服务器的任务均衡，并提供整体备份任务的性能。

在一个例子中，在服务器对region信息对应的数据进行备份时，数据的命名格式为：该region信息和该region信息在服务器上的备份优先级标识。基于此，参见图5所示，为针对步骤102的数据恢复阶段的处理流程图，其包括：

步骤501，从数据备份阶段备份的所有数据中，查询到具有最高优先级别的备份优先级标识对应的所有数据，并对查询到的数据进行恢复。

步骤502，判断当前是否存在未查询到的数据。如果是，执行步骤503。如果否，则完成数据恢复阶段，即针对region信息列表内的每个region信息，从数据备份阶段备份的所有数据中，选择该region信息对应的一份数据进行恢复。

步骤503，查询到具有下一级优先级别的备份优先级标识对应的所有数据。

步骤504，针对所述所有数据(即具有下一级优先级别的备份优先级标识对应的所有数据)中的每个数据，判断该数据是否已经存在对应的已恢复数据。

如果有，则执行步骤505；如果没有，则执行步骤506。

步骤505，丢弃该数据，若所述所有数据均完成处理，返回步骤502。

步骤506，对该数据进行恢复，若所述所有数据均完成处理，返回步骤502。

在一个例子中，可以将备份有数据的服务器重新组成集群，并对集群内的服务器中所有备份数据的region信息进行遍历，获取所有的region信息，并将这些region信息的分布以及优选顺序保存在集群zookeeper的还原节点中，如图6所示，为在zookeeper上创建BackUp节点，并通过BackUp节点保存每个服务器的待还原region信息的一个示例，即每个服务器下保存待恢复的region信息。

其中，BackUp表示在本地备份的region信息，例如，上述针对服务器1的region1、region6、region5、region10、region4、region9等。subBackUp表示迁移到本服务器上来备份的region信息，例如，上述从服务器2迁移到服务器1进行备份的region2、region7、region1、region6、region5、region10等。

在上述基础上，通过图6可以获知，需要分别恢复region1-region10的数据。首先，从数据备份阶段备份的所有数据中，查询到具有最高优先级别的备份优先级标识对应的所有数据，即查询到region_1的数据，即region1_1、region2_1、region3_1、region4_1、region5_1、region6_1、region7_1、region8_1、region9_1、region10_1的数据，并对查询到的数据进行恢复。之后，由于当前存在未查询到的数据，因此查询到具有下一级优先级别的备份优先级标识对应的数据，即查询到region_2的数据，即region1_2、region2_2、region3_2、region4_2、region5_2、region6_2、region7_2、region8_2、region9_2、region10_2的数据。如果之前已经成功恢复region1_1的数据，则说明region1_2已经存在对应的已恢复数据，丢弃region1_2对应的数据，如果之前没有成功恢复region1_1的数据，则说明region1_2没有存在对应的已恢复数据，对region1_2对应的数据进行恢复。同理，对于其它region_2的数据的处理类似，在此不再赘述。之后，由于当前存在未查询到的数据，因此查询到具有下一级优先级别的备份优先级标识对应的数据，即查询到region_3的数据，即region1_3、region2_3、region3_3、region4_3、region5_3、region6_3、region7_3、region8_3、region9_3、region10_3的数据。在对region_3的数据处理完成后，由于当前不存在未查询到的数据，完成数据恢复阶段，针对每个region信息，只对region信息对应的一份数据进行恢复。

在一个例子中，在数据恢复过程中，如果有服务器发生异常，导致数据无法恢复，则也可以恢复相应数据。例如，如果服务器2发生异常，则服务器2无法恢复region2、region7、region1、region6、region5、region10等region信息对应的数据。在采用上述流程时，当查询到region_1的数据时，服务器2无法对region2_1、region7_1的数据进行恢复，而其它region_1的数据均被恢复。当查询到region_2的数据时，则其它服务器可以完成region2_2、region7_2的数据的恢复，从而可以恢复所有region信息对应的数据，保证数据的完整性。

基于上述技术方案，本发明实施例中，可以由各服务器对region信息对应的数据进行备份，即通过文件拷贝方式对region信息对应的数据进行备份，不需要通过导出工具将服务器上的数据导出，不需要通过API来调用Hbase集群内的数据，减轻对Hbase集群的压力，避免对现有业务产生影响。而且，备份数据可以保存在服务器本地，不需要依赖其它备份服务器，备份数据不需要存储在HDFS文件上，不依赖于HDFS集群环境的稳定性。而且，多个服务器可以并发备份数据，可以冗余备份数据，解决单一服务器本地存储空间不足、数据本地容灾备份等问题，并降低了对每个服务器本地备份空间的要求，加快备份的速度，提高数据恢复的效率。而且，通过使用至少两个服务器对每个region信息对应的数据进行备份，可以保证数据备份的完整性、数据恢复的完整性。而且，在数据恢复过程中，可以在集群服务器并发执行，提高数据恢复的效率。

基于与上述方法同样的发明构思，本发明实施例中还提供了一数据恢复装置，该数据恢复装置应用在控制设备上。其中，该数据恢复装置可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在的控制设备的处理器，读取非易失性存储器中对应的计算机程序指令形成的。从硬件层面而言，如图7所示，为本发明提出的数据恢复装置所在的控制设备的一种硬件结构图，除了图7所示的处理器、非易失性存储器外，控制设备还可以包括其他硬件，如负责处理报文的转发芯片、网络接口、内存等；从硬件结构上来讲，该控制设备还可能是分布式设备，可能包括多个接口卡，以便在硬件层面进行报文处理的扩展。

如图8所示，为本发明提出的数据恢复装置的结构图，所述装置具体包括：

数据备份模块11，用于执行数据备份阶段，所述数据备份模块具体用于：获取服务器列表和region信息列表；针对所述region信息列表内的每个region信息，从所述服务器列表内为region信息分配至少两个服务器，并指定所述

region信息在分配的每个服务器的备份优先级；针对所述服务器列表内的每个服务器，为服务器生成节点信息结构，所述节点信息结构包括需要由所述服务器进行备份的region信息以及该region信息在所述服务器上的备份优先级，以使所述服务器利用所述节点信息结构对该region信息对应的数据进行备份；

数据恢复模块12，用于执行数据恢复阶段，所述数据恢复模块具体用于：针对所述region信息列表内的每个region信息，从所述数据备份阶段备份的所有数据中，选择该region信息对应的一份数据进行恢复。

在一个例子中，所述数据备份模块11为所述服务器生成的节点信息结构，用于使所述服务器从所述节点信息结构中解析出需要由所述服务器进行备份的region信息以及该region信息在所述服务器上的备份优先级，按照备份优先级从高到低的顺序，对需要由所述服务器进行备份的region信息进行排序，并按照排序结果，从第一个region信息开始，依次对每个region信息对应的数据进行备份，或者，按照备份优先级从低到高的顺序，对需要由所述服务器进行备份的region信息进行排序，并按照排序结果，从最后一个region信息开始，依次对每个region信息对应的数据进行备份。

在一个例子中，所述数据备份模块11，还用于当有服务器发生异常时，获取迁移的目的服务器，并将发生异常的服务器的备份任务迁移到所述目的服务器，由所述目的服务器对备份任务进行处理；其中，所述目的服务器对所述备份任务进行处理包括：所述目的服务器对需要由发生异常的服务器进行备份的region信息对应的数据进行备份；若当前存在已经备份完成的服务器，所述目的服务器为已经备份完成的服务器；若当前不存在已经备份完成的服务器，所述目的服务器为备份数据最快的服务器。

所述数据备份模块11，进一步用于在从所述服务器列表内为所述region信息列表内的每个region信息分配至少两个服务器的过程中，每个服务器上被分配的region信息的数量均衡；在指定所述region信息在分配的每个服务器的备份优先级的过程中，指定所述region信息在不同的服务器上的备份优先级不同。

所述数据恢复模块12，具体用于从数据备份阶段备份的所有数据中，查询到具有最高优先级别的备份优先级标识对应的所有数据，并对查询到的数据进行恢复；判断当前是否存在未查询到的数据；如果否，则完成数据恢复阶段；如果是，则查询到具有下一级优先级别的备份优先级标识对应的所有数据，针对所述所有数据中的每个数据，判断该数据是否已经存在对应的已恢复数据；如果有，则丢弃该数据，如果没有，则对该数据进行恢复；如果所述所有数据均完成处理，则返回判断当前是否存在未查询到的数据的步骤。

其中，本发明装置的各个模块可以集成于一体，也可以分离部署。上述模块可以合并为一个模块，也可以进一步拆分成多个子模块。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。本领域技术人员可以理解附图只是一个优选实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中，也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块，也可进一步拆分成多个子模块。上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

以上公开的仅为本发明的几个具体实施例，但是，本发明并非局限于此，任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims

1.一种数据恢复方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述服务器利用所述节点信息结构对该region信息对应的数据进行备份的过程，具体包括：

所述服务器从所述节点信息结构中解析出需要由所述服务器进行备份的region信息以及该region信息在所述服务器上的备份优先级；

3.根据权利要求1所述的方法，其特征在于，所述方法进一步包括：

4.根据权利要求1所述的方法，其特征在于，所述方法进一步包括：

5.根据权利要求1所述的方法，其特征在于，所述方法进一步包括：

所述数据恢复阶段，具体包括：从数据备份阶段备份的所有数据中，查询到具有最高优先级别的备份优先级标识对应的所有数据，并对查询到的数据进行恢复；判断当前是否存在未查询到的数据；如果否，则完成数据恢复阶段；如果是，则查询到具有下一级优先级别的备份优先级标识对应的所有数据，针对具有下一级优先级别的备份优先级标识对应的所有数据中的每个数据，判断该数据是否已经存在对应的已恢复数据；如果有，则丢弃该数据，如果没有，则对该数据进行恢复；如果具有下一级优先级别的备份优先级标识对应的所有数据均完成处理，则返回判断当前是否存在未查询到的数据的步骤。

6.一种数据恢复装置，其特征在于，所述装置具体包括：

7.根据权利要求6所述的装置，其特征在于，所述数据备份模块为所述服务器生成的节点信息结构，用于使所述服务器从所述节点信息结构中解析出需要由所述服务器进行备份的region信息以及该region信息在所述服务器上的备份优先级，按照备份优先级从高到低的顺序，对需要由所述服务器进行备份的region信息进行排序，并按照排序结果，从第一个region信息开始，依次对每个region信息对应的数据进行备份，或者，按照备份优先级从低到高的顺序，对需要由所述服务器进行备份的region信息进行排序，并按照排序结果，从最后一个region信息开始，依次对每个region信息对应的数据进行备份。

8.根据权利要求6所述的装置，其特征在于，所述数据备份模块，还用于当有服务器发生异常时，获取迁移的目的服务器，并将发生异常的服务器的备份任务迁移到所述目的服务器，由所述目的服务器对备份任务进行处理；其中，所述目的服务器对所述备份任务进行处理包括：所述目的服务器对需要由发生异常的服务器进行备份的region信息对应的数据进行备份；若当前存在已经备份完成的服务器，所述目的服务器为已经备份完成的服务器；若当前不存在已经备份完成的服务器，所述目的服务器为备份数据最快的服务器。

9.根据权利要求6所述的装置，其特征在于，

10.根据权利要求6所述的装置，其特征在于，

所述数据恢复模块，具体用于从数据备份阶段备份的所有数据中，查询到具有最高优先级别的备份优先级标识对应的所有数据，并对查询到的数据进行恢复；判断当前是否存在未查询到的数据；如果否，则完成数据恢复阶段；如果是，则查询到具有下一级优先级别的备份优先级标识对应的所有数据，针对所述具有下一级优先级别的备份优先级标识对应的所有数据中的每个数据，判断该数据是否已经存在对应的已恢复数据；如果有，则丢弃该数据，如果没有，则对该数据进行恢复；如果具有下一级优先级别的备份优先级标识对应的所有数据均完成处理，则返回判断当前是否存在未查询到的数据的步骤。