WO2017107984A1

WO2017107984A1 - 一种数据恢复方法及装置

Info

Publication number: WO2017107984A1
Application number: PCT/CN2016/111762
Authority: WO
Inventors: 唐小岚; 王志坤
Original assignee: 中兴通讯股份有限公司
Priority date: 2015-12-25
Filing date: 2016-12-23
Publication date: 2017-06-29
Also published as: CN106919470A

Abstract

一种数据恢复方法及装置，当分布式文件系统HDFS进行数据恢复时，该方法包括：下载元数据列表和数据块列表（101）；接收访问任一目标文件的请求，根据所述请求在所述元数据中查找所述目标文件所包含的目标数据块信息（102）；若在数据块列表中查找到所述目标数据块信息，则获取所述目标数据块信息对应的下载完成标志（103）；若根据所述下载完成标志确定所述目标数据块信息未下载完成，则在所述数据块列表中查找所述目标数据块的属性信息（104）；从所述属性信息中获取所述目标数据块信息的预期访问时间，并根据所述请求的属性调整所述预期访问时间（105）。

Description

一种数据恢复方法及装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种数据恢复方法及装置。

背景技术

随着大数据时代的到来，数据信息日益重要，数据保护问题日渐突出。数据保护、数据的容灾是非常重要的话题。

据统计，导致系统出现问题的原因分布比例一般为:硬件故障占44％、人为错误占32％、软件故障占14％、病毒影响占7％、自然灾难占3％。数据容灾系统，就是为计算机信息系统提供的一个能应付各种灾难的环境。当计算机系统在遭受如火灾、水灾、地震、战争等不可抗拒的自然灾难以及计算机犯罪、计算机病毒、掉电、网络/通信失败、硬件/软件错误和人为操作错误等人为灾难时，容灾系统将保证用户数据的安全性。甚至，一个更加完善的容灾系统，还能提供不间断的应用服务。

Hadoop分布式文件系统(Hadoop distributed filesystem，简称HDFS)被设计成适合运行在通用硬件上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时，它和其他的分布式文件系统也有很明显的区别。HDFS是一个高度容错性的系统，适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。

随着HDFS的使用越来越普遍，如何把HDFS中的大量数据快速准确地备份到远端服务器，并且能够在指定的集群上迅速恢复成为了一个显著问题。

在系统损坏恢复过程中，我们希望HDFS能够尽快从备份服务器恢复数据，并向外提供服务，以减小服务的中断时间。

但是一个HDFS系统中往往保存了大量的数据，尽管使用了多个数据节点并行传输的方法，依然需要花费相当长的时间从备份服务器恢复过来，导致服务中断时间过长。

发明内容

本发明提供一种数据恢复方法和装置，该方法和装置用于解决现有技术中HDFS系统从备份服务器恢复数据时服务中断时间过长的问题。

本发明公开一种数据恢复方法，当分布式文件系统HDFS进行数据恢复时，包括：

下载元数据列表和数据块列表；

接收访问任一目标文件的请求，根据所述请求在所述元数据中查找所述目标文件所包含的目标数据块信息；

若在数据块列表中查找到所述目标数据块信息，则获取所述目标数据块信息对应的下载完成标志；

若根据所述下载完成标志确定所述目标数据块信息未下载完成，则在所述数据块列表中查找所述目标数据块信息的属性信息；

从所述属性信息中获取所述目标数据块信息的预期访问时间，并根据所述请求的属性调整所述预期访问时间。

可选的，数据节点根据所述请求的属性调整所述预期访问时间包括：

当根据所述请求的属性信息确定所述请求为读取所述任一文件，则确定所述预期访问时间与当前的系统时间中的最小值，将所述预期访问时间调整为所述最小值，使得系统利用调整后的所述预期访问时间恢复所述目标数据块信息。

可选的，将所述预期访问时间调整为所述最小值之后，该方法进一步包括：

在所述数据块列表中找到所述目标数据块信息对应的目标数据节点，通过远程过程调用向所述目标数据节点发送调整信息，使得该目标数据节点根据该调整信息更新预存的所述目标数据块信息的预期访问时间。

可选的，下载元数据列表和数据块列表之前，该方法进一步包括：

设置操作阈值，使得在数据恢复操作未完成时可以对外提供对数据进行操作的服务；其中，所述操作阈值为已恢复的数据块的数量占待恢复的所有数据块的数量的比例。

可选的，该方法还包括：

当根据所述请求的属性信息确定所述请求为删除所述任一文件，则在所述数据块列表中查找所述目标数据块信息对应的目标数据节点，通过远程过程调用向所述目标数据节点发送删除消息；使得所述目标数据节点收到所述删除消息后，在数据块的下载队列中删除所述目标数据块信息对应的信息。

可选的，根据所述请求的属性调整所述预期访问时间之后，进一步包括：

数据节点中维护一个数据块下载的优先队列，数据节点每次从该队列中取出预期访问时间最小的块信息；

从备份端服务器下载块信息对应的数据块。

本发明还提供一种数据恢复装置，包括：

列表模块，用于当分布式文件系统HDFS进行数据恢复时，下载元数据列表和数据块列表；

第一查找模块，用于接收访问任一目标文件的请求，根据所述请求在所述元数据中查找所述目标文件所包含的目标数据块信息；

获取模块，用于若在数据块列表中查找到所述目标数据块信息，则获取所述目标数据块信息对应的下载完成标志；

第二查找模块，用于若根据所述下载完成标志确定所述目标数据块信息未下载完成，则在所述数据块列表中查找所述目标数据块信息的属性信息；

调整模块，用于从所述属性信息中获取所述目标数据块信息的预期访问时间，并根据所述请求的属性调整所述预期访问时间。

可选的，所述调整模块具体用于当根据所述请求的属性信息确定所述请求为读取所述任一文件，则确定所述预期访问时间与当前的系统时间中的最小值，将所述预期访问时间调整为所述最小值，使得系统利用调整后的所述预期访问时间恢复所述目标数据块信息。

可选的，所述调整模块还用于将所述预期访问时间调整为所述最小值之后，在所述数据块列表中找到所述目标数据块信息对应的目标数据节点，通过远程过程调用向所述目标数据节点发送调整信息，使得该目标数据节点根据该调整信息更新预存的所述目标数据块信息的预期访问时间。

可选的，该装置还包括：

恢复模块，用于在下载元数据列表和数据块列表之前，设置操作阈值，使得在数据恢复操作未完成时可以对外提供对数据进行操作的服务；其中，所述操作阈值为已恢复的数据块的数量占待恢复的所有数据块的数量的比例。

可选的，该装置还包括：

删除模块，用于当根据所述请求的属性信息确定所述请求为删除所述任一文件，则在所述数据块列表中查找所述目标数据块信息对应的目标数据节点，通过远程过程调用向所述目标数据节点发送删除消息；使得所述目标数据节点收到所述删除消息后，在数据块的下载队列中删除所述目标数据块信息对应的信息。

可选的，该装置还包括：

下载模块，用于在数据节点中维护一个数据块下载的优先队列，数据节点每次从该队列中取出预期访问时间最小的块信息；从备份端服务器下载块信息对应的数据块。

本发明还公开一种分布式文件系统HDFS的按需恢复数据的方法，包括：

接收针对一目标文件的请求，查找所述目标文件；

在查找到所述目标文件的情况下，判断所述目标文件对应的目标数据块文件是否下载完成；以及

在所述目标数据块文件未下载完成时，根据所述请求对数据块文件下载的优先队列进行调整以优先恢复所述目标数据块文件。

可选的，当所述请求为访问所述目标文件时，所述根据所述请求对数据块文件下载的优先队列进行调整以优先恢复所述目标数据块文件的步骤还包括：

在预先存储的数据块文件与数据节点的映射关系中查找所述目标数据块文件的信息；以及

从所述目标数据块文件的信息中获取所述目标数据块文件的预期访问时间，确定所述预期访问时间与当前的系统时间中的最小值，将所述预期访问时间调整为所述最小值，使得所述HDFS利用调整后的所述预期访问时间恢复所述目标数据块文件。

可选的，将所述预期访问时间调整为所述最小值之后，该方法还包括：

在所述映射关系中找到所述目标数据块文件对应的目标数据节点，通过远程过程调用向所述目标数据节点发送调整信息，使得该目标数据节点根据该调整信息更新预存的所述目标数据块文件的预期访问时间。

可选的，当所述请求为删除所述目标文件时，所述根据所述请求对数据块文件下载的优先队列进行调整以优先恢复所述目标数据块文件的步骤包括：

在预先存储的数据块文件与数据节点的映射关系中查找所述目标数据块文件对应的目标数据节点，通过远程过程调用向所述目标数据节点发送删除消息，使得所述目标数据节点在收到所述请求后，从所述目标数据节点的下载队列中删除所述目标数据块文件。

可选的，在所述接收针对一目标文件的请求，查找所述目标文件之前，所述方法还包括：从备份服务器下载元数据。

可选的，在所述从备份服务器下载元数据之前，所述方法还包括：

设置操作阈值，使得在所述按需恢复数据的方法未完成时可以对外提供对数据进行操作的服务；其中，所述操作阈值为已恢复的数据块的数量占待恢复的所有数据块的数量的比例。

可选的，所述方法还包括：

所述数据节点每次从所述优先队列中取出预期访问时间最小的数据块文件；以及

从备份服务器下载与被取出的数据块文件对应的数据。

此外，本发明还公开一种分布式文件系统HDFS的按需恢复数据的装置，包括：

第一查找模块，设置为接收针对一目标文件的请求，查找所述目标文件；

判断模块，设置为在查找到所述目标文件的情况下，判断所述目标文件对应的目标数据块文件是否下载完成；

调整模块，设置为在所述目标数据块文件未下载完成时，根据所述请求对数据块文件下载的优先队列进行调整以优先恢复所述目标数据块。

可选的，所述调整模块还设置为：

当所述请求为访问所述目标文件时，在预先储存的数据块文件与数据节点的映射关系中查找所述目标数据块文件的信息；以及

可选的，所述调整模块还设置为：

在将所述预期访问时间调整为所述最小值之后，在所述映射关系中找到所述目标数据文件对应的目标数据节点，通过远程调用向所述目标数据节点发送调整信息，使得该目标数据节点根据该调整信息更新预存的所述目标数据块文件的预期访问时间。

可选的，所述调整模块还设置为：

当所述请求为删除所述目标文件时，在预先存储的数据块文件与数据节点的映射关系中查找所述目标数据块文件对应的目标数据节点，通过远程过程调用向所述目标数据节点发送删除消息，使得所述目标数据节点在收到所述请求后，从所述目标数据节点的下载队列中删除所述目标数据块文件。

可选的，所述装置还包括备份模块，设置为：从备份服务器下载元数据。

可选的，所述装置还包括恢复模块，设置为：

设置操作阈值，使得在所述按需恢复数据未完成时可以对外提供对数据进行操作的服务；其中，所述操作阈值为已恢复的数据块的数量占待恢复的所有数据块的数量的比例。

可选的，所述装置还包括下载模块，设置为：

使所述数据节点每次从所述优先队列中取出预期访问时间最小的数据块文件；以及

从备份端服务器下载被取出的数据块文件对应的数据。

上述技术方案中的一个或两个，至少具有如下技术效果：

本发明公开的方法和装置，在下载数据块过程中，首先下载并载入元数据开始提供文件系统服务；在名字节点和数据节点中保存要下载的数据块列表；根据恢复过程中客户端对数据块的访问需求调整恢复的优先级，优先恢复客户端访问的文件；对于客户端删除的文件放弃恢复过程以节省时间；可以实现高效的分布式文件系统按需恢复。

附图说明

图1为本发明实施例提供一种数据恢复方法的流程图；

图2为本发明实施例所提供方法所实用的装置结构示意图；

图3为本发明实施例所提供方法在具体环境中使用时的流程示意图；

图4为本发明实施例提供一种数据恢复装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

在HDFS中并不会出现所有的数据在同一时刻被访问的情况，一般需要立刻访问的数据往往只是一小部分。为了减小数据恢复时服务中断时间，让HDFS尽快开始向外提供服务，本发明实施例提供的方法中，可以按需对数据进行恢复；即在数据恢复过程中，实时地根据访问情况调整恢复的优先级，先恢复需要尽快访问的数据，后恢复不需要现在访问的数据。通过上述方法，大大地减少了服务的中断恢复时间，并且提供了更灵活的控制恢复过程的方法。以下结合具体的附图对本发明实施例提供的方法作详细说明，具体包括：

如图1所示，本发明实施例提供一种数据恢复方法，当Hadoop分布式文件系统进行数据恢复时，具体包括：

步骤101，下载元数据列表和数据块列表；

现有技术中，如果数据没有恢复到一定程度，HDFS文件系统处于安全模式，此时只支持文件系统目录树的查看，不支持对文件系统的修改和对文件的读取。为了保证即使在文件系统中的数据块没有被下载完成时，文件系统依然可以对外提供完整的服务，在该实施例中，可以在步骤101下载元数据列表和数据块列表之前，进一步包括：

设置操作阈值，使得在数据恢复操作未完成时可以对外提供对数据进行操作的服务；其中，所述操作阈值为已恢复的数据块的数量占待恢复的所有数据块的数量的比例。具体使用时，该操作阈值可以设置为系统能够接受的最小值，例如设置为0。

步骤102，接收访问任一目标文件的请求，根据所述请求在所述元数据中查找所述目标文件所包含的目标数据块信息；

步骤103，若在数据块列表中查找到所述目标数据块信息，则获取所述目标数据块信息对应的下载完成标志；

步骤104，若根据所述下载完成标志确定所述目标数据块信息未下载完成，则在所述数据块列表中查找所述目标数据块信息的属性信息；

步骤105，从所述属性信息中获取所述目标数据块信息的预期访问时间，并根据所述请求的属性调整所述预期访问时间。

在本发明实施例中，根据请求的属性调整预期访问时间包括的具体实现方式包括多种，以下提供一种最优化的方式，具体可以是：

进一步，将预期访问时间调整为系统时间和下载之前设定的预期访问时间中的最小值后，该方法进一步包括：

另外，在数据恢复过程中，对于客户端删除的文件可以选择放弃恢复过程以节省数据恢复的时间；可以实现高效的分布式文件系统按需恢复。具体实现可以是：

基于上述方案根据访问的需求对数据块的预期访问时间进行调整之后，具体进行数据块的下载包括：

从备份端服务器下载块信息对应的数据块。

另外，数据块下载完成后，通过远程过程调用名字节点(NameNode)上的一个函数，告知名字节点(NameNode)已经完成下载的该数据块的信息，数据块的信息可以包括数据块的id、生成标志、长度；名字节点NameNode把对应数据块的下载完成标志置为true。

上述实施例所提供的方法应用到具体的环境中时，本发明实施例所实用的使用环境如图2所示，具体实现流程可以是：

该实施例中HDFS从备份服务器下载数据，然后HDFS中的名字节点(NameNode)和数据节点(DataNode)对下载的数据进行对应的处理，具体实现包括：

名字节点(NameNode)的内存中包括从备份端服务器下载的所有数据块的列表，同时HDFS启动时指定了数据节点(DataNode)的个数，NameNode将所有的数据块平均分配给所有的DataNode，即在DataNode向NameNode注册时，NameNode把分配给该DataNode的数据块列表发送给它，并且NameNode在内存中保存一个数据块信息到DataNode的映射关系(即数据块列表：Block-DataNode Map)，数据块的信息包括数据块的id、生成标志、长度、下载完成标志(默认false)、预期访问时间(一个长整数，默认为最大的长整数)。

在实施例中，从备份服务器下载数据的具体实现可以是：

数据节点中保存有一个数据块下载的优先队列，数据节点每次从该队列中取出预期访问时间最小的数据块(预期访问时间类型是一个长整数，初始化所有数据块的预期访问时间为最大的长整数)，从备份端服务器下载该数据块，下载完成后，通过远程过程调用调用名字节点上的一个函数，告知名字节点已经完成下载的该数据块的信息，这些信息包括数据块的id、生成标志、长度，名字节点把对应数据块的下载完成标志置为true。

启动名字节点，下载元数据；

在配置文件中进行配置，HDFS通过命令行启动，指定恢复选项、要恢复的文件系统名称和数据节点个数。配置文件优选是hdfs-backup.xml。配置文件存放于$HADOOP/etc/hadoop/hdfs-backup.xml，需要配置备份服务器的地址端口。配置完成以后HDFS系统执行恢复命令启动，指定恢复选项-recoverFromBackup、要恢复的文件系统名称、数据节点的个数。名字节点会从备份端服务器下载元数据的压缩文件到本地，并把该文件载入内存中得到文件系统的元数据，即文件系统的目录树；同时，名字节点从备份端服务器获取文件系统中所包含的所有数据块的列表，并将其放入内存中。

具体地，HDFS默认在文件系统中，当现有的数据块的数量占应该包含的所有数据块的数量的比例小于某个设定的阈值时，HDFS文件系统处于安全模式，此时只支持文件系统目录树的查看，不支持对文件系统的修改和对文件的读取；为了即使在文件系统中所有的数据块都没有被下载时，文件系统依然可以对外提供完整的服务，在该实施例中可以将该阈值设置为0。

启动数据节点，下载块数据；

数据节点启动之后向名字节点进行注册。名字节点在注册时向DataNode分配需要下载的数据块的列表。数据节点从备份服务器下载列表中的数据。

具体地，名字节点的内存中包括从备份端服务器下载的所有数据块的列表，同时HDFS启动时指定了数据节点的个数，名字节点将所有的数据块平均分配给所有的数据节点，即在数据节点向名字节点注册时，名字节点把分配给该数据节点的数据块列表发送给它，并且名字节点在内存中保存一个数据块信息到数据节点的映射关系(即数据块列表：Block-DataNode Map)，数据块的信息包括数据块的id、生成标志、长度、下载完成标志(默认false)、预期访问时间(一个长整数，默认为最大的长整数)。

具体地，数据节点中保存有一个数据块下载的优先队列，数据节点每次从该队列中取出预期访问时间最小的块(预期访问时间类型是一个长整数，初始化所有数据块的预期访问时间为最大的长整数)，从备份端服务器下载该数据块，下载完成后，通过远程过程调用调用名字节点上的一个函数，告知名字节点已经完成下载的该数据块的信息，包括数据块的id、生成标志、长度，名字节点把对应数据块的下载完成标志置为true。

如图3所示，基于上述数据下载的方法，如果在数据还没有恢复完成时，接收到客户端发送的访问某一数据的请求(该访问请求可以是读取某一数据也可以是删除数据)，则具体该方法还包括：

步骤301，客户端读取或删除任一文件；

步骤302，在元数据中查找该任一文件对应的数据块列表；

步骤303，在数据块列表中查找数据块更新预期访问时间或删除数据块，并发送指令到相应的数据节点；

步骤304，数据节点根据名字节点的指令更新相应的预期访问时间或删除相应的数据块；

数据节点在下载数据时候是根据预先设置的优先队列进行的，预先设置的优先队列是以预期访问时间排序的优先队列。

步骤305，数据节点根据修改后的优先队列中的顺序，逐个下载数据块。

为了更详细的说明数据读取和删除的具体实现方式，以下分别对数据读取和删除的具体实现方式做进一步的说明，具体包括：

(1)根据访问文件情况改变优先级。

客户端向名字节点发送打开文件命令；名字节点在内存中的元数据中查找到该文件所包含的待读取数据块，在Block-DataNode Map中查找该待读取数据块，若未找到，则说明要读取的数据块是启动之后新建的文件，则进行正常的读写操作；否则查看数据块的下载完成标志的值。如果所有数据块的下载完成标志都为true(表示已经下载完成)，则进行正常的读写操作。如果存在数据块的下载完成标志为false(表示未下载完成)，则对客户端返回一个“数据块下载中”错误，要求客户端稍后访问该文件；同时，在Block-DataNode Map中查找该数据块的信息，取现在的系统时间和该数据块的预期访问时间中的最小值设置为该数据块的预期访问时间，若该数据块的预期访问时间改变，则在Block-DataNode Map中找到它对应的数据节点，通过远程过程调用向该数据节点发送信息，更新该数据块的预期访问时间。

(2)根据删除文件情况改变优先级。

客户端向名字节点发送删除文件命令；名字节点在内存中的元数据中查找到该文件所包含的数据块，在Block-DataNode Map中查找这些数据块，若未找到，则说明要删除的是启动之后新建的文件，进行正常的删除操作；否则进行正常的删除元数据操作，并查看所包含的数据块的下载完成标志的值；对于下载完成标志为true的数据块，进行正常的删除操作；对于下载完成标志为false的数据块，在Block-DataNode Map中查找该数据块对应的数据节点，通过远程过程调用向该数据节点发送删除消息；数据节点收到消息后，若下载队列中有该数据块，则从数据块的下载队列中删除该数据块。

完成恢复过程。在执行上面的恢复步骤时，检测名字节点中的Block-DataNode Map，当Block-DataNode Map变为空或其中所有的数据块的下载标志都为true时，删除NameNode内存中的Block-DataNode Map，完成恢复过程。

本发明实施例所提供的方法在下载数据块过程中，首先下载并载入元数据开始提供文件系统服务；在名字节点和数据节点中保存要下载的数据块列表；根据恢复过程中客户端对数据块的访问需求调整恢复的优先级，优先恢复客户端访问的文件；对于客户端删除的文件放弃恢复过程以节省时间；可以实现高效的分布式文件系统按需恢复。

实施例

如图4所示，本发明实施例还提供一种数据恢复装置，该装置包括：

列表模块401，用于当分布式文件系统HDFS进行数据恢复时，下载元数据列表和数据块列表；

第一查找模块402，用于接收访问任一目标文件的请求，根据所述请求在所述元数据中查找所述目标文件所包含的目标数据块信息；

获取模块403，用于若在数据块列表中查找到所述目标数据块信息，则获取所述目标数据块信息对应的下载完成标志；

第二查找模块404，用于若根据所述下载完成标志确定所述目标数据块信息未下载完成，则在所述数据块列表中查找所述目标数据块信息的属性信息；

调整模块405，用于从所述属性信息中获取所述目标数据块信息的预期访问时间，并根据所述请求的属性调整所述预期访问时间。

可选的，该调整模块405具体用于当根据所述请求的属性信息确定所述请求为读取所述任一文件，则确定所述预期访问时间与当前的系统时间中的最小值，将所述预期访问时间调整为所述最小值，使得系统利用调整后的所述预期访问时间恢复所述目标数据块信息。

可选的，该调整模块405还用于将所述预期访问时间调整为所述最小值之后，在所述数据块列表中找到所述目标数据块信息对应的目标数据节点，通过远程过程调用向所述目标数据节点发送调整信息，使得该目标数据节点根据该调整信息更新预存的所述目标数据块信息的预期访问时间。

另外，该装置还包括：

可选的，为了节省数据恢复的时间，对于客户端要删除的文件可以选择放弃恢复，则该装置还包括：

可选的，该装置还包括：

本领域普通技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机可读取存储介质中。其中，所述的存储介质可以为ROM/RAM、磁碟、光盘等。

本发明提供一种非临时性计算机可读存储介质，其中存储有指令，当数据恢复装置中的一个或多个处理器执行所述指令时，所述数据恢复装置执行一种数据恢复方法，该方法包括：接收针对一目标文件的请求，查找所述目标文件；在查找到所述目标文件的情况下，判断所述目标文件对应的目标数据块文件是否下载完成；以及在所述目标数据块文件未下载完成时，根据所述请求对数据块文件下载的优先队列进行调整以优先恢复所述目标数据块文件。

本发明所提供的方法及装置，具有以下优点：

本申请实施例提供的数据恢复装置中的各个模块或单元可以通过一个或多个数字信号处理器(DSP)、专用集成电路(ASIC)、处理器、微处理器、控制器、微控制器、现场可编程阵列(FPGA)、可编程逻辑器件或其他电子单元或其任意组合来实现。在本申请实施例中描述的一些功能或处理也可以通过在处理器上执行的软件来实现。

工业实用性

本发明涉及数据处理技术领域，可以解决现有技术中HDFS系统从备份服务器恢复数据时服务中断时间过长的问题。

显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

Claims

一种分布式文件系统HDFS的按需恢复数据的方法，包括：

接收针对一目标文件的请求，查找所述目标文件；

在查找到所述目标文件的情况下，判断所述目标文件对应的目标数据块文件是否下载完成；以及

在所述目标数据块文件未下载完成时，根据所述请求对数据块文件下载的优先队列进行调整以优先恢复所述目标数据块文件。
如权利要求1所述的方法，其中，当所述请求为访问所述目标文件时，所述根据所述请求对数据块文件下载的优先队列进行调整以优先恢复所述目标数据块文件的步骤包括：

在预先存储的数据块文件与数据节点的映射关系中查找所述目标数据块文件的信息；以及

从所述目标数据块文件的信息中获取所述目标数据块文件的预期访问时间，确定所述预期访问时间与当前的系统时间中的最小值，将所述预期访问时间调整为所述最小值，使得所述HDFS利用调整后的所述预期访问时间恢复所述目标数据块文件。
如权利要求2所述的方法，其中，将所述预期访问时间调整为所述最小值之后，该方法还包括：

在所述映射关系中找到所述目标数据块文件对应的目标数据节点，通过远程过程调用向所述目标数据节点发送调整信息，使得该目标数据节点根据该调整信息更新预存的所述目标数据块文件的预期访问时间。
如权利要求1所述的方法，其中，当所述请求为删除所述目标文件时，所述根据所述请求对数据块文件下载的优先队列进行调整以优先恢复所述目标数据块文件的步骤包括：

在预先存储的数据块文件与数据节点的映射关系中查找所述目标数据块文件对应的目标数据节点，通过远程过程调用向所述目标数据节点发送删除消息，使得所述目标数据节点在收到所述请求后，从所述目标数据节点的下载队列中删除所述目标数据块文件。
如权利要求1～4中任一项所述的方法，其中，在所述接收针对一目标文件的请求，查找所述目标文件之前，所述方法还包括：从备份服务器下载元数据。
如权利要求5所述的方法，其中，在所述从备份服务器下载元数据之前，所述方法还包括：

设置操作阈值，使得在所述按需恢复数据的方法未完成时可以对外提供对数据进行操作的服务；其中，所述操作阈值为已恢复的数据块文件的数量占待恢复的所有数据块文件的数量的比例。
如权利要求2-4中任一项所述的方法，还包括：

所述数据节点每次从所述优先队列中取出预期访问时间最小的数据块文件；以及

从备份服务器下载与被取出的数据块文件对应的数据。
一种分布式文件系统HDFS的按需恢复数据的装置，包括：

第一查找模块，设置为接收针对一目标文件的请求，查找所述目标文件；

判断模块，设置为在查找到所述目标文件的情况下，判断所述目标文件对应的目标数据块文件是否下载完成；

调整模块，设置为在所述目标数据块文件未下载完成时，根据所述请求对数据块文件下载的优先队列进行调整以优先恢复所述目标数据块。
如权利要求8所述的装置，其中，所述调整模块还设置为：

当所述请求为访问所述目标文件时，在预先储存的数据块文件与数据节点的映射关系中查找所述目标数据块文件的信息；以及

从所述目标数据块文件的信息中获取所述目标数据块文件的预期访问时间，确定所述预期访问时间与当前的系统时间中的最小值，将所述预期访问时间调整为所述最小值，使得所述HDFS利用调整后的所述预期访问时间恢复所述目标数据块文件。
如权利要求9所述的装置，其中，所述调整模块还设置为：

在将所述预期访问时间调整为所述最小值之后，在所述映射关系中找到所述目标数据文件对应的目标数据节点，通过远程调用向所述目标数据节点发送调整信息，使得该目标数据节点根据该调整信息更新预存的所述目标数据块文件的预期访问时间。
如权利要求8所述的装置，其中，所述调整模块还设置为：

当所述请求为删除所述目标文件时，在预先存储的数据块文件与数据节点的映射关系中查找所述目标数据块文件对应的目标数据节点，通过远程过程调用向所述目标数据节点发送删除消息，使得所述目标数据节点在收到所述请求后，从所述目标数据节点的下载队列中删除所述目标数据块文件。
如权利要求8-11中任一项所述的装置，还包括备份模块，设置为：从备份服务器下载元数据。
如权利要求12所述的装置，还包括恢复模块，设置为：

设置操作阈值，使得在所述按需恢复数据未完成时可以对外提供对数据进行操作的服务；其中，所述操作阈值为已恢复的数据块文件的数量占待恢复的所有数据块文件的数量的比例。
如权利要求9～11中任一项所述的装置，还包括下载模块，设置为：

使所述数据节点每次从所述优先队列中取出预期访问时间最小的数据块文件；以及

从备份端服务器下载被取出的数据块文件对应的数据。