WO2016145838A1

WO2016145838A1 - 一种元数据管理方法及装置、分布式文件系统

Info

Publication number: WO2016145838A1
Application number: PCT/CN2015/092114
Authority: WO
Inventors: 郑跃杰
Original assignee: 中兴通讯股份有限公司
Priority date: 2015-08-03
Filing date: 2015-10-16
Publication date: 2016-09-22
Also published as: CN106708657A

Abstract

本发明实施例提供了一种元数据管理方法、装置、分布式文件系统和计算机可读存储介质。该方法包括：在元数据备份时，采用差分算法计算得到当前元数据与已备份元数据的差分数据；在元数据恢复时，利用差分数据及已备份元数据恢复当前元数据。

Description

一种元数据管理方法及装置、分布式文件系统

技术领域

本文涉及但不限于分布式文件存储领域，尤其涉及一种元数据管理方法、装置、分布式文件系统和计算机可读存储介质。

背景技术

目前包括彩铃、MS、WAP网关等产品中都用到了网络存储设备，为了达到大容量、高吞吐量和高可靠性的要求，随着对这些产品可靠性等要求的提高，往往价格也是呈现指数级上升，这些设备在整个系统的中的成本往往都超过了50％，在廉价的通用硬件平台上构建分布式文件系统已经是各种存储类业务发展的必然趋势。

分布式文件系统是一个通用存储软件平台，运行在通用硬件之上，为需要存储服务的产品提供存储平台支撑，提供存储、查询检索和管理产品所产生的海量数据服务，如多媒体内容存储、业务数据存储等。单域支持10PB(10亿文件数)存储能力，系统整体可达EB级(千亿文件数)海量存储能力，系统整体性能随存储规模同步线性增长。海量的文件产生上百G的元数据，系统升级和备份过程都需要上百G的磁盘空间来备份，而且需要1-2h时间的备份；随着系统容量不断增加，系统元数据也不断增加，备份和还原系统元数据成为系统升级或日常备份时的瓶颈，大量占用系统cpu和磁盘使用。

因此，如何提供一种可快速进行元数据备份及恢复的元数据管理方法，是本领域技术人员亟待解决的技术问题。

发明内容

以下是对本文详细描述的主题的概述，本概述并非是为了限制权利要求的保护范围。

本发明实施例提供了一种元数据管理方法及装置、分布式文件系统，以实现对元数据的快速备份及恢复。

本发明实施例提供了一种元数据管理方法，其包括：在元数据备份时，采用差分算法计算得到当前元数据与已备份元数据的差分数据；在元数据恢复时，利用差分数据及已备份元数据恢复当前元数据。

可选的，已备份元数据包括最近一次全量备份的元数据。

可选的，差分数据包括已备份元数据的标识、差异数据偏移量及差异数据。

可选的，利用差分数据及已备份元数据恢复当前元数据包括：确定差分数据对应的已备份元数据，根据差异数据偏移量确定已备份元数据内的待替换数据，将待替换数据替换为差异数据，生成当前元数据。

可选的，差分数据还包括已备份元数据内的原始差异数据。

可选的，还包括：采用多线程并行进行元数据备份及元数据恢复。

可选的，在元数据备份后，还包括：根据差分数据的大小确定下一次数据备份时的备份方式，备份方式包括：全量备份和差分备份。

本发明实施例提供了一种元数据管理装置，其包括：备份模块，设置为在元数据备份时，采用差分算法计算得到当前元数据与已备份元数据的差分数据；恢复模块，设置为在元数据恢复时，利用差分数据及已备份元数据恢复当前元数据。

可选的，已备份元数据包括最近一次全量备份的元数据。

可选的，恢复模块设置为确定差分数据对应的已备份元数据，根据差异数据偏移量确定已备份元数据内的待替换数据，将待替换数据替换为差异数据，生成当前元数据。

可选的，差分数据还包括已备份元数据内的原始差异数据。

可选的，备份模块还设置为采用多线程并行进行元数据备份，恢复模块还设置为采用多线程并行进行元数据恢复。

可选的，在元数据备份后，备份模块还设置为根据差分数据的大小确定下一次数据备份时的备份方式，备份方式包括：全量备份和差分备份。

本发明实施例提供了一种分布式文件系统，其包括本发明实施例提供的元数据管理装置。

本发明实施例的有益效果：

本发明实施例提供了一种新的元数据管理方法，通过快速差分算法和差分还原算法快速进行元数据备份和恢复，原来的备份磁盘空间使用由GB降低到MB的量级，实现了元数据的快速备份及恢复，可以使分布式文件系统海量元数据备份时长由原来的几小时缩短为几分钟。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图概述

图1为本发明第一实施例提供的元数据管理装置的结构示意图；

图2为本发明第二实施例提供的元数据管理方法的流程图；

图3为本发明第三实施例提供的元数据管理方法的流程图；

图4为本发明第三实施例中元数据的对比示意图。

本发明的较佳实施方式

现通过具体实施方式结合附图的方式对本发明实施例的方案做出进一步的诠释说明。

第一实施例：

图1为本发明第一实施例提供的元数据管理装置的结构示意图，由图1可知，在本实施例中，本实施例提供的元数据管理装置1包括：

备份模块11，设置为在元数据备份时，采用差分算法计算得到当前元数据与已备份元数据的差分数据；

恢复模块12，设置为在元数据恢复时，利用差分数据及已备份元数据恢复当前元数据。

可选地，在一些实施例中，上述实施例中的已备份元数据包括最近一次全量备份的元数据。在实际使用中，元数据的变化是渐变的，差分算法以最近一次的元数据作为计算基础，可以大大减少差分数据的数据量，当然，本领域技术人员可以根据需要设置特定时间点进行全量备份的元数据作为差分计算的基础。

可选地，在一些实施例中，上述实施例中的差分数据包括已备份元数据的标识、差异数据偏移量及差异数据。这样在恢复时，就可以快速的确定差异数据的位置，进行差分逆计算得到当前元数据。

可选地，在一些实施例中，上述实施例中的恢复模块12设置为确定差分数据对应的已备份元数据，根据差异数据偏移量确定已备份元数据内的待替换数据，将待替换数据替换为差异数据，生成当前元数据。

可选地，在一些实施例中，上述实施例中的差分数据还包括已备份元数据内的原始差异数据。这个在进行恢复时，就可以进行对比，当待替换数据与原始差异数据相同时，说明没有错误，可以直接进行恢复，若不相同，则说明差分数据/已备份元数据存在错误，需要根据实际情况判断是否需要恢复，以及如何恢复。

可选地，在一些实施例中，上述实施例中的备份模块11还设置为采用多线程并行进行元数据备份，恢复模块12还设置为采用多线程并行进行元数据恢复。多线程并行方式可以加强元数据的备份及恢复速度。

可选地，在一些实施例中，在元数据备份后，上述实施例中的备份模块11还设置为根据差分数据的大小确定下一次数据备份时的备份方式，备份方式包括：全量备份和差分备份。可选的，可以设置一个阈值，当某一次进行差分备份时的差分数据大于阈值，就说明当前元数据与已备份元数据的差异较大，这往往代表了用户对分布式文件系统的存储数据进行了较大的修改，如更换硬件设备等，仅进行差分备份容易造成差异数据的漏计算，因此设置下一次备份时，采用全量备份的方式进行原数据的全量备份，作为后续差分备份的基础。

第二实施例：

图2为本发明第二实施例提供的元数据管理方法的流程图，由图2可知，在本实施例中提供的元数据管理方法包括以下步骤：

S201：在元数据备份时，采用差分算法计算得到当前元数据与已备份元数据的差分数据；

S202：在元数据恢复时，利用差分数据及已备份元数据恢复当前元数据。

可选地，在一些实施例中，上述实施例中的已备份元数据包括最近一次全量备份的元数据。

可选地，在一些实施例中，上述实施例中的差分数据包括已备份元数据的标识、差异数据偏移量及差异数据。

可选地，在一些实施例中，上述实施例中的利用差分数据及已备份元数据恢复当前元数据包括：确定差分数据对应的已备份元数据，根据差异数据偏移量确定已备份元数据内的待替换数据，将待替换数据替换为差异数据，生成当前元数据。

可选地，在一些实施例中，上述实施例中的差分数据还包括已备份元数据内的原始差异数据。

可选地，在一些实施例中，上述实施例中的方法还包括：采用多线程并行进行元数据备份及元数据恢复。

可选地，在一些实施例中，上述实施例中的方法在元数据备份后，还包括：根据差分数据的大小确定下一次数据备份时的备份方式，备份方式包括：全量备份和差分备份。

现结合具体应用场景对本发明实施例做进一步的诠释说明。

第三实施例：

图3为本发明第三实施例提供的元数据管理方法的流程图，由图3可知，在本实施例中提供的元数据管理方法包括以下步骤：

S301：设置备份周期及全量备份阈值。

系统初始时，配置备份方式、备份周期为3小时、全量备份阈值为1G。

S302：第一次备份时间到，进行全量备份。

备份周期到后，确定为第一次备份时间，进行一次元数据全量备份，并配置下次备份方式为差分备份。生成的备份文件以当前系统版本和时间戳作为备份ID。

S303：第二次备份时间到，进行差分备份。

下一个备份周期到时，检查备份数据ID和备份方式，根据备份ID和备份方式进行本次备份。如果是全量备份，备份完成后生成备份数据ID。如果是差分备份，生成备份数据ID和备份生成的差分数据文件。备份时采用多线程，同时对不同的元数据文件进行差分，生成对应的差分数据文件。

S304：比较差分数据与全量备份阈值，确定下一次备份方式。

在步骤S303备份完成后，判断本次备份的备份文件大小是否在设定的门限内，如果小于设置门限1G，则设定下次备份方式为差分备份，如果大于门限，则设定下次备份方式为全量备份。

S305：利用差分数据进行元数据恢复。

备份文件的恢复还原，如果需要还原原始数据，根据备份数据ID，备份方式和原始数据进行还原。同样的，差分还原的时候，采用多线程的方式根据对应的差分数据，当前元数据由差分还原算法生成对应的原始数据来实现元数据还原。

本实施例通过差分算法来针对分布式文件系统的海量元数据文件进行差分，生成对应的差分文件来进行快速备份和快速还原，采用元数据文件差分算法和逆向还原算法，有效的对原始文件和目标文件进行差分生成差分文件，如果需要还原数据可以根据差分文件和目标文件还原成原始文件。

在实际生产过程中，分布式文件系统的海量文件其中大部分是不做修改的，也就是说大部分文件产生的元数据是不变的，由此差分备份和还原是对不变的海量元数据最佳的备份和还原方式。

如图4所示，两份不同时期元数据二进制比较，若按照现有元数据备份方法，需要对所有元数据进行全量备份，若依据本发明，只有从140-1423个字节是不同的，通过字节流的差分算法比较差异文件生成差分文件，差分文件只会记录不同数据的偏移量以及3个字节的数据(用于数据备份)和原始的3个字节数据(用于数据还原)，以上的处理过程即是差分文件生成算法；通常的，元数据改变只会是几十个甚至几个字节的不同，以此算法处理可以节约大量存储空间，并且加快元数据备份速度。

元数据恢复是差分备份的逆向过程，通过差分文件我们可以很容易的根据当前文件与差分文件中的偏移量和差异字节生成原始文件，如上则实现了逆向还原算法。

第四实施例：

对应的，还提供了一种分布式文件系统，其包括本发明实施例提供的元数据管理装置1。

第五实施例：

本发明实施例还提供一种计算机可读存储介质，存储有程序指令，当该程序指令被处理器执行时可实现本发明实施例所提供的一种元数据管理方法。

综上可知，通过本发明实施例的方案，至少存在以下有益效果：

提供了一种新的元数据管理方法，通过快速差分算法和差分还原算法进行元数据备份和恢复，实现了元数据的快速备份及恢复，规范了系统升级的协作流程，可以使分布式文件系统海量元数据备份时长由原来的几小时缩短为几分钟，原来的备份磁盘空间使用量由GB降低到MB的量级，随着元数据的增多，其性能将更加明显。

本领域普通技术人员可以理解上述实施例的全部或部分步骤可以使用计算机程序流程来实现，所述计算机程序可以存储于一计算机可读存储介质中，所述计算机程序在相应的硬件平台上(如系统、设备、装置、器件等)执行，在执行时，包括方法实施例的步骤之一或其组合。

可选地，上述实施例的全部或部分步骤也可以使用集成电路来实现，这些步骤可以被分别制作成一个个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。

上述实施例中的各装置/功能模块/功能单元可以采用通用的计算装置来实现，它们可以集中在单个的计算装置上，也可以分布在多个计算装置所组成的网络上。

上述实施例中的各装置/功能模块/功能单元以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。上述提到的计算机可读取存储介质可以是只读存储器，磁盘或光盘等。

工业实用性

本发明实施例提供了一种新的元数据管理方法，通过快速差分算法和差分还原算法进行元数据备份和恢复，实现了元数据的快速备份及恢复，规范了系统升级的协作流程，可以使分布式文件系统海量元数据备份时长由原来的几小时缩短为几分钟，原来的备份磁盘空间使用量由GB降低到MB的量级。

Claims

一种元数据管理方法，包括：

在元数据备份时，采用差分算法计算得到当前元数据与已备份元数据的差分数据；

在元数据恢复时，利用所述差分数据及所述已备份元数据恢复所述当前元数据。
如权利要求1所述的元数据管理方法，其中，所述已备份元数据包括最近一次全量备份的元数据。
如权利要求1所述的元数据管理方法，其中，所述差分数据包括所述已备份元数据的标识、差异数据偏移量及差异数据。
如权利要求3所述的元数据管理方法，其中，所述利用所述差分数据及所述已备份元数据恢复所述当前元数据包括：确定所述差分数据对应的已备份元数据，根据差异数据偏移量确定所述已备份元数据内的待替换数据，将所述待替换数据替换为所述差异数据，生成所述当前元数据。
如权利要求3所述的元数据管理方法，其中，所述差分数据还包括所述已备份元数据内的原始差异数据。
如权利要求1所述的元数据管理方法，还包括：采用多线程并行进行元数据备份及元数据恢复。
如权利要求1至6任一项所述的元数据管理方法，其中，在元数据备份后，还包括：根据所述差分数据的大小，确定下一次数据备份时的备份方式；所述备份方式包括：全量备份和差分备份。
一种元数据管理装置，包括：备份模块和恢复模块；其中，

所述备份模块，设置为在元数据备份时，采用差分算法计算得到当前元数据与已备份元数据的差分数据；

所述恢复模块，设置为在元数据恢复时，利用所述差分数据及所述已备份元数据恢复所述当前元数据。
如权利要求8所述的元数据管理装置，其中，所述已备份元数据包括最近一次全量备份的元数据。
如权利要求8所述的元数据管理装置，其中，所述差分数据包括所述已备份元数据的标识、差异数据偏移量及差异数据。
如权利要求10所述的元数据管理装置，其中，所述恢复模块设置为确定所述差分数据对应的已备份元数据，根据差异数据偏移量确定所述已备份元数据内的待替换数据，将所述待替换数据替换为所述差异数据，生成所述当前元数据。
如权利要求10所述的元数据管理装置，其中，所述差分数据还包括所述已备份元数据内的原始差异数据。
如权利要求8所述的元数据管理装置，其中，所述备份模块还设置为采用多线程并行进行元数据备份，所述恢复模块还设置为采用多线程并行进行元数据恢复。
如权利要求8至13任一项所述的元数据管理装置，其中，在元数据备份后，所述备份模块还设置为根据所述差分数据的大小确定下一次数据备份时的备份方式；所述备份方式包括：全量备份和差分备份。
一种分布式文件系统，包括如权利要求8至14任一项所述的元数据管理装置。
一种计算机可读存储介质，存储有程序指令，当该程序指令被处理器执行时实现权利要求1至7任一项所述的方法。