CN112506698B

CN112506698B - 一种小文件数据重构恢复方法、系统、终端及存储介质

Info

Publication number: CN112506698B
Application number: CN202011301679.XA
Authority: CN
Inventors: 鄢婷; 魏坤; 徐晓阳
Original assignee: Suzhou Inspur Intelligent Technology Co Ltd
Current assignee: Suzhou Inspur Intelligent Technology Co Ltd
Priority date: 2020-11-19
Filing date: 2020-11-19
Publication date: 2022-11-25
Anticipated expiration: 2040-11-19
Also published as: CN112506698A

Abstract

本发明提供一种小文件数据重构恢复方法、系统、终端及存储介质，包括：预先存储小文件数据重构策略模型；统计已恢复的对象数量和所述对象数量中的小文件数量占比；若所述小文件数量占比达到预设阈值，则判定当前恢复场景为小文件恢复场景；在所述小文件恢复场景下调用所述小文件数据重构策略模型；获取下个恢复周期的对象总数，并根据所述对象总数调整重构恢复的总带宽。本发明对于提升产品的稳定性和性能带来很大的好处，对于产品的竞争力得到很大的提升。

Description

一种小文件数据重构恢复方法、系统、终端及存储介质

技术领域

本发明涉及存储系统技术领域，具体涉及一种小文件数据重构恢复方法、系统、终端及存储介质。

背景技术

Ceph是一个对外部云平台提供分布式存储服务的系统，基于ceph可以对平台提供对象存储服务，块存储服务和文件系统存储服务等等其他分布式存储服务。Ceph系统集群架构中，至少需要一个Ceph Monitor和两个OSD(对象存储设备)守护进程。其中，CephMonitor维护着展示集群状态的各种图表，包括监视器图、OSD图、归置组(PG)图、和CRUSH图。Ceph保存着发生在Monitors、OSD和PG上的每一次状态变更的历史信息。

存储系统最根本的元素是磁盘，所有数据都是存放在磁盘中，无论是HDD， SSD或者NMVE等磁盘。存储系统采用一定的算法将这些磁盘组成存储池，对外提供安全可靠的存储服务。但是分布式存储最主要的特性就是大规模集群可能就是成千上万块磁盘组成的大容量存储池，这些存储池的数据量可能达到PB 甚至EB的级别，因此对磁盘的维护至关重要。当磁盘故障或者需要对存储进行扩缩容时，保证数据的完整性重构恢复是一个很重要的流程。

故障硬盘承载的数据重新被分配到新硬盘中，故障硬盘中的数据在其他正常硬盘中被恢复出来的过程被称为数据重构。数据重构是数据恢复的一种形式。存储最重要的是保持数据的完整性、一致性，所以在保持数据完整性、一致性的基础上进行不同类型业务，不同类型数据的恢复速度提出了很重要的研究问题。

现有数据重构方法采用ceph社区默认集群重构方案，并没有对特殊场景进行处理，比如海量KB级别小文件场景，针对HDD和SSD不同硬件配置进行处理。因此在数据重构时存在重构速率慢的问题。

发明内容

针对现有技术的上述不足，本发明提供一种小文件数据重构恢复方法、系统、终端及存储介质，以解决上述技术问题。

第一方面，本发明提供一种小文件数据重构恢复方法，包括：

预先存储小文件数据重构策略模型；

统计已恢复的对象数量和所述对象数量中的小文件数量占比；

若所述小文件数量占比达到预设阈值，则判定当前恢复场景为小文件恢复场景；

在所述小文件恢复场景下调用所述小文件数据重构策略模型；

获取下个恢复周期的对象总数，并根据所述对象总数调整重构恢复的总带宽。

进一步的，所述预先存储小文件数据重构策略模型，包括：

设置恢复模式为随机恢复；

设置对象不同存储方式对应的恢复策略，所述存储方式包括副本方式和纠删码方式；

对于SSD存储池设置根据CPU线程数、SSD大小和存储系统总存储量生成超线程模型比例的策略。

进一步的，所述统计已恢复对象中的小文件数量占比，包括：

从预分配补偿算法采集指定期限内已恢复的对象总数；

获取已恢复的对象大小，统计已恢复对象中的小文件数量；

将无法获取大小的未知对象暂存至未知列表中；

等待预设时间后对所述未知列表中的未知对象大小进行识别，若所述未知对象为小文件，则统计入所述小文件数量；

根据小文件数量和已恢复的对象总数计算所述小文件数量占比。

进一步的，所述根据对象数量调整重构恢复的总带宽，包括：

通过存储系统监控器采集所有存储池的待恢复对象信息，所述待恢复对象信息包括待恢复对象的恢复优先级和恢复时段；

筛选出恢复时段与下个恢复周期匹配的待恢复对象集合；

设置单次周期分配的对象恢复限额和存储池恢复对象限额；

根据所述对象恢复限额和存储池恢复对象限额从待恢复对象集合选定目标恢复对象；

遍历所有存储池的目标对象，根据目标对象在所属优先级下的带宽，计算总带宽。

进一步的，所述根据对象恢复限额和存储池恢复对象限额从待恢复对象集合选定目标恢复对象，包括：

判断存储池的需要恢复的对象数量是否超过相应的存储池恢复对象限额：若是，则从所有需要恢复的对象中选出所述存储池恢复对象限额数量的对象作为所述存储池的待恢复对象；若否，则将所有需要恢复的对象作为所述存储池的待恢复对象；

判断待恢复对象集合的对象数量是否超过所述对象恢复限额：若是，则根据对象优先级从所述待恢复对象集合筛选出所述对象恢复限额数量的对象作为目标恢复对象；若否，则将所述待恢复对象集合的所有待恢复对象作为目标恢复对象。

第二方面，本发明提供一种小文件数据重构恢复系统，包括：

模型预设单元，配置用于预先存储小文件数据重构策略模型；

占比统计单元，配置用于统计已恢复的对象数量和所述对象数量中的小文件数量占比；

场景确认单元，配置用于若所述小文件数量占比达到预设阈值，则判定当前恢复场景为小文件恢复场景；

模型调用单元，配置用于在所述小文件恢复场景下调用所述小文件数据重构策略模型；

带宽调节单元，配置用于获取下个恢复周期的对象总数，并根据所述对象总数调整重构恢复的总带宽。

进一步的，所述模型预设单元包括：

随机设置模块，配置用于设置恢复模式为随机恢复；

方式设置模块，配置用于设置对象不同存储方式对应的恢复策略，所述存储方式包括副本方式和纠删码方式；

线程设置模块，配置用于对于SSD存储池设置根据CPU线程数、SSD大小和存储系统总存储量生成超线程模型比例的策略。

进一步的，所述占比统计单元包括：

总数采集模块，配置用于从预分配补偿算法采集指定期限内已恢复的对象总数；

数量统计模块，配置用于获取已恢复的对象大小，统计已恢复对象中的小文件数量；

未知暂存模块，配置用于将无法获取大小的未知对象暂存至未知列表中；

二次统计模块，配置用于等待预设时间后对所述未知列表中的未知对象大小进行识别，若所述未知对象为小文件，则统计入所述小文件数量；

占比计算模块，配置用于根据小文件数量和已恢复的对象总数计算所述小文件数量占比。

第三方面，提供一种终端，包括：

处理器、存储器，其中：

该存储器用于存储计算机程序；

该处理器用于从存储器中调用并运行该计算机程序，使得终端执行上述的终端的方法。

第四方面，提供了一种计算机存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

本发明的有益效果在于：

本发明提供的小文件数据重构恢复方法、系统、终端及存储介质，能够对海量KB级别小文件场景进行识别，并结合集群规模与硬件磁盘配置相结合，对小文件场景的数据恢复参数进行优化，大幅度提高小文件的数据恢复性能，并充分利用SSD的性能优势，提高SSD存储池的数据恢复性能。本发明对于提升产品的稳定性和性能带来很大的好处，对于产品的竞争力得到很大的提升。

此外，本发明设计原理可靠，结构简单，具有非常广泛的应用前景。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例的方法的示意性流程图。

图2是本发明一个实施例的系统的示意性框图。

图3为本发明实施例提供的一种终端的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

下面对本发明中出现的关键术语进行解释。

英文缩写：MON；

英文全称：Monitor；

中文全称：监控器。

图1是本发明一个实施例的方法的示意性流程图。其中，图1执行主体可以为一种小文件数据重构恢复系统。

如图1所示，该方法包括：

步骤110，预先存储小文件数据重构策略模型；

步骤120，统计已恢复的对象数量和所述对象数量中的小文件数量占比；

步骤130，若所述小文件数量占比达到预设阈值，则判定当前恢复场景为小文件恢复场景；

步骤140，在所述小文件恢复场景下调用所述小文件数据重构策略模型；

步骤150，获取下个恢复周期的对象总数，并根据所述对象总数调整重构恢复的总带宽。

具体的，所述小文件数据重构恢复方法包括：

S1、预先存储小文件数据重构策略模型。

命令行输入具体策略模型，对接ceph底层接口。MON监控器处理流程：收到命令行输入的设置参数，对参数进行保存；调用函数，对当前ceph底层进行中断保存；触发响应中断，判断宕机节点是否DOWN，则置OSD为OUT状态，并进行海量KB级别小文件重构算法的模型设置；重构完成，触发回调函数，恢复断点配置信息。

小文件数据重构策略模型包括：恢复模式为随机恢复(大文件为顺序恢复)；对象不同存储方式对应的恢复策略(具体恢复策略设置方法为现有技术，并非本申请所保护的内容，因此不再赘述)，存储方式包括副本方式和纠删码方式；对于SSD存储池，根据CPU线程数、SSD大小和存储系统ceph总存储量生成超线程模型比例，在进行线程的超线程处理机制并在重构结束恢复默认线程。

相应地，也可以设置一个大文件恢复场景的数据重构策略，用于在大文件恢复场景调用。

S2、统计已恢复的对象数量和所述对象数量中的小文件数量占比，若所述小文件数量占比达到预设阈值，则判定当前恢复场景为小文件恢复场景。

引入引用计数的算法，在已有的数据恢复控制算法中每恢复一个对象会累加对象的大小，在此流程中增加计数，记录恢复对象的总数和恢复的小文件的个数。在已有的数据恢复控制算法中定时器会定时计算，计算下个恢复周期内数据恢复总的数据恢复量，以及单次恢复的对象个数等参数。在该步骤中需要考虑数据恢复场景是大对象恢复还是小文件恢复。具体是根据上述得到的恢复的小文件个数占总的恢复对象个数的比例确定是否是小文件场景。

具体计算方法为：

在预分配补偿算法的流程中每处理一个对象都对已恢复的对象个数进行计数，如果该对象是小文件则小文件的计数+1，如果当前没有获取到该对象的大小，则将该对象插入未知大小的map结构中，于此同时记录未知大小的对象个数。若对象已在补偿map中，则还需要判断该对象是否在未知大小的map中，再判断该对象是否是小文件，如果是小文件则小文件的计数+1。

统计完成后触发对象存储的定时器。触发定时器后，首先获取需要恢复的数量object数量，根据经验值，若小对象比例超过80％，则识别为小对象恢复体系中；否则认为非小对象恢复体系，按照默认ceph数据重构流程进行。

S3、在所述小文件恢复场景下调用所述小文件数据重构策略模型。

若步骤S2判定当前为小文件场景，则按照预先设置的小文件数据重构策略模型进行数据重构。

S4、获取下个恢复周期的对象总数，并根据所述对象总数调整重构恢复的总带宽。

修改OSD计算当前周期需要重构的数据量的计算方式，集群重构的总带宽不再是固定值，集群重构的总带宽由Monitor根据重构的OSD个数进行计算。 Monitor根据重构的主OSD的个数以及单个OSD在不同重构优先级下的带宽，计算出来总的重构带宽，然后将总带宽发送给OSD。

具体带宽调整方法如下：

(1)动态获取当前集群的降级对象个数以及各存储池的降级对象个数，同时获取本OSD降级对象总数。

(2)如果本OSD中没有配置过恢复优先级的存储池则计算整个OSD的本定时周期允许恢复的数据量，否则进入(3)。

(3)计算各个存储池本定时器周期运行恢复的数据量。

(4)获取上个定时周期分配的数据量和实际恢复的数据量。

(5)将(4)中获取的两个量的差值加到或减到本周期计算的运行恢复的数据总量中。

(6)遍历OSD所述的存储池，并计算恢复带宽，得出每个所述存储池的恢复速度。

(7)对object对象文件获取特定存储池恢复参数，判断该存储池已恢复数据量或者已恢复对象个数是否已经超过该定时器周期计算的最大值，如果超过最大值，则该存储池在本定时器周期内已完成恢复，将PG重新加入恢复队列并结束本次调用，否则启动该PG的恢复流程，本次需要恢复max_single_start 个对象。

如图2所示，该系统200包括：

模型预设单元210，配置用于预先存储小文件数据重构策略模型；

占比统计单元220，配置用于统计已恢复的对象数量和所述对象数量中的小文件数量占比；

场景确认单元230，配置用于若所述小文件数量占比达到预设阈值，则判定当前恢复场景为小文件恢复场景；

模型调用单元240，配置用于在所述小文件恢复场景下调用所述小文件数据重构策略模型；

带宽调节单元250，配置用于获取下个恢复周期的对象总数，并根据所述对象总数调整重构恢复的总带宽。

可选地，作为本发明一个实施例，所述模型预设单元包括：

随机设置模块，配置用于设置恢复模式为随机恢复；

可选地，作为本发明一个实施例，所述占比统计单元包括：

图3为本发明实施例提供的一种终端300的结构示意图，该终端300可以用于执行本发明实施例提供的小文件数据重构恢复方法。

其中，该终端300可以包括：处理器310、存储器320及通信单元330。这些组件通过一条或多条总线进行通信，本领域技术人员可以理解，图中示出的服务器的结构并不构成对本发明的限定，它既可以是总线形结构，也可以是星型结构，还可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

其中，该存储器320可以用于存储处理器310的执行指令，存储器320可以由任何类型的易失性或非易失性存储终端或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。当存储器320中的执行指令由处理器310 执行时，使得终端300能够执行以下上述方法实施例中的部分或全部步骤。

处理器310为存储终端的控制中心，利用各种接口和线路连接整个电子终端的各个部分，通过运行或执行存储在存储器320内的软件程序和/或模块，以及调用存储在存储器内的数据，以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit，简称IC)组成，例如可以由单颗封装的IC所组成，也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说，处理器310可以仅包括中央处理器(Central Processing Unit，简称CPU)。在本发明实施方式中，CPU可以是单运算核心，也可以包括多运算核心。

通信单元330，用于建立通信信道，从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。

本发明还提供一种计算机存储介质，其中，该计算机存储介质可存储有程序，该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文：read-only memory，简称：ROM)或随机存储记忆体(英文：random access memory，简称：RAM)等。

因此，本发明能够对海量KB级别小文件场景进行识别，并结合集群规模与硬件磁盘配置相结合，对小文件场景的数据恢复参数进行优化，大幅度提高小文件的数据恢复性能，并充分利用SSD的性能优势，提高SSD存储池的数据恢复性能。本发明对于提升产品的稳定性和性能带来很大的好处，对于产品的竞争力得到很大的提升，本实施例所能达到的技术效果可以参见上文中的描述，此处不再赘述。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器 (ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质，包括若干指令用以使得一台计算机终端(可以是个人计算机，服务器，或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。

本说明书中各个实施例之间相同相似的部分互相参见即可。尤其，对于终端实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例中的说明即可。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统和方法，可以通过其它的方式实现。例如，以上所描述的系统实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，系统或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述，但本发明并不限于此。在不脱离本发明的精神和实质的前提下，本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换，而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种小文件数据重构恢复方法，其特征在于，包括：

预先存储小文件数据重构策略模型；

获取下个恢复周期的对象总数，并根据所述对象总数调整重构恢复的总带宽

所述预先存储小文件数据重构策略模型，包括：

设置恢复模式为随机恢复；

2.根据权利要求1所述的方法，其特征在于，所述统计已恢复对象中的小文件数量占比，包括：

从预分配补偿算法采集指定期限内已恢复的对象总数；

获取已恢复的对象大小，统计已恢复对象中的小文件数量；

将无法获取大小的未知对象暂存至未知列表中；

3.根据权利要求1所述的方法，其特征在于，所述根据对象数量调整重构恢复的总带宽，包括：

筛选出恢复时段与下个恢复周期匹配的待恢复对象集合；

设置单次周期分配的对象恢复限额和存储池恢复对象限额；

4.根据权利要求3所述的方法，其特征在于，所述根据对象恢复限额和存储池恢复对象限额从待恢复对象集合选定目标恢复对象，包括：

5.一种小文件数据重构恢复系统，其特征在于，包括：

带宽调节单元，配置用于获取下个恢复周期的对象总数，并根据所述对象总数调整重构恢复的总带宽；

所述模型预设单元包括：

随机设置模块，配置用于设置恢复模式为随机恢复；

6.根据权利要求5所述的系统，其特征在于，所述占比统计单元包括：

7.一种终端，其特征在于，包括：

处理器；

用于存储处理器的执行指令的存储器；

其中，所述处理器被配置为执行权利要求1-4任一项所述的方法。

8.一种存储有计算机程序的计算机可读存储介质，其特征在于，该程序被处理器执行时实现如权利要求1-4中任一项所述的方法。