CN114756523A

CN114756523A - 一种分布式存储方法、装置以及介质

Info

Publication number: CN114756523A
Application number: CN202210329921.7A
Authority: CN
Inventors: 臧林劼
Original assignee: Suzhou Inspur Intelligent Technology Co Ltd
Current assignee: Suzhou Inspur Intelligent Technology Co Ltd
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2022-07-15

Abstract

本申请公开了一种分布式存储方法、装置以及介质，在从客户端接收到文件后，在访问过程中产生的日志文件中过滤出存有文件的元数据信息的目标日志文件，根据该目标日志文件能够确定文件的实际大小，判断文件的实际大小是否小于预先设置的阈值以确定该文件是大文件还是小文件，进而根据文件的实际大小将文件存入存储设备中不同的存储池。相对于当前技术中，大小文件混合存放，无法区分文件的大小，使小文件的读写制约大文件读写性能，进而导致存储系统整体性能下降。采用本技术方案，根据日志确定文件的大小，并将大文件和小文件分开存放，有效避免了小文件对大文件读写性能的制约，提高了存储系统整体性能。

Description

一种分布式存储方法、装置以及介质

技术领域

本申请涉及分布式存储技术领域，特别是涉及一种分布式存储方法、装置以及介质。

背景技术

分布式存储文件系统具有高扩展性、高可靠性、高性能的特点，因此，大部分数据中心的海量数据采用分布式存储系统进行存储管理，以对海量文件进行高效存储和管理。

但是在分布式存储文件系统的使用中，混合文件的存储场景比较广泛，其特点是文件大小不一，一个文件大小范围从字节Byte到GB级别，且文件类型无规律，当前技术中无法有效区分混合文件，小文件的频繁混合读写会制约大文件的读写性能，导致存储系统整体性能下降。

由此可见，如何在分布式存储文件系统中区分混合文件是本领域技术人员亟待解决的问题。

发明内容

本申请的目的是提供一种分布式存储方法、装置以及介质，用于在分布式存储文件系统中区分混合文件。

为解决上述技术问题，本申请提供一种分布式存储方法，该方法包括：

获取客户端发送的文件；

从日志文件中获取存有所述文件的元数据信息的目标日志文件；

根据所述目标日志文件，确定所述文件的实际大小；

判断所述文件的实际大小是否小于阈值，若小于，则确认所述文件为小文件，若不小于，则确认所述文件为大文件；

根据所确定出的所述文件的实际大小将所述文件存入存储设备中不同的存储池。

优选的，在所述根据所确定出的所述文件的实际大小将所述文件存入存储设备中不同的存储池的步骤之后，还包括：

统计所述存储设备中各大小文件的占比情况。

优选的，在所述根据所确定出的所述文件的实际大小将所述文件存入存储设备中不同的存储池的步骤之前，还包括：

获取所述文件的写入类型，其中，所述写入类型包括追加写、对齐覆盖写、非对齐覆盖写；

进一步的，所述根据所述文件的大小将所述文件存入存储设备中不同的存储池包括：

根据所述文件的大小以及写入类型将所述文件存入所述存储设备中不同的存储池。

优选的，若所述写入类型为对齐覆盖写，则所述文件存入所述存储设备的对应的所述存储池包括：

将所述文件的待写入数据写入对应的所述存储池的对应位置；

根据所述对应位置更新元数据索引。

优选的，若所述写入类型为非对齐覆盖写，则所述文件存入所述存储设备的对应的所述存储池包括：

读取所述存储池的待写入位置的原始数据，并与所述文件的待写入数据进行合并；

将合并后的数据重新写入所述待写入位置。

优选的，所述存储池包括副本池和纠删池，其中，所述副本池为2个，所述副本池以副本的形式实现对所述文件的备份，所述纠删池根据纠删码算法对所述文件进行备份。

优选的，所述根据所述文件的大小将所述文件存入存储设备中不同的存储池包括：

若所述文件为小文件，则将所述文件存入所述副本池；若所述文件为大文件，则将所述文件存入所述纠删池。

为解决上述技术问题，本申请还提供一种分布式存储装置，该装置包括：

第一获取模块，用于获取客户端发送的文件；

第二获取模块，用于从日志文件中获取存有所述文件的元数据信息的目标日志文件；

确定模块，用于根据所述目标日志文件，确定所述文件的实际大小；

判断模块，用于判断所述文件的实际大小是否小于阈值，若小于，则确认所述文件为小文件，若不小于，则确认所述文件为大文件；

存储模块，用于根据所确定出的所述文件的实际大小将所述文件存入存储设备中不同的存储池。

为解决上述技术问题，本申请还提供另一种分布式存储装置，该装置包括存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上述的分布式存储方法的步骤。

为解决上述技术问题，本申请还提供一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述的分布式存储方法的步骤。

本申请所提供的分布式存储方法，在从客户端接收到文件后，在访问过程中产生的日志文件中过滤出存有文件的元数据信息的目标日志文件，根据该目标日志文件能够确定文件的实际大小，判断文件的实际大小是否小于预先设置的阈值以确定该文件是大文件还是小文件，进而根据文件的实际大小将文件存入存储设备中不同的存储池。相对于当前技术中，大小文件混合存放，无法区分文件的大小，使小文件的读写制约大文件读写性能，进而导致存储系统整体性能下降。采用本技术方案，根据日志确定文件的大小，并将大文件和小文件分开存放，有效避免了小文件对大文件读写性能的制约，提高了存储系统整体性能。

此外，本申请所提供的分布式存储装置以及介质与上述分布式存储方法相对应，效果同上。

附图说明

为了更清楚地说明本申请实施例，下面将对实施例中所需要使用的附图做简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种分布式存储方法的流程图；

图2为本申请实施例提供的一种分布式存储装置的结构图；

图3为本申请实施例提供的另一种分布式存储装置的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下，所获得的所有其他实施例，都属于本申请保护范围。

本申请的核心是提供一种分布式存储方法、装置以及介质，用于在分布式存储文件系统中区分混合文件。

为了使本技术领域的人员更好地理解本申请方案，下面结合附图和具体实施方式对本申请作进一步的详细说明。

图1为本申请实施例提供的一种分布式存储方法的流程图，如图1所示，该方法包括：

S10：获取客户端发送的文件。

S11：从日志文件中获取存有文件的元数据信息的目标日志文件。

S12：根据目标日志文件，确定文件的实际大小。

S13：判断文件的实际大小是否小于阈值，若小于，则进入步骤S131，若不小于，则进入步骤S132。

S131：确认文件为小文件。

S132：确认文件为大文件。

S14：根据所确定出的文件的实际大小将文件存入存储设备中不同的存储池。

分布式存储文件系统具有高扩展性、高可靠性、高性能的特点，其提供了对象、块、文件三种协议访问接口，通过底层的动态库与后端交互，分布式集群对应包括对象网关服务、块服务、文件服务。

对象是分布式存储文件系统中数据存储的基本单位，一个对象实际上就是文件的数据和一组属性信息的组合，这些属性信息可以定义基于文件的RAID参数、数据分布和服务质量等。

分布式存储文件系统采用存储池存放数据，存储池包含多个磁盘，每个磁盘作为对象存储资源(Object Storage Device，OSD)响应客户端请求返回具体数据的进程。分布式存储文件系统将从客户端接收的文件切割成多个对象，每个对象会被映射到一个放置组(Placement Grouops，PG)中，其中，PG是一个逻辑概念，在Linux系统中可以直接看到对象，但是无法直接看到PG。它在数据寻址时类似于数据库中的索引，每个对象都会固定映射进一个PG中，所以当用户要寻找一个对象时，只需要先找到对象所属的PG，然后遍历这个PG就可以了，无需遍历所有对象。最后通过Hash算法将PG映射到多个OSD磁盘中，从而完成数据写入的过程。

客户端在写入文件时，经过存储接口进行分布式存储访问，元数据请求会经过元数据服务器(Metadata Server，MDS)存储到磁盘中。本实施例中，通过分布式存储OSD进程模块调整debug日志，过滤出Client IO请求模型日志文件。具体是在对象缓存层日志文件objcachefile中，通过关键字过滤出文件inode列表信息，将其记录到fileinodes文件中。通过该文件，可以确定出文件的实际大小，并且该文件中也包含了历史存放的文件信息，可以查看历史存放的文件大小，也可以统计出各大小文件的占比情况。由此，本实施例通过日志实现了对文件的大小的获取，需要说明的是，本实施例中文件的大小指的是该文件写入时所占的字节的大小。在具体实施中，本实施例会将小于128k的文件定义为小文件，将不小于128k的文件定义为大文件。

本申请实施例提供的分布式存储方法，在从客户端接收到文件后，在访问过程中产生的日志文件中过滤出存有文件的元数据信息的目标日志文件，根据该目标日志文件能够确定文件的实际大小，判断文件的实际大小是否小于预先设置的阈值以确定该文件是大文件还是小文件，进而根据文件的实际大小将文件存入存储设备中不同的存储池。相对于当前技术中，大小文件混合存放，无法区分文件的大小，使小文件的读写制约大文件读写性能，进而导致存储系统整体性能下降。采用本技术方案，根据日志确定文件的大小，并将大文件和小文件分开存放，有效避免了小文件对大文件读写性能的制约，提高了存储系统整体性能。

在具体实施中，有时需要根据存储文件的多少调整系统内存。因此，在上述实施例的基础上，在本实施例中，在根据所确定出的文件的实际大小将文件存入存储设备中不同的存储池的步骤之后，还包括：

统计存储设备中各大小文件的占比情况。

本实施例通过统计存储设备中各大小文件的占比情况，可以适应调整内存，例如，小文件多时可以增加内存，小文件少时可以减少内存。此外，在具体实施中，在统计各大小文件的占比情况时，可以不仅体现出小文件与大文件的比例，还可以根据日志统计各文件的具体大小，例如可以对128k、512k、1MB、4MB、1GB的文件进行区分。

在上述实施例的基础上，在本实施例中，在根据所确定出的文件的实际大小将文件存入存储设备中不同的存储池的步骤之前，还包括：

获取文件的写入类型，其中，写入类型包括追加写、对齐覆盖写、非对齐覆盖写；

进一步的，根据文件的大小将文件存入存储设备中不同的存储池包括：

根据文件的大小以及写入类型将文件存入存储设备中不同的存储池。

可以理解的是，分布式存储文件系统的写入类型有多种，其中，追加写表示保留之前写入的内容，再增加写入，覆盖写表示不保留之前写入的内容，重新写入新的数据。

本实施例提供多种写入类型，在文件写入存储池时，依据写入类型选择对应的写入方式。

在上述实施例的基础上，在本实施例中，若写入类型为对齐覆盖写，则文件存入存储设备的对应的存储池包括：

将文件的待写入数据写入对应的存储池的对应位置；

根据对应位置更新元数据索引。

在本实施例中，例如文件的长度为[0，128)，其映射到磁盘的地址为[0，128)，现在想要将该文件覆盖写入该地址，此时该文件的写入类型即为对齐覆盖写。本实施例提供的方法，在磁盘分区上重新分配一个新的块，将文件的待写入数据写入该块，将元数据索引中的映射关系更新至该块，以此完成文件的对齐覆盖写。

上述实施例介绍了文件对齐覆盖写的存入方法，在本实施例中，若写入类型为非对齐覆盖写，则文件存入存储设备的对应的存储池包括：

读取存储池的待写入位置的原始数据，并与文件的待写入数据进行合并；

将合并后的数据重新写入待写入位置。

例如文件的长度为[28，128)，在覆盖写入磁盘的[0，128)时，此时称为非对齐覆盖写。在当前技术中，此时的写入方法与对齐覆盖写相似，同样重新分配一个新的块，但是该块中只有部分数据，原有的磁盘中的部分数据仍有效，需要为该文件分配两个索引，在后续读取文件时，需要进行多次读取，影响了性能。本实施例中，在进行非对齐覆盖写时，读取存储池的待写入位置的原始数据，具体可以是只读取与待写入数据非对齐块的数据，将该数据与待写入数据进行合并，合并后的数据即为对齐的数据，此时可以将该数据重新覆盖写入磁盘，以此避免了元数据索引的增加，提高了性能。

在具体实施中，分布式文件存储系统为了保障数据的安全性，通常会对文件进行备份，在数据丢失时可以及时恢复，以保障可靠性。

因此，在本实施例中，存储池包括副本池和纠删池，其中，副本池为2个，副本池以副本的形式实现对文件的备份，纠删池根据纠删码算法对文件进行备份。

在本实施例中，副本池是以副本的形式实现对文件的备份，两个副本池中的文件的数据完全一致，当数据丢失时，可以及时的另一个副本池中进行恢复，可以理解的是，该备份方式可以很好的保证数据的完整性，但是会降低存储空间的利用率。而纠删池是根据纠删码算法对文件进行备份，通过纠删码算法将原数据进行编码得到冗余数据，并将原数据和冗余数据一并存储，以达到容错的目的，当数据出现问题时，通过对应的恢复算法进行数据恢复。可以理解的是，纠删池的备份方法能够增加存储空间的利用率，但是在数据恢复时会产生大量的数据读写和计算，增加了磁盘的读写压力，导致磁盘的损坏几率增大。本实施例提供两种备份方法，可以根据文件的实际大小选择合适的备份方法。

在上述实施例的基础上，在本实施例中，根据文件的大小将文件存入存储设备中不同的存储池包括：

若文件为小文件，则将文件存入副本池；若文件为大文件，则将文件存入纠删池。

在本实施例中，将大文件存入纠删池，能够更好的增加存储空间的利用率，将小文件存入副本池，保障数据的可靠性，同时由于小文件的元数据索引较多，将小文件存入副本池以避免过多的读写。

在上述实施例中，对于分布式存储方法进行了详细描述，本申请还提供分布式存储装置对应的实施例。需要说明的是，本申请从两个角度对装置部分的实施例进行描述，一种是基于功能模块的角度，另一种是基于硬件的角度。

图2为本申请实施例提供的一种分布式存储装置的结构图，如图2所示，该装置包括：

第一获取模块10，用于获取客户端发送的文件；

第二获取模块11，用于从日志文件中获取存有文件的元数据信息的目标日志文件；

确定模块12，用于根据目标日志文件，确定文件的实际大小；

判断模块13，用于判断文件的实际大小是否小于阈值，若小于，则确认文件为小文件，若不小于，则确认文件为大文件；

存储模块14，用于根据所确定出的文件的实际大小将文件存入存储设备中不同的存储池。

此外，在其他实施例中，分布式存储装置还可以包括：

统计模块，用于统计所述存储设备中各大小文件的占比情况。

第三获取模块，用于获取所述文件的写入类型。

由于装置部分的实施例与方法部分的实施例相互对应，因此装置部分的实施例请参见方法部分的实施例的描述，这里暂不赘述。

本申请所提供的分布式存储装置，在从客户端接收到文件后，在访问过程中产生的日志文件中过滤出存有文件的元数据信息的目标日志文件，根据该目标日志文件能够确定文件的实际大小，判断文件的实际大小是否小于预先设置的阈值以确定该文件是大文件还是小文件，进而根据文件的实际大小将文件存入存储设备中不同的存储池。相对于当前技术中，大小文件混合存放，无法区分文件的大小，使小文件的读写制约大文件读写性能，进而导致存储系统整体性能下降。采用本技术方案，根据日志确定文件的大小，并将大文件和小文件分开存放，有效避免了小文件对大文件读写性能的制约，提高了存储系统整体性能。

图3为本申请实施例提供的另一种分布式存储装置的结构图，如图3所示，该装置包括：存储器20，用于存储计算机程序；

处理器21，用于执行计算机程序时实现如上述实施例所述分布式存储方法的步骤。

本实施例提供的分布式存储装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。

其中，处理器21可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理器(Digital Signal Processor，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable LogicArray，PLA)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称中央处理器(CentralProcessing Unit，CPU)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器21可以集成有图像处理器(Graphics Processing Unit，GPU)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器21还可以包括人工智能(Artificial Intelligence，AI)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器20可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器20还可以包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。本实施例中，存储器20至少用于存储以下计算机程序201，其中，该计算机程序被处理器21加载并执行之后，能够实现前述任一实施例公开的分布式存储方法的相关步骤。另外，存储器20所存储的资源还可以包括操作系统202和数据203等，存储方式可以是短暂存储或者永久存储。其中，操作系统202可以包括Windows、Unix、Linux等。数据203可以包括但不限于目标日志文件、阈值等。

在一些实施例中，分布式存储装置还可以包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。

本领域技术人员可以理解，图3中示出的结构并不构成对分布式存储装置的限定，可以包括比图示更多或更少的组件。

本申请实施例提供的分布式存储装置，包括存储器和处理器，处理器在执行存储器存储的程序时，能够实现如下方法：分布式存储方法。

最后，本申请还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。

可以理解的是，如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(RandomAccess Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请所提供的计算机可读存储介质，在从客户端接收到文件后，在访问过程中产生的日志文件中过滤出存有文件的元数据信息的目标日志文件，根据该目标日志文件能够确定文件的实际大小，判断文件的实际大小是否小于预先设置的阈值以确定该文件是大文件还是小文件，进而根据文件的实际大小将文件存入存储设备中不同的存储池。相对于当前技术中，大小文件混合存放，无法区分文件的大小，使小文件的读写制约大文件读写性能，进而导致存储系统整体性能下降。采用本技术方案，根据日志确定文件的大小，并将大文件和小文件分开存放，有效避免了小文件对大文件读写性能的制约，提高了存储系统整体性能。

以上对本申请所提供的分布式存储方法、装置以及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

1.一种分布式存储方法，其特征在于，包括：

获取客户端发送的文件；

根据所述目标日志文件，确定所述文件的实际大小；

2.根据权利要求1所述的分布式存储方法，其特征在于，在所述根据所确定出的所述文件的实际大小将所述文件存入存储设备中不同的存储池的步骤之后，还包括：

统计所述存储设备中各大小文件的占比情况。

3.根据权利要求1所述的分布式存储方法，其特征在于，在所述根据所确定出的所述文件的实际大小将所述文件存入存储设备中不同的存储池的步骤之前，还包括：

4.根据权利要求3所述的分布式存储方法，其特征在于，若所述写入类型为对齐覆盖写，则所述文件存入所述存储设备的对应的所述存储池包括：

根据所述对应位置更新元数据索引。

5.根据权利要求3所述的分布式存储方法，其特征在于，若所述写入类型为非对齐覆盖写，则所述文件存入所述存储设备的对应的所述存储池包括：

将合并后的数据重新写入所述待写入位置。

6.根据权利要求1所述的分布式存储方法，其特征在于，所述存储池包括副本池和纠删池，其中，所述副本池为2个，所述副本池以副本的形式实现对所述文件的备份，所述纠删池根据纠删码算法对所述文件进行备份。

7.根据权利要求6所述的分布式存储方法，其特征在于，所述根据所述文件的大小将所述文件存入存储设备中不同的存储池包括：

8.一种分布式存储装置，其特征在于，包括：

第一获取模块，用于获取客户端发送的文件；

9.一种分布式存储装置，其特征在于，包括存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任意一项所述的分布式存储方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的分布式存储方法的步骤。