WO2017107948A1

WO2017107948A1 - 文件的写聚合、读聚合方法及系统和客户端

Info

Publication number: WO2017107948A1
Application number: PCT/CN2016/111473
Authority: WO
Inventors: 杨洪章; 王志坤; 罗圣美
Original assignee: 中兴通讯股份有限公司
Priority date: 2015-12-23
Filing date: 2016-12-22
Publication date: 2017-06-29
Also published as: CN106911743A; CN106911743B

Abstract

本文公开了一种文件的写聚合方法及系统，该写聚合方法包括：客户端发起小文件的写操作；客户端根据元数据服务器为所述小文件分配的全局唯一编号和存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置；以及客户端向对象存储设备OSD发送携带所述聚合位置的小文件聚合请求；其中，所述小文件是指大小小于一阈值的文件。

Description

文件的写聚合、读聚合方法及系统和客户端

技术领域

本公开涉及分布式存储技术领域，例如涉及一种文件的写聚合、读聚合方法及系统。

背景技术

随着云计算、移动互联网等技术的发展，需要存储及读取的数据量日益增大，而不同的数据的存储与读取方式是不同的，如只有数千字节的小文件，广泛采用随机聚合、查表索引的方式来进行存储与读取。由于聚合策略中的小文件在聚合时，需要额外创建这些小文件的映射表，并通过查询映射表才能读取这些小文件，因此耗费较多小文件的读取和写入的时间。

发明内容

本公开提供一种文件写聚合、读聚合方法及系统，减少了小文件的写聚合和读聚合过程中读取和写入的时间。

本公开提供的一种文件写聚合方法，包括：

客户端发起小文件的写操作；

所述客户端根据元数据服务器为所述小文件分配的全局唯一编号和存储区域唯一编号计算所述小文件在对象存储设备OSD中的聚合位置；

所述客户端向所述对象存储设备OSD发送携带所述聚合位置的小文件聚合请求；其中，所述小文件是指大小小于一阈值的文件。

可选地，所述全局唯一编号为索引节点编号ino，存储区域唯一编号为对象编号ono，所述聚合位置的计算公式为：聚合位置＝((ino+ono+1)＜＜32)|1，其中，＜＜32表示左移32个比特位，|表示按位或运算。

可选地，所述客户端发起小文件的写操作包括：

所述客户端将所述小文件的内容写入本地缓存，以及向所述元数据服务器发送创建所述小文件的元数据的请求。

可选地，所述元数据服务器为所述小文件分配的全局唯一编号是按照时序递增的分配原则分配的；以及

在所述聚合位置中聚合的N个全局唯一编号连续的所述小文件被预判为同一对象，同一对象的N个小文件分别被分配不同的存储区域唯一编号；其中，N为小于或等于预设聚合数量的正整数。

可选地，所述客户端向所述对象存储设备OSD发送携带所述聚合位置的小文件聚合请求后，在所述小文件的存储区域唯一编号为负数时，所述小文件被写入编号为聚合位置的对象中的第一聚合位置个区域中，其中。-为负号。

本公开还提供一种文件写聚合系统，包括：

客户端、元数据服务器及对象存储设备OSD，其中，

所述客户端，设置为发起小文件的写操作；

所述元数据服务器，设置为为所述小文件分配全局唯一编号和存储区域唯一编号；

所述客户端，还设置为根据所述全局唯一编号和所述存储区域唯一编号计算所述小文件在所述对象存储设备OSD中的聚合位置；以及

所述对象存储设备OSD，设置为根据聚合位置将小文件聚合。

可选地，所述元数据服务器还设置为：

按时序递增的分配原则为所述小文件分配全局唯一编号；以及

可选地，所述对象存储设备OSD还设置为：

所述对象存储设备OSD接收所述客户端发送的小文件写聚合请求；以及

根据所述小文件写聚合请求逐个检测N个全局唯一编号连续的小文件的存储区域唯一编号，在所述小文件的存储区域唯一编号为负数时，将所述小文件写入编号为聚合位置的对象中的第-存储区域唯一编号个区域中；其中，-为负号；小文件写聚合请求包含小文件、聚合位置、全局唯一编号和存储区域唯一编号；N为小于或等于预设聚合数量的正整数。

本公开提供一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为上述任一文件写聚合方法。

本公开还提供了一种客户端，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行：

客户端发起小文件的写请求操作；

所述客户端根据元数据服务器为所述小文件分配的全局唯一编号和存储区域唯一编号计算所述小文件在对象存储设备OSD中的聚合位置；以及

客户端向所述对象存储设备OSD发送携带所述聚合位置的小文件聚合请求；其中，所述小文件是指大小小于一阈值的文件。

本公开通过客户端发起小文件的写操作，该客户端根据元数据服务器为小文件分配的全局唯一编号和存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置，客户端向向对象存储设备OSD发送携带所述聚合位置的小文件聚合请求，其中，所述小文件是指大小小于一阈值的文件。由于该小文件存储位置的是通过计算获取到的全局唯一编号和存储区域唯一编号而确定，并根据该小文件存储位置写入该小文件，因此不需要额外创建该小文件的映射表，从而减少了小文件的写入时间。

本公开提供的一种文件读聚合方法，包括：

客户端发起小文件的读请求；

从元数据服务器获取所述小文件的全局唯一编号和存储区域唯一编号；

根据所述全局唯一编号和所述存储区域唯一编号计算所述小文件在对象存储设备OSD中的聚合位置；以及

根据所述聚合位置从所述对象存储设备OSD中获取所述小文件。

可选地，在所述客户端发起小文件的读请求之后，所述方法还包括：

检测所述客户端的缓存中是否存在所述小文件；

若所述客户端的缓存中存在所述小文件，则获取所述小文件；以及

若所述客户端的缓存中未存在所述小文件，则从元数据服务器获取所述小文件的全局唯一编号和存储区域唯一编号。

可选地，所述根据所述聚合位置从所述对象存储设备OSD中获取所述小文件包括：

向所述对象存储设备OSD发送读聚合请求；

接收所述对象存储设备OSD发送的所述聚合位置中所有的小文件并保存；以及

获取所述存储区域唯一编号的绝对值对应区域中的小文件。

本公开还提供一种客户端，包括：

读请求模块，设置为发起小文件的读请求；

编号获取模块，设置为从元数据服务器获取所述小文件的全局唯一编号和存储区域唯一编号；

计算模块，设置为根据所述全局唯一编号和所述存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置；以及

小文件获取模块，设置为根据所述聚合位置从所述对象存储设备OSD中获取所述小文件。

可选地，所述客户端还包括：

检测模块，设置为检测所述客户端的缓存中是否存在所述小文件；

所述小文件获取模块，还设置为若所述客户端的缓存中存在所述小文件，则获取所述小文件；以及

所述编号获取模块，还设置为若所述客户端的缓存中未存在所述小文件，则从元数据服务器获取所述小文件的全局唯一编号和存储区域唯一编号。

可选地，所述小文件获取模块包括：

发送单元，设置为向所述对象存储设备OSD发送读聚合请求；

接收单元，设置为接收所述对象存储设备OSD发送的所述聚合位置中所有的小文件并保存；以及

获取单元，设置为获取所述存储区域唯一编号的绝对值对应区域中的小文件。本公开还提供了一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为执行文件读聚合方法。

本公开还提供了一种客户端，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

发起小文件的读请求；

本公开通过客户端发起小文件的读请求，根据该小文件的读请求从元数据服务器获取小文件的全局唯一编号和存储区域唯一编号，并根据全局唯一编号和存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置，使得该客户端根据聚合位置从OSD中获取小文件。由于该小文件存储位置的是通过计算获取到的全局唯一编号和存储区域唯一编号而确定，并根据该小文件存储位置读取该小文件，因此不需要通过查映射表来读取该小文件，从而减少了小文件的读取时间。

附图说明

图1为文件的写聚合方法的第一实施例的流程示意图；

图2为文件的写聚合方法的第二实施例中元数据服务器为小文件分配全局唯一编号和存储区域唯一编号的细化流程示意图；

图3为本文件写聚合方法的第三实施例中对象存储设备OSD根据聚合位置将小文件聚合的细化流程示意图；

图4为文件写聚合系统的第一实施例的功能模块示意图；

图5为文件读聚合方法的第一实施例的流程示意图；

图6为文件读聚合方法的第二实施例的流程示意图；

图7为文件读聚合方法的第三实施例中根据聚合位置获取小文件的细化流程示意图；

图8为客户端的第一实施例的功能模块示意图；

图9为客户端的第二实施例的功能模块示意图；

图10为客户端的第三实施例中文件获取模块的细化功能模块示意图；以及

图11为客户端的硬件结构示意图。

具体实施方式

应当理解，此处所描述的实施例仅仅用以解释本公开，并不用于限定本公开。

参照图1，图1为文件的写聚合方法的第一实施例的流程示意图。本公开的文件写聚合方法可以应用于小文件，小文件是指大小小于一阈值(例如1MB)的文件。

在步骤110中，客户端发起小文件的写操作。

在本实施例中，一个小文件的文件大小可以是小于64KB或1MB，小文件还可以是小于文件系统条带粒度(Stripe Size)的文件。客户端发起小文件写操作，客户端将该小文件的内容写入客户端的本地缓存中。在该客户端将该小文件的内容写入该客户端的本地缓存中后，该客户端向元数据服务器发送创建这些小文件的元数据请求。

可选的，所述客户端发起小文件的写操作包括将小文件的内容写入缓存、创建小文件的元数据请求以及将缓存中的内容根据元数据写入存储设备。

在步骤120中，元数据服务器为小文件分配全局唯一编号和存储区域唯一编号。其中，全局唯一编号可以为索引节点编号(inode number，ino)，存储区域唯一编号可以为对象编号(object number，ono)。该元数据服务器接收到元数据请求后，将会为该小文件逐一分配全局唯一编号和小文件在对象中的存储区域唯一编号，再将该全局唯一编号及该存储区域唯一编号回传给该客户端，该客户端接收该全局唯一编号和该存储区域唯一编号。其中，对象是基于对象存储设备(Object-based Storage Device，OSD)构建存储系统中数据存储的基本单位，一个对象是文件的数据和一组属性信息(Meta Data)的组合，对象存储结构包括对象、对象存储设备、元数据服务器、对象存储系统的客户端。

在步骤130中，客户端根据全局唯一编号和存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置。其中，聚合位置可以是由对象标识符(Object Identifier，OID)决定，对象标识符可以是一个64位比特的数据，当全局唯一编号为ino，存储区域唯一编号为ono时，OID可以通过公式OID＝((ino+ono+1)＜＜32)|1计算得到，OID的数据决定了小文件在对象存储设备中的聚合位置。

在该客户端接收到该元数据服务器回传该全局唯一编号和该存储区域唯一编号后，该客户端可以通过该聚合位置的计算公式聚合位置＝((ino+ono+1)＜＜32)|1，计算该小文件在对象存储设备OSD中的聚合位置，即小文件对象的编号＝((小文件的文件编号+小文件在对象中的区域编号+1)＜＜32)|1，计算出该小文件聚合成对象后，该对象的编号。其中，＜＜32表示左移32个比特位，|表示按位或运算。该聚合位置为该小文件在聚合成对象后，该对象在全局对象中的唯一编号。在同一对象中任一存储区域的小文件通过计算后得出的聚合位置均相同。该对象存储设备OSD的确定可以通过公式OSD_num＝HASH(聚合位置)，计算得到的，即对象存储设备的编号＝HASH(文件的对象编号)，计算出该对象所处的对象存储设备的编号，其中，HASH泛化了计算机领域常见的、公开的数据分布算法，包括但不限于：平方取中间值、模运算取余、分布式哈希表(Distributed Hash Table，DHT)算法、CRUSH(Controlled Replication Under Scalable Hashing)算法。计算得到聚合位置后，客户端将聚合位置发送给对象存储设备OSD。

在步骤140中，对象存储设备OSD根据聚合位置将小文件聚合。

在接收到该小文件的聚合位置后，该对象存储设备将具有相同的聚合位置的小文件聚合在同一对象中，分别写入不同区域中。同时，在对象存储设备OSD将该小文件聚合完成后，该对象存储设备向该客户端发送小文件聚合写完成指令，该客户端接收到该小文件聚合写完成指令后，该客户端向元数据服务器发送元数据更新请求更新指令，通知该元数据服务器更新该小文件的元数据信息，更新该小文件的文件编号、区域编号、小文件的创建时间、小文件的修改时间、访问权限、文件大小。

本实施例通过客户端发起小文件的写操作，以供元数据服务器为小文件分配的全局唯一编号和存储区域唯一编号该客户端根据该全局唯一编号和该存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置，使得该对象存储设备OSD根据该聚合位置将小文件聚合。由于该小文件存储位置的是通过计算全局唯一编号和存储区域唯一编号而确定，并根据该小文件存储位置写入该小文件，因此不需要额外创建该小文件的映射表，从而减少了小文件的写入时间。

基于文件的写聚合方法的第一实施例，提出文件的写聚合方法的第二实施例，在本实施例中，参照图2，上述步骤120包括：步骤1210-1220。

在步骤1210中，元数据服务器按时序递增的分配原则为小文件分配全局唯一编号。

在本实施例中，在该客户端发起该小文件的写操作后，该客户端向该元数据服务器发送该小文件元数据的创建请求，该元数据服务器根据该小文件元数据的创建请求为该小文件逐一分配全局唯一编号，该小文件的全局唯一编号的分配顺序可以按照时序递增的顺序来分配的，将该元数据服务器中预设的全局唯一编号，分配给该小文件中最早创建的小文件，后续创建的小文件的全局唯一编号在预设的唯一的文件编号基础上依次增加1。该元数据服务器按照小文件的创建时间来分配小文件的全局唯一编号，小文件的创建时间越晚，被分配到的文件编号越大。例如，小文件包括B、C、D、E、F、G、H、I、J、K、L、M，它们的创建时间依次增大，将该元数据服务器中预设的文件编号2015分配给最早创建的小文件B，则小文件C的文件编号为2016，则小文件D的文件编号为2017，小文件E、F、G、H、I、J、K、L、M的文件编号可以依次类推。

在步骤1220中，将在聚合位置中聚合的N个全局唯一编号连续的小文件预判为同一对象，为同一对象的N个小文件分别分配不同的存储区域唯一编号。其中，N为小于或等于预设聚合数量的正整数。

一个对象的内存容量为4MB，一个对象中最多聚合4个小文件，至少要聚合一个小文件，其中，一个对象中分配4个存储区域。在该元数据服务器为该小文件逐一分配该小文件的全局唯一编号后，该元数据服务器将具有连续全局唯一编号的4个小文件预判为同一个对象，例如，将(B、C、D、E)、(F、G、H、I)、(J、K、L、M)12个小文件判定分别合并在三个对象中。

当未聚合完毕的小文件的数量小于预设聚合数量(例如上述的预设聚合数量为4)时，可以将所述未聚合完毕的小文件聚合于同一对象中，并为其对象分配存储区域唯一编号。分配原则可以为：第K个区域中的小文件存储区域唯一编号为-k。例如，对小文件B、C、D、E、F、G、H、I、J、K进行聚合，则将(B、C、D、E)、(F、G、H、I)、(J、K)10个小文件分别聚合成三个对象中，其中包含(J、K)2个小文件的对象占用内存大小是4MB。在该小文件聚合成对象后，该元数据服务器为该小文件逐一分配在该对象中的区域编号。例如，小文件B在对象中的区域编号为-1、小文件C在对象中的区域编号为-2、小文件D在对象中的区域编号为-3、小文件E在对象中的区域编号为-4、小文件F在对象中的区域编号为-1、小文件G在对象中的区域编号为-2、小文件H在对象中的区域编号为-3、小文件I在对象中的区域编号为-4、小文件J在对象中的区域编号为-1、小文件K在对象中的区域编号为-2、小文件L在对象中的区域编号为-3、小文件M在对象中的区域编号为-4。

该元数据服务器可以逐一为上述小文件创建元数据，如小文件的创建时间、访问权限、最后修改时间、文件大小。

本实施例通过元数据服务器按时序递增的分配原则为小文件分配全局唯一编号，并为预判为同一对象的N个全局唯一编号连续的小文件分配存储区域唯一编号。由于该小文件的全局唯一编号及该存储区域唯一编号是按时序递增的原则分配的，并按照区域编号有序聚合在对象中，因此不需要额外创建这些小文件的映射表，从而提高对小文件的效率。

可选的，基于第一实施例，提出文件的写聚合方法的第三实施例，参照图3。

在步骤1410中，对象存储设备OSD接收客户端发送的小文件写聚合请求。

在本实施例中，在该客户端确定该小文件将要写入的OSD后，该客户端向该OSD发送该小文件写聚合请求，该OSD接收客户端发送的小文件写聚合请求。

在步骤1420中，对象存储设备OSD根据小文件写聚合请求逐个检测N个全局唯一编号连续小文件的存储区域唯一编号，在小文件的存储区域唯一编号为负数时，将小文件写入编号为聚合位置的对象中的第-存储区域唯一编号个区域中，其中，-为负号，N为小于或等于预设聚合数量的正整数。

在该OSD接收客户端发送的小文件写聚合请求，该OSD逐个检测接收到的小文件的存储区域唯一编号是否为负数，在确定接收到的小文件的存储区域唯一编号为负数后，该OSD通知该OSD中小文件聚合模块对该小文件进行小文件聚合写操作。该小文件聚合模块将连续个全局唯一编号小文件聚合在同一个对象中；或者，根据该存储区域唯一编号的绝对值确定该小文件在该对象的存储区域，将该小文件写入该小文件的存储区域唯一编号的绝对值对应的存储区域中。本实施例通过对象存储设备OSD接收客户端发送的小文件写聚合请求，并根据小文件写聚合请求逐个检测N个全局唯一编号连续小文件的存储区域唯一编号，在小文件的存储区域唯一编号为负数时，将小文件写入编号为聚合位置的对象中的第-存储区域唯一编号个区域中，使得小文件存储位置是定向的、唯一的，从而减少了小文件的读写时间。

本公开可选提供一种文件的写聚合系统。

参照图4，图4为文件的写聚合系统的第一实施例的功能模块示意图。

在本实施例中，该系统可以包括：客户端10、元数据服务器20、对象存储设备OSD 30。

所述客户端10设置为发起小文件的写操作。

在本实施例中，一个小文件的文件大小可以小于1MB，客户端发起小文件写操作，客户端将该小文件的内容写入客户端的本地缓存中。在该客户端将该小文件的内容写入该客户端的本地缓存中后，该客户端向元数据服务器发送创建这些小文件的元数据请求。

所述元数据服务器20设置为为小文件分配全局唯一编号和存储区域唯一编号。

该元数据服务器接收到元数据请求后，将会为该小文件逐一分配全局唯一编号和小文件在对象中的存储区域唯一编号，将该全局唯一编号及该存储区域唯一编号回传给该客户端，该客户端接收该全局唯一编号和该存储区域唯一编号。

所述客户端10还设置为根据全局唯一编号和存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置。

在该客户端接收到该元数据服务器回传该全局唯一编号和该存储区域唯一编号后，全局唯一编号可以为索引节点编号ino，存储区域唯一编号可以为对象编号ono，该客户端通过该聚合位置的计算公式聚合位置＝((ino+ono+1)＜＜32)|1，计算该小文件在对象存储设备OSD中的聚合位置，即小文件对象的编号＝((小文件的文件编号+小文件在对象中的区域编号+1)＜＜32)|1，计算出该小文件聚合成对象后，该对象的编号。其中，＜＜32表示左移32个比特位，|表示按位或运算，该聚合位置为该小文件在聚合成对象后，该对象在全局对象中的唯一编号。在同一对象中任一存储区域的小文件通过计算后得出的聚合位置均相同。该对象存储设备OSD的确定可以通过公式OSD_num＝HASH(聚合位置)，计算得到的，即对象存储设备的编号＝HASH(文件的对象编号)，计算出该对象所处的对象存储设备的编号，其中，HASH泛化了计算机领域常见的、公开的数据分布算法，包括但不限于：平方取中间值、模运算取余、DHT算法、CRUSH算法。

所述对象存储设备OSD 30设置为根据聚合位置将小文件聚合。

所述元数据服务器20还设置为按时序递增的分配原则为小文件分配全局唯一编号。

所述元数据服务器20还设置为在聚合位置中聚合的N个全局唯一编号连续的小文件被预判为同一对象，同一对象的N个小文件分别被分配不同的存储区域唯一编号。其中，N为小于或等于预设聚合数量的正整数。

一个对象的内存容量为4MB，一个对象中最多聚合4个小文件，至少要聚合一个小文件，其中，一个对象中分配4个存储区域。在该元数据服务器为该小文件逐一分配该小文件的全局唯一编号后，该元数据服务器将具有连续的全局唯一编号的4个小文件预判为同一个对象，例如，将(B、C、D、E)、(F、G、H、I)、(J、K、L、M)12个小文件判定分别合并在三个对象中。

当未聚合完毕的小文件的数量小于预设聚合数量(例如上述的预设聚合数量为4)时，可以将所述未聚合完毕的小文件聚合于同一对象中，并为对象分配存储区域唯一编号。分配原则可以为：第K个区域中的小文件存储区域唯一编号为-k。例如，对小文件B、C、D、E、F、G、H、I、J、K进行聚合，则将(B、C、D、E)、(F、G、H、I)、(J、K)10个小文件分别聚合成三个对象中，其中包含(J、K)2个小文件的对象占用内存大小是4MB。

在该小文件聚合成对象后，该元数据服务器为该小文件逐一分配在该对象中的区域编号。例如，小文件B在对象中的区域编号为-1、小文件C在对象中的区域编号为-2、小文件D在对象中的区域编号为-3、小文件E在对象中的区域编号为-4、小文件F在对象中的区域编号为-1、小文件G在对象中的区域编号为-2、小文件H在对象中的区域编号为-3、小文件I在对象中的区域编号为-4、小文件J在对象中的区域编号为-1、小文件K在对象中的区域编号为-2、小文件L在对象中的区域编号为-3、小文件M在对象中的区域编号为-4。

所述对象存储设备OSD 30还设置为接收客户端发送的小文件写聚合请求。

在本实施例中，在该客户端确定该小文件将要写入的OSD后，该客户端向该OSD发送该小文件写聚合请求，该OSD接收客户端发送的小文件写聚合请求，其中，该小文件写聚合请求包括小文件、聚合位置、全局唯一编号和存储区域唯一编号。

所述对象存储设备OSD 30还设置为根据小文件写聚合请求逐个检测N个全局唯一编号连续小文件的存储区域唯一编号，在小文件的存储区域唯一编号为负数时，将小文件写入编号为聚合位置的对象中的第-存储区域唯一编号个区域中，其中-为负号。

在该OSD接收客户端发送的小文件写聚合请求，该OSD逐个检测接收到的小文件的存储区域唯一编号是否为负数，在确定接收到的小文件的存储区域唯一编号为负数后，该OSD通知该OSD中小文件聚合模块对该小文件进行小文件聚合写操作。该小文件聚合模块将连续全局唯一编号的小文件聚合在同一个对象中；或者，根据该存储区域唯一编号的绝对值确定该小文件在该对象的存储区域，将该小文件写入该小文件的存储区域唯一编号的绝对值对应的存储区域中。

本实施例通过客户端10发起小文件的写操作，元数据服务器20为小文件分配全局唯一编号和存储区域唯一编号，该客户端10根据该全局唯一编号和该存储区域唯一编号计算小文件在对象存储设备OSD 30中的聚合位置，使得该对象存储设备OSD 30根据该聚合位置将小文件聚合。由于该小文件存储位置的是通过计算获取到的全局唯一编号和存储区域唯一编号而确定，并根据该小文件存储位置写入该小文件，因此不需要额外创建该小文件的映射表，从而减少了小文件的写入时间。

参照图4，图4为文件的读聚合方法的第一实施例的流程示意图。

在步骤510中，客户端发起小文件的读请求。

在本实施例中，一个小文件的文件大小可以小于1MB，客户端向小文件发起小文件读请求，即根据该客户端对该小文件按顺序进行读取。

在步骤520中，从元数据服务器获取小文件的全局唯一编号和存储区域唯一编号。

该客户端向元数据服务器获取当前读取的小文件的元数据。该元数据服务器根据该客户端发起的小文件的读请求，检测该客户端对小文件的访问权限，如果该元数据服务器判定该客户端对该小文件的是非法访问，则向该客户端反馈该客户端对该文件是非法访问的信息，该客户端检查对该小文件的读取是否完成，如果没有完成则继续读取该小文件中的下一个小文件，如果完成则结束小文件的读取。如果该元数据服务器判定该客户端对该小文件的是合法访问，则元数据服务器将该读取小文件的全局唯一编号和存储区域唯一编号发送给该客户端，该客户端接收该元数据服务器发送的该全局唯一编号和该存储区域唯一编号。

在步骤530中，根据全局唯一编号和存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置。

在该客户端接收到该元数据服务器回传该全局唯一编号和该存储区域唯一编号后，全局唯一编号可以为索引节点编号ino，存储区域唯一编号可以为对象编号ono，该客户端可以通过该聚合位置的计算公式聚合位置＝((ino+ono+1)＜＜32)|1，计算该小文件在对象存储设备OSD中的聚合位置，即小文件所属对象的编号＝((小文件的文件编号+小文件在对象中的区域编号+1)＜＜32)|1，计算出该小文件聚合成的对象后，该对象的对象编号。其中，＜＜32表示左移32个比特位，|表示按位或运算。该聚合位置为该小文件在聚合成对象后，该对象在全局对象中的唯一编号。在同一对象中任一存储区域的小文件通过计算后得出的聚合位置均相同。该对象存储设备OSD的确定可以通过公式OSD_num＝HASH(聚合位置)，计算得到的，即对象存储设备的编号＝HASH(文件的对象编号)，计算出该对象所处的对象存储设备的编号，其中，HASH泛化了计算机领域常见的、公开的数据分布算法，包括但不限于：平方取中间值、模运算取余、DHT算法、CRUSH算法。

在步骤540中，根据聚合位置从对象存储设备OSD中获取小文件。

在该客户端计算出该小文件的聚合位置后，即计算出该小文件在OSD中的聚合位置后，该OSD中的小文件聚合模块将该聚合位置中聚合的所有小文件发送给该客户端。客户端根据该小文件的存储区域唯一编号，将该小文件中的数据反馈给客户端的应用，该聚合位置中包含的其他小文件则存储在该客户端的本地缓存中。

本实施例通过客户端发起小文件的读请求，根据该小文件的读请求从元数据服务器获取小文件的全局唯一编号和存储区域唯一编号，并根据全局唯一编号和存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置，使得该客户端根据聚合位置从OSD中获取小文件。由于该小文件存储位置的是通过计算获取到的全局唯一编号和存储区域唯一编号而确定，并根据该小文件存储位置读取该小文件，因此不需要通过查映射表来读取该小文件，从而减少了小文件读取的时间。

可选的，基于文件的读聚合方法的第一实施例，提出文件的读聚合方法的第二实施例。在本实施例中，参照图6，上述步骤510之后，读聚合方法还包括：步骤550-560。

在步骤550中，检测客户端的缓存中是否存在小文件。

在本实施例中，该客户端检测当前读取的该小文件是否存在该客户端的本地缓存中，可以理解的是，对该小文件读取的同时也将该小文件聚合成的对象中的所有文件读取出来并保存，因此可以通过查找该客户端的缓存中是否存在该小文件，可以减少对该小文件的读取时间。

若客户端的缓存中存在小文件，则执行步骤560，获取小文件。

在该检测到该客户端的缓存中存在该小文件时，该客户端获取该小文件，并将该小文件中的数据返回给该客户端的应用。

若客户端的缓存中未存在小文件，则执行步骤520，即从元数据服务器获取小文件的全局唯一编号和存储区域唯一编号。

若检测到客户端的缓存中未存在该小文件，则该客户端向该元数据服务器发送该小文件的有序读请求，使得该客户端获取该元数据服务器为该小文件分配的文件编号及该小文件在对象中的区域编号。例如，客户端发起小文件B、C、D、E、F、G、H、I、J、K、L、M的有序读请求时，检测到该客户端的缓存中未存在该小文件，则该客户端向该元数据服务器发送该小文件的有序读请求，获取元数据服务器为小文件分配的全局唯一编号及小文件在对象存储区域唯一编号。

本实施例通过检测该客户端的缓存中是否存在该小文件，如果该客户端的缓存中存在该小文件时，则获取该小文件；如果客户端的缓存中未存在所述小文件，则从元数据服务器获取小文件的全局唯一编号和存储区域唯一编号，使得该客户端在对该小文件发起有序读请求后能够快速的对该小文件进行读取，从而提高了客户端对小文件的读写效率。

可选的，基于文件的读聚合方法的第一实施例，提出文件的读聚合方法的第三实施例，在本实施例中，参照图7，上述步骤540包括：步骤5410-5430。

在步骤5410中，向对象存储设备OSD发送读聚合请求。

在本实施例中，该客户端确定该小文件聚合成对象后所存储的OSD，该客户端向该OSD发送该小文件的读聚合请求，该OSD判断该小文件的存储区域唯一编号是否为负数，在确定该小文件的存储区域唯一编号为负数后，该OSD通知该OSD中的小文件聚合模块对该小文件进行小文件聚合读操作。

在步骤5420中，接收对象存储设备OSD发送的聚合位置中所有的小文件并保存。

该小文件聚合模块从该OSD中将该小文件所述的对象中的所有小文件发送给该客户端，该客户端并保存该对象中所有小文件。同时，在对象存储设备OSD将该小文件聚合读取完成后，该对象存储设备向该客户端发送小文件聚合读取完成指令，该客户端接收到该小文件聚合读取完成指令后，该客户端向元数据服务器发送元数据更新请求更新指令，通知该元数据服务器更新该小文件的元数据信息，如小文件的最后访问时间、对象的最后访问时间。

在步骤5430中，获取存储区域唯一编号的绝对值对应区域中的小文件。

该客户端将该小文件的存储区域唯一编号的绝对值，即该对象中第-存储区域唯一编号个区域的小文件从该对象中读取出，并将该小文件中的数据反馈给该客户端的应用。

本实施例通过客户端向OSD发送读聚合请求，该OSD判断该小文件的存储区域唯一编号是否为负数，在确定该小文件的存储区域唯一编号为负数后，该客户端接收OSD发送的聚合位置中所有的小文件并保存，从而该客户端获取存储区域唯一编号的绝对值对应区域中的小文件，使得不用通过查映射表来读取该小文件，节约了对小文件的读取的时间。

本公开还提供一种客户端。

参照图8，图8为本公开客户端的第一实施例的功能模块示意图。

在本实施例中，该客户端包括：读请求模块40、编号获取模块50、计算模块60以及小文件获取模块70。

所述读请求模块40设置为发起小文件的读请求。

本实施例中，一个小文件的文件大小小于1MB，客户端向小文件发起小文件读请求，即根据该客户端对该小文件按顺序进行读取。

所述编号获取模块50设置为从元数据服务器获取小文件的全局唯一编号和存储区域唯一编号。

所述计算模块60设置为根据全局唯一编号和存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置。

在该客户端接收到该元数据服务器回传该全局唯一编号和该存储区域唯一编号后，全局唯一编号可以为索引节点编号ino，存储区域唯一编号可以为对象编号ono，该客户端可以通过该聚合位置的计算公式聚合位置＝((ino+ono+1)＜＜32)|1，计算该小文件在对象存储设备OSD中的聚合位置，即小文件所属对象的编号＝((小文件的文件编号+小文件在对象中的区域编号+1)＜＜32)|1，计算出该小文件聚合成的对象后，该对象的对象编号。其中，＜＜32 表示左移32个比特位，|表示按位或运算。该聚合位置为该小文件在聚合成对象后，该对象在全局对象中的唯一编号。在同一对象中任一存储区域的小文件通过计算后得出的聚合位置均相同。该对象存储设备OSD的确定可以通过公式OSD_num＝HASH(聚合位置)，计算得到的，即对象存储设备的编号＝HASH(文件的对象编号)，计算出该对象所处的对象存储设备的编号，其中，HASH泛化了计算机领域常见的、公开的数据分布算法，包括但不限于：平方取中间值、模运算取余、DHT算法、CRUSH算法。

所述小文件获取模块70设置为根据聚合位置从对象存储设备OSD中获取小文件。

本实施例通过读请求模块40发起小文件的读请求，编号获取模块50根据该小文件的读请求从元数据服务器获取小文件的全局唯一编号和存储区域唯一编号，计算模块60根据全局唯一编号和存储区域唯一编号计算小文件在对象存储设备OSD中的聚合位置，使得该小文件获取模块70根据聚合位置从OSD中获取小文件。由于该小文件存储位置的是通过计算获取到的全局唯一编号和存储区域唯一编号而确定，并根据该小文件存储位置读取该小文件，因此不需要通过查映射表来读取该小文件，从而减少了小文件读取的时间。

可选的，基于客户端的第一实施例，提出本公开客户端第二实施例。参照图8，在本实施例中，所述客户端还包括：检测模块50。

所述检测模块80设置为检测客户端的缓存中是否存在小文件。

所述小文件获取模块70，还设置为在客户端的缓存中存在小文件时，则获取小文件；

所述编号获取模块50还设置为在客户端的缓存中未存在小文件时，则从元数据服务器获取小文件的全局唯一编号和存储区域唯一编号。

在检测到客户端的缓存中未存在该小文件时，则该客户端向该元数据服务器发送该小文件的有序读请求，使得该客户端获取该元数据服务器为该小文件分配的文件编号及该小文件在对象中的区域编号。例如，客户端发起小文件B、C、D、E、F、G、H、I、J、K、L、M的有序读请求时，检测到该客户端的缓存中未存在该小文件，则该客户端向该元数据服务器发送该小文件的有序读请求，获取元数据服务器为小文件分配的全局唯一编号及小文件在对象存储区域唯一编号。

可选的，基于客户端的第一实施例，提出本公开客户端第三实施例，参照图10，在本实施例中，所述小文件获取模块70包括发送单元71、接收单元72以及获取单元73。

所述发送单元71设置为向对象存储设备OSD发送读聚合请求。

所述接收单元72设置为接收对象存储设备OSD发送的聚合位置中所有的小文件并保存。

所述获取单元73设置为获取存储区域唯一编号的绝对值对应区域中的小文件。

本公开还提供一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为执行上述任一实施例中的文件读聚合方法。

本公开还提供了一种客户端的硬件结构示意图，参见图11，该客户端包括：

至少一个处理器(Processor)101，图11中以一个处理器101为例；和存储器(Memory)102，还可以包括通信接口(Communications Interface)104和总线103。其中，处理器101、通信接口104、存储器103可以通过总线103完成相互间的通信。通信接口104可以用于信息传输。处理器101可以调用存储器102中的逻辑指令，以执行文件读聚合方法。

此外，上述的存储器102中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。

存储器102作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序，如本公开实施例中的方法对应的程序指令或模块。处理器101通过运行存储在存储器102中的软件程序、指令或模块，从而执行功能应用以及数据处理，即实现文件读聚合方法。

存储器102可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端设备的使用所创建的数据等。此外，存储器102可以包括高速随机存取存储器，还可以包括非易失性存储器。

本公开的技术方案可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括一个或多个指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质，包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等多种可以存储程序代码的介质，也可以是暂态存储介质。

本公开还提供一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为执行上述任一实施例中的文件写聚合方法。

本公开还提供了一种客户端，与图11中的客户端具有相同的硬件结构，与图10中的客户端的不同在于，本实施例中客户端的处理器可以调用存储器中的逻辑指令，以执行文件写聚合方法。

本公开提供的文件的写聚合、读聚合方法及系统和客户端，减少了小文件的写聚合和读聚合过程中读取和写入的时间。

Claims

一种文件写聚合方法，包括：

客户端发起小文件的写操作；

所述客户端根据元数据服务器为所述小文件分配的全局唯一编号和存储区域唯一编号计算所述小文件在对象存储设备OSD中的聚合位置；

所述客户端向所述对象存储设备OSD发送携带所述聚合位置的小文件聚合请求；其中，所述小文件是指大小小于一阈值的文件。
如权利要求1所述的方法，其中，所述全局唯一编号为索引节点编号ino，存储区域唯一编号为对象编号ono，所述聚合位置的计算公式为：聚合位置＝((ino+ono+1)＜＜32)|1，其中，＜＜32表示左移32个比特位，|表示按位或运算。
如权利要求1所述的方法，其中，所述客户端发起小文件的写操作包括：

所述客户端将所述小文件的内容写入本地缓存，以及向所述元数据服务器发送创建所述小文件的元数据的请求。
如权利要求1所述的方法，其中，所述元数据服务器为所述小文件分配的全局唯一编号是按照时序递增的分配原则分配的；以及

在所述聚合位置中聚合的N个全局唯一编号连续的所述小文件被预判为同一对象，同一对象的N个小文件分别被分配不同的存储区域唯一编号；其中，N为小于或等于预设聚合数量的正整数。
如权利要求4所述的方法，其中，

所述客户端向所述对象存储设备OSD发送携带所述聚合位置的小文件聚合请求后，在所述小文件的存储区域唯一编号为负数时，所述小文件被写入编号为聚合位置的对象中的第-存储区域唯一编号个区域中，其中，-为负号。
一种文件写聚合系统，包括：客户端、元数据服务器及对象存储设备OSD，其中，

所述客户端，设置为发起小文件的写操作；

所述元数据服务器，设置为为所述小文件分配全局唯一编号和存储区域唯一编号；

所述客户端，还设置为根据所述全局唯一编号和所述存储区域唯一编号计算所述小文件在所述对象存储设备OSD中的聚合位置；以及

所述对象存储设备OSD，设置为根据所述聚合位置将所述小文件聚合。
如权利要求6所述的系统，其中，所述全局唯一编号为索引节点编号ino，存储区域唯一编号为对象编号ono，所述聚合位置的计算公式为：聚合位置＝((ino+ono+1)＜＜32)|1，其中，＜＜32表示左移32个比特位，|表示按位或运算。
如权利要求6所述的系统，其中，所述元数据服务器还设置为：

按时序递增的分配原则为所述小文件分配全局唯一编号；以及

在所述聚合位置中聚合的N个全局唯一编号连续的所述小文件被预判为同一对象，同一对象的N个小文件分别被分配不同的存储区域唯一编号；其中，N为小于或等于预设聚合数量的正整数。
如权利要求6所述的系统，其中，所述对象存储设备OSD还设置为：

接收所述客户端发送的小文件写聚合请求；以及

根据所述小文件写聚合请求逐个检测N个全局唯一编号连续的小文件的存储区域唯一编号，在所述小文件的存储区域唯一编号为负数时，将所述小文件写入编号为聚合位置的对象中的第-存储区域唯一编号个区域中；其中，-为负号；小文件写聚合请求包含小文件、聚合位置、全局唯一编号和存储区域唯一编号；N为小于或等于预设聚合数量的正整数。
一种文件读聚合方法，包括：

客户端发起小文件的读请求；

从元数据服务器获取所述小文件的全局唯一编号和存储区域唯一编号；

根据所述全局唯一编号和所述存储区域唯一编号计算所述小文件在对象存储设备OSD中的聚合位置；以及

根据所述聚合位置从所述对象存储设备OSD中获取所述小文件。
如权利要求10所述的方法，其中，所述全局唯一编号为索引节点编号ino，存储区域唯一编号为对象编号ono，所述聚合位置的计算公式为：聚合位置＝((ino+ono+1)＜＜32)|1，其中，＜＜32表示左移32个比特位，|表示按位或运算。
如权利要求10所述的方法，在所述客户端发起小文件的读请求之后，所述方法还包括：

检测所述客户端的缓存中是否存在所述小文件；

若所述客户端的缓存中存在所述小文件，则获取所述小文件；以及

若所述客户端的缓存中未存在所述小文件，则从元数据服务器获取所述小文件的全局唯一编号和存储区域唯一编号。
如权利要求10所述的方法，其中，所述根据所述聚合位置从所述对象存储设备OSD中获取所述小文件包括：

向所述对象存储设备OSD发送读聚合请求；

接收所述对象存储设备OSD发送的所述聚合位置中所有的小文件并保存；以及

获取所述存储区域唯一编号的绝对值对应区域中的小文件。
一种客户端，包括：

读请求模块，设置为发起小文件的读请求；

编号获取模块，设置为从元数据服务器获取所述小文件的全局唯一编号和存储区域唯一编号；

计算模块，设置为根据所述全局唯一编号和所述存储区域唯一编号计算所述小文件在对象存储设备OSD中的聚合位置；以及

小文件获取模块，设置为根据所述聚合位置从所述对象存储设备OSD中获取所述小文件。
如权利要求14所述的客户端，其中，所述全局唯一编号为索引节点编号ino，存储区域唯一编号为对象编号ono，所述聚合位置的计算公式为：聚合位置＝((ino+ono+1)＜＜32)|1，其中，＜＜32表示左移32个比特位，|表示按位或运算。
如权利要求14所述的客户端，所述客户端还包括：

检测模块，设置为检测所述客户端的缓存中是否存在所述小文件；

所述小文件获取模块，还设置为若所述客户端的缓存中存在所述小文件，则获取所述小文件；以及

所述编号获取模块，还设置为若所述客户端的缓存中未存在所述小文件，则从元数据服务器获取所述小文件的全局唯一编号和存储区域唯一编号。
如权利要求14所述的客户端，其中，所述小文件获取模块包括：

发送单元，设置为向所述对象存储设备OSD发送读聚合请求；

接收单元，设置为接收所述对象存储设备OSD发送的所述聚合位置中所有的小文件并保存；以及

获取单元，设置为获取所述存储区域唯一编号的绝对值对应区域中的小文件。
一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为执行权利要求1-5和10-13中任一项的方法。