WO2014166446A1

WO2014166446A1 - 文件访问处理方法、系统及计算机存储介质

Info

Publication number: WO2014166446A1
Application number: PCT/CN2014/076906
Authority: WO
Inventors: 邹同亮; 缪敬
Original assignee: 中兴通讯股份有限公司
Priority date: 2013-07-10
Filing date: 2014-05-06
Publication date: 2014-10-16
Also published as: CN104281414A; CN104281414B

Abstract

一种文件访问处理方法、系统及计算机存储介质；所述方法包括：定义文件访问预处理接口；当接收到文件访问指令时，根据所述文件访问指令的类型调用对应的文件访问预处理接口，以获取文件访问的预处理信息；通过调用与所述文件访问预处理接口对应的标准文件访问处理接口，并根据所述预处理信息进行访问处理。

Description

文件访问处理方法、系统及计算机存储介质技术领域

本发明涉及计算机存储技术，尤其涉及一种文件访问处理方法、系统及计算机存储介质。背景技术

目前互连网中信息产生的速度日益提高，特别是近年移动互连网的飞速发展，智能手机的广泛应用，每天都在产生海量的图片、短信、微信等小文件，因此对海量小文件的快速存取、分析有着重要的现实意义，一方面方便用户保存信息和分享，另一方面可以帮助网络运营公司、手机制造商吸引客户，从中提取有用信息，实现增值服务。

对于海量的文件存储，利用目前的磁盘阵列技术实现不但成本高昂，在规模、性能上无法实现动态的线性扩容。目前，能动态扩容、按需分配存储资源的分布式文件系统应运而生，技术实现上主要分为对称式和非对称式。前者使用一致性哈希等技术，让存储系统中的每个节点都能存储文件和元数据（主要是文件在节点的分布信息），一个节点的宕机不会影响对某个文件的访问。非对称式分布文件系统有专门的元数据服务器，逻辑结构简单，便于管理，特别是对同一目录下文件的访问更为高效，为目前分布式文件系统主流方式，著名的开源分布式文件系统包括 Hadoop分布式文件系统（ HDFS， Hadoop Distributed File System )、 lustre等。

目前开源的分布式文件系统难以能满足对海量小文件访问的性能需求，由于分布式文件系统为确保数据一致性、数据位置信息分配，在一次访问中往往需要服务器内部节点间和服务器与客户端间进行多次交互，中间还会导致一些对磁盘的随机访问，这样使得小文件的访问性能低于本地访问小文件的性能，相关技术通常釆用合并、緩存、预取来减少节点间、服务器和客户端的交互，变随机访问为顺序访问，减少访问磁盘的访问次数，从而提升性能。其中比较典型的方案有：

方案 1， Hadoo 归档 ( HAR, Hadoop Archives )

将小文件打包成一个大文件进行存储，打包后的文件由索引和存储两大部分组成，索引部分记录了原有的目录结构和文件状态；该方案缺点在于一旦创建大文件就不能修改，也不支持对大文件进行追加操作，要做增加和爹改文件必须对小文件重新打包。

方案 2， Hadoo 序列文件 ( Sequeues File )

Sequence file由一系列的二进制 key/value组成，如果 key为小文件名， value 则为文件内容，该方案支持将批量小文件合并成一个大文件。提供 Writer, Reader和 Sequence File Sorter类以支持对大文件中的小文件进行写、读和排序操作；该方案支持对大文件中的小文件的进行存取操作，且不限制进行存取操作的用户数量、以及存取文件的数量，支持对大文件追加 ( Append )写入小文件，支持对大文件进行三级文档压缩（包括：不压缩、文件级、块级别）。

该方案缺点在于需要在分布式文件系统内部实现，需要专用的应用程序编程接口（ API, Application Programming Interface )来提供访问支持，并且需要上层应用改动，无法应用于其它分布式文件系统。

相关技术中，小文件优化都和分布式文件系统紧密相关，通常直接在分布式文件系统上进行改造，改动复杂，随着分布式文件系统的更新，需要做相应的改动，工作量大；

且在一种分布式文件系统优化的方案无法直接应用于为其它类型的分布式文件系统。而且，由于为了将小文件访问和一般的文件访问进行区分，还需要专用的 API支持，这会导致已有的 API无法使用，或者要对已有的 API进行修改后，工作量大，实施成本高。发明内容

本发明实施例提供一种文件访问处理方法、系统及计算机存储介质，能够提升分布式文件系统文件访问的响应性能。

本发明实施例的技术方案是这样实现的：

本发明实施例提供一种文件访问处理方法，包括：

定义文件访问预处理接口；

当接收到文件访问指令时，根据所述文件访问指令的类型调用对应的文件访问预处理接口，以获取文件访问的预处理信息；

通过调用与所述文件访问预处理接口对应的标准文件访问处理接口，并根据所述预处理信息进行访问处理。

其中，相应地，当文件访问指令的类型为创建小文件时，所述根据该文件访问指令的类型调用对应的文件访问预处理接口，以获取文件访问预处理信息，包括：

通过调用与所述文件访问预处理接口对应的标准文件访问处理接口，在大文件中建立存放所述 ' j、文件的布局信息；

创建所述小文件，并根据所述布局信息将所述小文件合并到所述大文件，将所得到的与所述小文件合并后的大文件，作为所述预处理信息。

其中，所述文件访问预处理接口包括：创建小文件的预处理接口；所述在所述大文件中建立存放所述小文件的布局信息之前，所述方法还包括：通过调用所述创建小文件的预处理接口，判断是否需要将创建的小文件合并到所述大文件以进行优化，如果需要，则执行所述建立布局信息的操作；否则，通过调用所述文件访问预处理接口对应的标准文件访问处理接口，创建小文件。

其中，在所述大文件中建立存放所述小文件的布局信息之前，所述方法还包括：

判断所述大文件是否存在；

在所述大文件不存在时创建所述大文件。

其中，所述在所述大文件中建立存放小文件的布局信息，包括：利用所述创建小文件的预处理接口将所述大文件等分为块；

建立在所述大文件中存放所述小文件的布局信息，所述布局信息包括：全局描述信息、索引节点表、索引节点描述表以及块描述表。

其中，所述根据所述布局信息将小文件合并到所述大文件，包括：根据所述布局信息为所述小文件分配目录项，所述目录项包括文件名和索引节点；

根据为所述小文件分配的目录项，将所述小文件合并到所述大文件。其中，所述判断是否需要将创建的小文件合并到大文件以进行优化，包括：

根据需要创建的小文件所在的目录或者小文件的大小，判断是否需要将所创建的小文件合并到所述大文件以进行优化。

其中，所述文件访问预处理接口包括：读写小文件的预处理接口；相应地，当所述文件访问指令的类型为读写小文件时，所述根据该文件访问指令类型调用对应的文件预处理接口获取文件访问的预处理信息，包括：

通过调用所述读写小文件的预处理接口，查找所述小文件对应的目录项，根据在所述目录项中查找到的索引节点查找所述小文件在所述大文件中所对应的块，获取所查找到块的块信息，将所获取的块信息作为所述预处理信息。

其中，所述调用与所述文件访问预处理接口对应的标准文件访问处理接口，并根据所述预处理信息进行访问处理，包括：通过调用与所述文件预处理接口对应的标准文件访问处理接口，并根据所获取的块信息，对所查找到的块中的小文件进行读写。

其中，所述查找所述小文件对应的目录项之前，所述方法还包括：通过调用所述读写小文件的预处理接口，判断需要读写的小文件是否为优化的文件，如果是，则执行查找所述小文件对应的目录项的操作；否则，调用与所述文件预处理接口对应的标准文件访问处理接口进行访问处理。

本发明实施例还提供一种分布式文件系统，包括：接口定义模块、预处理模块和处理模块；

所述接口定义模块，配置为定义文件访问预处理接口；

所述预处理模块，配置为当接收到文件访问指令时，根据所述文件访问指令的类型调用对应的文件访问预处理接口，以获取文件访问的预处理信息；

所述处理模块，配置为调用与所述文件预处理接口对应的标准文件访问处理接口，并根据所述预处理信息进行访问处理。

其中，所述文件访问预处理接口包括：创建小文件的预处理接口；所述预处理模块包括：合并单元和布局信息建立单元；

所述布局信息建立单元，配置为当接收到文件访问指令的类型为创建小文件时，通过调用与所述文件访问预处理接口对应的标准文件访问处理接口，在所述大文件中建立存放小文件的布局信息；

所述合并单元，配置为创建小文件，并根据所述布局信息将所述小文件合并到所述大文件，将所得到的与所述小文件合并后的大文件，作为所述预处理信息。

其中，所述文件访问预处理接口包括：创建小文件的预处理接口；所述预处理模块还包括：第一优化判断单元，配置为在通过调用所述创建小文件的预处理接口，判断是否需要将创建的小文件合并到所述大文件以进行优化，如果需要，则触发所述布局信息建立单元建立布局信息；否则，触发所述处理模块通过调用所述文件访问预处理接口对应的标准文件访问处理接口，创建小文件。

其中，所述系统还包括：大文件判断模块和大文件创建模块；所述大文件判断模块，配置为判断所述大文件是否存在；如果存在，则触发所述大文件创建模块创建所述大文件；否则，触发所述布局信息建立单元建立布局信息。

其中，所述布局信息建立单元，还配置为利用所述创建小文件的预处理接口将所述大文件等分为块；建立在所述大文件中存放所述小文件的布局信息；

所述布局信息包括：全局描述信息、索引节点表、索引节点描述表以及块描述表。

其中，所述合并单元，还配置为根据所述布局信息为所述小文件分配目录项，所述目录项包括文件名和索引节点；根据为所述小文件分配的目录项，将所述小文件合并到所述大文件。

其中，所述第一优化判断单元，还配置为根据需要创建的小文件所在的目录或者小文件的大小，判断是否需要将所创建的小文件合并到所述大文件以进行优化。

其中，所述文件访问预处理接口包括：读写小文件的预处理接口；所述预处理模块还包括：

第一查找处理单元，配置为接收到的文件访问指令的类型为读写小文件时，通过调用所述读写小文件的预处理接口，查找所述小文件对应的目录项；第二查找处理单元，配置为根据在所述目录项中查找到的索引节点查找所述小文件在所述大文件中所对应的块，获取所查找到块的块信息，将所获取的块信息作为所述预处理信息。

其中，所述处理模块，还配置为通过调用与所述文件预处理接口对应的标准文件访问处理接口，并根据所获取的块信息，对所查找到的块中的小文件进行读写。

其中，所述预处理模块还包括：

第二优化判断单元，配置为通过调用所述读写小文件的预处理接口，判断需要读写的小文件是否为优化的文件，如果是，则触发所述第一查找处理单元执行查找所述小文件对应的目录项的操作；否则，触发所述处理模块调用与所述文件预处理接口对应的标准文件访问处理接口进行访问处理。

本发明实施例还提供一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行以上所述的文件访问处理方法。

本发明实施例中，在文件访问处理之前进行预处理，然后通过调用标准文件访问接口根据预处理的信息进行访问处理，通过自定义的预处理接口替代标准接口，以自定义的预处理接口实现功能，无需对已有分布式文件系统中标准接口作任何改造即可实现对文件访问的处理；实施容易，也更为通用，能显著提升小文件访问的处理性能。附图说明

图 1为本发明实施例记载的文件访问处理方法的实现流程图一；图 2为本发明实施例记载的文件访问处理方法的实现流程图二；图 3为本发明实施例记载的文件访问处理方法的实现流程图三；图 4为本发明实施例记载的分布式文件系统的结构示意图一；图 5为本发明实施例记载的分布式文件系统中预处理模块 42的结构示意图一；

图 6为本发明实施例记载的分布式文件系统中预处理模块 42的结构示意图二；

图 7为本发明实施例记载的分布式文件系统的结构示意图二；图 8为本发明实施例记载的分布式文件系统中预处理模块 42的结构示意图三；

图 9为本发明实施例记载的分布式文件系统中预处理模块 42的结构示意图四。具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。

本发明实施例记载了一种文件访问处理方法，如图 1 所示，包括以下步骤：

步骤 101 : 定义文件访问预处理接口。

步骤 102: 当接收到文件访问指令时，通过调用与所述文件访问指令的类型对应的文件访问预处理接口，获取文件访问预处理信息。

步骤 103:通过调用与所述文件访问预处理接口对应的标准文件访问处理接口，并根据所述预处理信息进行访问处理，即响应文件访问指令。

本发明实施例中利用自定义的文件访问预处理接口，对文件访问进行预处理，从而不需要对上层访问接口进行改动，就能实现小文件优化或者其他文件访问的处理，实施本发明实施例的技术方案，不需要对已有分布式文件系统作任何改动，与已有的在分布式文件系统层面修改的方法比较有更强的可实现性、通用性。

本发明实施例记载的访问指令的类型主要包括：创建小文件、打开小文件、读写小文件以及删除小文文件。针对访问指令的类型，本发明实施例中记载的文件访问预处理接口可以包括：创建小文件的预处理接口、打开小文件的预处理接口、读写小文件的预处理接口以及删除小文件的预处理接口。

如图 2所示，当接收到访问指令的类型为创建小文件时，文件访问处理包括以下步骤：

步骤 201 : 通过调用创建小文件的预处理接口，判断是否需要将创建的小文件合并到大文件，即对小文件进行优化，如果需要，则执行步骤 202; 否则，执行步骤 206。

步骤 202: 检测所述大文件是否存在，如果存在，则执行步骤 204; 否则，执行步骤 203。

步骤 203: 创建所述大文件。

步骤 204: 在所述大文件中建立存放小文件的布局信息，创建小文件，并根据所述布局信息将所创建的小文件合并到所述大文件。

合并小文件后的大文件作为文件访问的预处理信息，供后续进行访问处理。

步骤 205：通过调用与所述文件预处理接口对应的标准文件访问处理接口，并根据所述预处理信息进行访问处理，流程结束。

所述预处理信息包括：合并所述小文件后的所述大文件的信息。

步骤 206:通过调用所述文件访问预处理接口对应的标准文件访问处理接口创建小文件，流程结束。

本发明实施例中，在已有的标准接口与分布式文件系统之间进行操作，通过预处理接口替换上层访问接口，不需要对已有分布式文件系统作任何改造，因此实施更容易，也更为通用。另外，本发明实施例记载的方案可以针对进程实施，对于不需要使用分布式文件系统的进程、以及不需要合并文件的进程，可以不釆用本发明实施例记载的技术方案，避免引入优化对其它进程性能造成影响。

作为一个实施方式，步骤 201 中判断是否需要将创建的小文件合并到大文件，即进行小文件优化，包括：根据需要创建的小文件所在的目录或者小文件的大小，判断是否需要将创建的小文件合并到大文件进行优化。

作为一个实施方式，步骤 204 中在所述大文件中建立存放小文件的布局信息，包括：

利用所述创建小文件的预处理接口将所述大文件等分为块；

建立在所述大文件中存放小文件的布局信息，所述布局信息包括：全局描述信息、索引节点表、索引节点描述表以及块描述表；其中，

所述全局描述信息（又称为超级块），包括块（即大文件等分后得到的块）的大小、数据块（即存储数据的块）和索引节点的占用情况、根目录位置；

所述索引节点表由一系列大小相同的索引节点组成，每个索引节点描述一个小文件数据所在的块的信息，以及其它文件信息，如创建时间、大小等；

索引节点描述表，用于描述索引节点使用情况；

块描述表，用于描述块的使用情况；

相应地，步骤 204 中根据所述布局信息将小文件合并到所述大文件，包括：

根据所述布局信息为所述小文件分配目录项，所述目录项包括文件名和索引节点；

根据所分配的目录项将所述小文件合并到所述大文件。

本发明实施例中所记载的目录也视为文件或目录文件，目录中的内容为目录项，实际应用中，可以将目录项的长度进行拓展，以保存文件名、索引节点、索引节点类型（如文件还是目录）。为了加快访问在文件创建时会根据釆用算法放置目录项，常用的算法有 B+树、 hash表、 hash树等。在为小文件分配目录项、索引节点时，可以优先为小文件分配距离小文件父目录所在的存储位置最近的目录项、索引节点，以提高预读取命中率。另外还可以緩存部分目录项、索引节点、文件数据，并定期老化，以减少磁盘访问。

作为一个实施方式，如图 3 所示，当接收到的访问指令类型为读写小文件时，小文件访问处理包括以下步骤：

步骤 301 : 通过调用读写小文件的预处理接口，判断需要读写的小文件是否为优化的文件（即是否与大文件进行了合并），如果是，则执行步骤 302; 否则，执行步骤 304。

步骤 302: 查找所述小文件所在块的块信息。

通过调用所述读写小文件的预处理接口，查找所述小文件对应的目录项，根据在所述目录项中查找到的索引节点，查找所述小文件在大文件中所对应的块，获取所查找到块的块信息，即文件访问的预处理信息。

步骤 303：通过调用与所述文件预处理接口对应的标准文件访问处理接口，并根据所查找到的块信息，对所查找到的块中的小文件进行读写。

步骤 304:直接调用与所述文件预处理接口对应的标准文件访问处理接口进行访问处理。

当所接收到访问指令的类型为打开优化小文件时，可以通过超级块找到根目录的目录文件，再从目录文件中逐级找下级目录，最终找到小文件或小文件所在目录。为小文件分配句柄，建立句柄和索引节点的关系，并緩存文件访问的相关信息，比如文件当前读写位置。

作为一个实施方式，当所接收到访问指令的访问类型为删除优化小文件时，首先找到文件对应的目录项，进而找到索引节点，释放索引节点内记录的块，更新块描述表；释放索引节点，更新索引节点表，再到目录项文件中删除该优化小文件对应的目录项。

以上处理中还涉及到小文件句柄的管理，文件句柄是应用程序操作文件手段，句柄需要区分与非优化访问的句柄，这样当应用操作时才能决定走正常访问流程还是优化的访问流程。

本实施例中定义的文件操作接口包括 create, close, write, read, unlink, sync, fstat等 API。

下面以 linux环境下对可移植操作系统接口（POSIX, Portable Operating System Interface )进行替换为例，对本发明实施例记载的技术方案进行说明。

在小文件优化中定义的 POSIX文件操作接口，主要包括 create, close, write, read, unlink, sync, fstat等 API, 把上述接口编译成小文件优化动态库，当进程启动时，先于标准的 POSIX文件操作接口所在动态库 libc加载小文件优化动态库，这样当进程要访问文件时就会调用小文件优化动态库中的上述 API。在运行进程运行前还要完成初始化，以准备为小文件访问进行优化，初始化包括：获得上述 API在 libc中的函数指针，以便在优化动态库中使用；获得当前系统中文件描述符（FD， File Descriptor ) 的最大值，小文件优化模块生成的 FD大于系统 FD最大值，以区别于常规文件访问；读取配置信息到内存，配置信息包括判断小文件优化的规则，以及其它一些参数，包括大文件的创建是新建还是拷贝、大文件是否动态增长、緩存大小、延迟写入时间和大小等。

对于 create这样的创建文件操作，当进程访问文件时首先调用小文件优化动态库中的 POSIX接口；然后判断是否需要优化，如果不需要优化，则调用 libc中相应标准接口处理后返回，如果需要优化进入以下处理流程：根据文件所在目录、文件大小等规则来判断是否需要将小文件合并到大文件，以及合并的大文件的路径；如果要合并入的大文件不存在，需要动态创建，一般选取从一个模板文件拷贝布局信息，加快大文件的建立速度，建立后还需要为大文件分配相应空间，分配空间的过程可以和为小文件索引节点等信息过程同步进行。 create操作首先要为文件分配目录项，为快速查找需要按一定规则存放；还要为小文件分配 FD，并建立以 FD为索引 fd和索引节点关系、文件读写位置等信息等。完成后为上层应用返回 FD，应用就可以用 FD来进行各种和常规 POSIX—样的文件操作。

对于其它如 write、 read等操作，由于文件（小文件或大文件）已经打开，会有 FD从应用层传递到 Linux内核，因此可以根据 FD判定小文件是否为访问优化的文件，进而获得小文件对应的大文件，以及小文件的索引节点信息、读写位置等相关信息。根据索引节点信息可以获得文件内容位置信息，再根据当前读写位置信息完成读写操作。

利用上述小文件访问处理方法不但可以提高分布式文件系统小文件访问速度，且所有实现都不涉及操作系统内核，也不涉及分布式文件系统的实现机制，可以有效降低开发难度，并具有很好的通用性。

本发明实施例还记载了一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于图 1至图 3任一附图所示的文件访问处理方法。

本发明实施例还记载了一种分布式文件系统，如图 4所示，包括：接口定义模块 41、预处理模块 42和处理模块 43;

所述接口定义模块 41，配置为定义文件访问预处理接口；

所述预处理模块 42，配置为当接收到文件访问指令时，根据所述文件访问指令的类型调用对应的文件访问预处理接口，以获取文件访问的预处理信息；

所述处理模块 43，配置为调用与所述文件预处理接口对应的标准文件访问处理接口，并根据所述预处理信息进行访问处理。

其中，所述文件访问预处理接口包括：创建小文件的预处理接口；作为一个实施方式，如图 5所示，所述预处理模块 42包括：合并单元 421和布局信息建立单元 422;

所述布局信息建立单元 422，配置为当接收到文件访问指令的类型为创建小文件时，通过调用与所述文件访问预处理接口对应的标准文件访问处理接口，在所述大文件中建立存放小文件的布局信息；

所述合并单元 421，配置为创建小文件，并根据所述布局信息将所述小文件合并到所述大文件，将所得到的与所述小文件合并后的大文件，作为所述预处理信息。

作为一个实施方式，所述文件访问预处理接口包括：创建小文件的预处理接口；

如图 6所示，在图 5所示预处理模块 42的基础上，所述预处理模块 42 还包括：

第一优化判断单元 423，配置为在通过调用所述创建小文件的预处理接口，判断是否需要将创建的小文件合并到所述大文件以进行优化，如果需要，则触发所述布局信息建立单元 422建立布局信息；否则，触发所述处理模块 43 通过调用所述文件访问预处理接口对应的标准文件访问处理接口，创建小文件。

作为一个实施方式，如图 7所示，在图 4所示分布式文件系统的基础上，所述系统还包括：大文件判断模块 44和大文件创建模块 45;

所述大文件判断模块 44，配置为判断所述大文件是否存在；如果存在，则触发所述大文件创建模块 45创建所述大文件；否则，触发所述布局信息建立单元 422建立布局信息。

作为一个实施方式，所述布局信息建立单元 422，还配置为利用所述创建小文件的预处理接口将所述大文件等分为块；建立在所述大文件中存放所述小文件的布局信息；所述布局信息包括：全局描述信息、索引节点表、索引节点描述表以及块描述表。

作为一个实施方式，所述合并单元 421，还配置为根据所述布局信息为所述小文件分配目录项，所述目录项包括文件名和索引节点；根据为所述小文件分配的目录项，将所述小文件合并到所述大文件。

作为一个实施方式，所述第一优化判断单元 423，还配置为根据需要创建的小文件所在的目录或者小文件的大小，判断是否需要将所创建的小文件合并到所述大文件以进行优化。

作为一个实施方式，所述文件访问预处理接口包括：读写小文件的预处理接口；如图 8所示，所述预处理模块 42包括：

第一查找处理单元 424，配置为在接收到的文件访问指令的类型为读写小文件时，通过调用所述读写小文件的预处理接口，查找所述小文件对应的目录项；

第二查找处理单元 425，配置为根据在所述目录项中查找到的索引节点查找所述小文件在所述大文件中所对应的块，获取所查找到块的块信息，将所获取的块信息作为所述预处理信息。

作为一个实施方式，所述处理模块 43，还配置为通过调用与所述文件预处理接口对应的标准文件访问处理接口，并根据所获取的块信息，对所查找到的块中的小文件进行读写。

作为一个实施方式，如图 9所示，在图 8所示的预处理模块 42的基础上，所述预处理模块 42还包括：

第二优化判断单元 426，配置为通过调用所述读写小文件的预处理接口，判断需要读写的小文件是否为优化的文件，如果是，则触发所述第一查找处理单元 424执行查找所述小文件对应的目录项的操作；否则，触发所述处理模块 43调用与所述文件预处理接口对应的标准文件访问处理接口进行访问处理。

本发明实施例还记载一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行图 1至图 3任一附图所示的文件访问处理方法。

实际应用中，所述分布式文件系统设置于多个服务器上，所述接口定义模块 41、预处理模块 42和处理模块 43可由服务器中的中央处理器（ CPU, Central Processing Unit )、数字信号处理器（DSP， Digital Signal Processor ) 或现场可编程门阵列（FPGA， Field Programmable Gate Array ) 实现。

本实施例的系统详细的工作过程可以参考上述图 1至图 3 中关于文件访问处理方法的描述。

本发明实施例中，不但可以提高分布式文件系统小文件访问速度，且所有实现都不涉及操作系统内核，不涉及分布式文件系统的实现机制，可以有效降低开发难度，并具有很好的通用性。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可釆用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可釆用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质 (包括但不限于磁盘存储器和光学存储器等 )上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备（系统）、和计算机程序产品的流程图和 /或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和 /或方框、以及流程图和 /或方框图中的流程和 /或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生配置为实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供配置为实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。工业实用性本发明实施例中，当接收到文件访问指令时，根据该文件访问指令的类型调用对应的文件访问预处理接口获取文件访问预处理信息；调用与所述文件预处理接口对应的标准文件访问处理接口根据所述预处理信息进行访问处理；能够提升分布式文件系统小文件访问的响应性能。

Claims

权利要求书

1、一种文件访问处理方法，包括：

定义文件访问预处理接口；

2、如权利要求 1所述的文件访问处理方法，其中，当文件访问指令的类型为创建小文件时，所述根据该文件访问指令的类型调用对应的文件访问预处理接口，以获取文件访问预处理信息，包括：

3、如权利要求 2所述的文件访问处理方法，其中，所述文件访问预处理接口包括：创建小文件的预处理接口；

相应地，所述在所述大文件中建立存放所述小文件的布局信息之前，所述方法还包括：

通过调用所述创建小文件的预处理接口，判断是否需要将创建的小文件合并到所述大文件以进行优化，如果需要，则执行所述建立布局信息的操作；否则，通过调用所述文件访问预处理接口对应的标准文件访问处理接口，创建小文件。

4、如权利要求 2所述的文件访问处理方法，其中，在所述大文件中建立存放所述小文件的布局信息之前，所述方法还包括：

判断所述大文件是否存在；在所述大文件不存在时创建所述大文件。

5、如权利要求 3所述的文件访问处理方法，其中，所述在所述大文件中建立存放小文件的布局信息，包括：

利用所述创建小文件的预处理接口将所述大文件等分为块；

6、如权利要求 2至 5任一项所述的文件访问处理方法，其中，所述根据所述布局信息将小文件合并到所述大文件，包括：

根据为所述小文件分配的目录项，将所述小文件合并到所述大文件。

7、如权利要求 3所述的文件访问处理方法，其中，所述判断是否需要将创建的小文件合并到大文件以进行优化，包括：

8、如权利要求 1所述的文件访问处理方法，其中，所述文件访问预处理接口包括：读写小文件的预处理接口；

相应地，当所述文件访问指令的类型为读写小文件时，所述根据该文件访问指令类型调用对应的文件预处理接口获取文件访问的预处理信息，包括：

9、如权利要求 8所述的文件访问处理方法，其中，所述调用与所述文件访问预处理接口对应的标准文件访问处理接口，并根据所述预处理信息进行访问处理，包括：

通过调用与所述文件预处理接口对应的标准文件访问处理接口，并根据所获取的块信息，对所查找到的块中的小文件进行读写。

10、如权利要求 8或 9所述的文件访问处理方法，其中，所述查找所述小文件对应的目录项之前，所述方法还包括：

通过调用所述读写小文件的预处理接口，判断需要读写的小文件是否为优化的文件，如果是，则执行查找所述小文件对应的目录项的操作；否则，调用与所述文件预处理接口对应的标准文件访问处理接口进行访问处理。

11、一种分布式文件系统，包括：接口定义模块、预处理模块和处理模块；

所述接口定义模块，配置为定义文件访问预处理接口；

12、如权利要求 11所述的分布式文件系统，其中，所述预处理模块包括：合并单元和布局信息建立单元；

13、如权利要求 12所述的分布式文件系统，其中，所述文件访问预处理接口包括：创建小文件的预处理接口；

所述预处理模块还包括：

第一优化判断单元，配置为在通过调用所述创建小文件的预处理接口，判断是否需要将创建的小文件合并到所述大文件以进行优化，如果需要，则触发所述布局信息建立单元建立布局信息；否则，触发所述处理模块通过调用所述文件访问预处理接口对应的标准文件访问处理接口，创建小文件。

14、如权利要求 12所述的分布式文件系统，其中，所述系统还包括：大文件判断模块和大文件创建模块；

所述大文件判断模块，配置为判断所述大文件是否存在；如果存在，则触发所述大文件创建模块创建所述大文件；否则，触发所述布局信息建立单元建立布局信息。

15、如权利要求 13所述的分布式文件系统，其中，

所述布局信息建立单元，还配置为利用所述创建小文件的预处理接口将所述大文件等分为块；建立在所述大文件中存放所述小文件的布局信息；所述布局信息包括：全局描述信息、索引节点表、索引节点描述表以及块描述表。

16、如权利要求 12至 15任一项所述的分布式文件系统，其中，所述合并单元，还配置为根据所述布局信息为所述小文件分配目录项，所述目录项包括文件名和索引节点；根据为所述小文件分配的目录项，将所述小文件合并到所述大文件。

17、如权利要求 13所述的分布式文件系统，其中，

所述第一优化判断单元，还配置为根据需要创建的小文件所在的目录或者小文件的大小，判断是否需要将所创建的小文件合并到所述大文件以进行优化。

18、如权利要求 11所述的分布式文件系统，其中，所述文件访问预处理接口包括：读写小文件的预处理接口；

所述预处理模块还包括：

第一查找处理单元，配置为接收到的文件访问指令的类型为读写小文件时，通过调用所述读写小文件的预处理接口，查找所述小文件对应的目录项；

第二查找处理单元，配置为根据在所述目录项中查找到的索引节点查找所述小文件在所述大文件中所对应的块，获取所查找到块的块信息，将所获取的块信息作为所述预处理信息。

19、如权利要求 18所述的分布式文件系统，其中，

所述处理模块，还配置为通过调用与所述文件预处理接口对应的标准文件访问处理接口，并根据所获取的块信息，对所查找到的块中的小文件进行读写。

20、如权利要求 18或 19所述的分布式文件系统，其中，所述预处理模块还包括：

21、一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求 1至 10任一项所述的文件访问处理方法。