CN103136294B

CN103136294B - 文件操作方法及装置

Info

Publication number: CN103136294B
Application number: CN201110399908.0A
Authority: CN
Inventors: 褚大鹏
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2011-12-05
Filing date: 2011-12-05
Publication date: 2017-04-12
Anticipated expiration: 2031-12-05
Also published as: CN103136294A

Abstract

本申请提供了一种文件操作方法及装置，其中，文件操作方法包括：获取分布式文件系统的文件操作指令，分布式文件系统中至少一个服务器的根目录下设置有至少两级子目录，第一级子目录包括至少一个业务子目录，第二级子目录包括至少一个用户根目录，一个业务子目录对应于一个业务，一个用户根目录对应于一个用户，一个业务子目录和一个用户根目录在其所在的服务器上的名称和级别固定，一个用户根目录的数据完整地设置于一个服务器上；根据文件操作指令，使用业务子目录的名称和用户根目录的名称查找目标文件夹；对查找到的目标文件夹下的文件执行文件操作指令指定的文件操作。通过本申请，简化了元数据集群设计。

Description

文件操作方法及装置

技术领域

本申请涉及网络技术领域，特别是涉及一种分布式文件系统的文件操作方法及装置。

背景技术

分布式文件系统是指文件系统管理的物理存储资源不一定直接连接在本地节点上，而是通过计算机网络与其他节点相连。分布式文件系统的设计基于客户机/服务器模式，一个典型的网络可能包括多个供用户访问的服务器。

在分布式文件系统中，文件(和目录)的数量极其庞大，尤其是对于海量小文件的分布式文件系统，文件和目录的数量更为巨大。以TFS(Taobao File System，淘宝文件系统)为例，TFS用于存储淘宝网主站的数据，例如商品图片、商品描述、交易快照、社区图片等等，这些数据的一个突出特点是单个文件尺寸较小，通常不大于1MB，但是数量巨大。对于当前的这些分布式文件系统，一般都要在一个集群内支撑众多的业务，而每个业务又要服务上亿的客户，因而使得系统内的文件(和目录)的数目极其庞大，必须采用分布式集群来提供对元数据的存储以及查询和修改等操作。但是，当元数据放入集群后，对文件的操作，如把一个目录(或文件)移动到另一个目录的操作，可能要在两台服务器上才能完成。然而，元数据的特性要求高可靠性、高可用性、高一致性，这种跨服务器的一致性和原子性给元数据集群的设计带来极大挑战。

现有的可以支持海量文件的元数据集群，为了能够做到高可靠性、高可用性、高一致性，要么采用价格高昂的大内存、大处理能力的服务器，要么采用复杂的分布式协议，或者干脆在一定程度上牺牲掉一致性，但即使这样，元数据集群的设计也十分复杂，开发维护成本极高。

总之，需要本领域技术人员迫切解决的一个技术问题就是：如何能够在满足业务需求的情况下，降低元数据集群的设计复杂度和实现成本。

发明内容

本申请所要解决的技术问题是提供一种分布式文件系统的文件操作方法及装置，能够在满足业务需求的情况下，降低元数据集群的设计复杂度和实现成本。

为了解决上述问题，本申请公开了一种文件操作方法，包括：获取分布式文件系统的文件操作指令，所述分布式文件系统中至少一个服务器的根目录下设置有至少两级子目录，其中，第一级子目录包括至少一个业务子目录，第二级子目录包括至少一个用户根目录，一个所述业务子目录对应于一个业务，一个所述用户根目录对应于一个用户，一个所述业务子目录和一个所述用户根目录在其所在的服务器上的名称和级别固定，并且，一个所述用户根目录的数据完整地设置于一个服务器上；根据所述文件操作指令，使用所述业务子目录的名称和所述用户根目录的名称查找目标文件夹；对查找到的所述目标文件夹下的文件执行所述文件操作指令指定的文件操作。

优选地，所述文件操作指令中包括所述业务子目录的名称和所述用户根目录的名称。

优选地，所述文件操作指令通过以下方式获取：根据所述文件操作指令中的所述业务子目录的名称和所述用户根目录的名称，使用一致性哈希算法，确定所述业务子目录的名称和所述用户根目录的名称所在的服务器，并将所述文件操作指令发送给所述服务器；所述服务器接收并获取所述文件操作指令。

优选地，当所述文件操作指令指定对文件进行移动时，该文件在其所在的用户根目录范围内移动。

优选地，当所述文件操作指令指定对文件进行修改时，该文件所在的服务器先对存储器中的该文件进行修改，然后在缓存中对该文件进行相同的修改，或者删除该文件在所述缓存中的数据。

为了解决上述问题，本申请还公开了一种文件操作装置，包括：获取模块，用于获取分布式文件系统的文件操作指令，所述分布式文件系统中至少一个服务器的根目录下设置有至少两级子目录，其中，第一级子目录包括至少一个业务子目录，第二级子目录包括至少一个用户根目录，一个所述业务子目录对应于一个业务，一个所述用户根目录对应于一个用户，一个所述业务子目录和一个所述用户根目录在其所在的服务器上的名称和级别固定，并且，一个所述用户根目录的数据完整地设置于一个服务器上；查找模块，用于根据所述文件操作指令，使用所述业务子目录的名称和所述用户根目录的名称查找目标文件夹；操作模块，用于对查找到的所述目标文件夹下的文件执行所述文件操作指令指定的文件操作。

优选地，所述获取模块通过以下方式获取文件操作指令：客户端或所述分布式文件系统根据所述文件操作指令中的所述业务子目录的名称和所述用户根目录的名称，使用一致性哈希算法，确定所述业务子目录的名称和所述用户根目录的名称所在的服务器，并将所述文件操作指令发送给所述服务器；所述服务器的所述获取模块接收并获取所述文件操作指令。

优选地，当所述文件操作指令指定对文件进行修改时，该文件所在的服务器的所述操作模块先对所述服务器的存储器中的该文件进行修改，然后在所述服务器的缓存中对该文件进行相同的修改，或者删除该文件在所述缓存中的数据。

与现有技术相比，本申请具有以下优点：

本申请在对业务行为进行了充分分析的基础上，在分布式文件系统，尤其是在海量小文件的分布式文件系统的服务器中建立固定的两级目录，且使每一个用户根目录的数据都完整地设置于一个服务器上，实现了采用固定目录前辍对分布式文件系统的文件操作，这种只在一定范围内的分布式文件系统的文件操作有效满足了元数据的原子性和一致性需求，使得分布式文件系统既能最大限度的满足业务需求，又简化了元数据集群设计，且实现简单，有效降低了元数据集群设计的实现成本。

附图说明

图1是根据本申请实施例一的一种文件操作方法的步骤流程图；

图2是根据本申请实施例二的一种文件操作方法的步骤流程图；

图3是图2所示实施例中的一种文件系统目录的示意图；

图4是根据本申请实施例三的一种文件操作方法的步骤流程图；

图5是根据本申请实施例四的一种文件操作装置的结构框图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

实施例一

参照图1，其示出了根据本申请实施例一的一种文件操作方法的步骤流程图。

本实施例的文件操作方法包括以下步骤：

步骤S102：获取分布式文件系统的文件操作指令。

其中，该分布式文件系统中至少一个服务器的根目录下设置有至少两级子目录，第一级子目录包括至少一个业务子目录，第二级子目录包括至少一个用户根目录，一个业务子目录对应于一个业务，一个用户根目录对应于一个用户，一个业务子目录和一个用户根目录在其所在的服务器上的名称和级别固定，并且，一个用户根目录的数据完整地设置于一个服务器上。

也即，在本申请中，至少有一个分布式文件系统中的服务器上设置有固定的两级子目录。第一级子目录直接设置于服务器的根目录下，为业务目录，其对应于一个业务。第二级子目录设置于第一级子目录下，为一个用户名目录，其对应于一个用户。本申请中，用户使用广义的概念，其有可能是一个实际的用户，如淘宝网上的卖家A，也有可能是一个非实际用户，如根据设定规则拆分出来的业务等等。此外，本申请中，一个用户的所有数据(包括下级子目录和文件)完整地设置于一个服务器上，以避免跨服务器操作和查找。

本实施例中，获取分布式文件系统的文件操作指令的服务器具有上述设置。

步骤S104：根据文件操作指令，使用业务子目录的名称和用户根目录的名称查找目标文件夹。

步骤S106：对查找到的目标文件夹下的文件执行文件操作指令指定的文件操作。

其中，文件操作为本领域技术人员的常规操作，如改名、增加、删除等等。

通过本实施例，在对业务行为进行了充分分析的基础上，在分布式文件系统，尤其是海量小文件的分布式文件系统的服务器中建立固定的两级目录，且使每一个用户根目录的数据都完整地设置于一个服务器上，实现了采用固定目录前辍对分布式文件系统的文件操作，这种只在一定范围内的分布式文件系统的文件操作，有效满足了元数据的原子性和一致性需求，使得分布式文件系统既能最大限度的满足业务需求，又简化了元数据集群设计，且实现简单，有效降低了元数据集群设计的实现成本。

实施例二

参照图2，其示出了根据本申请实施例二的一种文件操作方法的步骤流程图。

本实施例的文件操作方法包括以下步骤：

步骤S202：获得文件操作指令，根据该文件操作指令中的业务子目录的名称和用户根目录的名称，确定文件操作指令的目标服务器。

其中，该文件操作指令中携带有业务子目录的名称和用户根目录的名称。通过在文件操作指令中携带有业务子目录的名称和用户根目录的名称，可以快速、方便地确定该文件操作指令的目标服务器。

确定目标服务器的操作可以在客户端完成，也可以由分布式文件系统完成，当然，不限于此，本领域技术人员还可以根据实际需要灵活设置。当确定目标服务器的操作由分布式文件系统完成时，文件操作指令由客户端发出，可以由分布式文件系统中的任意服务器接收并处理客户端发出的文件操作指令，也可以由分布式文件系统中设置的专用于接收并处理客户端发送的文件操作指令的设备或模块来完成。

文件操作指令的目标服务器也即业务子目录的名称和用户根目录的名称所在的服务器。确定目标服务器的方法可以由本领域技术人员根据实际情况灵活设置。优选地，使用哈希算法。更优选地，使用一致性哈希算法。通过采用一致性哈希算法，可以容易地实现分布式文件系统的扩容。

步骤S204：将该文件操作指令发送给该目标服务器。

步骤S206：目标服务器接收文件操作指令，获取其中的业务子目录的名称和用户根目录的名称。

本实施例中，目标服务器上设置有固定的两级目录，根目录下设置有第一级子目录，即业务目录，第一级子目录下设置有第二级子目录，即用户根目录，用户根目录下为该用户的所有数据(包括其子目录和文件)。

图3示出了本实施例的一种文件系统目录的示意图。如图3所示，系统的根为0级目录，业务层为1级目录，包括业务1、业务2、业务3......业务N，到具体的用户是2级目录，包括用户1根目录、用户2根目录、用户3根目录、......、用户N根目录。每一个用户根目录下为该用户的数据，如用户1根目录下为用户1建立的子目录和文件(如图片、订单等等)。任意一个一级目录即业务层目录或二级目录即用户目录，在其所在的服务器上的名称和级别都是固定的。

步骤S208：目标服务器根据业务子目录的名称和用户根目录的名称查找确定目标文件夹。

以业务子目录的名称为“业务2”，用户根目录的名称为“用户1根目录”为例，则本步骤中，目标服务器能够根据业务子目录的名称和用户根目录的名称快速查找并确定本次文件操作的目标文件夹的位置。

步骤S210：目标服务器对确定的目标文件夹下的文件执行文件操作指令指定的文件操作。

本实施例中，文件操作指令指定的操作为本领域技术人员的常规文件操作，如增加、删除、修改、移动等等。需要说明的是，本申请中，如无特殊说明，文件即可指具体文件，也可以是文件目录。

优选地，当文件操作指令指定对文件进行移动时，该文件在其所在的用户根目录范围内移动。这样，文件或者目录的移动操作是不可以跨2级目录的。通过这种设置，可以方便地把一个2级目录的所有信息放到一台服务器上处理(虽然用户数量是亿级别的，但是一个用户所拥有的文件则比较有限)，从而达到了更新的一致性。

优选地，当文件操作指令指定对文件进行修改时，该文件所在的服务器先对其存储器中的该文件进行修改，然后再在其缓存中对该文件进行相同的修改，或者删除该文件在其缓存中的数据。通过先修改存储器中数据，再修改缓存中数据，实现了数据更新的一致性，避免了脏数据的产生。

本实施例通过对业务的分析，发现其实对于一个海量小文件的分布式系统，不需要在全局范围内支持目录和文件的操作，如移动和改名操作等。也就是说，可以只在一定范围内实现文件操作的原子性和一致性，就能满足系统和用户的需求。由此解决了分布式文件系统在满足业务需求的情况下，降低元数据集群的设计复杂度和实现成本的问题，使得分布式文件系统既能最大限度的满足业务需求，又简化了元数据集群设计，且实现简单，有效降低了元数据集群设计的实现成本。同时，还可以采用一致性哈希的算法解决处理能力的扩容问题。

实施例三

参照图4，其示出了根据本申请实施例三的一种文件操作方法的步骤流程图。

本实施例中，分布式文件系统通过元数据集群(Meta cluster)实现。元数据集群(Meta cluster)的设计分为两个部分，一个是提供目录解析逻辑的元数据服务器(metaserver)，一个是提供存储的元数据存储器(meta store)，也可以为元数据存储服务器。元数据服务器(meta server)把元数据存储器(meta store)的细节屏蔽掉，客户端(client)只与元数据服务器(meta server)交互。另外，本实施例的元数据服务器(meta server)采用图3所示的文件系统目录。

本实施例的文件操作方法包括以下步骤：

步骤S302：客户端(client)根据文件操作指令中的业务名(业务子目录的名称)，用户名(用户根目录的名称)，采用哈希算法得到一个哈希值。

步骤S304：然后，客户端采用一致性哈希的方式，通过查表找到处理该服务的元数据服务器(meta server)，将文件操作指令发给这个元数据服务器(meta server)。

步骤S306：元数据服务器(meta server)先尝试在自己的缓存里完成对指令的解析，如果缓存没有命中，则向后端的存储器请求数据，并放入自己的缓存。

步骤S308：元数据服务器(meta server)执行文件操作指令指定的文件操作，然后应答客户端。

对于修改操作，元数据服务器(meta server)先修改后端的存储器，然后修改自己的缓存信息(或者直接失效掉相关信息)，最后应答客户端。

本实施例中，元数据存储器(meta store)可以采用成熟的数据库来简化设计，在此不再赘述。

通过本实施例，一个业务下一个用户的所有元数据信息一定是在同一台元数据服务器(meta server)上进行处理的，这样在进行操作时，这台元数据服务器(meta server)就可以通过锁机制等来保证原子性和一致性。并且，元数据服务器(meta server)缓存了元数据信息，可以大大提升访问速度。此外，采用一致性哈希算法，系统可以很容易地扩容。

实施例四

参照图5，其示出了根据本申请实施例四的一种文件操作装置的结构框图。

本实施例的文件操作装置包括：

获取模块402，用于获取分布式文件系统的文件操作指令，该分布式文件系统中至少一个服务器的根目录下设置有至少两级子目录，其中，第一级子目录包括至少一个业务子目录，第二级子目录包括至少一个用户根目录，一个业务子目录对应于一个业务，一个用户根目录对应于一个用户，一个业务子目录和一个用户根目录在其所在的服务器上的名称和级别固定，并且，一个用户根目录的数据完整地设置于一个服务器上；

查找模块404，用于根据文件操作指令，使用业务子目录的名称和用户根目录的名称查找目标文件夹；

操作模块406，用于对查找到的目标文件夹下的文件执行文件操作指令指定的文件操作。

优选地，文件操作指令中包括业务子目录的名称和用户根目录的名称。

优选地，获取模块402通过以下方式获取文件操作指令：客户端或分布式文件系统根据文件操作指令中的业务子目录的名称和用户根目录的名称，使用一致性哈希算法，确定业务子目录的名称和用户根目录的名称所在的服务器，并将文件操作指令发送给该服务器；该服务器的获取模块402接收并获取文件操作指令。

优选地，当文件操作指令指定对文件进行移动时，该文件在其所在的用户根目录范围内移动。

优选地，当文件操作指令指定对文件进行修改时，该文件所在的服务器的操作模块先对该服务器的存储器中的该文件进行修改，然后在该服务器的缓存中对该文件进行相同的修改，或者删除该文件在该服务器的缓存中的数据。

本实施例的文件操作装置用于实现前述方法实施例中相应的文件操作方法，并具有相应的方法实施例的有益效果，在此不再赘述。

本申请中，通过业务分析发现，在一个分布式系统承载着多项应用，每项应用要服务于上亿用户的场景下，只要支持在一个特定应用下一个特定用户的名字空间内的文件操作，如rename(改名)和mv(移动)等，并保证这种操作的原子性和一致性就可以满足业务的需求。因此，本申请设置固定两级目录结构，采用固定目录前缀的方式，也就是前两级目录分别是业务名和用户名，对于每个业务用某种逻辑产生的用户，每次对文件的访问必须指定业务名和用户名，mv操作不能跨用户的方式，实现分布式系统的文件操作。由此，本申请的技术方案针对海量小文件的分布式文件系统，在一个特定范围内对目录和文件的操作提供了原子性和一致性，能很好的满足业务需求，同时大大简化了设计和实现。并且，本申请的技术方案还通过一致性哈希算法解决分布式文件系统的扩容问题。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上对本申请所提供的一种分布式文件系统的文件操作方法和装置进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种文件操作方法，其特征在于，包括：

获取分布式文件系统的文件操作指令，所述分布式文件系统中至少一个服务器的根目录下设置有至少两级子目录，其中，第一级子目录包括至少一个业务子目录，第二级子目录包括至少一个用户根目录，一个所述业务子目录对应于一个业务，一个所述用户根目录对应于一个用户，一个所述业务子目录和一个所述用户根目录在其所在的服务器上的名称和级别固定，并且，一个所述用户根目录的所有数据完整地设置于同一个服务器上；

根据所述文件操作指令，使用所述业务子目录的名称和所述用户根目录的名称查找目标文件夹；

对查找到的所述目标文件夹下的文件执行所述文件操作指令指定的文件操作；所述文件操作包括移动、改名、增加、或删除；当所述文件操作指令指定对文件进行移动时，该文件在其所在的用户根目录范围内移动；

当所述文件操作指令指定对文件进行修改时，该文件所在的服务器先对存储器中的该文件进行修改，然后在缓存中对该文件进行相同的修改，或者删除该文件在所述缓存中的数据。

2.根据权利要求1所述的方法，其特征在于，所述文件操作指令中包括所述业务子目录的名称和所述用户根目录的名称。

3.根据权利要求2所述的方法，其特征在于，所述文件操作指令通过以下方式获取：

根据所述文件操作指令中的所述业务子目录的名称和所述用户根目录的名称，使用一致性哈希算法，确定所述业务子目录的名称和所述用户根目录的名称所在的服务器，并将所述文件操作指令发送给所述服务器；

所述服务器接收并获取所述文件操作指令。

4.一种文件操作装置，其特征在于，包括：

获取模块，用于获取分布式文件系统的文件操作指令，所述分布式文件系统中至少一个服务器的根目录下设置有至少两级子目录，其中，第一级子目录包括至少一个业务子目录，第二级子目录包括至少一个用户根目录，一个所述业务子目录对应于一个业务，一个所述用户根目录对应于一个用户，一个所述业务子目录和一个所述用户根目录在其所在的服务器上的名称和级别固定，并且，一个所述用户根目录的所有数据完整地设置于同一个服务器上；

查找模块，用于根据所述文件操作指令，使用所述业务子目录的名称和所述用户根目录的名称查找目标文件夹；

操作模块，用于对查找到的所述目标文件夹下的文件执行所述文件操作指令指定的文件操作；所述文件操作包括移动、改名、增加、或删除；当所述文件操作指令指定对文件进行移动时，该文件在其所在的用户根目录范围内移动；当所述文件操作指令指定对文件进行修改时，该文件所在的服务器的所述操作模块先对所述服务器的存储器中的该文件进行修改，然后在所述服务器的缓存中对该文件进行相同的修改，或者删除该文件在所述缓存中的数据。

5.根据权利要求4所述的装置，其特征在于，所述文件操作指令中包括所述业务子目录的名称和所述用户根目录的名称。

6.根据权利要求5所述的装置，其特征在于，所述获取模块通过以下方式获取文件操作指令：

客户端或所述分布式文件系统根据所述文件操作指令中的所述业务子目录的名称和所述用户根目录的名称，使用一致性哈希算法，确定所述业务子目录的名称和所述用户根目录的名称所在的服务器，并将所述文件操作指令发送给所述服务器；

所述服务器的所述获取模块接收并获取所述文件操作指令。