WO2021169113A1

WO2021169113A1 - 数据管理方法、装置、计算机设备和存储介质

Info

Publication number: WO2021169113A1
Application number: PCT/CN2020/098793
Authority: WO
Inventors: 刘昌鑫; 李立帅
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-02-26
Filing date: 2020-06-29
Publication date: 2021-09-02
Also published as: CN111427841A

Abstract

本申请涉及大数据领域，揭示数据管理方法、装置、计算机设备和存储介质，方法包括将文件系统的目录树存储于元数据服务器中；将文件系统所包含的各个文件的文件数据进行分块，并分别存储于集群服务器的多个节点中；将文件系统所对应的属性信息进行分块，并分别存储于集群服务器的多个节点中；获取用户发送的数据读写指令；判断目录树内是否包含指定目录信息；若是，则从所述元数据服务器内提取指定目录信息对应的指定文件标识；根据指定文件标识，确定所述待读写文件对应的文件数据在集群服务器中分布的各个指定节点；根据读写操作信息，完成与各个指定节点的读写操作。本申请减少了元数据服务器的运行压力，提高了高并发场景的数据读取效率。

Description

数据管理方法、装置、计算机设备和存储介质

本申请要求于2020年02月26日提交中国专利局、申请号为202010120131.9，发明名称为“数据管理方法、装置、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及大数据技术领域，具体涉及一种数据管理方法、装置、计算机设备和存储介质。

背景技术

文件系统中，通常包括大量的文件数据，这些文件数据分布于文件系统的目录或者子目录中。一个目录中包含有大量的子目录或文件数据，且每个子目录中又包括有大量的文件数据。文件系统的元数据包括目录树以及属性信息。其中目录树用于记录文件数据逻辑与物理位置的映射关系，属性信息用于记录文件大小、修改时间、读写权限等属性信息的数据。发明人意识到，在现有技术中，通常将目录项元数据、文件数据和属性信息进行集中管理。在高并发场景中，由于数据访问的互斥会导致业务的并发度低下，数据读取的耗时较长，系统效率低下。

技术问题

本申请的主要目的为提供一种数据管理方法、装置、计算机设备和存储介质，旨在解决现有技术中的文件数据集中管理，数据读取耗时长，系统效率低下的问题。

技术解决方案

本申请提出一种数据管理方法，包括：

将文件系统的目录树存储于元数据服务器中；以及将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将所述文件系统所对应的属性信息进行分块，并将各块分别存储于所述集群服务器的多个节点中；

获取用户发送的数据读写指令，其中，所述数据读写指令中携带待读写文件的指定目录信息和读写操作信息；

判断所述目录树内是否包含所述指定目录信息，其中所述目录树以键-值的形式存储，以各个文件的目录信息为键，以各个文件对应的文件标识为值；

若是，则从所述元数据服务器内提取所述指定目录信息对应的指定文件标识；

根据所述指定文件标识，确定所述待读写文件对应的文件数据在所述集群服务器中分布的各个指定节点；

根据所述读写操作信息，完成与各个所述指定节点的读写操作。

本申请还提出了一种数据管理装置，包括：

数据存储单元，用于将文件系统的目录树存储于元数据服务器中；以及将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将所述文件系统所对应的属性信息进行分块，并将各块分别存储于所述集群服务器的多个节点中；

指令获取单元，用于获取用户发送的数据读写指令，其中，所述数据读写指令中携带待读写文件的指定目录信息和读写操作信息；

判断单元，用于判断所述目录树内是否包含所述指定目录信息，其中所述目录树以键-值的形式存储，以各个文件的目录信息为键，以各个文件对应的文件标识为值；

标识提取单元，用于若包含所述指定目录信息，则从所述元数据服务器内提取所述指定目录信息对应的指定文件标识；

节点确定单元，用于根据所述指定文件标识，确定所述待读写文件对应的文件数据在所述集群服务器中分布的各个指定节点；

读写操作单元，用于根据所述读写操作信息，完成与各个所述指定节点的读写操作。

本申请还提出了一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现一种数据管理方法的步骤：

本申请还提出了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现一种数据管理方法的步骤：

有益效果

本申请的有益效果：本申请的数据管理方法、装置、计算机设备和存储介质，将文件系统的目录树存储于元数据服务器中；以及将文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将文件系统所对应的属性信息进行分块，并将各块分别存储于集群服务器的多个节点中；在进行数据读写操作时，只需从元数据服务器中查找待读写文件对应的指定文件标识，就可以根据指定文件标识，到待读写文件对应的指定节点进行读写操作，而无需从元数据服务器上进行读写操作，一方面大大减少了元数据服务器的运行压力，另一方面大大提高了高并发场景的数据读取效率。

附图说明

图1是本申请一实施例的数据管理方法的流程示意图；

图2是本申请一实施例的数据管理装置的结构示意框图；

图3是本申请一实施例的计算机设备的结构示意框图。

本发明的最佳实施方式

参照图1，本申请一实施例中提供了一种数据管理方法，包括：

S1、将文件系统的目录树存储于元数据服务器中；以及将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将所述文件系统所对应的属性信息进行分块，并将各块分别存储于所述集群服务器的多个节点中；

S2、获取用户发送的数据读写指令，其中，所述数据读写指令中携带待读写文件的指定目录信息和读写操作信息；

S3、判断所述目录树内是否包含所述指定目录信息，其中所述目录树以键-值的形式存储，以各个文件的目录信息为键，以各个文件对应的文件标识为值；

S4、若是，则从所述元数据服务器内提取所述指定目录信息对应的指定文件标识；

S5、根据所述指定文件标识，确定所述待读写文件对应的文件数据在所述集群服务器中分布的各个指定节点；

S6、根据所述读写操作信息，完成与各个所述指定节点的读写操作。

本实施例中，上述步骤S1中，上述文件数据为在文件系统中的文件内容中所包含的数据，上述属性信息为记录文件大小、修改时间、读写权限等属性信息的数据。将目录树存储于专门的元数据服务器中，将文件数据分布式存储于集群服务器的多个节点中，并将属性信息也分布式存储于集群服务器的多个节点中。

上述元数据服务器为专门存储目录树的元数据服务器。上述元数据服务器可以为单台服务器；也可以为分布式元数据服务器集群，采用多台元数据服务器，多台元数据服务器采用全对等模式，即每台元数据服务器是完全对等的，每台元数据服务器都可以独立对外提供元数据服务，各台元数据服务器的数据保持同步。当元数据服务器采用分布式元数据服务器集群时，采用其中一台元数据服务器作为主元数据服务器，对外提供元数据服务，其余元数据服务器的数据保持同步更新，但不对外提供元数据服务；当主元数据服务器发生故障时，从其余元数据服务器中挑选一台作为新的主元数据服务器；以此保证元数据服务器对外服务的可靠性。

上述集群服务器中包括多个节点，集群服务器用于分布式存储文件数据和属性信息。在集群服务器中，每个节点存储一部分数据，多个节点共同构成完整数据。分布式的集群服务器将文件数据和属性信息分别分散到多台节点。当用户需要进行某个文件的数据读写操作时，在对应的节点即可进行，无需从元数据服务器上进行读写操作，有效地降低了元数据服务器的压力。

上述步骤S2～S4中，在元数据服务器中，目录树以键-值的形式存储，键-值存储可以为文件系统的分布式存储管理带来很好的扩展性，如果需要处理的文件数据增加，在键-值目录树中增加新的文件数据的映射关系即可。表1为某个文件系统以键-值的形式存储的目录树的具体例子，该文件系统的文件夹FS1下包含dir1、dir2和dir3子文件夹，其中dir3子文件夹下包括文件file1和file2。

表1文件系统目录树

键	值
FS1	0001
0001/dir1	0002
0001/dir2	0003
0001/dir3	0004
0001/0004/file1	0005
0001/0004/file2	0006

当用户想要打开file2文件，并对file2文件进行读写操作时，在数据读写指令中携带待读写文件的指定目录信息，即<FS1/dir3/file2>。元数据服务器首先判断在目录树中是否包含上述指定目录信息，对于表1的具体例子，元数据服务器首先查找到FS1的值为0001，再查找前缀为“0001”的根目录下名为“dir3”的目录，即“0001/dir3”的键对应的值为“0004”，再进一步查找前缀为“0001/0004”的根目录下名为“file2”的文件，即查找到“0001/0004/file2”的键对应的值为“0006”。当元数据服务器查找到上述指定目录信息对应的指定文件标识，即判定在目录树中包含上述指定目录信息，提取出该指定文件标识，对于表1的具体例子，即为值“0006”。根据值“0006”即确定了文件数据在集群服务器上的逻辑位置。

上述步骤S5～S6中，根据待读写文件的指定文件标识，即可确定待读写文件在集群服务器中分布的各个指定节点。即根据上述指定文件标识，即可确定该指定文件标识对应的文件数据分布式存储于集群服务器中的具体节点信息。再根据数据读写指令中的读写操作信息，在上述指定节点中完成对应的读写操作。

本实施例的数据管理方法，将文件系统的目录树存储于元数据服务器中；以及将文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将文件系统所对应的属性信息进行分块，并将各块分别存储于集群服务器的多个节点中；在进行数据读写操作时，首先获取用户发送的数据读写指令，其中，数据读写指令中携带待读写文件的指定目录信息和读写操作信息；当目录树内包含指定目录信息时，从元数据服务器内提取指定目录信息对应的指定文件标识；接着根据指定文件标识，确定待读写文件对应的文件数据在集群服务器中分布的各个指定节点；最后根据所述读写操作信息完成与各个所述指定节点之间的读写操作；这样只需从元数据服务器查找待读写文件对应的指定文件标识，就可以根据指定文件标识到对应的指定节点进行读写操作，而无需从元数据服务器上进行读写操作，一方面大大减少了元数据服务器的运行压力，另一方面大大提高了高并发场景的数据读取效率。

在一个实施例中，上述将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中的步骤S1包括：

S101、分别将各个所述文件的文件数据按照第一预置大小分割成多个第一块数据；

S102、分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系；

S103、根据所述第一映射关系，分别将各个所述文件对应的第一块数据存储至各个所述第一节点。

本实施例中，通过预设hash算法将多个第一块数据分配到集群服务器的多个节点中。上述第一节点选自集群服务器，指的是储存单个第一块数据的单个节点。通过预设hash算法对各个文件数据的第一块数据进行分配，将每个第一块数据定位至对应的第一节点，建立各个第一块数据与各个第一节点之间的映射关系，使得集群服务器中的各个节点的负载保持最大程度的均匀，不会出现某些节点负载过大，而某些节点负载过小的问题。

在一个实施例中，上述读写操作信息中包括数据读取起点值和数据读取长度值，上述根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤S6，包括：

S601、从所述读写操作信息中提取所述数据读取起点值和所述数据读取长度值；

S602、从各个所述指定节点中，确定所述数据读取起点值对应的第一目标节点；

S603、在所述第一目标节点中，以所述数据读取起点值为起点，从所述第一目标节点对应的第一块数据中，读取与所述数据读取长度值对应的读取数据。

本实施例中，上述步骤S601中，当用户需要从待读写文件数据中读取一定的数据片段时，可以在读写操作信息中写入对应的数据读取起点值和数据读取长度值时。在一个具体例子中，例如用户要从待读写文件中，读取从距首字符的偏移量为60M的数据点开始的、长度为2M的数据片段，则对应的读写操作信息中数据读取起点值为<off＝60M>，数据读取长度值为<len＝2M>。

上述步骤S602中，首先根据数据读取起点值确定该数据读取起点位置所处的第一目标节点。例如对于前述具体例子，在步骤S5中根据指定文件标识确定了待读写文件分布的各个指定节点，本步骤S602中则用于确定<off＝60M>的数据读取起点值具体位于各个指定节点中的哪个节点，该节点即为上述第一目标节点。具体地，根据数据读取起点值，在前述各个第一块数据与第一节点之间的第一映射关系中进行匹配，例如待读写文件数据被按照25M的大小依序分割成多个第一块数据，则根据<off＝60M>，可以确定数据读取起点值位于被分割的第3个第一块数据中，则从第一映射关系中进行匹配，得到该第一块数据对应的第一节点，即可确定第一目标节点。

上述步骤S603中，在上述第一目标节点中，从数据读取起点值开始，读取与数据读取长度值对应的读取数据。数据的读取操作均在集群服务器的节点内完成，无需在元数据服务器中进行操作，大大减轻了元数据服务器的压力，并且有利于高并发场景业务的进行。

在一个实施例中，上述读写操作信息中包括数据操作起点值和数据写入信息，上述根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤S6，包括：

S611、从所述读写操作信息中提取所述数据操作起点值和所述数据写入信息；

S612、从多个所述指定节点中，确定所述数据操作起点值对应的第二目标节点；

S613、在所述第二目标节点中，以所述数据操作起点值为起点，将所述数据写入信息写入所述第二目标节点对应的第一块数据中，得到所述第二目标节点对应的更新块数据；

S614、根据预设hash算法，重新分配所述更新块数据在所述集群服务器中存储的各个节点。

本实施例中，上述步骤S611中，当用户需要对待读写文件数据中写入一定的数据片段时，可以在读写操作信息中写入对应的数据操作起点值和数据写入信息时。在一个具体例子中，例如用户要从待读写文件中，从距首字符的偏移量为60M的数据点开始，写入内容为<xxxx>的数据片段，则对应的读写操作信息中数据读取起点值为<off＝60M>，数据写入信息为<xxxx>。

上述步骤S612中，首先根据数据操作起点值确定该数据操作起点位置所处的第二目标节点。例如对于前述具体例子，在步骤S5中根据指定文件标识确定了待读写文件分布的各个指定节点，本步骤S612中则用于确定<off＝60M>的数据操作起点值具体位于各个指定节点中的哪个节点，该节点即为上述第二目标节点。具体地，根据数据操作起点值，在前述各个第一块数据与第一节点之间的第一映射关系中进行匹配，例如待读写文件数据被按照25M的大小依序分割成多个第一块数据，则根据<off＝60M>，可以确定数据操作起点值位于被分割的第3个第一块数据中，则从第一映射关系中进行匹配，得到该第一块数据对应的第一节点，即可确定第二目标节点。

上述步骤S613～S614中，在上述第二目标节点中，从数据操作起点值开始，写入对应的数据写入信息，得到更新块数据。上述更新块数据的大小超出了第一预置大小，则再次通过预设hash算法将更新块数据进行分块存储至集群服务器的多个节点中，以使得整个集群服务器的各个节点的负载最大程度地保持均衡。在上述步骤S614后，进一步地对上述第一映射关系进行更新。

本实施例的数据的写入操作均在集群服务器的节点内完成，无需在元数据服务器中进行操作，大大减轻了元数据服务器的压力，并且有利于高并发场景业务的进行。

在一个实施例中，上述分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系中的步骤S102包括：

S1021、将所述集群服务器中的全部节点按照从0开始的阿拉伯数字依序进行编号，分别得到各个节点编号数；

S1022、对一个所述文件对应的全部第一块数据按照预设编号规则依序进行编号，得到一个所述文件对应的全部文件块编号；

S1023、根据所述预设hash算法，分别对一个所述文件对应的文件标识和其对应的每个所述第一块数据所对应的文件块编号，进行哈希计算，分别得到每个所述第一块数据对应的哈希值；

S1024、分别将每个所述第一块数据对应的哈希值，对最大的节点编号数进行取模运算，得到取模运算结果；

S1025、将各个所述第一块数据，按照预设映射规则分别映射至各个所述第一节点，其中，所述预设映射规则为第一块数据的取模运算结果与第一节点的节点编号数相等。

本实施例中，对集群服务器中的各个节点进行编号，例如从0到N-1，通过对每个文件数据在目录树键-值表中对应的值和各个第一块数据的文件块编号进行哈希计算得到各个第一块数据对应的哈希值，对该哈希值按N取模，得到余数i，则在集群服务器中编号为i的节点即为与该第一块数据对应的第一节点。其中，哈希算法为现有技术，本申请在此不对算法进行赘述。

在一个实施例中，上述元数据服务器为分布式元数据服务器集群，上述将文件系统的目录树存储于元数据服务器中的步骤S1，包括：

S121、将所述文件系统的目录树存储于所述元数据服务器集群中的每台元数据服务器中，并将其中一台元数据服务器作为主元数据服务器，其余元数据服务器作为从元数据服务器，其中，所述主元数据服务器用于对外提供元数据服务；

S122、判断所述主元数据服务器是否发生故障；

S123、若所述主元数据服务器发生故障，则从所述元数据服务器中选择一台作为新的主元数据服务器，并采用所述新的主元数据服务器对外提供元数据服务。

在一个实施例中，上述将所述文件系统所对应的属性信息分布式存储于所述集群服务器中的步骤S1包括：

S111、将所述属性信息按照第二预置大小分割成多个第二块数据；

S112、根据所述第二块数据的数目，从所述集群服务器的全部节点中，通过预设hash算法确定用于存储各个所述第二块数据的各个第二节点，建立各个所述第二块数据与各个所述第二节点之间的第二映射关系；

S113、根据所述第二映射关系，将各个所述第二块数据分别存储至各个所述第二节点。

本实施例中，通过预设hash算法将多个第二块数据分配到集群服务器的多个节点中。上述第二节点选自集群服务器，指的是储存单个第二块数据的单个节点。通过预设hash算法对属性信息的第二块数据进行分配，将每个第二块数据定位至对应的第二节点，建立各个第二块数据与各个第二节点之间的映射关系，使得集群服务器中的各个节点的负载保持最大程度的均匀，不会出现某些节点负载过大，而某些节点负载过小的问题。具体地，预设hash算法的具体分配计算过程如下，对集群服务器中的各个节点进行编号，例如从0到N-1，通过对各个第二块数据的文件块编号进行哈希计算得到各个第二块数据对应的哈希值，对该哈希值按N取模，得到余数i，则在集群服务器中编号为i的节点即为与该第二块数据对应的第二节点。其中，哈希计算的具体过程为现有技术，本申请在此不做赘述。

在一个实施例中，上述根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤S6后，包括：

S7、基于所述读写操作，更新所述文件系统对应的属性信息。

本实施例中，上述属性信息用于记录文件大小、修改时间、读写权限等属性信息的数据。当对文件系统的文件进行了读写操作后，文件系统的属性信息也被修改。基于具体的读写操作，对上述属性信息进行修改。具体地，根据前述第二映射关系，确定属性信息所存储的具体节点，在对应的节点对属性信息进行修改。

在一个实施例中，上述判断所述目录树内是否包含所述指定目录信息的步骤S3后，包括：

S401、若否，则在所述目录树内为所述指定目录信息分配对应的新建文件标识；

S501、通过预设hash算法为所述新建文件标识分配用于存储所述新建文件标识对应的文件数据的节点。

本实施例中，上述步骤S401中，当上述目录树中没有包含上述指定目录信息时，则为该指定目录信息分配一个新建文件标识，并更新目录树。举例来说，上述指定目录信息为<FS1/dir3/file3>，在表1的目录树中查找不到对应的目录信息，则在为该目录信息分配一个新建文件标识，例如“0007”，并更新目录树，新增一条键为“0001/0004/file3”，对应的值为“0007”。

上述步骤S501中，通过预设hash算法分配上述新建文件标识对应的文件数据的节点，以用于在上述节点中新建与上述指定目录信息对应的文件。通过上述步骤S401～S501，用户可以在文件系统中新增文件数据。在元数据服务器内仅需对目录树进行更新，其余文件新建、数据写入的操作等均可在集群服务器的节点完成，大大减轻了元数据服务器的压力，并且有利于高并发场景业务的进行。

参照图2，本申请一实施例中提供了一种数据管理装置，包括：

数据存储单元10，用于将文件系统的目录树存储于元数据服务器中；以及将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将所述文件系统所对应的属性信息进行分块，并将各块分别存储于所述集群服务器的多个节点中；

指令获取单元20，用于获取用户发送的数据读写指令，其中，所述数据读写指令中携带待读写文件的指定目录信息和读写操作信息；

判断单元30，用于判断所述目录树内是否包含所述指定目录信息，其中所述目录树以键-值的形式存储，以各个文件的目录信息为键，以各个文件对应的文件标识为值；

标识提取单元40，用于若包含所述指定目录信息，则从所述元数据服务器内提取所述指定目录信息对应的指定文件标识；

节点确定单元50，用于根据所述指定文件标识，确定所述待读写文件对应的文件数据在所述集群服务器中分布的各个指定节点；

读写操作单元60，用于根据所述读写操作信息，完成与各个所述指定节点的读写操作。

本实施例中，上述数据管理装置中的数据存储单元10、指令获取单元20、判断单元30、标识提取单元40、节点确定单元50与读写操作单元60的功能和作用的实现过程具体详见上述数据管理方法中对应步骤S1-S6的实现过程，在此不再赘述。

本实施例的数据管理装置，将文件系统的目录树存储于元数据服务器中；以及将文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将文件系统所对应的属性信息进行分块，并将各块分别存储于集群服务器的多个节点中；在进行数据读写操作时，首先获取用户发送的数据读写指令，其中，数据读写指令中携带待读写文件的指定目录信息和读写操作信息；当目录树内包含指定目录信息时，从元数据服务器内提取指定目录信息对应的指定文件标识；接着根据指定文件标识，确定待读写文件对应的文件数据在集群服务器中分布的各个指定节点；最后根据所述读写操作信息完成与各个所述指定节点之间的读写操作；这样只需从元数据服务器查找待读写文件对应的指定文件标识，就可以根据指定文件标识到对应的指定节点进行读写操作，而无需从元数据服务器上进行读写操作，一方面大大减少了元数据服务器的运行压力，另一方面大大提高了高并发场景的数据读取效率。

在一个实施例中，上述数据存储单元10包括：

第一分割子单元，用于分别将各个所述文件的文件数据按照第一预置大小分割成多个第一块数据；

第一分配子单元，用于分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系；

第一存储子单元，用于根据所述第一映射关系，分别将各个所述文件对应的第一块数据存储至各个所述第一节点。

本实施例中，上述数据管理装置中的第一分割子单元、第一分配子单元与第一存储子单元的功能和作用的实现过程具体详见上述数据管理方法中对应步骤S101-S103的实现过程，在此不再赘述。

在一个实施例中，上述读写操作单元60包括：

第一读取子单元，用于从所述读写操作信息中提取所述数据读取起点值和所述数据读取长度值；

第一确定子单元，用于从各个所述指定节点中，确定所述数据读取起点值对应的第一目标节点；

第一操作子单元，用于在所述第一目标节点中，以所述数据读取起点值为起点，从所述第一目标节点对应的第一块数据中，读取与所述数据读取长度值对应的读取数据。

本实施例中，上述数据管理装置中的第一读取子单元、第一确定子单元与第一操作子单元的功能和作用的实现过程具体详见上述数据管理方法中对应步骤S601-S603的实现过程，在此不再赘述。

在一个实施例中，上述读写操作单元60，包括：

第二读取子单元，用于从所述读写操作信息中提取所述数据操作起点值和所述数据写入信息；

第二确定子单元，用于从多个所述指定节点中，确定所述数据操作起点值对应的第二目标节点；

第二操作子单元，用于在所述第二目标节点中，以所述数据操作起点值为起点，将所述数据写入信息写入所述第二目标节点对应的第一块数据中，得到所述第二目标节点对应的更新块数据；

重新分配子单元，用于根据预设hash算法，重新分配所述更新块数据在所述集群服务器中存储的各个节点。

本实施例中，上述数据管理装置中的第二读取子单元、第二确定子单元、第二操作子单元与重新分配子单元的功能和作用的实现过程具体详见上述数据管理方法中对应步骤S611-S614的实现过程，在此不再赘述。

在一个实施例中，上述第一分配子单元包括：

第一编号模块，用于将所述集群服务器中的全部节点按照从0开始的阿拉伯数字依序进行编号，分别得到各个节点编号数；

第二编号模块，用于对一个所述文件对应的全部第一块数据按照预设编号规则依序进行编号，得到一个所述文件对应的全部文件块编号；

哈希计算模块，用于根据所述预设hash算法，分别对一个所述文件对应的文件标识和其对应的每个所述第一块数据所对应的文件块编号，进行哈希计算，分别得到每个所述第一块数据对应的哈希值；

取模运算模块，用于分别将每个所述第一块数据对应的哈希值，对最大的节点编号数进行取模运算，得到取模运算结果；

映射模块，用于将各个所述第一块数据，按照预设映射规则分别映射至各个所述第一节点，其中，所述预设映射规则为第一块数据的取模运算结果与第一节点的节点编号数相等。

本实施例中，上述第一分配子单元中的第一编号模块、第二编号模块、哈希计算模块、取模运算模块与映射模块的功能和作用的实现过程具体详见上述数据管理方法中对应步骤S1021-S1025的实现过程，在此不再赘述。

在一个实施例中，上述元数据服务器为分布式元数据服务器集群，上述数据存储单元10，包括：

目录树存储子单元，用于将所述文件系统的目录树存储于所述元数据服务器集群中的每台元数据服务器中，并将其中一台元数据服务器作为主元数据服务器，其余元数据服务器作为从元数据服务器，其中，所述主元数据服务器用于对外提供元数据服务；

判断子单元，用于判断所述主元数据服务器是否发生故障；

重选子单元，用于若所述主元数据服务器发生故障，则从所述元数据服务器中选择一台作为新的主元数据服务器，并采用所述新的主元数据服务器对外提供元数据服务。

本实施例中，上述数据存储单元10中的目录树存储子单元、判断子单元与重选子单元的功能和作用的实现过程具体详见上述数据管理方法中对应步骤S121-S123的实现过程，在此不再赘述。

上述数据存储单元10包括：

第二分割子单元，用于将所述属性信息按照第二预置大小分割成多个第二块数据；

第二分配子单元，用于根据所述第二块数据的数目，从所述集群服务器的全部节点中，通过预设hash算法确定用于存储各个所述第二块数据的各个第二节点，建立各个所述第二块数据与各个所述第二节点之间的第二映射关系；

第二存储子单元，用于根据所述第二映射关系，将各个所述第二块数据分别存储至各个所述第二节点。

本实施例中，上述数据管理装置中的第二分割子单元、第二分配子单元与第二存储子单元的功能和作用的实现过程具体详见上述数据管理方法中对应步骤S111-S113的实现过程，在此不再赘述。

在一个实施例中，上述数据管理装置，还包括：

属性更新单元，用于基于所述读写操作，更新所述文件系统对应的属性信息。

本实施例中，上述数据管理装置中的属性更新单元的功能和作用的实现过程具体详见上述数据管理方法中对应步骤S7的实现过程，在此不再赘述。

在一个实施例中，上述数据管理装置，还包括：

标识分配单元，用于若不包含所述指定目录信息，则在所述目录树内为所述指定目录信息分配对应的新建文件标识；

节点分配单元，用于通过预设hash算法为所述新建文件标识分配用于存储所述新建文件标识对应的文件数据的节点。

本实施例中，上述数据管理装置中的标识分配单元与节点分配单元的功能和作用的实现过程具体详见上述数据管理方法中对应步骤S401～S501的实现过程，在此不再赘述。

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目录树等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据管理方法。

上述处理器执行上述数据管理方法，包括：

在一实施例中，上述处理器将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中的步骤包括：

分别将各个所述文件的文件数据按照第一预置大小分割成多个第一块数据；

分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系；

根据所述第一映射关系，分别将各个所述文件对应的第一块数据存储至各个所述第一节点。

在一实施例中，所述读写操作信息中包括数据读取起点值和数据读取长度值，上述处理器根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤，包括：

从所述读写操作信息中提取所述数据读取起点值和所述数据读取长度值；

从各个所述指定节点中，确定所述数据读取起点值对应的第一目标节点；

在所述第一目标节点中，以所述数据读取起点值为起点，从所述第一目标节点对应的第一块数据中，读取与所述数据读取长度值对应的读取数据。

在一实施例中，所述读写操作信息中包括数据操作起点值和数据写入信息，上述处理器根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤，包括：

从所述读写操作信息中提取所述数据操作起点值和所述数据写入信息；

从多个所述指定节点中，确定所述数据操作起点值对应的第二目标节点；

在所述第二目标节点中，以所述数据操作起点值为起点，将所述数据写入信息写入所述第二目标节点对应的第一块数据中，得到所述第二目标节点对应的更新块数据；

根据预设hash算法，重新分配所述更新块数据在所述集群服务器中存储的各个节点。

在一实施例中，上述处理器分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系中的步骤包括：

将所述集群服务器中的全部节点按照从0开始的阿拉伯数字依序进行编号，分别得到各个节点编号数；

对一个所述文件对应的全部第一块数据按照预设编号规则依序进行编号，得到一个所述文件对应的全部文件块编号；

根据所述预设hash算法，分别对一个所述文件对应的文件标识和其对应的每个所述第一块数据所对应的文件块编号，进行哈希计算，分别得到每个所述第一块数据对应的哈希值；

分别将每个所述第一块数据对应的哈希值，对最大的节点编号数进行取模运算，得到取模运算结果；

将各个所述第一块数据，按照预设映射规则分别映射至各个所述第一节点，其中，所述预设映射规则为第一块数据的取模运算结果与第一节点的节点编号数相等。

在一实施例中，上述元数据服务器为分布式元数据服务器集群，上述处理器将文件系统的目录树存储于元数据服务器中的步骤，包括：

将所述文件系统的目录树存储于所述元数据服务器集群中的每台元数据服务器中，并将其中一台元数据服务器作为主元数据服务器，其余元数据服务器作为从元数据服务器，其中，所述主元数据服务器用于对外提供元数据服务；

判断所述主元数据服务器是否发生故障；

若所述主元数据服务器发生故障，则从所述元数据服务器中选择一台作为新的主元数据服务器，并采用所述新的主元数据服务器对外提供元数据服务。

在一实施例中，上述处理器判断所述目录树内是否包含所述指定目录信息的步骤后，包括：

若否，则在所述目录树内为所述指定目录信息分配对应的新建文件标识；

通过预设hash算法为所述新建文件标识分配用于存储所述新建文件标识对应的文件数据的节点。

本领域技术人员可以理解，图3中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质，上述存储介质可以是非易失性存储介质，也可以是易失性存储介质。其上存储有计算机程序，计算机程序被处理器执行时实现一种数据管理方法，具体为：

判断所述主元数据服务器是否发生故障；

综上所述，为本申请的数据管理方法、装置、计算机设备和存储介质，将文件系统的目录树存储于元数据服务器中；以及将文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将文件系统所对应的属性信息进行分块，并将各块分别存储于集群服务器的多个节点中；在进行数据读写操作时，只需从元数据服务器中查找待读写文件对应的指定文件标识，就可以根据指定文件标识，到待读写文件对应的指定节点进行读写操作，而无需从元数据服务器上进行读写操作，一方面大大减少了元数据服务器的运行压力，另一方面大大提高了高并发场景的数据读取效率。

Claims

一种数据管理方法，其中，包括：

将文件系统的目录树存储于元数据服务器中；以及将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将所述文件系统所对应的属性信息进行分块，并将各块分别存储于所述集群服务器的多个节点中；

获取用户发送的数据读写指令，其中，所述数据读写指令中携带待读写文件的指定目录信息和读写操作信息；

判断所述目录树内是否包含所述指定目录信息，其中所述目录树以键-值的形式存储，以各个文件的目录信息为键，以各个文件对应的文件标识为值；

若是，则从所述元数据服务器内提取所述指定目录信息对应的指定文件标识；

根据所述指定文件标识，确定所述待读写文件对应的文件数据在所述集群服务器中分布的各个指定节点；

根据所述读写操作信息，完成与各个所述指定节点的读写操作。
如权利要求1所述的数据管理方法，其中，所述将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中的步骤包括：

分别将各个所述文件的文件数据按照第一预置大小分割成多个第一块数据；

分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系；

根据所述第一映射关系，分别将各个所述文件对应的第一块数据存储至各个所述第一节点。
如权利要求2所述的数据管理方法，其中，所述读写操作信息中包括数据读取起点值和数据读取长度值，所述根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤，包括：

从所述读写操作信息中提取所述数据读取起点值和所述数据读取长度值；

从各个所述指定节点中，确定所述数据读取起点值对应的第一目标节点；

在所述第一目标节点中，以所述数据读取起点值为起点，从所述第一目标节点对应的第一块数据中，读取与所述数据读取长度值对应的读取数据。
如权利要求2所述的数据管理方法，其中，所述读写操作信息中包括数据操作起点值和数据写入信息，所述根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤，包括：

从所述读写操作信息中提取所述数据操作起点值和所述数据写入信息；

从多个所述指定节点中，确定所述数据操作起点值对应的第二目标节点；

在所述第二目标节点中，以所述数据操作起点值为起点，将所述数据写入信息写入所述第二目标节点对应的第一块数据中，得到所述第二目标节点对应的更新块数据；

根据预设hash算法，重新分配所述更新块数据在所述集群服务器中存储的各个节点。
如权利要求2所述的数据管理方法，其中，所述分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系中的步骤包括：

将所述集群服务器中的全部节点按照从0开始的阿拉伯数字依序进行编号，分别得到各个节点编号数；

对一个所述文件对应的全部第一块数据按照预设编号规则依序进行编号，得到一个所述文件对应的全部文件块编号；

根据所述预设hash算法，分别对一个所述文件对应的文件标识和其对应的每个所述第一块数据所对应的文件块编号，进行哈希计算，分别得到每个所述第一块数据对应的哈希值；

分别将每个所述第一块数据对应的哈希值，对最大的节点编号数进行取模运算，得到取模运算结果；

将各个所述第一块数据，按照预设映射规则分别映射至各个所述第一节点，其中，所述预设映射规则为第一块数据的取模运算结果与第一节点的节点编号数相等。
如权利要求1所述的数据管理方法，其中，所述元数据服务器为分布式元数据服务器集群，所述将文件系统的目录树存储于元数据服务器中的步骤，包括：

将所述文件系统的目录树存储于所述元数据服务器集群中的每台元数据服务器中，并将其中一台元数据服务器作为主元数据服务器，其余元数据服务器作为从元数据服务器，其中，所述主元数据服务器用于对外提供元数据服务；

判断所述主元数据服务器是否发生故障；

若所述主元数据服务器发生故障，则从所述元数据服务器中选择一台作为新的主元数据服务器，并采用所述新的主元数据服务器对外提供元数据服务。
如权利要求1所述的数据管理方法，其中，所述判断所述目录树内是否包含所述指定目录信息的步骤后，包括：

若否，则在所述目录树内为所述指定目录信息分配对应的新建文件标识；

通过预设hash算法为所述新建文件标识分配用于存储所述新建文件标识对应的文件数据的节点。
一种数据管理装置，其中，包括：

数据存储单元，用于将文件系统的目录树存储于元数据服务器中；以及将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将所述文件系统所对应的属性信息进行分块，并将各块分别存储于所述集群服务器的多个节点中；

指令获取单元，用于获取用户发送的数据读写指令，其中，所述数据读写指令中携带待读写文件的指定目录信息和读写操作信息；

判断单元，用于判断所述目录树内是否包含所述指定目录信息，其中所述目录树以键-值的形式存储，以各个文件的目录信息为键，以各个文件对应的文件标识为值；

标识提取单元，用于若包含所述指定目录信息，则从所述元数据服务器内提取所述指定目录信息对应的指定文件标识；

节点确定单元，用于根据所述指定文件标识，确定所述待读写文件对应的文件数据在所述集群服务器中分布的各个指定节点；

读写操作单元，用于根据所述读写操作信息，完成与各个所述指定节点的读写操作。
一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，其中，所述处理器执行所述计算机程序时实现一种数据管理方法的步骤：

将文件系统的目录树存储于元数据服务器中；以及将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将所述文件系统所对应的属性信息进行分块，并将各块分别存储于所述集群服务器的多个节点中；

获取用户发送的数据读写指令，其中，所述数据读写指令中携带待读写文件的指定目录信息和读写操作信息；

判断所述目录树内是否包含所述指定目录信息，其中所述目录树以键-值的形式存储，以各个文件的目录信息为键，以各个文件对应的文件标识为值；

若是，则从所述元数据服务器内提取所述指定目录信息对应的指定文件标识；

根据所述指定文件标识，确定所述待读写文件对应的文件数据在所述集群服务器中分布的各个指定节点；

根据所述读写操作信息，完成与各个所述指定节点的读写操作。
如权利要求9所述的计算机设备，其中，所述将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中的步骤包括：

分别将各个所述文件的文件数据按照第一预置大小分割成多个第一块数据；

分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系；

根据所述第一映射关系，分别将各个所述文件对应的第一块数据存储至各个所述第一节点。
如权利要求10所述的计算机设备，其中，所述读写操作信息中包括数据读取起点值和数据读取长度值，所述根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤，包括：

从所述读写操作信息中提取所述数据读取起点值和所述数据读取长度值；

从各个所述指定节点中，确定所述数据读取起点值对应的第一目标节点；

在所述第一目标节点中，以所述数据读取起点值为起点，从所述第一目标节点对应的第一块数据中，读取与所述数据读取长度值对应的读取数据。
如权利要求10所述的计算机设备，其中，所述读写操作信息中包括数据操作起点值和数据写入信息，所述根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤，包括：

从所述读写操作信息中提取所述数据操作起点值和所述数据写入信息；

从多个所述指定节点中，确定所述数据操作起点值对应的第二目标节点；

在所述第二目标节点中，以所述数据操作起点值为起点，将所述数据写入信息写入所述第二目标节点对应的第一块数据中，得到所述第二目标节点对应的更新块数据；

根据预设hash算法，重新分配所述更新块数据在所述集群服务器中存储的各个节点。
如权利要求10所述的计算机设备，其中，所述分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系中的步骤包括：

将所述集群服务器中的全部节点按照从0开始的阿拉伯数字依序进行编号，分别得到各个节点编号数；

对一个所述文件对应的全部第一块数据按照预设编号规则依序进行编号，得到一个所述文件对应的全部文件块编号；

根据所述预设hash算法，分别对一个所述文件对应的文件标识和其对应的每个所述第一块数据所对应的文件块编号，进行哈希计算，分别得到每个所述第一块数据对应的哈希值；

分别将每个所述第一块数据对应的哈希值，对最大的节点编号数进行取模运算，得到取模运算结果；

将各个所述第一块数据，按照预设映射规则分别映射至各个所述第一节点，其中，所述预设映射规则为第一块数据的取模运算结果与第一节点的节点编号数相等。
如权利要求9所述的计算机设备，其中，所述元数据服务器为分布式元数据服务器集群，所述将文件系统的目录树存储于元数据服务器中的步骤，包括：

将所述文件系统的目录树存储于所述元数据服务器集群中的每台元数据服务器中，并将其中一台元数据服务器作为主元数据服务器，其余元数据服务器作为从元数据服务器，其中，所述主元数据服务器用于对外提供元数据服务；

判断所述主元数据服务器是否发生故障；

若所述主元数据服务器发生故障，则从所述元数据服务器中选择一台作为新的主元数据服务器，并采用所述新的主元数据服务器对外提供元数据服务。
如权利要求9所述的计算机设备，其中，所述判断所述目录树内是否包含所述指定目录信息的步骤后，包括：

若否，则在所述目录树内为所述指定目录信息分配对应的新建文件标识；

通过预设hash算法为所述新建文件标识分配用于存储所述新建文件标识对应的文件数据的节点。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现一种数据管理方法的步骤。

将文件系统的目录树存储于元数据服务器中；以及将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中；以及将所述文件系统所对应的属性信息进行分块，并将各块分别存储于所述集群服务器的多个节点中；

获取用户发送的数据读写指令，其中，所述数据读写指令中携带待读写文件的指定目录信息和读写操作信息；

判断所述目录树内是否包含所述指定目录信息，其中所述目录树以键-值的形式存储，以各个文件的目录信息为键，以各个文件对应的文件标识为值；

若是，则从所述元数据服务器内提取所述指定目录信息对应的指定文件标识；

根据所述指定文件标识，确定所述待读写文件对应的文件数据在所述集群服务器中分布的各个指定节点；

根据所述读写操作信息，完成与各个所述指定节点的读写操作。
如权利要求16所述的计算机可读存储介质，其中，所述将所述文件系统所包含的各个文件的文件数据进行分块，并将各块分别存储于集群服务器的多个节点中的步骤包括：

分别将各个所述文件的文件数据按照第一预置大小分割成多个第一块数据；

分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系；

根据所述第一映射关系，分别将各个所述文件对应的第一块数据存储至各个所述第一节点。
如权利要求17所述的计算机可读存储介质，其中，所述读写操作信息中包括数据读取起点值和数据读取长度值，所述根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤，包括：

从所述读写操作信息中提取所述数据读取起点值和所述数据读取长度值；

从各个所述指定节点中，确定所述数据读取起点值对应的第一目标节点；

在所述第一目标节点中，以所述数据读取起点值为起点，从所述第一目标节点对应的第一块数据中，读取与所述数据读取长度值对应的读取数据。
如权利要求17所述的计算机可读存储介质，其中，所述读写操作信息中包括数据操作起点值和数据写入信息，所述根据所述读写操作信息，完成与各个所述指定节点的读写操作的步骤，包括：

从所述读写操作信息中提取所述数据操作起点值和所述数据写入信息；

从多个所述指定节点中，确定所述数据操作起点值对应的第二目标节点；

在所述第二目标节点中，以所述数据操作起点值为起点，将所述数据写入信息写入所述第二目标节点对应的第一块数据中，得到所述第二目标节点对应的更新块数据；

根据预设hash算法，重新分配所述更新块数据在所述集群服务器中存储的各个节点。
如权利要求17所述的计算机可读存储介质，其中，所述分别根据各个所述文件对应的第一块数据的数目，从所述集群服务器的全部节点中，根据预设hash算法确定用于存储各个所述第一块数据的各个第一节点，建立各个所述第一块数据与各个所述第一节点之间的第一映射关系中的步骤包括：

将所述集群服务器中的全部节点按照从0开始的阿拉伯数字依序进行编号，分别得到各个节点编号数；

对一个所述文件对应的全部第一块数据按照预设编号规则依序进行编号，得到一个所述文件对应的全部文件块编号；

根据所述预设hash算法，分别对一个所述文件对应的文件标识和其对应的每个所述第一块数据所对应的文件块编号，进行哈希计算，分别得到每个所述第一块数据对应的哈希值；

分别将每个所述第一块数据对应的哈希值，对最大的节点编号数进行取模运算，得到取模运算结果；

将各个所述第一块数据，按照预设映射规则分别映射至各个所述第一节点，其中，所述预设映射规则为第一块数据的取模运算结果与第一节点的节点编号数相等。