WO2014023000A1

WO2014023000A1 - 分布式数据处理方法及装置

Info

Publication number: WO2014023000A1
Application number: PCT/CN2012/079876
Authority: WO
Inventors: 石胜兵; 王道辉; 王炎
Original assignee: 华为技术有限公司
Priority date: 2012-08-09
Filing date: 2012-08-09
Publication date: 2014-02-13
Also published as: EP2821925A4; US20150113218A1; CN103180852A; EP2821925B1; CN103180852B; EP2821925A1

Abstract

本发明实施例提供一种分布式数据处理方法及装置，该分布式数据处理方法包括：集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息；集群客户处理装置接收用户发送的读或写数据命令，根据读或写数据命令和逻辑卷的存储信息确定第一存储信息；集群客户处理装置根据每一组四元组信息中的树标识和数据块标识确定每一组四元组存储信息对应的数据处理节点；集群客户处理装置向每一组四元组信息对应的数据处理节点发送数据处理命令。本发明实施例提供的分布式数据处理方法及装置，避免了分布式存储系统中需要全局设置或者读写Bitmap而带来的资源消耗问题，提高了数据处理效果。

Description

分布式数据处理方法及装置

技术领域

本发明实施例涉及数据存储技术，尤其涉及一种分布式数据处理方法及装置。背景技术

分布式数据存储技术中，相对于磁盘、分区这些物理卷，可以将物理卷的空间加以管理之后，虚拟出逻辑卷（Logical Volume ) , 逻辑卷将存储虚拟化，存储不再受限于物理磁盘的大小。使用逻辑卷，文件系统可以扩展到多个磁盘上，聚合多个磁盘或磁盘分区成一个逻辑卷，创建出来的逻辑卷在用户没有写入数据的时候，可以不用真实分配物理存储空间，而是到了写入的时候，动态分配物理存储空间，从而达到节省物理存储空间，延迟成本投入等目的。

快照（Snapshot )是指定数据集合的一个完全可用的拷贝，该拷贝包括相应数据在某个时间点（拷贝的时间点）的映像。快照是一种特殊的逻辑卷，是用户创建的普通逻辑卷的准确拷贝，或者说普通逻辑卷的精确的副本。当创建快照的时候，将已存在的普通逻辑卷的逻辑存储空间标记为快照的逻辑存储空间，并分配新的逻辑存储空间供普通逻辑卷使用，创建快照之后，没有修改的数据块在逻辑存储空间上和快照共享，但是后续所有的修改都将写入普通逻辑卷自己的新逻辑存储空间中。删除普通逻辑卷的时候，在该普通逻辑卷上创建的所有快照会被全部删除。

在数据存储过程中 ,通常将逻辑卷按照相同大小划分为多个逻辑数据块 , 将逻辑数据块作为数据的最小增量单元。在记录哪些数据块已经写入数据，哪些没有写入的时候，一般会采用位图（Bitmap ) 的机制，将每个逻辑数据块对应一个比特位，如果已写入数据则置为 1 , 否则置为 0。当创建快照的时候，需要将当前普通逻辑卷的 Bitmap备份为创建的快照的 Bitmap, 并重置普通逻辑卷的 Bitmap。这样在每次新写入数据的时候，都需要同步更新 Bitmap, 尤其是在分布式数据处理系统中，需要把 Bitmap的变动实时同步至各个集群客户处理装置中。另外，在读取数据时，需要集群客户端通过对当前普通逻辑卷的 Bitmap和所有快照的 Bitmap进行查询，确定需要的数据存储在哪个快照或普通逻辑卷中。如果 Bitmap緩存在内存中，那么就会对内存造成很大的资源消耗，如果未緩存在内存中，则会对存储设备自身增加资源消耗，影响数据处理的效率。发明内容本发明实施例提供一种分布式数据处理方法及装置，以避免分布式存储系统中需要全局设置或者读写 Bitmap而带来的资源消耗问题。

第一个方面，本发明实施例提供一种分布式数据处理方法，包括：集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的四元组信息，所述四元组信息包括树标识、数据块标识、分支标识和节点标识；

所述集群客户处理装置接收用户发送的读或写数据命令，根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，其中，所述第一存储信息包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

所述集群客户处理装置根据所述每一组四元组信息中的树标识和数据块标识确定所述每一组四元组存储信息对应的数据处理节点；

所述集群客户处理装置向所述每一组四元组信息对应的数据处理节点发送数据处理命令，其中，所述数据处理命令包含所述数据处理节点对应的每一组四元组信息，以使得所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读或写的操作。

在第一种可能的实现方式中，所述集群客户处理装置根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，包括：

所述集群客户处理装置根据所述逻辑卷的存储信息和所述读或写数据命令中的操作对象信息获取所述读或写数据命令相应的逻辑卷的第一树标识和第一分支标识，根据所述逻辑卷的存储信息和所述读或写数据命令中的偏移量信息确定一组或多组第一数据块标识，获取所述一组或多组第一数据块标识、所述第一树标识和第一分支标识所对应的最大节点标识，将所述最大节点标识加 1生成所述第一节点标识。

结合第一方面或第一方面的第一种可能的实现方式，在第二种可能的实现方式中，所述数据处理命令用以指示读数据操作；

相应地，所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读操作，包括：

所述每一组四元组信息对应的数据处理节点获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中的待处理的物理数据块，若所述物理数据块存在，则直接在所述物理数据块上进行读操作。

结合第一方面的第二种可能的实现方式，在三种可能的实现方式中，所述分布式数据处理方法，还包括：

若所述物理数据块不存在，则所述数据处理节点将所述每一组四元组信息中的第一节点标识以 1为步长递减，直到查找到递减后的四元组信息对应的物理数据块存在为止；

若所述每一组四元组信息中的第一节点标识减为 0仍然不存在对应的物理数据块时，所述数据处理节点将所述每一组四元组信息中的第一分支标识以 1为步长递减，寻找父分支是否存在对应的物理数据块，直到查找到相应的物理数据块为止。

结合第一方面或第一方面的第一种可能的实现方式，在第四种可能的实现方式中，所述数据处理命令用以指示写数据操作；

相应地，所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行写操作，包括：

所述每一组四元组信息对应的数据处理节点获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。

在第五种可能的实现方式中，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

所述集群客户处理装置接收所述管理装置发送的快照命令，根据所述快照命令和所述逻辑卷的存储信息确定第二存储信息，其中，所述第二存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第二树标识、第二分支标识、第二数据块标识和第二节点标识；

所述集群客户处理装置获取与所述第二树标识、所述第二分支标识和所述第二数据块标识对应的第二最大节点标识，将所述第二最大节点标识加 1。

在第六种可能的实现方式中，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

所述集群客户处理装置接收所述管理装置发送的克隆命令，根据所述克隆命令和所述逻辑卷的存储信息确定第三存储信息，其中，所述第三存储信息包括第三树标识、第三分支标识、第三数据块标识和第三节点标识；所述集群客户处理装置获取与所述第三树标识和所述第三数据块标识对应的最大分支标识，将所述最大分支标识加 1生成克隆分支标识，将所述第三树标识、所述第三数据块标识、所述克隆分支标识和克隆节点标识形成第四存储信息，建立所述第四存储信息与所述第三存储信息的克隆关系，将所述克隆关系进行广播，其中，所述克隆节点标识为 0。

在第七种可能的实现方式中，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

所述集群客户处理装置接收所述管理装置发送的文件关闭命令，将所述逻辑卷的存储信息删除。

第二个方面，本发明实施例提供一种分布式数据处理方法，包括：数据处理节点接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作。

在第一种可能的实现方式中，所述数据处理命令用以指示读数据操作；

相应地，所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作，包括：

所述数据处理节点获取所述数据处理命令中的每一组四元组信息，根述物理数据块存在，则直接在所述物理数据块上进行读操作。结合第二方面的第一种可能的实现方式，在第二种可能的实现方式中，所述分布式数据处理方法，还包括：

在第三种可能的实现方式中，所述数据处理命令用以指示写数据操作；相应地，所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作，包括：

所述数据处理节点获取所述数据处理命令中的每一组四元组信息，根待分配的物理数据块上进行写操作。

第三个方面，本发明实施例提供一种集群客户处理装置，包括：同步单元，用于接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的四元组信息，所述四元组信息包括树标识、数据块标识、分支标识和节点标识；

第一读写处理单元，与所述同步单元相连，用于接收用户发送的读或写数据命令，根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，其中，所述第一存储信息包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

第二读写处理单元，与所述第一读写处理单元相连，用于根据所述每一组四元组信息中的树标识和数据块标识确定所述每一组四元组存储信息对应的数据处理节点；发送单元，与所述第二读写处理单元相连，用于向所述每一组四元组信息对应的数据处理节点发送数据处理命令，其中，所述数据处理命令包含所述数据处理节点对应的每一组四元组信息，以使得所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读或写的操作。

在第一种可能的实现方式中，第一读写处理单元还用于根据所述逻辑卷的存储信息和所述读或写数据命令中的操作对象信息获取所述读或写数据命令相应的逻辑卷的第一树标识和第一分支标识，根据所述逻辑卷的存储信息和所述读或写数据命令中的偏移量信息确定一组或多组第一数据块标识，获取所述一组或多组第一数据块标识、所述第一树标识和第一分支标识所对应的最大节点标识，将所述最大节点标识加 1生成所述第一节点标识。

在第二种可能的实现方式中，所述集群客户处理装置，还包括：第一快照处理单元，与所述同步单元相连，用于接收所述管理装置发送的快照命令，根据所述快照命令和所述逻辑卷的存储信息确定第二存储信息，其中，所述第二存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第二树标识、第二分支标识、第二数据块标识和第二节点标识；

第二快照处理单元，与所述第一快照处理单元相连，获取与所述第二树标识、所述第二分支标识和所述第二数据块标识对应的第二最大节点标识，将所述第二最大节点标识加 1。

在第三种可能的实现方式中，所述集群客户处理装置，还包括：第一克隆处理单元，与所述同步单元相连，用于接收所述管理装置发送的克隆命令，根据所述克隆命令和所述逻辑卷的存储信息确定第三存储信息，其中，所述第三存储信息包括第三树标识、第三分支标识、第三数据块标识和第三节点标识；

第二克隆处理单元，与所述第一克隆处理单元相连，用于获取与所述第三树标识和所述第三数据块标识对应的最大分支标识，将所述最大分支标识加 1生成克隆分支标识，将所述第三树标识、所述第三数据块标识、所述克隆分支标识和克隆节点标识形成第四存储信息，建立所述第四存储信息与所述第三存储信息的克隆关系，将所述克隆关系进行广播，其中，所述克隆节点标识为 0。

在第四种可能的实现方式中，所述集群客户处理装置，还包括：删除单元，与所述同步单元相连，用于接收所述管理装置发送的文件关闭命令，将所述逻辑卷的存储信息删除。

第四个方面，本发明实施例提供一种数据处理节点，包括：

命令接收单元，用于接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

操作单元，与所述命令接收单元相连，用于根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作。

相应地，所述操作单元还用于获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中的待处理的物理数据块，若所述物理数据块存在，则直接在所述物理数据块上进行读操作。

在第二种可能的实现方式中，所述操作单元还用于若所述物理数据块不存在，则将所述每一组四元组信息中的第一节点标识以 1为步长递减，直到查找到递减后的四元组信息对应的物理数据块存在为止；若所述每一组四元组信息中的第一节点标识减为 0仍然不存在对应的物理数据块时，将所述每一组四元组信息中的第一分支标识以 1为步长递减，寻找父分支是否存在对应的物理数据块，直到查找到相应的物理数据块为止。

在第三种可能的实现方式中，所述数据处理命令用以指示写数据操作；相应地，所述操作单元还用于获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。

由上述技术方案可知，本发明实施例提供的分布式数据处理方法及装置，集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，逻辑卷的存储信息为描述逻辑数据块的四元组信息，四元组信息包括树标识、数据块标识、分支标识和节点标识，将逻辑卷均分后得到大小相等的逻辑数据块，接收用户发送的读或写数据命令，根据读或写数据命令和逻辑卷的存储信息确定第一存储信息，根据每一组四元组信息中的树标识和数据块标识确定每一组四元组存储信息对应的数据处理节点，向每一组四元组信息对应的数据处理节点发送数据处理命令，以使得每一组四元组信息对应的数据处理节点根据每一组四元组信息进行读或写的操作。通过存储信息的设置，该存储信息包括树标识、分支标识、数据块标识和节点标识，可以以逻辑卷上的每一个数据块为单位进行存储信息的管理和维护，形式更为灵活，当用户进行读或写数据操作时，集群客户处理装置仅需要确定对相应的逻辑数据块的存储信息，并据此进行相应的操作即可，避免内存空间的占用，以及分布式存储系统中需要全局设置或者读写 Bitmap而带来的资源消耗问题，提高了数据处理的效率。附图说明

实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明实施例提供的分布式数据处理系统结构示意图图 2为本发明实施例提供的一种树结构示意图；

图 3为本发明实施例提供的第一种分布式数据处理方法流程图；图 4为本发明实施例提供的第二种分布式数据处理方法流程图；图 5为本发明实施例提供的另一种树结构示意图；

图 6为本发明实施例提供的再一种树结构示意图；

图 7为本发明实施例提供的第三种分布式数据处理方法流程图；图 8为本发明实施例提供的一种集群客户处理装置结构示意图；图 9为本发明实施例提供的另一种集群客户处理装置结构示意图；图 10为本发明实施例提供的数据处理节点结构示意图；具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图 1为本发明实施例提供的分布式数据处理系统结构示意图，该示例图为实施本发明所提供的分布式处理方法的一个示例性的系统，并非唯一的可用于实施本发明方法的系统架构，本领域技术人员可以根据本章节中提供的系统以及方法的具体实施方式，构造其它未实质性变换的系统。

如图 1所示，本实施例提供一种分布式数据处理系统包括：管理装置 11、至少一个集群客户处理装置 12, 至少两个数据处理节点 13以及至少两个数据存储设备 14。用户 10作为整个分布式系统的使用者，是存储 I/O 命令和数据管理命令的发起者。

所述的管理装置 11面向用户 10提供存储管理类接口，用户可以通过该接口向管理装置发送创建逻辑卷、创建快照或链接克隆，以及使用逻辑卷的数据管理命令；管理装置 11接收到用户 10的数据管理命令后，根据所述数据管理命令执行相应操作，若用户 10发送创建逻辑卷的命令，则为用户 10分配创建的逻辑卷的树标识、分支标识和节点标识；若用户 10 发送使用逻辑卷的命令，则由所述用户 10指定或者按照配置的规则自动分配为用户 10服务的至少一个集群客户处理装置 12, 并将所述用户 10 使用的逻辑卷的树标识、分支标识和节点标识同步到所述至少一个集群客户处理装置 12, 以当所述至少一个集群客户处理装置 12接收到用户 10 发送的存储 I/O命令时，可以根据管理装置 11同步过来的信息进行相应地处理；若用户 10发送创建快照或链接克隆的命令，则为所述用户 10分配创建的快照卷或链接克隆卷的树标识、分支标识和节点标识，并在用户 10 使用所述逻辑卷的时候，将创建的快照卷或链接克隆卷的树标识、分支标识和节点标识同步到所述至少一个集群客户处理装置 12,或者将创建快照或链接克隆的命令发送给所述至少一个集群客户处理装置 12,以使得所述至少一个集群客户处理装置 12根据所述创建快照或链接克隆的命令，在已同步的信息的基础上分配创建的快照卷或链接克隆卷的树标识、分支标识和节点标识；若用户 10发送文件关闭命令，则管理装置 11将该文件关闭命令发送给所述至少一个集群客户处理装置 12,所述至少一个集群客户处理装置 12将文件管理命令对应的逻辑卷、快照卷和链接克隆卷的树标识、分支标识和节点标识都删除。

在此需要说明的是，本申请文件中直接表述的 "逻辑卷" 是指用户创建的非快照形式的普通逻辑卷， "快照逻辑卷" 或 "链接克隆逻辑卷" 此类特殊逻辑卷使用 "快照卷" 或 "链接克隆卷" 表述。

所述至少一个集群客户处理装置 12在该分布式数据处理系统中面向用户以逻辑卷的形式为用户 10提供存储服务，提供用户 10访问分布式集群的入口，接收用户 10的存储 I/O命令，将用户 10的存储 I/O命令转换成集群内部协议的数据处理命令；所述至少一个集群客户处理装置 12在该分布式数据处理系统中面向数据处理节点 13以逻辑数据块的形式进行数据存储（按照逻辑卷的大小将逻辑卷划分为大小相等的逻辑数据块），确定用户当前存储 I/O命令所涉及的逻辑卷的逻辑数据块，并确定所述逻辑数据块所在的数据处理节点 13 , 并向其发送数据处理命令，该数据处理命令包含该数据处理节点对应的（也即数据处理节点待处理的）逻辑数据块的树标识、数据块标识、分支标识和节点标识的四元组信息；另外，集群客户处理装置 12还面向管理装置 11提供接口 , 接收管理装置 11发送的数据管理命令，进行快照或者链接克隆等操作。

具体地，集群客户处理装置 12维护以逻辑卷上每一个逻辑数据块为单位的存储信息（逻辑卷上的每一个逻辑数据块代表该逻辑卷下所有的普通卷、快照卷、链接克隆卷上的每一个逻辑数据块），该存储信息主要包括该逻辑数据块的树标识、数据块标识、分支标识和节点标识的四元组信息，例如用户所创建的逻辑卷 0的第 1块逻辑数据块的在经历了快照和链接克隆等每一次操作之后的四元组信息。所述的集群客户处理装置 12自身维护以逻辑卷上每一个逻辑数据块为单位的存储信息，将会在逻辑上得到如图 2所示的卷-快照树，每一个逻辑卷的每一个逻辑数据块形成一个卷 -快照树，树上的每个节点采用四元组信息进行标识，包括树标识、数据块标识、分支标识和节点标识，其中，树标识用以指示该逻辑数据块所位于的逻辑卷（位于一个相同逻辑卷的所有的逻辑数据块的树标识都相同），数据块标识用以指示该逻辑数据块在逻辑卷中所处的位置，如按照逻辑卷的大小将逻辑卷划分为八个逻辑数据块，可以将该八个逻辑数据块从 0到 7进行编号以作为该数据块标识；当创建一个新的逻辑卷时，可以将该新的逻辑卷的分支标识设置为 0, 每当创建一个克隆卷到该逻辑卷上时，为该克隆卷分配一个新的分支标识，如 1 , 并记录该克隆卷与逻辑卷的克隆关系。节点标识用以指示对原逻辑卷或对克隆卷的快照操作，每当创建一个快照卷到该逻辑卷上时，为该快照卷分配一个新的节点标识，如 1。

如图 2所示的树结构，该树结构包括多个节点，以对应逻辑数据块在各个操作状态的存储空间，可以用四元组信息来标识树结构中的节点。为了描述方便，在以下实施例中，四元组信息的顺序均以树标识、数据块标识、分支标识和节点标识进行说明。图 2示出了树标识为 0, 且数据块标识为 0的树结构，以记录对某个逻辑卷中的某个逻辑数据块的数据处理过程。当创建一个新的逻辑卷时，对于该逻辑卷中的第一个逻辑数据块 0, 对应节点 0000, 此时该节点 0000为叶子节点，代表该逻辑数据块 0的存储空间。创建该新的逻辑卷的快照卷时，对于该逻辑数据块 0, 创建节点 0000的快照，则该节点 0000成为快照节点，增加新的节点 0001作为叶子节点。创建节点 0001的快照，则该节点 0001成为快照节点，增加新的叶子节点 0002, 创建节点 0002的快照，则该节点 0002成为快照节点，增加新的叶子节点 0003。节点 0000、节点 0001、节点 0002和节点 0003作为该树结构的一个分支，其分支标识为 0。当创建该新的逻辑卷的克隆卷时，对于该逻辑数据块 0, 对节点 0000进行克隆，增加克隆的节点 0010。当创建该克隆卷的快照卷时，对于该逻辑数据块 0, 创建该克隆的节点 0010 的快照，则该克隆的节点 0010成为快照节点，增加新的克隆的叶子节点 001 1。节点 0010和节点 0011作为该树结构的另一个分支，其分支标识为 1„

管理装置 1 1、集群客户处理装置 12和数据处理节点均可以以对图 2 所示树结构为基础来实现对数据的管理和操作。值得注意的是，为了提高对数据处理过程的管理，可以通过图 2所示的树结构的方式来实现，但是据块各个操作状态的存储空间可能存在有相应的物理数据块，则该四元组信息可以对相应的物理数据块进行标识。所述的至少两个数据处理节点 13面向集群客户处理装置 12提供接口，接收集群客户处理装置 12转发的对某逻辑数据块的数据处理命令，根据四元组信息确定当前所需要操作的逻辑数据块的存储空间，并根据确定的存储空间（对应物理数据块）对底层数据存储设备 14的进行相应的数据操作。

所述的数据存储设备 14用于根据数据处理节点 13的命令，对数据进行存储的各种操作。

上述的管理装置 11、集群客户处理装置 12以及数据处理节点 13在具体实践中可以通过软件实现，也可以通过硬件实现，具体实现方式本实施例不做限制。

上述对实施本发明方法的系统实例的各组成进行了概括性的介绍，各组成具体如何实施本发明提供的方法将在以下的实施例中进行更为详细的介绍。

图 3为本发明实施例提供的第一种分布式数据处理方法流程图。如图处理系统中对数据的处理过程。

本实施例提供的分布式数据处理方法具体包括：

步骤 A10、集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的四元组信息，所述四元组信息包括树标识、数据块标识、分支标识和节点标识；

步骤 A20、所述集群客户处理装置接收用户发送的读或写数据命令，根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，其中，所述第一存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；步骤 A30、所述集群客户处理装置根据所述每一组四元组信息中的树标识和数据块标识确定所述每一组四元组存储信息对应的数据处理节点；步骤 A40、所述集群客户处理装置向所述每一组四元组信息对应的数据处理节点发送数据处理命令，其中，所述数据处理命令包含所述数据处理节点对应的每一组四元组信息，以使得所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读或写的操作。

具体地，用户可以通过终端与该分布式数据处理系统进行交互，终端具体可以为各种终端设备，如手机，个人计算机，平板电脑，笔记本电脑等都可以作为终端。用户通过终端将数据管理命令发送给管理装置，该数据管理命令具体可以用以指示用户创建逻辑卷、创建快照或链接克隆，以及使用逻辑卷的操作。例如，用户新创建了一个文件，该文件对应至少一个逻辑卷，则用户向管理装置发送创建逻辑卷的命令，管理装置为用户分配创建的逻辑卷的三元组信息，该三元组信息包括树标识、分支标识和节点标识等存储信息。当用户使用该文件时，用户可以指定集群客户处理装置，管理装置将用户当前使用的逻辑卷的存储信息同步到用户指定的集群客户处理装置中。若用户没有指定集群客户处理装置，则管理装置可以根据配置的规则确定集群客户处理装置，并将用户当前使用的逻辑卷的存储信息同步到该集群客户处理装置中。该逻辑卷的存储信息为描述逻辑数据块的四元组信息，四元组信息包括树标识、数据块标识、分支标识和节点标识，将逻辑卷根据预设数据块容量均分后可以得到大小相等的逻辑数据块。集群客户处理装置维护该以逻辑卷上每一个逻辑数据块为单位的存储信息。

用户需要对逻辑卷上的数据块进行读或写操作时，通过终端将读或写数据命令发送给相应的集群客户处理装置，集群客户处理装置根据读或写数据命令和逻辑卷的存储信息确定第一存储信息，该第一存储信息包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识。集群客户处理装置根据每一组四元组信息确定相应的数据处理节点，并向该数据处理节点发送数据处理命令，以使得数据处理节点根据该数据处理命令中的四元组信息进行相应的读或写的操作。当系统中设置底层数据存储设备时，具体的数据均存储在数据存储设备中，则数据处理节点可以对数据存储设备进行相应的读或写的操作。当数据处理命令用以指示读数据操作时，数据处理节点将读取到的数据发送给集群客户处理装置，集群客户处理装置再将该数据发送给用户。

本实施例提供的分布式数据处理方法，集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，逻辑卷的存储信息为描述逻辑数据块的四元组信息，四元组信息包括树标识、数据块标识、分支标识和节点标识，将逻辑卷均分后得到大小相等的逻辑数据块，接收用户发送的读或写数据命令，根据读或写数据命令和逻辑卷的存储信息确定第一存储信息，根据每一组四元组信息中的树标识和数据块标识确定每一组四元组存储信息对应的数据处理节点，向每一组四元组信息对应的数据处理节点发送数据处理命令，以使得每一组四元组信息对应的数据处理节点根据每一组四元组信息进行读或写的操作。通过存储信息的设置，该存储信息包括树标识、分支标识、数据块标识和节点标识，可以以逻辑卷上的每一个数据块为单位进行存储信息的管理和维护，形式更为灵活，当用户进行读或写数据操作时，集群客户处理装置仅需要确定对相应的逻辑数据块的存储信息，并据此进行相应的操作即可，避免内存空间的占用，以及分布式存储系统中需要全局设置或者读写 Bitmap而带来的资源消耗问题，提高了数据处理的效率。

在本实施例中，步骤 A20, 所述集群客户处理装置根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，具体可以包括：所述集群客户处理装置根据所述逻辑卷的存储信息和所述读或写数据命令中的操作对象信息获取所述读或写数据命令相应的逻辑卷的第一树标识和第一分支标识，根据所述逻辑卷的存储信息和所述读或写数据命令中的偏移量信息确定一组或多组第一数据块标识，获取所述一组或多组第一数据块标识、所述第一树标识和第一分支标识所对应的最大节点标识，将所述最大节点标识加 1生成所述第一节点标识。

具体地，用户发送的读或写数据命令中携带有操作对象信息和偏移量信息。操作对象信息具体用以指示用户操作的是普通逻辑卷、快照卷还是链接克隆卷。集群客户处理装置根据逻辑卷的存储信息和该操作对象信息获取该读或写数据命令相应的逻辑卷的第一树标识和第一分支标识。偏移量信息具体用以指示用户操作的逻辑数据块所在的位置。集群客户处理装置根据逻辑卷的存储信息和该偏移量信息确定一组或多组第一数据块标识，再根据逻辑卷的存储信息获取所述一组或多组第一数据块标识、第一树标识和第一分支标识所对应的最大节点标识，将最大节点标识加 1生成第一节点标识。再结合图 2, 例如第一树标识、第一数据块标识和第一分支标识分别为 0、 0和 0, 则获取分支标识为 0的分支上节点标识最大的为

3 , 3即为第一最大节点标识，将 3加 1生成该第一节点标识，即为 4。因此，第一存储信息为 0004, 将 0004携带在数据处理命令中发送给相应的数据处理节点。树结构中增加节点 0004。集群客户处理装置可以将增加的节点同步更新给管理装置。

在一种实现方式中，若用户进行写数据操作，则该数据处理命令用以指示写数据操作，该数据处理命令中还携带有待写入的数据。数据处理节点接收到该数据处理命令时，从数据处理命令中提取出第一存储信息

0004, 获知第一存储信息 0004不存在，则为 0004分配待处理的物理数据块，将待写入的数据写入该待处理的物理数据块。

在另一种实现方式中，若用户进行读数据操作，则该数据处理命令用以指示读数据操作，数据处理节点接收到该数据处理命令时，从数据处理命令中提取第一存储信息 0004, 获知第一存储信息 0004不存在，则将第一节点标识减 1 , 减 1后的第一存储信息为 0003 , 获取 0003对应的物理数据块，读取该物理数据块中的数据。

在本实施例中，所述数据处理命令用以指示读数据操作。相应地，所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读操作，具体可以包括：

在本实施例中，所述的分布式数据处理方法还可以包括：

若所述每一组四元组信息中的第一节点标识减为 0仍然不存在对应的物理数据块时，所述数据处理节点将所述每一组四元组信息中的第一分支标识以 1为步长递减，寻找父分支是否存在对应的物理数据块，直到查找到相应的物理数据块为止。在本实施例中，所述数据处理命令用以指示写数据操作。相应地，所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行写操作，包括：

图 4为本发明实施例提供的第二种分布式数据处理方法流程图。如图 4所示，在本实施例中，步骤 A10, 所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还可以包括：步骤 A50、所述集群客户处理装置接收所述管理装置发送的快照命令，根据所述快照命令和所述逻辑卷的存储信息确定第二存储信息，其中，所述第二存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第二树标识、第二分支标识、第二数据块标识和第二节点标识；

步骤 A60、所述集群客户处理装置获取与所述第二树标识、所述第二分支标识和所述第二数据块标识对应的第二最大节点标识，将所述第二最大节点标识加 1。

具体地，用户还可以对数据进行快照操作，则用户向管理装置发送创建快照的数据管理命令，管理装置再向集群客户处理装置发送快照命令。快照命令中具体可以携带有逻辑卷信息、操作对象信息和偏移量信息，可以根据逻辑卷信息、操作对象信息和偏移量信息以及逻辑卷的存储信息确定第二树标识、第二分支标识、第二数据块标识和第二节点标识。如图 5 所示，仍以第二树标识、第二分支标识和第二数据块标识分别为 0、 0和 0 为例，获取分支标识为 0的分支上节点标识最大的为 3 , 3即为第二最大节点标识，将该第二最大节点标识加 1 , 更新为 4。在用户对数据的快照操作处理过程中，管理装置也可以进行上述处理，集群客户处理装置可以不通知数据处理节点，即数据处理节点不对快照操作进行任何处理，对数据的快照操作只在集群客户处理装置中记录，可以降低数据处理节点的工作量，避免资源的浪费。

在本实施例中，步骤 A10, 所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还可以包括：步骤 A70、所述集群客户处理装置接收所述管理装置发送的克隆命令，根据所述克隆命令和所述逻辑卷的存储信息确定第三存储信息，其中，所述第三存储信息包括第三树标识、第三分支标识、第三数据块标识和第三节点标识；

步骤 A80、所述集群客户处理装置获取与所述第三树标识和所述第三数据块标识对应的最大分支标识，将所述最大分支标识加 1生成克隆分支标识，将所述第三树标识、所述第三数据块标识、所述克隆分支标识和克隆节点标识形成第四存储信息，建立所述第四存储信息与所述第二存储信息的克隆关系，将所述克隆关系进行广播，其中，所述克隆节点标识为 0。

具体地，用户还可以对数据进行克隆操作，则用户向管理装置发送创建链接克隆的数据管理命令，管理装置再向集群客户处理装置发送克隆命令。克隆命令中具体可以携带有逻辑卷信息、操作对象信息和偏移量信息，可以根据逻辑卷信息、操作对象信息和偏移量信息以及逻辑卷的存储信息确定第三树标识、第三分支标识、第三数据块标识和第三节点标识，即第三存储信息。如图 6所示，例如第三存储信息为 0001 , 该第三存储信息对应的树结构中分支标识最大的为 1 , 即最大分支标识，则将该最大分支标识加 1生成克隆分支标识，为 2。将第三树标识、第三数据块标识、克隆分支标识和克隆节点标识形成第三存储信息，克隆节点标识设置为 0, 则该第四存储信息为 0020, 对应节点 0020, 并建立第三存储信息 0001与第四存储信息为 0020的克隆关系，图 6所示的树结构中，反映为节点 0001 与节点 0020为父子关系。在用户对数据的克隆操作处理过程中，管理装置也可以进行上述处理，集群客户处理装置可以只将克隆关系通过广播的形式使相应的数据处理节点获知，以使该数据处理节点在用户对数据进行读或写操作时，根据该克隆关系进行相应地处理，以及数据处理节点在需要获知克隆关系时再向集群客户处理装置请求，减小了集群客户处理装置的处理压力。

值得注意的，步骤 A20-步骤 A40是对读或写数据命令的处理，步骤 A50和步骤 A60是对快照命令的处理，步骤 A70和步骤 A80是对克隆命令的处理，三个处理过程可以并行执行，并不具有必然的时序关系。

在本实施例中，步骤 A10, 所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还可以包括：步骤 A90, 所述集群客户处理装置接收所述管理装置发送的文件关闭命令，将所述逻辑卷的存储信息删除。

具体地，当用户关闭正在使用的文件时，向管理装置发送文件关闭命令，管理装置将文件关闭命令发送给集群客户处理装置，集群客户处理装置将该逻辑卷的存储信息删除以释放存储空间，避免存储空间的浪费。

图 7为本发明实施例提供的第三种分布式数据处理方法流程图。如图 7所示，本实施例提供的分布式数据处理方法具体可以与本发明任意实施例提供的适用于集群客户处理装置的方法配合实现对数据的处理过程，其具体实现过程，此不再赘述。该分布式数据处理方法可以通过数据处理节点来执行，该数据数据处理节点具体可以采用软件和 /或硬件的方式来实现。

在本实施例中，该分布式数据处理方法具体包括：

步骤 B10、数据处理节点接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

步骤 B20、所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作。

本实施例提供的分布式数据处理方法，数据处理节点接收集群客户处理装置发送的数据处理命令，其中，数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识，根据数据处理命令中的每一组四元组信息进行读或写的操作。通过存储信息的设置，该存储信息包括树标识、分支标识、数据块标识和节点标识，可以以逻辑卷上的每一个数据块为单位进行存储信息的管理和维护，形式更为灵活，当用户进行读或写数据操作时，集群客户处理装置仅需要确定对相应的逻辑数据块的存储信息，并据此发送给数据处理节点数据处理命令，数据处理节点根据数据处理命令中的存储信息即可对某个物理数据块进行相应地的操作，避免内存空间的占用，以及分布式存储系统中需要全局设置或者读写 Bitmap而带来的资源消耗问题，提高了数据处理的效率。在本实施例中，所述数据处理命令用以指示读数据操作。相应地，步骤 B20, 所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作，具体可以包括：

所述数据处理节点获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中的待处理的物理数据块，若所述物理数据块存在，则直接在所述物理数据块上进行读操作。

在本实施例中，所述分布式数据处理方法还可以包括：

具体地，对于用以指示读数据操作的数据处理命令。例如该数据处理命令的四元组信息为 0004, 则数据处理节点查找四元组信息 0004对于对应的物理数据块是否存在，如存在，该物理数据块即为待处理的物理数据块，读取该物理数据块中存储的数据。在对数据的快照操作和克隆操作而产生该四元组信息 0004, 且没有通知数据处理节点的情况下，数据处理节点中可能不存在该四元组信息 0004。若四元组信息 0004对应的物理数据块不存在，且第一分支标识为 0, 则将第一节点标识以 1为步长递减，即查找 0003对应的物理数据块是否存在，若不存在，则查找 0002对应的物理数据块是否存在，直到查找到存在物理数据块为止。若第一分支标识不为 0, 例如四元组信息为 0011 , 则说明该读数据操作的对象为克隆卷，将四元组信息 001 1的节点标识减为 0, 即 0010后，仍然不存在对应的物理数据块时，根据克隆关系可知， 0010与 0000为克隆关系，则可以根据该克隆关系确定 0000 , 读取 0000对应物理数据块中存储的数据。

在本实施例中，所述数据处理命令用以指示写数据操作；相应地，步骤 B20, 所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作，具体可以包括：所述数据处理节点获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。

具体地，写数据处理命令中携带有待写入的数据，对待处理的物理数据块进行写数据处理即将待写入的数据写入该待处理的物理数据块中。

在实际实现过程中，可以根据待写入的数据的大小进行不同的处理。例如，四元组信息为 0004, 为该四元组信息 0004分配物理数据块，待写入的数据为 AB , 待写入的数据 AB的大小与待处理的物理数据块的大小相同，则可以直接将 AB写入待处理的物理数据块。若待写入的数据为 C, 数据处理节点中 0003对应的物理数据块中存储的数据为 AB ,则可以先将 AB取出放在緩存中，将 AB修改为 AC, 再将 AC写入 0004对应的待处理的物理数据块中。

图 8为本发明实施例提供的一种集群客户处理装置结构示意图。如图 8所示，本实施例提供的集群客户处理装置具体可以实现本发明任意实施例提供的应用于集群客户处理装置的分布式数据处理方法的各个步骤，此不再赘述。

本实施例提供的集群客户处理装置具体包括同步单元 21、第一读写处理单元 22、第二读写处理单元 23和发送单元 24。同步单元 21用于接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的四元组信息，所述四元组信息包括树标识、数据块标识、分支标识和节点标识。第一读写处理单元 22与所述同步单元 21相连，用于接收用户发送的读或写数据命令，根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，其中，所述第一存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识。第二读写处理单元 23与所述第一读写处理单元 22相连，用于根据所述每一组四元组信息中的树标识和数据块标识确定所述每一组四元组存储信息对应的数据处理节点。发送单元 24与所述第二读写处理单元 23相连，用于向所述每一组四元组信息对应的数据处理节点发送数据处理命令，其中，所述数据处理命令包含所述数据处理节点对应的每一组四元组信息，以使得所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读或写的操作。

本实施例提供的集群客户处理装置，同步单元 21接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，逻辑卷的存储信息为描述逻辑数据块的四元组信息，四元组信息包括树标识、数据块标识、分支标识和节点标识，将逻辑卷均分后得到大小相等的逻辑数据块，第一读写处理单元 22接收用户发送的读或写数据命令，根据读或写数据命令和逻辑卷的存储信息确定第一存储信息，第二读写处理单元 23根据每一组四元组信息中的树标识和数据块标识确定每一组四元组存储信息对应的数据处理节点，发送单元 24向每一组四元组信息对应的数据处理节点发送数据处理命令，以使得每一组四元组信息对应的数据处理节点根据每一组四元组信息进行读或写的操作。通过存储信息的设置，该存储信息包括树标识、分支标识、数据块标识和节点标识，可以以逻辑卷上的每一个数据块为单位进行存储信息的管理和维护，形式更为灵活，当用户进行读或写数据操作时，集群客户处理装置仅需要确定对相应的逻辑数据块的存储信息，并据此进行相应的操作即可，避免内存空间的占用，以及分布式存储系统中需要全局设置或者读写 Bitmap而带来的资源消耗问题，提高了数据处理的效率。

图 9为本发明实施例提供的另一种集群客户处理装置结构示意图。如图 9所示，在本实施例中，第一读写处理单元 22还用于根据所述逻辑卷的存储信息和所述读或写数据命令中的操作对象信息获取所述读或写数据命令相应的逻辑卷的第一树标识和第一分支标识，根据所述逻辑卷的存储信息和所述读或写数据命令中的偏移量信息确定一组或多组第一数据块标识，获取所述一组或多组第一数据块标识、所述第一树标识和第一分支标识所对应的最大节点标识，将所述最大节点标识加 1生成所述第一节点标识。

进一步地，在本实施例中，所述集群客户处理装置可以还包括第一快照处理单元 25和第二快照处理单元 26,所述快照处理单元 25与所述同步单元 21相连，用于接收所述管理装置发送的快照命令，根据所述快照命令和所述逻辑卷的存储信息确定第二存储信息，其中，所述第二存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第二树标识、第二分支标识、第二数据块标识和第二节点标识；所述第二快照处理单元 26 与所述第一快照处理单元 25相连获取与所述第二树标识、所述第二分支标识和所述第二数据块标识对应的第二最大节点标识，将所述第二最大节点标识加 1。

在用户对数据的快照操作处理过程中，可以不通知数据处理节点，即数据处理节点不对快照操作进行任何处理，对数据的快照操作只在集群客户处理装置中记录，可以降低数据处理节点的工作量，避免资源的浪费。

进一步地，在本实施例中，所述的集群客户处理装置还可以包括第一克隆处理单元 27和第二克隆处理单元 28。所述第一克隆处理单元 27与所述同步单元 21相连，用于接收所述管理装置发送的克隆命令，根据所述克隆命令和所述逻辑卷的存储信息确定第三存储信息，其中，所述第三存储信息包括第三树标识、第三分支标识、第三数据块标识和第三节点标识。所述第二克隆处理单元 28与所述第一克隆处理单元 27相连，用于获取与所述第三树标识和所述第三数据块标识对应的最大分支标识，将所述最大分支标识加 1生成克隆分支标识，将所述第三树标识、所述第三数据块标识、所述克隆分支标识和克隆节点标识形成第四存储信息，建立所述第四存储信息与所述第三存储信息的克隆关系，将所述克隆关系进行广播，其中，所述克隆节点标识为 0。

在用户对数据的克隆操作处理过程中，可以只将克隆关系通过广播的形式使相应的数据处理节点获知，以使该数据处理节点在用户对数据进行读或写操作时，根据该克隆关系进行相应地处理，以及数据处理节点在需要获知克隆关系时再向集群客户处理装置请求，减小了集群客户处理装置的处理压力。

在本实施例中，所述的集群客户处理装置还包括删除单元 29, 所述删除单元 29与所述同步单元 21相连，用于接收所述管理装置发送的文件关闭命令，将所述逻辑卷的存储信息删除。通过删除单元的设置，可以将用户关闭的文件对应的逻辑卷的存储信息删除以释放存储空间，避免存储空间的浪费。

图 10为本发明实施例提供的数据处理节点结构示意图。如图 10所示，本实施例提供的数据处理节点具体可以实现本发明任意实施例提供的应用于数据处理节点的分布式数据处理方法的各个步骤，在此不再赘述。

本实施例提供的数据处理节点具体包括命令接收单元 31和操作单元 32。所述命令接收单元 31用于接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识。所述操作单元 32与所述命令接收单元 31相连，用于根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作。

本实施例提供的数据处理节点，命令接收单元 31接收集群客户处理装置发送的数据处理命令，其中，数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识，操作单元 32根据数据处理命令中的每一组四元组信息进行读或写的操作。通过存储信息的设置，该存储信息包括树标识、分支标识、数据块标识和节点标识，可以以逻辑卷上的每一个数据块为单位进行存储信息的管理和维护，形式更为灵活，当用户进行读或写数据操作时，集群客户处理装置仅需要确定对相应的逻辑数据块的存储信息，并据此发送给数据处理节点数据处理命令，数据处理节点根据数据处理命令中的存储信息即可对某个物理数据块进行相应地的操作，避免内存空间的占用，以及分布式存储系统中需要全局设置或者读写 Bitmap而带来的资源消耗问题，提高了数据处理的效率。

在本实施例中，所述数据处理命令用以指示读数据操作。相应地，所述操作单元 32还用于获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中的待处理的物理数据块，若所述物理数据块存在，则直接在所述物理数据块上进行读操作。

在本实施例中，所述操作单元 32还用于若所述物理数据块不存在，则将所述每一组四元组信息中的第一节点标识以 1为步长递减，直到查找到递减后的四元组信息对应的物理数据块存在为止；若所述每一组四元组信息中的第一节点标识减为 0仍然不存在对应的物理数据块时，将所述每一组四元组信息中的第一分支标识以 1为步长递减，寻找父分支是否存在对应的物理数据块，直到查找到相应的物理数据块为止。在本实施例中，所述数据处理命令用以指示写数据操作。相应地，所述操作单元 32还用于获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括： ROM、 RAM, 磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

权利要求书

1、一种分布式数据处理方法，其特征在于，包括：

集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的四元组信息，所述四元组信息包括树标识、数据块标识、分支标识和节点标识；

2、根据权利要求 1所述的分布式数据处理方法，其特征在于，所述集群客户处理装置根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，包括：

3、根据权利要求 1或 2所述的分布式数据处理方法，其特征在于：所述数据处理命令用以指示读数据操作；

4、根据权利要求 3所述的分布式数据处理方法，其特征在于，还包括：

5、根据权利要求 1或 2所述的分布式数据处理方法，其特征在于：所述数据处理命令用以指示写数据操作；

6、根据权利要求 1所述的分布式数据处理方法，其特征在于，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

7、根据权利要求 1所述的分布式数据处理方法，其特征在于，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

8、根据权利要求 1所述的分布式数据处理方法，其特征在于，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

9、一种分布式数据处理方法，其特征在于，包括：

数据处理节点接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

10、根据权利要求 9所述的分布式数据处理方法，其特征在于：所述数据处理命令用以指示读数据操作；

所述数据处理节点获取所述数据处理命令中的每一组四元组信息，根述物理数据块存在，则直接在所述物理数据块上进行读操作。

1 1、根据权利要求 10所述的分布式数据处理方法，其特征在于，还包括：若所述物理数据块不存在，则所述数据处理节点将所述每一组四元组信息中的第一节点标识以 1为步长递减，直到查找到递减后的四元组信息对应的物理数据块存在为止；

12、根据权利要求 9所述的分布式数据处理方法，其特征在于：所述数据处理命令用以指示写数据操作；相应地，所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作，包括：

13、一种集群客户处理装置，其特征在于，包括：

同步单元，用于接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的四元组信息，所述四元组信息包括树标识、数据块标识、分支标识和节点标识；

第二读写处理单元，与所述第一读写处理单元相连，用于根据所述每一组四元组信息中的树标识和数据块标识确定所述每一组四元组存储信息对应的数据处理节点；

发送单元，与所述第二读写处理单元相连，用于向所述每一组四元组信息对应的数据处理节点发送数据处理命令，其中，所述数据处理命令包含所述数据处理节点对应的每一组四元组信息，以使得所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读或写的操作。

14、根据权利要求 13所述的集群客户处理装置，其特征在于：第一读写处理单元还用于根据所述逻辑卷的存储信息和所述读或写数据命令中的操作对象信息获取所述读或写数据命令相应的逻辑卷的第一树标识和第一分支标识，根据所述逻辑卷的存储信息和所述读或写数据命令中的偏移量信息确定一组或多组第一数据块标识，获取所述一组或多组第一数据块标识、所述第一树标识和第一分支标识所对应的最大节点标识，将所述最大节点标识加 1生成所述第一节点标识。

15、根据权利要求 13所述的集群客户处理装置，其特征在于，还包括：

第一快照处理单元，与所述同步单元相连，用于接收所述管理装置发送的快照命令，根据所述快照命令和所述逻辑卷的存储信息确定第二存储信息，其中，所述第二存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第二树标识、第二分支标识、第二数据块标识和第二节点标识；

16、根据权利要求 13所述的集群客户处理装置，其特征在于，还包括：

第一克隆处理单元，与所述同步单元相连，用于接收所述管理装置发送的克隆命令，根据所述克隆命令和所述逻辑卷的存储信息确定第三存储信息，其中，所述第三存储信息包括第三树标识、第三分支标识、第三数据块标识和第三节点标识；

17、根据权利要求 13所述的集群客户处理装置，其特征在于，还包括：

删除单元，与所述同步单元相连，用于接收所述管理装置发送的文件关闭命令，将所述逻辑卷的存储信息删除。

18、一种数据处理节点，其特征在于，包括：

19、根据权利要求 18所述的数据处理节点，其特征在于：所述数据处理命令用以指示读数据操作；

20、根据权利要求 19所述的数据处理节点，其特征在于：所述操作单元还用于若所述物理数据块不存在，则将所述每一组四元组信息中的第一节点标识以 1为步长递减，直到查找到递减后的四元组信息对应的物理数据块存在为止；若所述每一组四元组信息中的第一节点标识减为 0仍然不存在对应的物理数据块时，将所述每一组四元组信息中的第一分支标识以 1为步长递减，寻找父分支是否存在对应的物理数据块，直到查找到相应的物理数据块为止。

21、根据权利要求 19所述的数据处理节点，其特征在于：所述数据处理命令用以指示写数据操作；相应地，所述操作单元还用于获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。