CN103180852B

CN103180852B - 分布式数据处理方法及装置

Info

Publication number: CN103180852B
Application number: CN201280002840.0A
Authority: CN
Inventors: 石胜兵; 王道辉; 王炎
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2012-08-09
Filing date: 2012-08-09
Publication date: 2017-02-22
Anticipated expiration: 2032-08-09
Also published as: EP2821925B1; CN103180852A; EP2821925A1; EP2821925A4; WO2014023000A1; US20150113218A1

Abstract

本发明实施例提供一种分布式数据处理方法及装置，该分布式数据处理方法包括：集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息；集群客户处理装置接收用户发送的读或写数据命令，根据读或写数据命令和逻辑卷的存储信息确定第一存储信息；集群客户处理装置根据每一组四元组信息中的树标识和数据块标识确定每一组四元组存储信息对应的数据处理节点；集群客户处理装置向每一组四元组信息对应的数据处理节点发送数据处理命令。本发明实施例提供的分布式数据处理方法及装置，避免了分布式存储系统中需要全局设置或者读写Bitmap而带来的资源消耗问题，提高了数据处理效果。

Description

分布式数据处理方法及装置

技术领域

本发明实施例涉及数据存储技术，尤其涉及一种分布式数据处理方法及装置。

背景技术

分布式数据存储技术中，相对于磁盘、分区这些物理卷，可以将物理卷的空间加以管理之后，虚拟出逻辑卷(Logical Volume)，逻辑卷将存储虚拟化，存储不再受限于物理磁盘的大小。使用逻辑卷，文件系统可以扩展到多个磁盘上，聚合多个磁盘或磁盘分区成一个逻辑卷，创建出来的逻辑卷在用户没有写入数据的时候，可以不用真实分配物理存储空间，而是到了写入的时候，动态分配物理存储空间，从而达到节省物理存储空间，延迟成本投入等目的。

快照(Snapshot)是指定数据集合的一个完全可用的拷贝，该拷贝包括相应数据在某个时间点(拷贝的时间点)的映像。快照是一种特殊的逻辑卷，是用户创建的普通逻辑卷的准确拷贝，或者说普通逻辑卷的精确的副本。当创建快照的时候，将已存在的普通逻辑卷的逻辑存储空间标记为快照的逻辑存储空间，并分配新的逻辑存储空间供普通逻辑卷使用，创建快照之后，没有修改的数据块在逻辑存储空间上和快照共享，但是后续所有的修改都将写入普通逻辑卷自己的新逻辑存储空间中。删除普通逻辑卷的时候，在该普通逻辑卷上创建的所有快照会被全部删除。

在数据存储过程中，通常将逻辑卷按照相同大小划分为多个逻辑数据块，将逻辑数据块作为数据的最小增量单元。在记录哪些数据块已经写入数据，哪些没有写入的时候，一般会采用位图(Bitmap)的机制，将每个逻辑数据块对应一个比特位，如果已写入数据则置为1，否则置为0。当创建快照的时候，需要将当前普通逻辑卷的Bitmap备份为创建的快照的Bitmap，并重置普通逻辑卷的Bitmap。这样在每次新写入数据的时候，都需要同步更新Bitmap，尤其是在分布式数据处理系统中，需要把Bitmap的变动实时同步至各个集群客户处理装置中。另外，在读取数据时，需要集群客户端通过对当前普通逻辑卷的Bitmap和所有快照的Bitmap进行查询，确定需要的数据存储在哪个快照或普通逻辑卷中。如果Bitmap缓存在内存中，那么就会对内存造成很大的资源消耗，如果未缓存在内存中，则会对存储设备自身增加资源消耗，影响数据处理的效率。

发明内容

本发明实施例提供一种分布式数据处理方法及装置，以避免分布式存储系统中需要全局设置或者读写Bitmap而带来的资源消耗问题。

第一个方面，本发明实施例提供一种分布式数据处理方法，包括：

集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的四元组信息，所述四元组信息包括树标识、数据块标识、分支标识和节点标识；

所述集群客户处理装置接收用户发送的读或写数据命令，根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，其中，所述第一存储信息包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

所述集群客户处理装置根据所述每一组四元组信息中的树标识和数据块标识确定所述每一组四元组存储信息对应的数据处理节点；

所述集群客户处理装置向所述每一组四元组信息对应的数据处理节点发送数据处理命令，其中，所述数据处理命令包含所述数据处理节点对应的每一组四元组信息，以使得所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读或写的操作。

在第一种可能的实现方式中，所述集群客户处理装置根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，包括：

所述集群客户处理装置根据所述逻辑卷的存储信息和所述读或写数据命令中的操作对象信息获取所述读或写数据命令相应的逻辑卷的第一树标识和第一分支标识，根据所述逻辑卷的存储信息和所述读或写数据命令中的偏移量信息确定一组或多组第一数据块标识，获取所述一组或多组第一数据块标识、所述第一树标识和第一分支标识所对应的最大节点标识，将所述最大节点标识加1生成所述第一节点标识。

结合第一方面或第一方面的第一种可能的实现方式，在第二种可能的实现方式中，所述数据处理命令用以指示读数据操作；

相应地，所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读操作，包括：

所述每一组四元组信息对应的数据处理节点获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中的待处理的物理数据块，若所述物理数据块存在，则直接在所述物理数据块上进行读操作。

结合第一方面的第二种可能的实现方式，在三种可能的实现方式中，所述分布式数据处理方法，还包括：

若所述物理数据块不存在，则所述数据处理节点将所述每一组四元组信息中的第一节点标识以1为步长递减，直到查找到递减后的四元组信息对应的物理数据块存在为止；

若所述每一组四元组信息中的第一节点标识减为0仍然不存在对应的物理数据块时，所述数据处理节点将所述每一组四元组信息中的第一分支标识以1为步长递减，寻找父分支是否存在对应的物理数据块，直到查找到相应的物理数据块为止。

结合第一方面或第一方面的第一种可能的实现方式，在第四种可能的实现方式中，所述数据处理命令用以指示写数据操作；

相应地，所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行写操作，包括：

所述每一组四元组信息对应的数据处理节点获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。

在第五种可能的实现方式中，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

所述集群客户处理装置接收所述管理装置发送的快照命令，根据所述快照命令和所述逻辑卷的存储信息确定第二存储信息，其中，所述第二存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第二树标识、第二分支标识、第二数据块标识和第二节点标识；

所述集群客户处理装置获取与所述第二树标识、所述第二分支标识和所述第二数据块标识对应的第二最大节点标识，将所述第二最大节点标识加1。

在第六种可能的实现方式中，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

所述集群客户处理装置接收所述管理装置发送的克隆命令，根据所述克隆命令和所述逻辑卷的存储信息确定第三存储信息，其中，所述第三存储信息包括第三树标识、第三分支标识、第三数据块标识和第三节点标识；

所述集群客户处理装置获取与所述第三树标识和所述第三数据块标识对应的最大分支标识，将所述最大分支标识加1生成克隆分支标识，将所述第三树标识、所述第三数据块标识、所述克隆分支标识和克隆节点标识形成第四存储信息，建立所述第四存储信息与所述第三存储信息的克隆关系，将所述克隆关系进行广播，其中，所述克隆节点标识为0。

在第七种可能的实现方式中，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

所述集群客户处理装置接收所述管理装置发送的文件关闭命令，将所述逻辑卷的存储信息删除。

第二个方面，本发明实施例提供一种分布式数据处理方法，包括：

数据处理节点接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作。

在第一种可能的实现方式中，所述数据处理命令用以指示读数据操作；

相应地，所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作，包括：

所述数据处理节点获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息中的确定数据存储设备中的待处理的物理数据块，若所述物理数据块存在，则直接在所述物理数据块上进行读操作。

结合第二方面的第一种可能的实现方式，在第二种可能的实现方式中，所述分布式数据处理方法，还包括：

在第三种可能的实现方式中，所述数据处理命令用以指示写数据操作；相应地，所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作，包括：

所述数据处理节点获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息中的确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。

第三个方面，本发明实施例提供一种集群客户处理装置，包括：

同步单元，用于接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的四元组信息，所述四元组信息包括树标识、数据块标识、分支标识和节点标识；

第一读写处理单元，与所述同步单元相连，用于接收用户发送的读或写数据命令，根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，其中，所述第一存储信息包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

第二读写处理单元，与所述第一读写处理单元相连，用于根据所述每一组四元组信息中的树标识和数据块标识确定所述每一组四元组存储信息对应的数据处理节点；

发送单元，与所述第二读写处理单元相连，用于向所述每一组四元组信息对应的数据处理节点发送数据处理命令，其中，所述数据处理命令包含所述数据处理节点对应的每一组四元组信息，以使得所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读或写的操作。

在第一种可能的实现方式中，第一读写处理单元还用于根据所述逻辑卷的存储信息和所述读或写数据命令中的操作对象信息获取所述读或写数据命令相应的逻辑卷的第一树标识和第一分支标识，根据所述逻辑卷的存储信息和所述读或写数据命令中的偏移量信息确定一组或多组第一数据块标识，获取所述一组或多组第一数据块标识、所述第一树标识和第一分支标识所对应的最大节点标识，将所述最大节点标识加1生成所述第一节点标识。

在第二种可能的实现方式中，所述集群客户处理装置，还包括：

第一快照处理单元，与所述同步单元相连，用于接收所述管理装置发送的快照命令，根据所述快照命令和所述逻辑卷的存储信息确定第二存储信息，其中，所述第二存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第二树标识、第二分支标识、第二数据块标识和第二节点标识；

第二快照处理单元，与所述第一快照处理单元相连，获取与所述第二树标识、所述第二分支标识和所述第二数据块标识对应的第二最大节点标识，将所述第二最大节点标识加1。

在第三种可能的实现方式中，所述集群客户处理装置，还包括：

第一克隆处理单元，与所述同步单元相连，用于接收所述管理装置发送的克隆命令，根据所述克隆命令和所述逻辑卷的存储信息确定第三存储信息，其中，所述第三存储信息包括第三树标识、第三分支标识、第三数据块标识和第三节点标识；

第二克隆处理单元，与所述第一克隆处理单元相连，用于获取与所述第三树标识和所述第三数据块标识对应的最大分支标识，将所述最大分支标识加1生成克隆分支标识，将所述第三树标识、所述第三数据块标识、所述克隆分支标识和克隆节点标识形成第四存储信息，建立所述第四存储信息与所述第三存储信息的克隆关系，将所述克隆关系进行广播，其中，所述克隆节点标识为0。

在第四种可能的实现方式中，所述集群客户处理装置，还包括：

删除单元，与所述同步单元相连，用于接收所述管理装置发送的文件关闭命令，将所述逻辑卷的存储信息删除。

第四个方面，本发明实施例提供一种数据处理节点，包括：

命令接收单元，用于接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

操作单元，与所述命令接收单元相连，用于根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作。

相应地，所述操作单元还用于获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中的待处理的物理数据块，若所述物理数据块存在，则直接在所述物理数据块上进行读操作。

在第二种可能的实现方式中，所述操作单元还用于若所述物理数据块不存在，则将所述每一组四元组信息中的第一节点标识以1为步长递减，直到查找到递减后的四元组信息对应的物理数据块存在为止；若所述每一组四元组信息中的第一节点标识减为0仍然不存在对应的物理数据块时，将所述每一组四元组信息中的第一分支标识以1为步长递减，寻找父分支是否存在对应的物理数据块，直到查找到相应的物理数据块为止。

在第三种可能的实现方式中，所述数据处理命令用以指示写数据操作；相应地，所述操作单元还用于获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。

由上述技术方案可知，本发明实施例提供的分布式数据处理方法及装置，集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，逻辑卷的存储信息为描述逻辑数据块的四元组信息，四元组信息包括树标识、数据块标识、分支标识和节点标识，将逻辑卷均分后得到大小相等的逻辑数据块，接收用户发送的读或写数据命令，根据读或写数据命令和逻辑卷的存储信息确定第一存储信息，根据每一组四元组信息中的树标识和数据块标识确定每一组四元组存储信息对应的数据处理节点，向每一组四元组信息对应的数据处理节点发送数据处理命令，以使得每一组四元组信息对应的数据处理节点根据每一组四元组信息进行读或写的操作。通过存储信息的设置，该存储信息包括树标识、分支标识、数据块标识和节点标识，可以以逻辑卷上的每一个数据块为单位进行存储信息的管理和维护，形式更为灵活，当用户进行读或写数据操作时，集群客户处理装置仅需要确定对相应的逻辑数据块的存储信息，并据此进行相应的操作即可，避免内存空间的占用，以及分布式存储系统中需要全局设置或者读写Bitmap而带来的资源消耗问题，提高了数据处理的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的分布式数据处理系统结构示意图

图2为本发明实施例提供的一种树结构示意图；

图3为本发明实施例提供的第一种分布式数据处理方法流程图；

图4为本发明实施例提供的第二种分布式数据处理方法流程图；

图5为本发明实施例提供的另一种树结构示意图；

图6为本发明实施例提供的再一种树结构示意图；

图7为本发明实施例提供的第三种分布式数据处理方法流程图；

图8为本发明实施例提供的一种集群客户处理装置结构示意图；

图9为本发明实施例提供的另一种集群客户处理装置结构示意图；

图10为本发明实施例提供的数据处理节点结构示意图；

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的分布式数据处理系统结构示意图，该示例图为实施本发明所提供的分布式处理方法的一个示例性的系统，并非唯一的可用于实施本发明方法的系统架构，本领域技术人员可以根据本章节中提供的系统以及方法的具体实施方式，构造其它未实质性变换的系统。

如图1所示，本实施例提供一种分布式数据处理系统包括：管理装置11、至少一个集群客户处理装置12，至少两个数据处理节点13以及至少两个数据存储设备14。用户10作为整个分布式系统的使用者，是存储I/O命令和数据管理命令的发起者。

所述的管理装置11面向用户10提供存储管理类接口，用户可以通过该接口向管理装置发送创建逻辑卷、创建快照或链接克隆，以及使用逻辑卷的数据管理命令；管理装置11接收到用户10的数据管理命令后，根据所述数据管理命令执行相应操作，若用户10发送创建逻辑卷的命令，则为用户10分配创建的逻辑卷的树标识、分支标识和节点标识；若用户10发送使用逻辑卷的命令，则由所述用户10指定或者按照配置的规则自动分配为用户10服务的至少一个集群客户处理装置12，并将所述用户10使用的逻辑卷的树标识、分支标识和节点标识同步到所述至少一个集群客户处理装置12，以当所述至少一个集群客户处理装置12接收到用户10发送的存储I/O命令时，可以根据管理装置11同步过来的信息进行相应地处理；若用户10发送创建快照或链接克隆的命令，则为所述用户10分配创建的快照卷或链接克隆卷的树标识、分支标识和节点标识，并在用户10使用所述逻辑卷的时候，将创建的快照卷或链接克隆卷的树标识、分支标识和节点标识同步到所述至少一个集群客户处理装置12，或者将创建快照或链接克隆的命令发送给所述至少一个集群客户处理装置12，以使得所述至少一个集群客户处理装置12根据所述创建快照或链接克隆的命令，在已同步的信息的基础上分配创建的快照卷或链接克隆卷的树标识、分支标识和节点标识；若用户10发送文件关闭命令，则管理装置11将该文件关闭命令发送给所述至少一个集群客户处理装置12，所述至少一个集群客户处理装置12将文件管理命令对应的逻辑卷、快照卷和链接克隆卷的树标识、分支标识和节点标识都删除。

在此需要说明的是，本申请文件中直接表述的“逻辑卷”是指用户创建的非快照形式的普通逻辑卷，“快照逻辑卷”或“链接克隆逻辑卷”此类特殊逻辑卷使用“快照卷”或“链接克隆卷”表述。

所述至少一个集群客户处理装置12在该分布式数据处理系统中面向用户以逻辑卷的形式为用户10提供存储服务，提供用户10访问分布式集群的入口，接收用户10的存储I/O命令，将用户10的存储I/O命令转换成集群内部协议的数据处理命令；所述至少一个集群客户处理装置12在该分布式数据处理系统中面向数据处理节点13以逻辑数据块的形式进行数据存储(按照逻辑卷的大小将逻辑卷划分为大小相等的逻辑数据块)，确定用户当前存储I/O命令所涉及的逻辑卷的逻辑数据块，并确定所述逻辑数据块所在的数据处理节点13，并向其发送数据处理命令，该数据处理命令包含该数据处理节点对应的(也即数据处理节点待处理的)逻辑数据块的树标识、数据块标识、分支标识和节点标识的四元组信息；另外，集群客户处理装置12还面向管理装置11提供接口，接收管理装置11发送的数据管理命令，进行快照或者链接克隆等操作。

具体地，集群客户处理装置12维护以逻辑卷上每一个逻辑数据块为单位的存储信息(逻辑卷上的每一个逻辑数据块代表该逻辑卷下所有的普通卷、快照卷、链接克隆卷上的每一个逻辑数据块)，该存储信息主要包括该逻辑数据块的树标识、数据块标识、分支标识和节点标识的四元组信息，例如用户所创建的逻辑卷0的第1块逻辑数据块的在经历了快照和链接克隆等每一次操作之后的四元组信息。所述的集群客户处理装置12自身维护以逻辑卷上每一个逻辑数据块为单位的存储信息，将会在逻辑上得到如图2所示的卷-快照树，每一个逻辑卷的每一个逻辑数据块形成一个卷-快照树，树上的每个节点采用四元组信息进行标识，包括树标识、数据块标识、分支标识和节点标识，其中，树标识用以指示该逻辑数据块所位于的逻辑卷(位于一个相同逻辑卷的所有的逻辑数据块的树标识都相同)，数据块标识用以指示该逻辑数据块在逻辑卷中所处的位置，如按照逻辑卷的大小将逻辑卷划分为八个逻辑数据块，可以将该八个逻辑数据块从0到7进行编号以作为该数据块标识；当创建一个新的逻辑卷时，可以将该新的逻辑卷的分支标识设置为0，每当创建一个克隆卷到该逻辑卷上时，为该克隆卷分配一个新的分支标识，如1，并记录该克隆卷与逻辑卷的克隆关系。节点标识用以指示对原逻辑卷或对克隆卷的快照操作，每当创建一个快照卷到该逻辑卷上时，为该快照卷分配一个新的节点标识，如1。

如图2所示的树结构，该树结构包括多个节点，以对应逻辑数据块在各个操作状态的存储空间，可以用四元组信息来标识树结构中的节点。为了描述方便，在以下实施例中，四元组信息的顺序均以树标识、数据块标识、分支标识和节点标识进行说明。图2示出了树标识为0，且数据块标识为0的树结构，以记录对某个逻辑卷中的某个逻辑数据块的数据处理过程。当创建一个新的逻辑卷时，对于该逻辑卷中的第一个逻辑数据块0，对应节点0000，此时该节点0000为叶子节点，代表该逻辑数据块0的存储空间。创建该新的逻辑卷的快照卷时，对于该逻辑数据块0，创建节点0000的快照，则该节点0000成为快照节点，增加新的节点0001作为叶子节点。创建节点0001的快照，则该节点0001成为快照节点，增加新的叶子节点0002，创建节点0002的快照，则该节点0002成为快照节点，增加新的叶子节点0003。节点0000、节点0001、节点0002和节点0003作为该树结构的一个分支，其分支标识为0。当创建该新的逻辑卷的克隆卷时，对于该逻辑数据块0，对节点0000进行克隆，增加克隆的节点0010。当创建该克隆卷的快照卷时，对于该逻辑数据块0，创建该克隆的节点0010的快照，则该克隆的节点0010成为快照节点，增加新的克隆的叶子节点0011。节点0010和节点0011作为该树结构的另一个分支，其分支标识为1。

管理装置11、集群客户处理装置12和数据处理节点均可以以对图2所示树结构为基础来实现对数据的管理和操作。值得注意的是，为了提高对数据处理过程的管理，可以通过图2所示的树结构的方式来实现，但是本领域技术人员也可以通过其他方式来实现。在数据处理节点中，逻辑数据块各个操作状态的存储空间可能存在有相应的物理数据块，则该四元组信息可以对相应的物理数据块进行标识。

所述的至少两个数据处理节点13面向集群客户处理装置12提供接口，接收集群客户处理装置12转发的对某逻辑数据块的数据处理命令，根据四元组信息确定当前所需要操作的逻辑数据块的存储空间，并根据确定的存储空间(对应物理数据块)对底层数据存储设备14的进行相应的数据操作。

所述的数据存储设备14用于根据数据处理节点13的命令，对数据进行存储的各种操作。

上述的管理装置11、集群客户处理装置12以及数据处理节点13在具体实践中可以通过软件实现，也可以通过硬件实现，具体实现方式本实施例不做限制。

上述对实施本发明方法的系统实例的各组成进行了概括性的介绍，各组成具体如何实施本发明提供的方法将在以下的实施例中进行更为详细的介绍。

图3为本发明实施例提供的第一种分布式数据处理方法流程图。如图3所示，本实施例提供的分布式数据处理方法具体可以应用于分布式数据处理系统中对数据的处理过程。

本实施例提供的分布式数据处理方法具体包括：

步骤A10、集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的四元组信息，所述四元组信息包括树标识、数据块标识、分支标识和节点标识；

步骤A20、所述集群客户处理装置接收用户发送的读或写数据命令，根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，其中，所述第一存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

步骤A30、所述集群客户处理装置根据所述每一组四元组信息中的树标识和数据块标识确定所述每一组四元组存储信息对应的数据处理节点；

步骤A40、所述集群客户处理装置向所述每一组四元组信息对应的数据处理节点发送数据处理命令，其中，所述数据处理命令包含所述数据处理节点对应的每一组四元组信息，以使得所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读或写的操作。

具体地，用户可以通过终端与该分布式数据处理系统进行交互，终端具体可以为各种终端设备，如手机，个人计算机，平板电脑，笔记本电脑等都可以作为终端。用户通过终端将数据管理命令发送给管理装置，该数据管理命令具体可以用以指示用户创建逻辑卷、创建快照或链接克隆，以及使用逻辑卷的操作。例如，用户新创建了一个文件，该文件对应至少一个逻辑卷，则用户向管理装置发送创建逻辑卷的命令，管理装置为用户分配创建的逻辑卷的三元组信息，该三元组信息包括树标识、分支标识和节点标识等存储信息。当用户使用该文件时，用户可以指定集群客户处理装置，管理装置将用户当前使用的逻辑卷的存储信息同步到用户指定的集群客户处理装置中。若用户没有指定集群客户处理装置，则管理装置可以根据配置的规则确定集群客户处理装置，并将用户当前使用的逻辑卷的存储信息同步到该集群客户处理装置中。该逻辑卷的存储信息为描述逻辑数据块的四元组信息，四元组信息包括树标识、数据块标识、分支标识和节点标识，将逻辑卷根据预设数据块容量均分后可以得到大小相等的逻辑数据块。集群客户处理装置维护该以逻辑卷上每一个逻辑数据块为单位的存储信息。

用户需要对逻辑卷上的数据块进行读或写操作时，通过终端将读或写数据命令发送给相应的集群客户处理装置，集群客户处理装置根据读或写数据命令和逻辑卷的存储信息确定第一存储信息，该第一存储信息包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识。集群客户处理装置根据每一组四元组信息确定相应的数据处理节点，并向该数据处理节点发送数据处理命令，以使得数据处理节点根据该数据处理命令中的四元组信息进行相应的读或写的操作。当系统中设置底层数据存储设备时，具体的数据均存储在数据存储设备中，则数据处理节点可以对数据存储设备进行相应的读或写的操作。当数据处理命令用以指示读数据操作时，数据处理节点将读取到的数据发送给集群客户处理装置，集群客户处理装置再将该数据发送给用户。

本实施例提供的分布式数据处理方法，集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，逻辑卷的存储信息为描述逻辑数据块的四元组信息，四元组信息包括树标识、数据块标识、分支标识和节点标识，将逻辑卷均分后得到大小相等的逻辑数据块，接收用户发送的读或写数据命令，根据读或写数据命令和逻辑卷的存储信息确定第一存储信息，根据每一组四元组信息中的树标识和数据块标识确定每一组四元组存储信息对应的数据处理节点，向每一组四元组信息对应的数据处理节点发送数据处理命令，以使得每一组四元组信息对应的数据处理节点根据每一组四元组信息进行读或写的操作。通过存储信息的设置，该存储信息包括树标识、分支标识、数据块标识和节点标识，可以以逻辑卷上的每一个数据块为单位进行存储信息的管理和维护，形式更为灵活，当用户进行读或写数据操作时，集群客户处理装置仅需要确定对相应的逻辑数据块的存储信息，并据此进行相应的操作即可，避免内存空间的占用，以及分布式存储系统中需要全局设置或者读写Bitmap而带来的资源消耗问题，提高了数据处理的效率。

在本实施例中，步骤A20，所述集群客户处理装置根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，具体可以包括：

具体地，用户发送的读或写数据命令中携带有操作对象信息和偏移量信息。操作对象信息具体用以指示用户操作的是普通逻辑卷、快照卷还是链接克隆卷。集群客户处理装置根据逻辑卷的存储信息和该操作对象信息获取该读或写数据命令相应的逻辑卷的第一树标识和第一分支标识。偏移量信息具体用以指示用户操作的逻辑数据块所在的位置。集群客户处理装置根据逻辑卷的存储信息和该偏移量信息确定一组或多组第一数据块标识，再根据逻辑卷的存储信息获取所述一组或多组第一数据块标识、第一树标识和第一分支标识所对应的最大节点标识，将最大节点标识加1生成第一节点标识。再结合图2，例如第一树标识、第一数据块标识和第一分支标识分别为0、0和0，则获取分支标识为0的分支上节点标识最大的为3，3即为第一最大节点标识，将3加1生成该第一节点标识，即为4。因此，第一存储信息为0004，将0004携带在数据处理命令中发送给相应的数据处理节点。树结构中增加节点0004。集群客户处理装置可以将增加的节点同步更新给管理装置。

在一种实现方式中，若用户进行写数据操作，则该数据处理命令用以指示写数据操作，该数据处理命令中还携带有待写入的数据。数据处理节点接收到该数据处理命令时，从数据处理命令中提取出第一存储信息0004，获知第一存储信息0004不存在，则为0004分配待处理的物理数据块，将待写入的数据写入该待处理的物理数据块。

在另一种实现方式中，若用户进行读数据操作，则该数据处理命令用以指示读数据操作，数据处理节点接收到该数据处理命令时，从数据处理命令中提取第一存储信息0004，获知第一存储信息0004不存在，则将第一节点标识减1，减1后的第一存储信息为0003，获取0003对应的物理数据块，读取该物理数据块中的数据。

在本实施例中，所述数据处理命令用以指示读数据操作。相应地，所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读操作，具体可以包括：

在本实施例中，所述的分布式数据处理方法还可以包括：

在本实施例中，所述数据处理命令用以指示写数据操作。相应地，所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行写操作，包括：

图4为本发明实施例提供的第二种分布式数据处理方法流程图。如图4所示，在本实施例中，步骤A10，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还可以包括：

步骤A50、所述集群客户处理装置接收所述管理装置发送的快照命令，根据所述快照命令和所述逻辑卷的存储信息确定第二存储信息，其中，所述第二存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第二树标识、第二分支标识、第二数据块标识和第二节点标识；

步骤A60、所述集群客户处理装置获取与所述第二树标识、所述第二分支标识和所述第二数据块标识对应的第二最大节点标识，将所述第二最大节点标识加1。

具体地，用户还可以对数据进行快照操作，则用户向管理装置发送创建快照的数据管理命令，管理装置再向集群客户处理装置发送快照命令。快照命令中具体可以携带有逻辑卷信息、操作对象信息和偏移量信息，可以根据逻辑卷信息、操作对象信息和偏移量信息以及逻辑卷的存储信息确定第二树标识、第二分支标识、第二数据块标识和第二节点标识。如图5所示，仍以第二树标识、第二分支标识和第二数据块标识分别为0、0和0为例，获取分支标识为0的分支上节点标识最大的为3，3即为第二最大节点标识，将该第二最大节点标识加1，更新为4。在用户对数据的快照操作处理过程中，管理装置也可以进行上述处理，集群客户处理装置可以不通知数据处理节点，即数据处理节点不对快照操作进行任何处理，对数据的快照操作只在集群客户处理装置中记录，可以降低数据处理节点的工作量，避免资源的浪费。

在本实施例中，步骤A10，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还可以包括：

步骤A70、所述集群客户处理装置接收所述管理装置发送的克隆命令，根据所述克隆命令和所述逻辑卷的存储信息确定第三存储信息，其中，所述第三存储信息包括第三树标识、第三分支标识、第三数据块标识和第三节点标识；

步骤A80、所述集群客户处理装置获取与所述第三树标识和所述第三数据块标识对应的最大分支标识，将所述最大分支标识加1生成克隆分支标识，将所述第三树标识、所述第三数据块标识、所述克隆分支标识和克隆节点标识形成第四存储信息，建立所述第四存储信息与所述第二存储信息的克隆关系，将所述克隆关系进行广播，其中，所述克隆节点标识为0。

具体地，用户还可以对数据进行克隆操作，则用户向管理装置发送创建链接克隆的数据管理命令，管理装置再向集群客户处理装置发送克隆命令。克隆命令中具体可以携带有逻辑卷信息、操作对象信息和偏移量信息，可以根据逻辑卷信息、操作对象信息和偏移量信息以及逻辑卷的存储信息确定第三树标识、第三分支标识、第三数据块标识和第三节点标识，即第三存储信息。如图6所示，例如第三存储信息为0001，该第三存储信息对应的树结构中分支标识最大的为1，即最大分支标识，则将该最大分支标识加1生成克隆分支标识，为2。将第三树标识、第三数据块标识、克隆分支标识和克隆节点标识形成第三存储信息，克隆节点标识设置为0，则该第四存储信息为0020，对应节点0020，并建立第三存储信息0001与第四存储信息为0020的克隆关系，图6所示的树结构中，反映为节点0001与节点0020为父子关系。在用户对数据的克隆操作处理过程中，管理装置也可以进行上述处理，集群客户处理装置可以只将克隆关系通过广播的形式使相应的数据处理节点获知，以使该数据处理节点在用户对数据进行读或写操作时，根据该克隆关系进行相应地处理，以及数据处理节点在需要获知克隆关系时再向集群客户处理装置请求，减小了集群客户处理装置的处理压力。

值得注意的，步骤A20-步骤A40是对读或写数据命令的处理，步骤A50和步骤A60是对快照命令的处理，步骤A70和步骤A80是对克隆命令的处理，三个处理过程可以并行执行，并不具有必然的时序关系。

步骤A90，所述集群客户处理装置接收所述管理装置发送的文件关闭命令，将所述逻辑卷的存储信息删除。

具体地，当用户关闭正在使用的文件时，向管理装置发送文件关闭命令，管理装置将文件关闭命令发送给集群客户处理装置，集群客户处理装置将该逻辑卷的存储信息删除以释放存储空间，避免存储空间的浪费。

图7为本发明实施例提供的第三种分布式数据处理方法流程图。如图7所示，本实施例提供的分布式数据处理方法具体可以与本发明任意实施例提供的适用于集群客户处理装置的方法配合实现对数据的处理过程，其具体实现过程，此不再赘述。该分布式数据处理方法可以通过数据处理节点来执行，该数据数据处理节点具体可以采用软件和/或硬件的方式来实现。

在本实施例中，该分布式数据处理方法具体包括：

步骤B10、数据处理节点接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；

步骤B20、所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作。

本实施例提供的分布式数据处理方法，数据处理节点接收集群客户处理装置发送的数据处理命令，其中，数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识，根据数据处理命令中的每一组四元组信息进行读或写的操作。通过存储信息的设置，该存储信息包括树标识、分支标识、数据块标识和节点标识，可以以逻辑卷上的每一个数据块为单位进行存储信息的管理和维护，形式更为灵活，当用户进行读或写数据操作时，集群客户处理装置仅需要确定对相应的逻辑数据块的存储信息，并据此发送给数据处理节点数据处理命令，数据处理节点根据数据处理命令中的存储信息即可对某个物理数据块进行相应地的操作，避免内存空间的占用，以及分布式存储系统中需要全局设置或者读写Bitmap而带来的资源消耗问题，提高了数据处理的效率。

在本实施例中，所述数据处理命令用以指示读数据操作。相应地，步骤B20，所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作，具体可以包括：

所述数据处理节点获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中的待处理的物理数据块，若所述物理数据块存在，则直接在所述物理数据块上进行读操作。

在本实施例中，所述分布式数据处理方法还可以包括：

具体地，对于用以指示读数据操作的数据处理命令。例如该数据处理命令的四元组信息为0004，则数据处理节点查找四元组信息0004对于对应的物理数据块是否存在，如存在，该物理数据块即为待处理的物理数据块，读取该物理数据块中存储的数据。在对数据的快照操作和克隆操作而产生该四元组信息0004，且没有通知数据处理节点的情况下，数据处理节点中可能不存在该四元组信息0004。若四元组信息0004对应的物理数据块不存在，且第一分支标识为0，则将第一节点标识以1为步长递减，即查找0003对应的物理数据块是否存在，若不存在，则查找0002对应的物理数据块是否存在，直到查找到存在物理数据块为止。若第一分支标识不为0，例如四元组信息为0011，则说明该读数据操作的对象为克隆卷，将四元组信息0011的节点标识减为0，即0010后，仍然不存在对应的物理数据块时，根据克隆关系可知，0010与0000为克隆关系，则可以根据该克隆关系确定0000，读取0000对应物理数据块中存储的数据。

在本实施例中，所述数据处理命令用以指示写数据操作；相应地，步骤B20，所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作，具体可以包括：

所述数据处理节点获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。

具体地，写数据处理命令中携带有待写入的数据，对待处理的物理数据块进行写数据处理即将待写入的数据写入该待处理的物理数据块中。

在实际实现过程中，可以根据待写入的数据的大小进行不同的处理。例如，四元组信息为0004，为该四元组信息0004分配物理数据块，待写入的数据为AB，待写入的数据AB的大小与待处理的物理数据块的大小相同，则可以直接将AB写入待处理的物理数据块。若待写入的数据为C，数据处理节点中0003对应的物理数据块中存储的数据为AB，则可以先将AB取出放在缓存中，将AB修改为AC，再将AC写入0004对应的待处理的物理数据块中。

图8为本发明实施例提供的一种集群客户处理装置结构示意图。如图8所示，本实施例提供的集群客户处理装置具体可以实现本发明任意实施例提供的应用于集群客户处理装置的分布式数据处理方法的各个步骤，此不再赘述。

本实施例提供的集群客户处理装置具体包括同步单元21、第一读写处理单元22、第二读写处理单元23和发送单元24。同步单元21用于接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的四元组信息，所述四元组信息包括树标识、数据块标识、分支标识和节点标识。第一读写处理单元22与所述同步单元21相连，用于接收用户发送的读或写数据命令，根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，其中，所述第一存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识。第二读写处理单元23与所述第一读写处理单元22相连，用于根据所述每一组四元组信息中的树标识和数据块标识确定所述每一组四元组存储信息对应的数据处理节点。发送单元24与所述第二读写处理单元23相连，用于向所述每一组四元组信息对应的数据处理节点发送数据处理命令，其中，所述数据处理命令包含所述数据处理节点对应的每一组四元组信息，以使得所述每一组四元组信息对应的数据处理节点根据所述每一组四元组信息进行读或写的操作。

本实施例提供的集群客户处理装置，同步单元21接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，逻辑卷的存储信息为描述逻辑数据块的四元组信息，四元组信息包括树标识、数据块标识、分支标识和节点标识，将逻辑卷均分后得到大小相等的逻辑数据块，第一读写处理单元22接收用户发送的读或写数据命令，根据读或写数据命令和逻辑卷的存储信息确定第一存储信息，第二读写处理单元23根据每一组四元组信息中的树标识和数据块标识确定每一组四元组存储信息对应的数据处理节点，发送单元24向每一组四元组信息对应的数据处理节点发送数据处理命令，以使得每一组四元组信息对应的数据处理节点根据每一组四元组信息进行读或写的操作。通过存储信息的设置，该存储信息包括树标识、分支标识、数据块标识和节点标识，可以以逻辑卷上的每一个数据块为单位进行存储信息的管理和维护，形式更为灵活，当用户进行读或写数据操作时，集群客户处理装置仅需要确定对相应的逻辑数据块的存储信息，并据此进行相应的操作即可，避免内存空间的占用，以及分布式存储系统中需要全局设置或者读写Bitmap而带来的资源消耗问题，提高了数据处理的效率。

图9为本发明实施例提供的另一种集群客户处理装置结构示意图。如图9所示，在本实施例中，第一读写处理单元22还用于根据所述逻辑卷的存储信息和所述读或写数据命令中的操作对象信息获取所述读或写数据命令相应的逻辑卷的第一树标识和第一分支标识，根据所述逻辑卷的存储信息和所述读或写数据命令中的偏移量信息确定一组或多组第一数据块标识，获取所述一组或多组第一数据块标识、所述第一树标识和第一分支标识所对应的最大节点标识，将所述最大节点标识加1生成所述第一节点标识。

进一步地，在本实施例中，所述集群客户处理装置可以还包括第一快照处理单元25和第二快照处理单元26，所述快照处理单元25与所述同步单元21相连，用于接收所述管理装置发送的快照命令，根据所述快照命令和所述逻辑卷的存储信息确定第二存储信息，其中，所述第二存储信息包括一组或多组四元组信息，所述每一组四元组信息包括第二树标识、第二分支标识、第二数据块标识和第二节点标识；所述第二快照处理单元26与所述第一快照处理单元25相连获取与所述第二树标识、所述第二分支标识和所述第二数据块标识对应的第二最大节点标识，将所述第二最大节点标识加1。

在用户对数据的快照操作处理过程中，可以不通知数据处理节点，即数据处理节点不对快照操作进行任何处理，对数据的快照操作只在集群客户处理装置中记录，可以降低数据处理节点的工作量，避免资源的浪费。

进一步地，在本实施例中，所述的集群客户处理装置还可以包括第一克隆处理单元27和第二克隆处理单元28。所述第一克隆处理单元27与所述同步单元21相连，用于接收所述管理装置发送的克隆命令，根据所述克隆命令和所述逻辑卷的存储信息确定第三存储信息，其中，所述第三存储信息包括第三树标识、第三分支标识、第三数据块标识和第三节点标识。所述第二克隆处理单元28与所述第一克隆处理单元27相连，用于获取与所述第三树标识和所述第三数据块标识对应的最大分支标识，将所述最大分支标识加1生成克隆分支标识，将所述第三树标识、所述第三数据块标识、所述克隆分支标识和克隆节点标识形成第四存储信息，建立所述第四存储信息与所述第三存储信息的克隆关系，将所述克隆关系进行广播，其中，所述克隆节点标识为0。

在用户对数据的克隆操作处理过程中，可以只将克隆关系通过广播的形式使相应的数据处理节点获知，以使该数据处理节点在用户对数据进行读或写操作时，根据该克隆关系进行相应地处理，以及数据处理节点在需要获知克隆关系时再向集群客户处理装置请求，减小了集群客户处理装置的处理压力。

在本实施例中，所述的集群客户处理装置还包括删除单元29，所述删除单元29与所述同步单元21相连，用于接收所述管理装置发送的文件关闭命令，将所述逻辑卷的存储信息删除。通过删除单元的设置，可以将用户关闭的文件对应的逻辑卷的存储信息删除以释放存储空间，避免存储空间的浪费。

图10为本发明实施例提供的数据处理节点结构示意图。如图10所示，本实施例提供的数据处理节点具体可以实现本发明任意实施例提供的应用于数据处理节点的分布式数据处理方法的各个步骤，在此不再赘述。

本实施例提供的数据处理节点具体包括命令接收单元31和操作单元32。所述命令接收单元31用于接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识。所述操作单元32与所述命令接收单元31相连，用于根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作。

本实施例提供的数据处理节点，命令接收单元31接收集群客户处理装置发送的数据处理命令，其中，数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识，操作单元32根据数据处理命令中的每一组四元组信息进行读或写的操作。通过存储信息的设置，该存储信息包括树标识、分支标识、数据块标识和节点标识，可以以逻辑卷上的每一个数据块为单位进行存储信息的管理和维护，形式更为灵活，当用户进行读或写数据操作时，集群客户处理装置仅需要确定对相应的逻辑数据块的存储信息，并据此发送给数据处理节点数据处理命令，数据处理节点根据数据处理命令中的存储信息即可对某个物理数据块进行相应地的操作，避免内存空间的占用，以及分布式存储系统中需要全局设置或者读写Bitmap而带来的资源消耗问题，提高了数据处理的效率。

在本实施例中，所述数据处理命令用以指示读数据操作。相应地，所述操作单元32还用于获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中的待处理的物理数据块，若所述物理数据块存在，则直接在所述物理数据块上进行读操作。

在本实施例中，所述操作单元32还用于若所述物理数据块不存在，则将所述每一组四元组信息中的第一节点标识以1为步长递减，直到查找到递减后的四元组信息对应的物理数据块存在为止；若所述每一组四元组信息中的第一节点标识减为0仍然不存在对应的物理数据块时，将所述每一组四元组信息中的第一分支标识以1为步长递减，寻找父分支是否存在对应的物理数据块，直到查找到相应的物理数据块为止。

在本实施例中，所述数据处理命令用以指示写数据操作。相应地，所述操作单元32还用于获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种分布式数据处理方法，其特征在于，包括：

集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的多组四元组信息，每组四元组信息包括树标识、数据块标识、分支标识和节点标识；其中，所述树标识用以指示所述逻辑数据块所位于的逻辑卷，所述数据块标识用以指示所述逻辑数据块在所述逻辑卷中所处的位置，每当创建一个克隆卷到所述逻辑卷上时，为所述克隆卷分配一个新的分支标识，所述分支标识用以记录所述克隆卷与所述逻辑卷的克隆关系，所述节点标识用以指示对原逻辑卷或对克隆卷的快照操作，每当创建一个快照卷到所述逻辑卷上时，为所述快照卷分配一个新的节点标识；

2.根据权利要求1所述的分布式数据处理方法，其特征在于，所述集群客户处理装置根据所述读或写数据命令和所述逻辑卷的存储信息确定第一存储信息，包括：

3.根据权利要求1或2所述的分布式数据处理方法，其特征在于：所述数据处理命令用以指示读数据操作；

4.根据权利要求3所述的分布式数据处理方法，其特征在于，还包括：

5.根据权利要求1或2所述的分布式数据处理方法，其特征在于：所述数据处理命令用以指示写数据操作；

6.根据权利要求1所述的分布式数据处理方法，其特征在于，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

7.根据权利要求1所述的分布式数据处理方法，其特征在于，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

8.根据权利要求1所述的分布式数据处理方法，其特征在于，所述集群客户处理装置接收管理装置发送的用户当前使用的逻辑卷的存储信息之后，所述方法还包括：

9.一种分布式数据处理方法，其特征在于，包括：

数据处理节点接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；其中，所述树标识用以指示逻辑数据块所位于的逻辑卷，所述数据块标识用以指示所述逻辑数据块在所述逻辑卷中所处的位置，每当创建一个克隆卷到所述逻辑卷上时，为所述克隆卷分配一个新的分支标识，所述分支标识用以记录所述克隆卷与所述逻辑卷的克隆关系，所述节点标识用以指示对原逻辑卷或对克隆卷的快照操作，每当创建一个快照卷到所述逻辑卷上时，为所述快照卷分配一个新的节点标识；

10.根据权利要求9所述的分布式数据处理方法，其特征在于：所述数据处理命令用以指示读数据操作；

11.根据权利要求10所述的分布式数据处理方法，其特征在于，还包括：

12.根据权利要求9所述的分布式数据处理方法，其特征在于：所述数据处理命令用以指示写数据操作；相应地，所述数据处理节点根据所述数据处理命令中的所述每一组四元组信息进行读或写的操作，包括：

13.一种集群客户处理装置，其特征在于，包括：

同步单元，用于接收管理装置发送的用户当前使用的逻辑卷的存储信息，其中，所述逻辑卷的存储信息为描述所述逻辑卷上每一个逻辑数据块的多组四元组信息，每组四元组信息包括树标识、数据块标识、分支标识和节点标识；其中，所述树标识用以指示所述逻辑数据块所位于的逻辑卷，所述数据块标识用以指示所述逻辑数据块在所述逻辑卷中所处的位置，每当创建一个克隆卷到所述逻辑卷上时，为所述克隆卷分配一个新的分支标识，所述分支标识用以记录所述克隆卷与所述逻辑卷的克隆关系，所述节点标识用以指示对原逻辑卷或对克隆卷的快照操作，每当创建一个快照卷到所述逻辑卷上时，为所述快照卷分配一个新的节点标识；

14.根据权利要求13所述的集群客户处理装置，其特征在于：

第一读写处理单元还用于根据所述逻辑卷的存储信息和所述读或写数据命令中的操作对象信息获取所述读或写数据命令相应的逻辑卷的第一树标识和第一分支标识，根据所述逻辑卷的存储信息和所述读或写数据命令中的偏移量信息确定一组或多组第一数据块标识，获取所述一组或多组第一数据块标识、所述第一树标识和第一分支标识所对应的最大节点标识，将所述最大节点标识加1生成所述第一节点标识。

15.根据权利要求13所述的集群客户处理装置，其特征在于，还包括：

16.根据权利要求13所述的集群客户处理装置，其特征在于，还包括：

17.根据权利要求13所述的集群客户处理装置，其特征在于，还包括：

18.一种分布式数据处理装置，其特征在于，包括：

命令接收单元，用于接收集群客户处理装置发送的数据处理命令，其中，所述数据处理命令包括一组或多组四元组信息，每一组四元组信息包括第一树标识、第一分支标识、第一数据块标识和第一节点标识；其中，所述树标识用以指示逻辑数据块所位于的逻辑卷，所述数据块标识用以指示所述逻辑数据块在所述逻辑卷中所处的位置，每当创建一个克隆卷到所述逻辑卷上时，为所述克隆卷分配一个新的分支标识，所述分支标识用以记录所述克隆卷与所述逻辑卷的克隆关系，所述节点标识用以指示对原逻辑卷或对克隆卷的快照操作，每当创建一个快照卷到所述逻辑卷上时，为所述快照卷分配一个新的节点标识；

19.根据权利要求18所述的分布式数据处理装置，其特征在于：所述数据处理命令用以指示读数据操作；

20.根据权利要求19所述的分布式数据处理装置，其特征在于：所述操作单元还用于若所述物理数据块不存在，则将所述每一组四元组信息中的第一节点标识以1为步长递减，直到查找到递减后的四元组信息对应的物理数据块存在为止；若所述每一组四元组信息中的第一节点标识减为0仍然不存在对应的物理数据块时，将所述每一组四元组信息中的第一分支标识以1为步长递减，寻找父分支是否存在对应的物理数据块，直到查找到相应的物理数据块为止。

21.根据权利要求19所述的分布式数据处理装置，其特征在于：所述数据处理命令用以指示写数据操作；相应地，所述操作单元还用于获取所述数据处理命令中的每一组四元组信息，根据所述四元组信息确定数据存储设备中待分配的物理数据块，在所述待分配的物理数据块上进行写操作。