WO2024001863A1

WO2024001863A1 - 一种数据处理方法及相关设备

Info

Publication number: WO2024001863A1
Application number: PCT/CN2023/101259
Authority: WO
Inventors: 李航; 惠卫锋; 陈续强; 韩峰哲; 罗日新
Original assignee: 华为技术有限公司
Priority date: 2022-06-27
Filing date: 2023-06-20
Publication date: 2024-01-04
Also published as: CN117349075A

Abstract

一种数据处理方法及相关设备，涉及存储技术领域。该方法由分布式存储系统中主节点执行，包括：获取第一请求，第一请求用于更新纠删码EC条带中的数据块，然后根据第一请求确定第一数据块，向从节点集合发送处理请求，以指示将主节点更新数据块的操作卸载至从节点集合中的一个或多个从节点。该方法将主节点更新数据块的操作卸载至从节点，减少了更新EC条带过程中读操作的次数，避免占用大量的网络资源，保障了分布式存系统的系统性能。

Description

一种数据处理方法及相关设备

本申请要求于2022年06月27日提交中国国家知识产权局、申请号为202210740423.1、发明名称为“一种数据处理的方法”的中国专利申请的优先权，以及要求于2022年08月23日提交中国国家知识产权局、申请号为202211017671.X、发明名称为“一种数据处理方法及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及存储技术领域，尤其涉及一种数据处理方法、数据处理装置、计算设备集群、计算机可读存储介质、计算机程序产品。

背景技术

随着信息化技术的不断发展，越来越多的产业应用采用信息化部署方式，由此产生了大量的数据。为了降低数据的存储成本并保障数据的可靠性，业界提出了纠删码(Erasure Code，EC)技术。EC具体是将数据分成多组数据块，然后根据每组数据块计算得到校验块，将该组数据块和校验块分散存储在分布式存储系统的不同的节点。

一组数据块和基于这组数据块通过校验生成的校验块的集合称作EC条带(stripe)。为保证数据一致性，数据的读取和更新操作通常由EC条带中的一个数据块(例如是第一个数据块)所在的节点完成。其中，EC条带中的第一个数据块所在的节点也可以称作主节点，EC条带中的其他数据块所在的节点以及校验块所在的节点称作从节点。

然而，在对EC条带进行更新，例如是更新EC条带中的一个数据块时，通常需要主节点进行较多次读操作、写操作，多次读操作、写操作可以占用大量的网络资源，降低分布式存储系统的系统性能。

发明内容

本申请提供了一种数据处理方法，该方法将主节点更新数据块的操作卸载至从节点，减少了更新EC条带过程中读操作的次数，避免占用大量的网络资源，保障了分布式存系统的系统性能。本申请还提供了上述方法对应的数据处理装置、计算设备集群、计算机可读存储介质、计算机程序产品。

第一方面，本申请提供一种数据处理方法。该方法可以由分布式存储系统中主节点执行。具体地，主节点获取第一请求，第一请求用于更新EC条带中的数据块，然后根据第一请求确定第一数据块，第一数据块为第一请求关联的数据块，接着主节点向包括分布式存储系统中至少一个从节点的从节点集合发送处理请求，以指示将主节点更新数据块的操作卸载至从节点集合中的一个或多个从节点。如此，可以减少更新EC条带中的数据块的过程中读操作的次数，降低网络传输开销，保障系统性能。

在一些可能的实现方式中，主节点可以向第一从节点发送包括第二数据块的第二请求，然后接收第一从节点将第一数据块更新为第二数据块所返回的第一数据块，接着根据第一数据块和第二数据块确定校验块更新信息，再向第二从节点发送包括校验块更新信息的第三请求，其中，校验块更新信息用于更新校验块。

该方法通过将计算新的校验块的算子部分下推至从节点，避免主节点从校验块所在的第二从节点读取校验块，减少读操作的次数，降低网络传输开销，保障系统性能。

在一些可能的实现方式中，主节点可以向第一从节点发送包括第二数据块的第二请求，第二请求用于指示第一从节点将第一数据块更新为第二数据块，以及根据第一数据块和所述第二数据块确定校验块更新信息。然后，主节点通过第一从节点向第二从节点发送包括校验块更新信息的第三请求，该校验块更新信息用于更新校验块。

该方法通过将计算新的校验块的算子全部下推至从节点，具体是下推至第一数据块所在的第一从节点(也可以称为更新节点)以及校验块所在的第二从节点，避免第一从节点从第二从节点读取校验块，减少读操作的次数，降低网络传输开销，保障系统性能。

在一些可能的实现方式中，主节点向第一从节点发送的第二请求为更新请求，该更新请求的返回值为第一数据块，用于指示第一从节点将第一数据块更新为第二数据块，并返回第一数据块。如此，主节点仅需一次更新操作即可替代相关技术中一次读操作和一次写操作，减少操作次数，降低网络传输开销，保障了系统性能。

在一些可能的实现方式中，第一数据块可以存储在第一从节点，主节点可以与第一从节点为同一节点。类似地，在另一些实施例中，校验块可以存储在第二主节点，主节点可以与第二从节点为同一节点。

如此，主节点可以从本地读取第一数据块或校验块，减少了远程读操作的次数，进而减少占用的网络资源，保障系统性能。

在一些可能的实现方式中，主节点获取第一请求之前，还可以获取包括数据流的第四请求，然后主节点将数据流中的数据分块得到多个数据块，将多个数据块按列写入分布式存储系统中的数据块存储节点，该数据块存储节点包括主节点和第一从节点，接着主节点根据多个数据块中每组数据块计算校验块，将校验块写入分布式存储系统中的校验块存储节点，该校验块存储节点包括第二从节点。

其中，将数据块按列存储至分布式存储系统，可以减少后续读数据过程中跨磁盘的次数，减少读开销。

在一些可能的实现方式中，数据流分块所得的多个数据块无法写满至少一个EC条带时，主节点还可以对至少一个EC条带中无数据的分片执行空操作，而不必执行填充操作，如此可以减少写放大。

在一些可能的实现方式中，主节点还可以获取包括起始地址的第五请求，然后根据起始地址确定目标节点，从目标节点按列读取目标数据块。如此，在读数据时，只用在一个节点读取一次硬盘即可读取所需的数据，减少了读放大。

第二方面，本申请提供一种数据处理方法。所述方法应用于分布式存储系统，包括：

主节点获取第一请求，所述第一请求用于更新纠删码EC条带中的第一数据块，根据所述第一请求确定所述第一数据块，所述第一数据块为所述第一请求关联的数据块，向从节点集合发送处理请求，所述从节点集合包括所述分布式存储系统中至少一个从节点，所述处理请求用于指示将所述主节点更新数据块的操作卸载至所述从节点集合中的一个或多个从节点；

所述从节点集合根据所述处理请求更新所述第一数据块和校验块。

该方法将主节点更新数据块的操作卸载至从节点集合，减少更新EC条带的数据块的过程中读操作的次数，降低网络传输开销，保障系统性能。

在一些可能的实现方式中，所述主节点向从节点集合发送处理请求，包括：

所述主节点向第一从节点发送包括所述第二数据块的第二请求；

所述第一从节点根据所述处理请求更新所述第一数据块，包括:

所述第一从节点将所述第一数据块更新为第二数据块，并返回所述第一数据块；

所述方法还包括：

所述主节点根据所述第一数据块和所述第二数据块确定校验块更新信息；

所述主节点向从节点集合发送处理请求，包括：

向第二从节点发送包括校验块更新信息的第三请求；

所述第二从节点根据所述处理请求更新校验块，包括:

所述第二从节点根据所述校验块更新信息更新校验块。

该方法将主节点更新数据块的过程中计算新的校验块的算子部分下推至从节点，减少从校验块所在的从节点读校验块的操作，降低网络传输开销，保障系统性能。

所述第一从节点将所述第一数据块更新为第二数据块；

所述方法还包括：

所述第一从节点根据所述第一数据块和所述第二数据块确定校验块更新信息；

所述主节点向从节点集合发送处理请求，包括：

通过所述第一从节点向第二从节点发送包括所述校验块更新信息的第三请求；

所述第二从节点根据所述处理请求更新校验块，包括:

所述第二从节点根据所述校验块更新信息更新校验块。

该方法将主节点更新数据块的过程中计算新的校验块的算子全部下推至从节点，减少从校验块所在的从节点读校验块的操作，降低网络传输开销，保障系统性能。

在一些可能的实现方式中，所述第二请求为更新请求，所述更新请求用于指示所述第一从节点将所述第一数据块更新为所述第二数据块，并返回所述第一数据块。如此，主节点仅需一次更新操作即可替代相关技术中一次读操作和一次写操作，减少操作次数，降低网络传输开销，保障了系统性能。

第三方面，本申请提供一种数据处理装置，所述装置包括用于执行第一方面或第一方面任一种可能实现方式中的数据处理方法的各个模块。

第三方面，本申请提供一种数据处理装置。该数据处理装置包括用于执行第二方面或第二方面任一种可能实现方式中的数据处理方法的各个单元。

第四方面，本申请提供一种数据处理系统。该数据处理系统包括用于执行第二方面或第二方面任一种可能实现方式中的数据处理方法的各个装置。

第五方面，本申请提供一种计算设备集群。所述计算设备集群包括至少一台计算设备，所述至少一台计算设备包括至少一个处理器和至少一个存储器。所述至少一个处理器、所述至少一个存储器进行相互的通信。所述至少一个处理器用于执行所述至少一个存储器中存储的指令，以使得计算设备或计算设备集群执行如第一方面或第二方面的任一种实现方式所述的数据处理方法。

第六方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，所述指令指示计算设备或计算设备集群执行上述第一方面或第一方面的任一种实现方式所述的数据处理方法。

第七方面，本申请提供了一种包含指令的计算机程序产品，当其在计算设备或计算设备集群上运行时，使得计算设备或计算设备集群执行上述第一方面或第一方面的任一种实现方式所述的数据处理方法。

本申请在上述各方面提供的实现方式的基础上，还可以进行进一步组合以提供更多实现方式。

附图说明

图1为本申请提供的一种EC条带更新的流程示意图；

图2为本申请提供的一种分布式存储系统的系统架构图；

图3为本申请提供的一种分布式存储系统的系统架构图；

图4为本申请提供的一种分布式存储系统的应用场景示意图；

图5为本申请提供的一种数据处理方法的流程图；

图6为本申请提供的一种行存与列存的示意图；

图7为本申请提供的一种写数据的流程示意图；

图8为本申请提供的一种EC条带更新的流程示意图；

图9为本申请提供的一种EC条带更新的流程示意图；

图10为本申请提供的一种数据处理装置的结构示意图；

图11为本申请提供的一种数据处理系统的结构示意图；

图12为本申请提供的一种计算设备集群的结构示意图；

图13为本申请提供的一种计算设备集群的结构示意图。

具体实施方式

为了便于理解，首先对本申请实施例中所涉及到的一些技术术语进行介绍。

EC条带更新，也可以简称为EC条带覆盖写，具体是采用新的若干数据块替换EC条带中的若干数据块，并基于对数据块的更新，对EC条带中校验块进行相应更新。根据生成新的校验块的方式不同，EC条带覆盖写还可以分为EC小写、EC大写。EC小写是指读取校验块、被修改的数据块、修改后的数据块确定新的校验块，EC大写是指读取EC条带中的其他数据块，根据修改后的数据块以及EC条带中的其他数据块，确定新的校验块。在覆盖写数据块较小时，采用EC小写方式读取的数据量较小，效率较高。在覆盖写数据块较大时，采用EC大写方式读取的数据量较小，效率较高。

下面对EC条带更新过程进行示例说明。参见图1所示的EC条带更新的流程示意图，在该示例中，EC条带包括数据块D₀至数据块D_k-1以及校验块P、校验块Q。数据块D₀所在的节点为主节点，数据块D₁至数据块D_k-1所在的节点为第一从节点，存储数据块D₀至数据块D_k-1的节点也称作数据块存储节点，校验块P和校验块Q所在的节点为第二从节点，也称作校验块存储节点。

如图1所示，客户端请求将数据块D′₁覆盖写至EC条带中的数据块D₁，为保证数据的强一致性，通常需要将待修改的数据如数据块D₁先读到主节点，以及将校验块P、校验块Q读到主节点，主节点根据数据块D₁、数据块D′₁和校验块P计算新的校验块P′，根据数据块D₁、数据块D′₁和校验块Q计算新的校验块Q′，具体如下所示：
P′＝α₀(D′₁-D₁)+P (1)
Q′＝β₀(D′₁-D₁)+Q (2)

其中，α₀和β₀分别为不同的校验系数。

然后，主节点将数据块D′₁、新的校验块P′、新的校验块Q′写入数据块D₁、校验块P、校验块Q所在的节点。如此导致更新EC条带中的一个数据块，需要读操作3次，写操作3次，占用大量的网络资源，降低了系统性能。

为了解决传统技术中多次读操作和写操作占用大量的网络资源导致系统性能下降的问题，本申请提供了一种应用于分布式存储系统的数据处理方法。具体地，分布式存储系统中的主节点获取第一请求，该第一请求用于更新EC条带中的数据块，主节点可以根据第一请求确定第一数据块，该第一数据块为第一请求关联的数据块，然后主节点向包括分布式存储系统中至少一个从节点的从节点集合发送处理请求，以指示将主节点更新数据块的操作卸载至从节点集合中的一个或多个从节点。

该方法将主节点更新数据块的操作卸载至从节点集合，例如是将计算新的校验块的算子下推至校验块所在的第二从节点，避免了主节点或第一数据块所在的第一从节点(也可以称为更新节点)从第二从节点读取校验块，减少了读操作的次数，降低了网络传输开销，保障了系统性能。区别于其他EC优化技术，本申请着重改变EC的数据传输流程和数据分布，增强数据传输和磁盘访问效率，因而适用多种存储场景，具有较高可用性。

进一步地，该方法还支持对数据块的更新过程进行优化，例如可以将一次读操作和一次写操作合并为一次读写操作。如此，只需一次读写操作加上两次写操作，即可完成EC条带的更新，网络传输开销减少一半，大幅降低了网络资源占有率，提升了系统性能。

下面结合附图对本申请实施例的系统架构进行介绍。

参见图2所示的分布式存储系统的系统架构图，该系统为存算分离结构，该系统包括计算节点集群和存储节点集群。计算节点集群包括一个或多个计算节点110(图2中示出了两个计算节点110，但不限于两个计算节点110)，各个计算节点110之间可以相互通信。计算节点110是一种计算设备，如服务器、台式计算机或者存储阵列的控制器等。在硬件上，如图2所示，计算节点110至少包括处理器112、内存113和网卡114。其中，处理器112是一个中央处理器(central processing unit，CPU)，用于处理来自计算节点110外部的数据访问请求，或者计算节点110内部生成的请求。示例性的，处理器112接收用户发送的写数据请求时，会将这些写数据请求中的数据暂时保存在内存113中。当内存113中的数据总量达到一定阈值时，处理器112将内存113中存储的数据发送给存储节点100进行持久化存储。除此之外，处理器112还用于数据进行计算或处理，例如元数据管理、重复数据删除、数据压缩、虚拟化存储空间以及地址转换等。图2中仅示出了一个CPU 112，在实际应用中，CPU 112的数量往往有多个，其中，一个CPU 112又具有一个或多个CPU核。本实施例不对CPU的数量，以及CPU核的数量进行限定。

内存113是指与处理器直接交换数据的内部存储器，它可以随时读写数据，而且速度很快，作为操作系统或其他正在运行中的程序的临时数据存储器。内存包括至少两种存储器，例如内存既可以是随机存取存储器，也可以是只读存储器(Read Only Memory,ROM)。举例来说，随机存取存储器是动态随机存取存储器(Dynamic Random Access Memory,DRAM)，或者存储级存储器(Storage Class Memory,SCM)。 DRAM是一种半导体存储器，与大部分随机存取存储器(Random Access Memory，RAM)一样，属于一种易失性存储器(volatile memory)设备。SCM是一种同时结合传统储存装置与存储器特性的复合型储存技术，存储级存储器能够提供比硬盘更快速的读写速度，但存取速度上比DRAM慢，在成本上也比DRAM更为便宜。然而，DRAM和SCM在本实施例中只是示例性的说明，内存还可以包括其他随机存取存储器，例如静态随机存取存储器(Static Random Access Memory，SRAM)等。而对于只读存储器，举例来说，可以是可编程只读存储器(Programmable Read Only Memory,PROM)、可抹除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)等。另外，内存113还可以是双列直插式存储器模块或双线存储器模块(Dual In-line Memory Module，简称DIMM)，即由动态随机存取存储器(DRAM)组成的模块，还可以是固态硬盘(Solid State Disk,SSD)。实际应用中，计算节点110中可配置多个内存113，以及不同类型的内存113。本实施例不对内存113的数量和类型进行限定。此外，可对内存113进行配置使其具有保电功能。保电功能是指系统发生掉电又重新上电时，内存113中存储的数据也不会丢失。具有保电功能的内存被称为非易失性存储器。

网卡114用于与存储节点100通信。例如，当内存113中的数据总量达到一定阈值时，计算节点110可通过网卡114向存储节点100发送请求以对所述数据进行持久化存储。另外，计算节点110还可以包括总线，用于计算节点110内部各组件之间的通信。在功能上，由于图2中的计算节点110的主要功能是计算业务，在存储数据时可以利用远程存储器来实现持久化存储，因此它具有比常规服务器更少的本地存储器，从而实现了成本和空间的节省。但这并不代表计算节点110不能具有本地存储器，在实际实现中，计算节点110也可以内置少量的硬盘，或者外接少量硬盘。

任意一个计算节点110可通过网络访问存储节点集群中的任意一个存储节点100。存储节点集群包括多个存储节点100(图2中示出了三个存储节点100，但不限于三个存储节点100)。一个存储节点100包括一个或多个控制器101、网卡104与多个硬盘105。网卡104用于与计算节点110通信。硬盘105用于存储数据，可以是磁盘或者其他类型的存储介质，例如固态硬盘或者叠瓦式磁记录硬盘等。控制器101用于根据计算节点110发送的读/写数据请求，往硬盘105中写入数据或者从硬盘105中读取数据。在读写数据的过程中，控制器101需要将读/写数据请求中携带的地址转换为硬盘能够识别的地址。由此可见，控制器101也具有一些简单的计算功能。

图3为本申请实施例所应用的另一种分布式存储系统的系统架构图，该系统为存算一体架构，该系统包括存储集群。存储集群包括一个或多个服务器110(图3中示出了三个服务器110，但不限于三个服务器110)，各个服务器110之间可以相互通信。服务器110是一种既具有计算能力又具有存储能力的设备，如服务器、台式计算机等。示例型的，ARM服务器或者X86服务器都可以作为这里的服务器110。

在硬件上，如图3所示，服务器110至少包括处理器112、内存113、网卡114和硬盘105。处理器112、内存113、网卡114和硬盘105之间通过总线连接。其中，处理器112和内存113用于提供计算资源。具体地，处理器112是一个中央处理器CPU，用于处理来自服务器110外部(应用服务器或者其他服务器110)的数据访问请求，也用于处理服务器110内部生成的请求。内存113是指与处理器直接交换数据的内部存储器，它可以随时读写数据，而且速度很快，作为操作系统或其他正在运行中的程序的临时数据存储器。实际应用中，服务器110中可配置多个内存113，以及不同类型的内存113。本实施例不对内存113的数量和类型进行限定。此外，可对内存113进行配置使其具有保电功能。硬盘105用于提供存储资源，例如存储数据。它可以是磁盘或者其他类型的存储介质，例如固态硬盘或者叠瓦式磁记录硬盘等。网卡114用于与其他服务器110通信。

需要说明的是，上述图2、图3仅仅是分布式存储系统的一种示意性架构，在本申请实施例其他可能的实现方式中，分布式存储系统也可以使用其他架构，例如分布式存储系统也可以采用全融合架构，或者Memory Fabric架构。

进一步地，上述分布式存储系统可以提供存储服务，例如，以存储接口形式为用户提供存储服务器，使用户可通过上述存储接口使用分布式存储系统的存储资源。参见图4所示的分布式存储系统的应用场景示意图，用户可以通过客户端(如应用客户端)访问分布式存储系统，该分布式存储系统可以是上述图2或图3所示的架构。

例如，分布式存储系统采用图2所示的架构时，客户端可以调用存储服务提供的存储接口生成存储请求，并发送存储请求至分布式存储系统，分布式存储系统中接收到该存储请求的计算节点可以将数据分为多组数据块，然后根据每组数据块计算出校验块，并将每组数据块以及由该组数据块确定的校验块分散写入不同的存储节点100中，例如是写入不同存储节点100的硬盘105中，形成EC条带。存储EC条带中第一个数据块(例如是数据块D₀)的存储节点100可以视为主节点，存储EC条带中其他数据块(例如是数据块D₁，…数据块D_k-1)的存储节点100可以视为第一从节点，存储校验块(例如是校验块P和校验块Q)的存储节点100可以视为第二从节点。

又例如，分布式存储系统采用图3所示的架构时，客户端可以调用存储服务提供的存储接口生成存储请求，并发送存储请求至分布式存储系统，分布式存储系统中的服务器110可以将数据分为多组数据块，然后根据每组数据块计算出校验块，并将每组数据块以及由该组数据块确定的校验块分散写入不同的服务器110中，例如是写入不同服务器100的硬盘105中。存储EC条带中第一个数据块(例如是数据块D₀)的服务器110可以视为主节点，存储EC条带中其他数据块(例如是数据块D₁，…数据块D_k-1)的存储节点100可以视为第一从节点，存储校验块(例如是校验块P和校验块Q)的服务器110可以视为第二从节点。

其中，客户端用于通过存储服务访问分布式存储系统，分布式存储系统可以通过存储服务响应用户对分布式存储系统的访问，返回访问结果。根据访问操作不同，访问结果可以是不同的。例如访问操作为写操作时，访问结果可以表征写成功的通知，又例如访问操作为读操作时，访问结果可以是读取的数据块。

针对EC条带覆盖写的场景，主节点可以获取用于更新EC条带的数据块的第一请求，根据第一请求确定第一数据块，然后向从节点集合发送处理请求，以指示将主节点更新数据块的操作卸载至从节点集合中的一个或多个从节点。例如处理请求可以指示将主节点更新数据块的操作卸载至第一数据块所在的第一从节点和校验块所在的第二从节点。

需要说明的是，上述第一数据块、校验块可以存储在分布式存储系统中除主节点之外的其他不同节点。在一些实施例中，第一数据块也可以存储在主节点，在该情况下，主节点与第一从节点为同一节点。在另一些实施例中，校验块也可以存储在主节点，在该情况下，主节点与第二从节点可以为同一节点。

接下来，以主节点、第一从节点、第二从节点为不同节点的场景，对本申请实施例的数据处理方法进行介绍。

参见图5所示的数据处理方法的流程图，该方法包括：

S502：主节点获取请求1。

请求1中包括数据流。请求1用于请求将数据流中的数据写入分布式存储系统进行持久化存储。其中，请求1可以由应用客户端基于业务需求产生，该请求1可以是写请求，也可以是需要写入数据的其他请求。根据应用客户端的业务需求不同，请求1可以包括不同类型的数据流。例如，应用客户端为短视频应用或长视频应用时，请求1可以包括视频数据流；又例如，应用客户端为文件管理应用或文本编辑应用时，请求1可以包括文本数据流。主节点可以接收应用客户端下发的请求1，以将请求1携带的数据流中的数据进行持久化存储。

S504：主节点将请求1包括的数据流中数据进行分块，获得多个数据块。

数据流可以是具有起点和终点的有序字节序列。具体地，主节点可以采用定长分块或变长分块，对请求1携带的数据流中的数据进行分块，从而获得多个数据块。其中，定长分块是指按照设置好的分块粒度对数据流中的数据进行分块。变长分块是将数据流中的数据分为大小不固定的数据块，变长分块可以包括基于滑动窗口的变长分块和基于内容的变长分块(content-defined chunking，CDC)。

为了便于理解，下面以定长分块进行示例说明。具体地，数据流中数据的大小为分块粒度的整数倍时，主节点可以将数据流中数据均匀地切分为多个数据块。数据流中数据的大小并非分块粒度的整数倍时，主节点可以将数据流中数据进行填充，例如是在数据流的末端填零，使得填充后的数据流中数据的大小为分块粒度的整数倍，接着主节点按照该分块粒度将数据流中的数据均匀地切分为多个数据块。例如，数据流中数据的大小为20KB，主节点按照4KB的分块粒度进行分块，可以获得5个大小为4KB的数据块。

在一些实施例中，针对数据流中数据的大小并非分块粒度的整数倍的情况，主节点也可以不对数据流中数据进行填充，而是按照分块粒度切分出K-1个大小等于分块粒度的数据块以及一个大小不等于分块粒度的数据块。

需要说明的是，执行本申请实施例的数据处理方法也可以不执行上述S504。例如，数据流中数据的大小较小，不足以进行分块，或者数据流中的数据已预先分块时，也可以不执行上述S504。

S506：主节点将多个数据块按列写入包括主节点和第一从节点在内的数据块存储节点。

假设数据块存储节点可以在每列存储L个数据块，其中，L为正整数，则主节点可以将多个数据块先按列写入主节点，当主节点中的列写满时，则将剩余的数据块按列写入第一从节点。

第一从节点包括多个时，主节点可以将剩余的数据块先按列写入第一个第一从节点。以此类推，当第一个从节点写满时，如果数据块还有剩余，则主节点将剩余的数据块按列写入下一个第一从节点。

为了便于理解，下面结合一示例进行说明。参见图6所示的行存与列存的示意图，其中，行存是指按行存储，列存是指按列存储。该示例中，每个数据块的大小为4K，数据块存储节点可以在每列存储256个数据块，数据块存储节点的数量为4，校验块存储节点的数量为2。若主节点按行写入数据块存储节点，则数据块D₀至数据块D₃分别写入4个数据块存储节点，具体是一个主节点和3个第一从节点，P₀和Q₀分别写入不同的校验块存储节点。类似地，数据块D₄至数据块D₇分别写入4个数据块存储节点，P₁和Q₁分别写入不同的校验块存储节点。若主节点按列写入数据块存储节点，则数据块D₀至D₂₅₅写入主节点，数据块D₂₅₆至D₅₁₁写入第一个第一从节点，以此类推，数据块D₅₁₂至D₇₆₇写入第二个第一从节点，数据块D₇₆₈至D₁₀₂₃写入第三个第一从节点。

在一些可能的实现方式中，多个数据块可以存在无法写满一个EC条带的情况，例如，每列存储256个数据块，数据块存储节点的数量为4时，若数据流中数据块的数量小于769(256*3+1)，则数据流中的至少一个数据块不足以写满一个EC条带时，可以通过将空的部分省略写的方式减少写放大。具体实现时，主节点可以对至少一个EC条带中无数据的分片(chunk)执行空操作(记作zero Op)，而不必执行填充操作，如此可以减少写放大。

如图7所示，主节点在chunk1写入一个数据块时，可以在主节点对应的事务1(记作transaction1)中加入zero Op，而事务2至4(记作transaction2～4)中的write Op均采用zero Op进行替代。相应地，chunk2～4实际上不会分配空间，也不会有实际的数据落盘，且在读取的时候，能够向上层请求返回正确数据，同时不会真正读盘。如此，可以减少写放大。

基于此，主节点可以先判断数据流中的大小，如果数据流中数据的大小不足满条带，则可以仅写需要填充的chunk，空闲的chunk不填充。这样不仅可以提高写的性能，同时可以减少空间浪费。

S508：主节点根据多个数据块中每组数据块计算校验块。

具体地，主节点可以对多个数据块可以进行分组，例如，可以按照各数据块所在的行对多个数据块进行分组。同一组数据块所在的行具有相同行号。然后，主节点可以根据校验算法，对每组数据块进行计算，生成校验块。其中，主节点可以采用不同的校验算法，生成不同的校验块。为了便于理解，仍以图6对计算校验块的过程进行示例说明。

在该示例中，主节点按列写入数据块时，主节点可以根据数据块D₁、数据块D₂₅₆、数据块D₅₁₂、数据块D₇₆₈计算得到校验块P₀和校验块Q₀，类似地，主节点可以根据数据块D₂、数据块D₂₅₇、数据块D₅₁₃、数据块D₇₆₉计算得到校验块P₁和校验块Q₁。

本申请实施例中，数据分布的方法可以由按照行存的方式调整为列存的方式。如此，相邻地址的数据块可以集中放置在相同的磁盘，如数据块D₀、数据块D₁放在相同的磁盘。相应地，一个EC条带可以包括不同数据段中的数据块，而不是一个数据段中的连续数据块。如图6所示，一个EC条带可以包括数据块D₀、数据块D₂₅₆、数据块D₅₁₂、数据块D₇₆₈和校验块P₀、Q₀。当数据块D₀所在磁盘或节点故障导致数据块D₀丢失时，可以根据数据块D₂₅₆、数据块D₅₁₂、数据块D₇₆₈和校验块P₀、Q₀恢复上述数据块D₀。

S510：主节点将校验块写入包括第二从节点在内的校验块存储节点。

当校验块存储节点的数量为多个时，也即第二从节点的数量为多个时，主节点可以将校验块分别写入各自对应的第二从节点。

需要说明的是，上述S506、S508可以按照设定顺序先后执行，然后执行S510。在一些实施例中，上述S506、S508可以并行执行，然后执行S510。在另一些实施例中，S506和S510也可以并行执行，例如可以先执行S508获得校验块后，将数据块和校验块并行写入相应的节点。本申请实施例对上述S506、S508、S510的顺序不作限制。

还需要说明的是，上述S502至S510为本申请实施例的可选步骤，执行本申请实施例的数据处理方法也可以不执行上述步骤。例如，本申请实施例的数据处理方法可以直接执行以下步骤，从而对EC条带进行更新。下面进行详细说明。

S511：主节点获取请求2。

请求2用于更新EC条带中的数据块，例如请求2用于将EC条带中的第一数据块更新为第二数据块。请求2中包括第二数据块。在一些实施例中，请求2中还可以包括第一数据块的逻辑地址，以用于快速寻址第一数据块。

S512：主节点根据请求2，确定第一数据块。

第一数据块具体为请求2关联的数据块。具体地，主节点可以解析请求2，获得请求2中需要更新的数据块的逻辑地址，根据该逻辑地址确定第一数据块。

S514：主节点向第一数据块所在的第一从节点发送请求3。

S516：第一数据块所在的第一从节点将第一数据块更新为第二数据块。

S518：主节点接收第一数据块所在的第一从节点返回的第一数据块。

S520：主节点根据第一数据块和第二数据块确定校验块更新信息。

S522:主节点向校验块所在的第二从节点发送请求4。

S524:第二从节点根据请求4中的校验块更新信息，更新校验块。

在更新EC条带的场景中，请求2也可以称作第一请求，请求3、请求4也可以统称为处理请求，处理请求为主节点向从节点集合发送的请求，其中，请求3可以称作第二请求，请求4可以称作第三请求。在构建EC条带场景中，请求1也可以称作第四请求。

在图5的示例中，请求3和请求4用于指示将主节点更新数据块的操作部分卸载至第一从节点和第二从节点。下面对卸载过程进行详细说明。

主节点向第一从节点发送的请求3包括第二数据块，请求3具体用于指示第一从节点将第一数据块更新为第二数据块。考虑到更新EC条带中的第一数据块时，校验块也会相应发生变化，主节点可以根据请求3，读出第一数据块，以用于计算新的校验块。

需要说明，请求3可以为更新请求，更新请求的返回值为第一数据块，如此，第一数据块所在的第一从节点可以在更新第一数据块时，读出第一数据块，然后写入第二数据块，此外，第一从节点还可以向主节点返回第一数据块。如此，通过一次更新操作(具体为读写操作)实现写入第二数据块，读取第一数据块。在一些可能的实现方式中，主节点也可以额外发送一个请求，以读取第一数据块，用于计算校验块更新信息。

主节点接收到第一数据块所在的第一从节点返回的第一数据块，可以根据第一数据块、第二数据块，通过EC算法，确定校验块更新信息。例如，主节点可以根据第一数据块、第二数据块，采用公式(1)或公式(2)确定校验块更新信息。

主节点向第二从节点发送的请求4包括校验块更新信息。请求4具体用于更新校验块。第二从节点可以根据请求4中的校验块更新信息，更新校验块。例如，第二从节点可以读取校验块，根据校验块和校验块更新信息确定新的校验块，然后存储新的校验块，从而实现更新校验块。

区别于传统方法中将校验块读取到主节点，主节点根据第一数据块、第二数据块和校验块计算新的校验块，然后下发新的校验块至校验块存储节点进行更新，本申请实施例将更新数据块的操作部分卸载至第一从节点和第二从节点，具体是将更新数据块的操作中更新校验块的过程分解为两步，由不同节点完成。

具体地，主节点可以完成前一步，具体是根据第一数据块和第二数据块计算校验块更新信息，然后向校验块存储节点下发校验块更新信息，校验块存储节点完成后一步，具体是根据校验块更新信息更新校验块。

为了便于理解，下面结合一具体示例进行说明。

如图8所示，主节点完成校验块更新信息P″＝α₀(D′₂₅₆-D₂₅₆)和校验块更新信息Q″＝β₀(D′₂₅₆-D₂₅₆)的计算，然后主节点将校验块更新信息P″和校验块更新信息Q″下推至校验块存储节点。校验块存储节点完成新的校验块P′＝P″+P和新的校验块Q′＝Q″+Q的计算。而且在主节点将D′₂₅₆和D₂₅₆新旧数据的先读后写操作变成一次更新操作。具体地，在更新请求中自带要写入的数据，但在写入之前先读出原地址的数据作为请求的返回值。然后将数据写入磁盘后，再将读出的数据返回到主节点。

还需要说明的是，执行本申请实施例的数据处理方法也可以不执行上述S516至S518。例如，请求3和请求4可以用于指示将主节点更新数据块的操作全部卸载至第一数据块所在的第一从节点和校验块所在的第二从节点。

例如，第一数据块所在的第一从节点(即更新节点)可以直接根据读出的第一数据块和第二数据块计算校验块更新信息。主节点可以通过第一从节点发送请求4，由该第一从节点将校验块更新信息携带在请求4中，下推至校验块所在的第二从节点，以使第二从节点根据请求4中的校验块更新信息计算新的校验块，从而实现校验块更新。

为了便于理解，下面仍以更新EC条带中的数据块D₂₅₆进行示例说明。

如图9所示，第一从节点完成校验块更新信息P″＝α₀(D′₂₅₆-D₂₅₆)和校验块更新信息Q″＝β₀(D′₂₅₆-D₂₅₆)的计算，然后第一从节点将校验块更新信息P″和校验块更新信息Q″下推至校验块存储节点。第二从节点完成新的校验块P′＝P″+P和新的校验块Q′＝Q″+Q。而且在主节点只用得到操作的结果即可，不使用数据无需读到主节点，减少数据传输。在第一从节点将D′₂₅₆和D₂₅₆新旧数据的先读后写操作变成一次更新操作。具体地，在更新请求中自带要写入的数据，但在写入之前先读出原地址的数据作为请求的返回值。然后将数据写入磁盘后，再将读出的数据返回到主节点。

以上为本申请实施例中主节点向从节点集合发送处理请求，从节点集合根据处理请求更新第一数据块和校验块的一些具体实现方式，在本申请实施例其他可能的实现方式中，主节点、从节点也可以通过其他方法步骤更新第一数据块和校验块。

在一些可能的实现方式中，主节点还可以接收请求5，请求5可以是读请求，然后主节点可以根据读请求，读取目标数据块。需要说明，在EC条带查询场景中，请求5也可以称作第五请求。其中，数据块采用列存方式时，主节点可以按列读取目标数据块。具体地，读请求可以包括起始地址，进一步地，读请求中还可以包括读数据的长度，主节点可以根据上述起始地址，从数据块存储节点中确定目标节点，然后主节点可以从目标节点按列读取目标数据块。

如此，在读数据时，只用在一个节点读取一次硬盘即可读取所需的数据，减少了读放大。以图6进行示例说明，如果想从起始地址读取8KB或者16KB的数据，虽然还是数据块D₀、数据块D₁、数据块D₂、数据块D₃，但只用在一台机器的同一块磁盘里完成，减少了跨盘读数据的次数。

基于上述内容描述，本申请实施例提供了一种数据处理方法。该方法通过将更新EC条带时对校验块的更新流程分为本地校验、远端更新，将原来由主节点计算出新的校验块发送至校验块所在的校验块存储节点进行更新的过程，优化为由主节点或更新节点计算校验块更新信息，校验块所在的校验块存储节点根据校验块更新信息生成新的校验块并写入该新的校验块。如此，避免了主节点或更新节点等从校验块存储节点读取校验块，减少了读操作的次数，降低了网络传输开销，保障了系统性能。进一步地，该方法支持写数据时将行存转为列存，如此在读数据时，可以实现在一台机器的同一块磁盘里完成，减少了跨盘读数据的次数，提升了读性能。

以上结合图1至图9对本申请提供的数据处理方法进行介绍，接下来结合附图对本申请提供的数据处理装置、数据处理系统的功能以及实现该数据处理装置、数据处理系统的计算设备或计算设备集群进行介绍。

首先，参见图10，示出了一种数据处理装置的结构示意图，数据处理装置1000可以部署于分布式存储系统中主节点，装置1000包括：

获取单元1002，用于获取第一请求，所述第一请求用于更新纠删码EC条带中的数据块；

确定单元1004，用于根据所述第一请求确定所述第一数据块，所述第一数据块为所述第一请求关联的数据块；

通信单元1006，用于向从节点集合发送处理请求，所述从节点集合包括所述分布式存储系统中至少一个从节点，所述处理请求用于指示将所述主节点更新数据块的操作卸载至所述从节点集合中的一个或多个从节点。

应理解的是，本发明本申请实施例的装置1000可以通过中央处理单元(central processing unit，CPU)实现，也可以通过专用集成电路(application-specific integrated circuit，ASIC)实现，或可编程逻辑器件(programmable logic device，PLD)实现，上述PLD可以是复杂程序逻辑器件(complex programmable logical device，CPLD)，现场可编程门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(generic array logic，GAL)、数据处理单元(data processing unit，DPU)、片上系统(system on chip，SoC)或其任意组合。也可以通过软件实现图5至图9所示的数据处理方法时，装置1000及其各个模块也可以为软件模块。

在一些可能的实现方式中，所述通信单元1006具体用于：

向第一从节点发送包括所述第二数据块的第二请求；

接收所述第一从节点将所述第一数据块更新为第二数据块所返回的所述第一数据块；

所述确定单元1004还用于：

根据所述第一数据块和所述第二数据块确定校验块更新信息；

所述通信单元1006具体用于：

向第二从节点发送包括所述校验块更新信息的第三请求，所述校验块更新信息用于更新所述校验块。

在一些可能的实现方式中，所述通信单元1006具体用于：

向第一从节点发送包括所述第二数据块的第二请求，所述第二请求用于指示所述第一从节点将所述第一数据块更新为所述第二数据块，以及根据所述第一数据块和所述第二数据块确定校验块更新信息；

通过所述第一从节点向第二从节点发送包括所述校验块更新信息的第三请求，所述校验块更新信息用于更新所述校验块。

在一些可能的实现方式中，所述第一数据块存储在第一从节点，所述主节点与所述第一从节点为同一节点；或者，所述EC条带中的校验块存储在第二从节点，所述主节点与所述第二从节点为同一节点。

在一些可能的实现方式中，所述获取单元1002还用于：

所述获取第一请求之前，获取包括数据流的第四请求；

所述装置1000还包括：

读写单元1008，用于将所述数据流中的数据分块得到多个数据块，将所述多个数据块按列写入所述分布式存储系统中的数据块存储节点，所述数据块存储节点包括所述主节点和所述第一从节点；

所述读写单元1008，还用于根据所述多个数据块中每组数据块计算校验块，将所述校验块写入所述分布式存储系统中的校验块存储节点，所述校验块存储节点包括所述第二从节点；

其中，所述多个数据块无法写满至少一个EC条带时，所述读写单元具体用于对所述至少一个EC条带中无数据的分片执行空操作。

在一些可能的实现方式中，所述获取单元1002还用于：

获取包括起始地址的第五请求；

所述读写单元1008还用于：

根据所述起始地址确定目标节点，按列读取所述目标数据块。

由于图10所示的数据处理装置1000对应于图5、图8、图9所示的方法，故图10所示的数据处理装置1000的具体实现方式及其所具有的技术效果，可以参见前述实施例中的相关之处描述，在此不做赘述。

然后，参见图11，示出了一种数据处理系统的结构示意图，数据处理系统1100包括第一数据处理装置1000A和第二数据处理装置1000B，第一数据处理装置1000A部署于分布式存储系统中主节点，第二数据处理装置1000B部署于分布式存储系统中从节点。

第一数据处理装置1000A，用于：获取第一请求，所述第一请求用于更新纠删码EC条带中的第一数据块，根据所述第一请求确定所述第一数据块，所述第一数据块为所述第一请求关联的数据块，向从节点集合发送处理请求，所述从节点集合包括所述分布式存储系统中至少一个从节点，所述处理请求用于指示将所述主节点更新数据块的操作卸载至所述从节点集合中的一个或多个从节点；

所述第二数据处理装置1000B，用于根据所述处理请求更新所述第一数据块和校验块。

在一些可能的实现方式中，所述第一数据处理装置1000A，具体用于：

向第一从节点发送包括所述第二数据块的第二请求；

所述第一从节点上的第二数据处理装置1000B，具体用于:

将所述第一数据块更新为第二数据块，并返回所述第一数据块；

所述第一数据处理装置1000A还用于：

所述第一数据处理装置1000A具体用于：

向第二从节点发送包括所述校验块更新信息的第三请求；

所述第二从节点上的第二数据处理装置1000B，具体用于:

根据所述校验块更新信息更新校验块。

向第一从节点发送包括所述第二数据块的第二请求；

所述第一从节点上的第二数据处理装置1000B，具体用于:

将所述第一数据块更新为第二数据块；

所述第一从节点上的第二数据处理装置1000B还用于：

所述第一数据处理装置1000A，具体用于：

所述第二从节点上的第二数据处理装置1000B，具体用于:

根据所述校验块更新信息更新校验块。

在一些可能的实现方式中，所述第二请求为更新请求，所述更新请求用于指示所述第一从节点将所述第一数据块更新为所述第二数据块，并返回所述第一数据块。

由于图11所示的数据处理系统1100对应于图5、图8、图9所示的方法，故图11所示的数据处理系统1100的具体实现方式及其所具有的技术效果，可以参见前述实施例中的相关之处描述，在此不做赘述。

图12为本申请提供的一种计算设备1200的硬件结构图，该计算设备1200可以是前述主节点，用于实现数据处理装置1000的功能。该计算设备1200可以是服务器或终端设备。终端设备包括但不限于台式机、笔记本电脑、平板电脑或智能手机。

如图12所示，计算设备1200包括：总线1202、处理器1204、存储器1206和通信接口1208。处理器1204、存储器1206和通信接口1208之间通过总线1202通信。应理解，本申请不限定计算设备1200中的处理器、存储器的个数。

总线1202可以是外设部件互连标准(peripheral component interconnect，PCI)总线或扩展工业标准结构(extended industry standard architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图12中仅用一条线表示，但并不表示仅有一根总线或一种类型的总线。总线1202可包括在计算设备1200各个部件(例如，存储器1206、处理器1204、通信接口1208)之间传送信息的通路。

处理器1204可以包括中央处理器(central processing unit，CPU)、图形处理器(graphics processing unit，GPU)、微处理器(micro processor，MP)或者数字信号处理器(digital signal processor，DSP)等处理器中的任意一种或多种。

存储器1206可以包括易失性存储器(volatile memory)，例如随机存取存储器(random access memory，RAM)。存储器1206还可以包括非易失性存储器(non-volatile memory)，例如只读存储器(read-only memory，ROM)，快闪存储器，机械硬盘(hard disk drive，HDD)或固态硬盘(solid state drive，SSD)。存储器1206中存储有可执行的程序代码，处理器1204执行该可执行的程序代码以实现前述数据处理方法。具体的，存储器1206上存有数据处理装置1000用于执行数据处理方法的指令。

通信接口1208使用例如但不限于网络接口卡、收发器一类的收发模块，来实现计算设备1200与其他设备或通信网络之间的通信。

本申请还提供了一种计算设备集群。该计算设备集群包括至少一台计算设备。该计算设备可以是服务器，例如是中心服务器、边缘服务器，或者是本地数据中心中的本地服务器。在一些实施例中，计算设备也可以是台式机、笔记本电脑或者智能手机等终端设备。

如图13所示，所述计算设备集群包括至少一个计算设备1200。计算设备集群中的一个或多个计算设备1200中的存储器1206中可以存有相同的数据处理系统1100用于执行数据处理方法的指令。

在一些可能的实现方式中，该计算设备集群中的一个或多个计算设备1200也可以用于执行数据处理系统1100用于执行数据处理方法的部分指令。换言之，一个或多个计算设备1200的组合可以共同执行数据处理系统1100用于执行数据处理方法的指令。

需要说明的是，计算设备集群中的不同的计算设备1200中的存储器1206可以存储不同的指令，用于执行数据处理系统1100的部分功能。

本申请实施例还提供了一种计算机可读存储介质。所述计算机可读存储介质可以是计算设备能够存储的任何可用介质或者是包含一个或多个可用介质的数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘)等。该计算机可读存储介质包括指令，所述指令指示计算设备执行上述执行数据处理方法。

本申请实施例还提供了一种包含指令的计算机程序产品。所述计算机程序产品可以是包含指令的，能够运行在计算设备上或被储存在任何可用介质中的软件或程序产品。当所述计算机程序产品在至少一个计算设备上运行时，使得至少一个计算设备执行上述数据处理方法。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的保护范围。

Claims

一种数据处理方法，其特征在于，所述方法由分布式存储系统中主节点执行，包括：

获取第一请求，所述第一请求用于更新纠删码EC条带中的数据块；

根据所述第一请求确定所述第一数据块，所述第一数据块为所述第一请求关联的数据块；

向从节点集合发送处理请求，所述从节点集合包括所述分布式存储系统中至少一个从节点，所述处理请求用于指示将所述主节点更新数据块的操作卸载至所述从节点集合中的一个或多个从节点。
根据权利要求1所述的方法，其特征在于，所述向从节点集合发送处理请求，包括：

向第一从节点发送包括所述第二数据块的第二请求；

接收所述第一从节点将所述第一数据块更新为第二数据块所返回的所述第一数据块；

根据所述第一数据块和所述第二数据块确定校验块更新信息；

向第二从节点发送包括所述校验块更新信息的第三请求，所述校验块更新信息用于更新所述校验块。
根据权利要求1所述的方法，其特征在于，所述向从节点集合发送处理请求，包括：

向第一从节点发送包括所述第二数据块的第二请求，所述第二请求用于指示所述第一从节点将所述第一数据块更新为所述第二数据块，以及根据所述第一数据块和所述第二数据块确定校验块更新信息；

通过所述第一从节点向第二从节点发送包括所述校验块更新信息的第三请求，所述校验块更新信息用于更新所述校验块。
根据权利要求1至3中任一项所述的方法，其特征在于，

所述第一数据块存储在第一从节点，所述主节点与所述第一从节点为同一节点；或者，

所述EC条带中的校验块存储在第二从节点，所述主节点与所述第二从节点为同一节点。
根据权利要求1至4中任一项所述的方法，其特征在于，所述获取第一请求之前，所述方法还包括：

获取包括数据流的第四请求；

将所述数据流中的数据分块得到多个数据块，将所述多个数据块按列写入所述分布式存储系统中的数据块存储节点，所述数据块存储节点包括所述主节点和第一从节点；

根据所述多个数据块中每组数据块计算校验块，将所述校验块写入所述分布式存储系统中的校验块存储节点，所述校验块存储节点包括第二从节点；

其中，所述多个数据块无法写满至少一个EC条带时，对所述至少一个EC条带中无数据的分片执行空操作。
根据权利要求5所述的方法，其特征在于，所述方法还包括：

获取包括起始地址的第五请求；

根据所述起始地址确定目标节点，按列读取所述目标数据块。
一种数据处理装置，其特征在于，所述装置部署于分布式存储系统中主节点，所述装置包括：

获取单元，用于获取第一请求，所述第一请求用于更新纠删码EC条带中的数据块；

确定单元，用于根据所述第一请求确定所述第一数据块，所述第一数据块为所述第一请求关联的数据块；

通信单元，用于向从节点集合发送处理请求，所述从节点集合包括所述分布式存储系统中至少一个从节点，所述处理请求用于指示将所述主节点更新数据块的操作卸载至所述从节点集合中的一个或多个从节点。
根据权利要求7所述的装置，其特征在于，所述通信单元具体用于：

向第一从节点发送包括所述第二数据块的第二请求；

接收所述第一从节点将所述第一数据块更新为第二数据块所返回的所述第一数据块；

所述确定单元还用于：

根据所述第一数据块和所述第二数据块确定校验块更新信息；

所述通信单元具体用于：

向第二从节点发送包括所述校验块更新信息的第三请求，所述校验块更新信息用于更新所述校验块。
根据权利要求7所述的装置，其特征在于，所述通信单元具体用于：

向第一从节点发送包括所述第二数据块的第二请求，所述第二请求用于指示所述第一从节点将所述第一数据块更新为所述第二数据块，以及根据所述第一数据块和所述第二数据块确定校验块更新信息；

通过所述第一从节点向第二从节点发送包括所述校验块更新信息的第三请求，所述校验块更新信息用于更新所述校验块。
根据权利要求7至9中任一项所述的装置，其特征在于，

所述第一数据块存储在第一从节点，所述主节点与所述第一从节点为同一节点；或者，

所述EC条带中的校验块存储在第二从节点，所述主节点与所述第二从节点为同一节点。
根据权利要求7至10中任一项所述的装置，其特征在于，所述获取单元还用于：

所述获取第一请求之前，获取包括数据流的第四请求；

所述装置还包括：

读写单元，用于将所述数据流中的数据分块得到多个数据块，将所述多个数据块按列写入所述分布式存储系统中的数据块存储节点，所述数据块存储节点包括所述主节点和所述第一从节点；

所述读写单元，还用于根据所述多个数据块中每组数据块计算校验块，将所述校验块写入所述分布式存储系统中的校验块存储节点，所述校验块存储节点包括所述第二从节点；

其中，所述多个数据块无法写满至少一个EC条带时，所述读写单元具体用于对所述至少一个EC条带中无数据的分片执行空操作。
根据权利要求11所述的装置，其特征在于，所述获取单元还用于：

获取包括起始地址的第五请求；

所述读写单元还用于：

根据所述起始地址确定目标节点，按列读取所述目标数据块。
一种计算设备集群，其特征在于，所述计算设备集群包括至少一台计算设备，所述至少一台计算设备包括至少一个处理器和至少一个存储器，所述至少一个存储器中存储有计算机可读指令；所述至少一个处理器执行所述计算机可读指令，以使得所述计算设备集群执行如权利要求1至6中任一项所述的方法。
一种计算机可读存储介质，其特征在于，包括计算机可读指令；所述计算机可读指令用于实现权利要求1至6中任一项所述的方法。
一种计算机程序产品，其特征在于，包括计算机可读指令；所述计算机可读指令用于实现权利要求1至6中任一项所述的方法。