WO2019137323A1

WO2019137323A1 - 一种数据存储方法、装置及系统

Info

Publication number: WO2019137323A1
Application number: PCT/CN2019/070582
Authority: WO
Inventors: 董元元; 赵亚飞; 魏舒展
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2018-01-09
Filing date: 2019-01-07
Publication date: 2019-07-18
Also published as: CN110018783B; US11210169B2; CN110018783A; US20200334106A1; EP3739441A1; EP3739441A4

Abstract

本申请公开了一种数据存储方法、装置及系统；上述数据存储方法，包括：对数据块进行纠删码编码，得到对应的多个数据分片；将多个数据分片分别写入对应分配的存储节点；若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则确定该数据块写入成功；其中，设定值大于或等于数据分片中的数据块分片的个数且小于或等于数据分片的个数。如此，能够降低数据写入延迟，并提高存储节点存在故障时的性能稳定性。

Description

一种数据存储方法、装置及系统

本申请要求2018年01月09日递交的申请号为201810020376.7、发明名称为“一种数据存储方法、装置及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及但不限于数据存储技术领域，尤其涉及一种数据存储方法、装置及系统。

背景技术

目前的分布式存储系统越来越多地采用纠删码(EC，Erasure Coding)技术对数据进行存储。以Reed-Solomon(RS，理德-所罗门)类EC为例，其技术原理是：将数据分割成K个数据块，采用冗余算法对K个数据块进行校验编码，生成M个校验块；其中，当K+M个块中小于或等于M个块丢失时，均可以还原丢失的块中的数据。为了保证存储的可靠性，分布式存储系统会将K+M个块交给K+M个存储节点进行存储。这样，即使某个节点出现故障，也能够根据其他节点中存储的数据进行数据恢复。

目前的分布式存储系统中EC实现方式主要包括：先将数据写成三个副本，然后在后台根据设定策略将三个副本转存成EC编码数据。然而，此种方式存在流量放大的问题。因此，针对某些情况下(比如，写入数据大于或等于128KB时)，可以直接进行EC编码，不再先写成三个副本，从而避免流量放大。然而，在上述直写(Direct)EC场景下，若写入过程中涉及的部分存储节点出现异常，导致不能保证所有存储节点均写入成功的情况下，则会一直重试写入直到超时或写入失败，对超时或写入失败的存储节点进行数据重建，重建完成后，再继续写入；如此，会产生比较大的写入延迟和写入失败率，从而导致直写EC延迟波动较大，性能不稳定。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本申请实施例提供一种数据存储方法、装置及系统，能够降低数据写入延迟，并提高存储节点存在故障时的性能稳定性。

第一方面，本申请实施例提供一种数据存储方法，包括：

对数据块进行纠删码编码，得到对应的多个数据分片；

将所述多个数据分片分别写入对应分配的存储节点；

若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则确定所述数据块写入成功；其中，所述设定值大于或等于所述数据分片中的数据块分片的个数且小于或等于所述数据分片的个数。

在示例性实施方式中，所述确定所述数据块写入成功之后，上述方法还可以包括：对于未成功写入存储节点的数据分片进行异步重新写入。

在示例性实施方式中，所述对于未成功写入存储节点的数据分片进行异步重新写入，可以包括：

向未成功写入数据分片的存储节点，重新写入所述数据分片；

若重新写入成功，则更新成功写入数据分片的存储节点的个数；

若重新写入失败，则对所述数据块进行密封操作，将所述数据块标记为只读，并通过存储管理节点对所述数据块进行数据重建和恢复。

在示例性实施方式中，所述将所述多个数据分片分别写入对应分配的存储节点之后，上述方法还可以包括：

若所述第一设定时长内成功写入数据分片的存储节点的个数小于所述设定值，则对所述数据块进行密封操作，将所述数据块标记为只读；

分配新的数据块，并确定所述新的数据块进行纠删码编码后得到的对应的多个数据分片；其中，所述新的数据块携带的数据内容与标记为只读的所述数据块携带的数据内容相同；

将所述新的数据块对应的数据分片分别写入重新分配的存储节点。

若第二设定时长内成功写入数据分片的存储节点的个数小于所述设定值，则确定所述数据块写入失败；其中，所述第二设定时长大于所述第一设定时长。

在示例性实施方式中，所述若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则确定所述数据块写入成功，可以包括：

若所述第一设定时长内成功写入数据分片的存储节点的个数大于或等于所述设定值，则在将未成功写入存储节点的数据分片成功写入已分配的备份存储节点后，确定所述数据块写入成功。

在示例性实施方式中，所述对数据块进行纠删码编码，得到对应的多个数据分片之前，上述方法还可以包括：

确定以下参数：任一数据块进行纠删码编码得到的数据块分片的个数K、任一数据块进行纠删码编码得到的校验分片的个数M、在任一数据块写入过程中的可靠性参数N；其中，K、M均为正整数，N为大于或等于0且小于或等于M的整数。

在示例性实施方式中，所述参数还可以包括：备份存储节点的个数。

第二方面，本申请实施例提供一种数据存储装置，包括：

编码模块，适于对数据块进行纠删码编码，得到对应的多个数据分片；

写入模块，适于将所述多个数据分片分别写入对应分配的存储节点；

处理模块，适于若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则确定所述数据块写入成功；其中，所述设定值大于或等于所述数据分片中的数据块分片的个数且小于或等于所述数据分片的个数。

在示例性实施方式中，所述处理模块，还可以适于在确定所述数据块写入成功之后，对于未成功写入存储节点的数据分片进行异步重新写入。

在示例性实施方式中，所述处理模块，还可以适于若所述第一设定时长内成功写入数据分片的存储节点的个数小于所述设定值，则对所述数据块进行密封操作，将所述数据块标记为只读；分配新的数据块，并确定所述新的数据块进行纠删码编码后得到的对应的多个数据分片；其中，所述新的数据块携带的数据内容与标记为只读的所述数据块携带的数据内容相同；以及将所述新的数据块对应的数据分片分别写入重新分配的存储节点。

在示例性实施方式中，所述处理模块，可以适于若所述第一设定时长内成功写入数据分片的存储节点的个数大于或等于所述设定值，则在将未成功写入存储节点的数据分片成功写入已分配的备份存储节点后，确定所述数据块写入成功。

在示例性实施方式中，上述装置还可以包括：参数确定模块，适于确定以下参数：任一数据块进行纠删码编码得到的数据块分片的个数K、任一数据块进行纠删码编码得到的校验分片的个数M、在任一数据块写入过程中的可靠性参数N；其中，K、M均为正整数，N为大于或等于0且小于或等于M的整数。

第三方面，本申请实施例提供一种数据存储系统，包括：存储客户端以及至少两个存储节点；其中，所述存储客户端适于对数据块进行纠删码编码，得到对应的多个数据分片；将所述多个数据分片分别写入对应分配的存储节点；若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则所述存储客户端确定所述数据块写入成功；其中，所述设定值大于或等于所述数据分片中的数据块分片的个数且小于或等于所述数据分片的个数。

在示例性实施方式中，所述存储客户端，还可以适于在确定所述数据块写入成功之后，对于未成功写入存储节点的数据分片进行异步重新写入。

在示例性实施方式中，上述系统还可以包括：存储管理节点，适于接收所述存储客户端的存储节点分配请求，并根据所述存储节点分配请求，给所述存储客户端分配存储所述数据分片的存储节点。

此外，本申请实施例还提供一种计算设备，包括存储器以及处理器，所述存储器适于存储数据存储程序，所述数据存储程序被所述处理器执行时实现上述第一方面提供的数据存储方法的步骤。

此外，本申请实施例还提供一种计算机可读介质，存储有数据存储程序，所述数据存储程序被处理器执行时实现上述第一方面提供的数据存储方法的步骤。

在本申请实施例中，对数据块进行EC编码，得到对应的多个数据分片；将多个数据分片分别写入对应分配的存储节点；若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则确定该数据块写入成功；其中，设定值大于或等于数据分片中的数据块分片的个数且小于或等于数据分片的个数。本申请实施例中，在数据块写入过程中能够容忍部分存储节点出现故障，即使部分存储节点出现故障，仍可以确定数据块写入成功；如此，实现降低数据写入延迟，提高存储节点存在故障时的性能稳定性。

当然，实施本申请的任一产品并不一定需要同时达到以上所有优点。

附图说明

图1为本申请实施例提供的数据存储系统的示意图；

图2为本申请实施例提供的数据存储系统的执行流程示例图一；

图3为本申请实施例提供的数据存储系统的执行流程示例图二；

图4为本申请实施例提供的数据存储方法的流程图；

图5为本申请实施例提供的数据存储装置的示意图；

图6为本申请实施例提供的计算设备的示意图。

具体实施方式

以下结合附图对本申请实施例进行详细说明，应当理解，以下所说明的实施例仅用于说明和解释本申请，并不用于限定本申请。

需要说明的是，如果不冲突，本申请实施例以及实施例中的各个特征可以相互结合，均在本申请的保护范围之内。另外，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

一些实施方式中，执行数据存储方法的计算设备可包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存(memory)。

内存可能包括计算机可读介质中的非永久性存储器、随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。内存可能包括模块1，模块2，……，模块N(N为大于2的整数)。

计算机可读介质包括永久性和非永久性、可移动和非可移动存储介质。存储介质可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)，快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本申请实施例提供一种数据存储方法、装置及系统，能够降低数据写入延迟，提高存储节点存在故障时的性能稳定性。特别地，在直写EC场景下，在部分存储节点出现异常，导致不能保证所有存储节点均写入成功的情况下，能够返回写入成功，从而降低直写EC处理延迟，并提高性能稳定性。

图1为本申请实施例提供的数据存储系统的示意图。如图1所示，本实施例提供的数据存储系统，包括：存储客户端(比如，存储客户端101a、101b、101n)以及多个存储节点(比如，存储节点102a、102b、102n)。存储客户端连接存储节点。

本实施例提供的数据存储系统可以为分布式存储系统。其中，存储客户端可以为部署在终端设备上的逻辑功能模块，负责确定写入存储节点的数据块，并向存储节点写入数据块，以及向用户或终端设备返回数据块是否写入成功的结果。存储节点适于存储数据块。存储节点可以是物理存储节点，也可以是物理存储节点划分的多个逻辑存储节点。然而，本申请对此并不限定。

如图1所示，本实施例提供的数据存储系统还可以包括：存储管理节点103，连接多个存储节点；存储管理节点103适于接收存储客户端的存储节点分配请求，并根据存储节点分配请求，给该存储客户端分配存储数据分片的存储节点。

本实施例中，存储客户端(比如，存储客户端101a)确定需要写入存储节点的数据块之后，向存储管理节点103发送存储节点分配请求，该存储节点分配请求中可以携带EC编码的相关参数；存储管理节点103接收该存储节点分配请求后，可以根据设定的存储节点分配策略，确定给该存储客户端分配的存储数据分片的存储节点；存储管理节点103向该存储客户端返回分配的存储节点的信息；然后，该存储客户端可以向这些存储节点写入对该数据块通过EC编码后得到的数据分片。其中，本申请对于存储节点分配策略并不限定。

本实施例中，针对一个数据块的多个数据分片，一个数据分片写入一个存储节点。因此，存储管理节点103给一个存储客户端分配的存储节点的数目可以根据数据块进行EC编码产生的数据分片的数目确定。

以EC编码采用Reed-Solomon算法为例，编码参数可以为(K，M)，决定了存储成本；其中，(K+M)/K为存储效率；例如，K＝8，M＝4，则存储效率为1.5。其中，K表示任一数据块进行EC编码得到的数据块分片的个数；M表示任一数据块进行EC编码得到的校验分片的个数。其中，K和M均为正整数。本示例中，一个数据块进行EC编码后可以得到K个数据块分片以及M个校验分片，即一共K+M个数据分片，则存储管理节点103可以给存储客户端分配K+M个存储节点。其中，M决定了完整的数据块在不丢失数据的情况下，最大能容忍宕掉存储节点的个数；换言之，当K+M个数据分片中小于或等于M个数据分片丢失时，均可以还原丢失的数据分片中的数据。

在本实施例中，存储客户端(比如，存储客户端101a)适于对数据块进行EC编码，得到对应的多个数据分片；将多个数据分片分别写入对应分配的存储节点；若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则存储客户端确定该数据块写入成功；其中，设定值大于或等于数据分片中的数据块分片的个数且小于或等于数据分片的个数。以EC编码采用Reed-Solomon算法，编码参数为(K，M)为例，则设定值可以大于或等于K且小于或等于K+M。换言之，当部分存储节点出现故障时，存储客户端仍可以确定数据块写入成功，比如向用户或终端设备返回数据块写入成功。

其中，第一设定时长可以根据相应场景下存储节点写入数据分片的超时平均值的经验值或统计值确定。然而，本申请对此并不限定。

本实施例中，在存储客户端还可以配置在任一数据块写入过程中的可靠性参数N；N用于决定在任一数据块的写入过程中，在确定该数据块写入成功且不丢失数据的情况下，最大能容忍宕掉存储节点的个数；其中，N为大于或等于0且小于或等于M的整数。即上述的设定值可以为K+N。换言之，在任一数据块的写入过程中，当K+M个数据分片中小于或等于N个数据分片丢失时，均可以确定该数据块写入成功。

在本实施例中，针对一个数据块的K+M个数据分片的写入过程，若成功写入数据分片的存储节点的数目为K+N个，则确定该数据块写入成功。因此，在写入过程中容忍故障的节点数可以为M-N。其中，N越大，数据可靠性越高，写入过程中容忍故障的节点数越少；N越小，数据可靠性越低，写入过程中容忍故障的节点数越多。

在一种示例性实施方式中，存储客户端还可以适于在确定数据块写入成功之后，对于未成功写入存储节点的数据分片进行异步重新写入。

示例性地，存储客户端可以适于通过以下方式对于未成功写入存储节点的数据分片进行异步重新写入：

向未成功写入数据分片的存储节点，重新写入数据分片；

若重新写入失败，则对数据块进行密封(Seal)操作，将该数据块标记为只读，并通过存储管理节点对该数据块进行数据重建和恢复。

其中，Seal操作可以包括：向存储管理节点持久化数据块的只读标记，使得该数据块标记为只读，不允许对该数据块的后续更新。

在本示例中，在部分存储节点出现异常，存储客户端仍确定数据块写入成功的情况下，对于未写入成功的数据分片进行异步写入处理，以确保数据块的完整写入。

示例性地，存储客户端还可以适于若第一设定时长内成功写入数据分片的存储节点的个数小于设定值，则对该数据块进行Seal操作，将该数据块标记为只读；分配新的数据块，并确定该新的数据块进行EC编码后得到的对应的多个数据分片；其中，该新的数据块携带的数据内容与标记为只读的该数据块携带的数据内容相同；将该新的数据块对应的数据分片分别写入重新分配的存储节点。

在本示例中，在未成功写入数据分片的存储节点的个数较多时，可以请求存储管理节点重新分配存储节点，然后，存储客户端重新分配新的数据块写入重新分配的存储节点。

示例性地，存储客户端还可以适于若第二设定时长内成功写入数据分片的存储节点的个数小于设定值，则确定数据块写入失败，比如，向用户或终端设备返回数据块写入失败；其中，第二设定时长大于第一设定时长。

在本示例中，第二设定时长可以根据存储客户端向用户返回写入结果的最大超时时长确定。即，存储客户端在进行写入过程的时长达到第二设定时长时，若仍没有满足写入成功的条件，则返回写入失败。

在另一示例性实施方式中，存储客户端还可以适于若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则在将未成功写入存储节点的数据分片成功写入已分配的备份存储节点后，确定数据块写入成功。

在本示例中，在存储客户端还可以配置备份存储节点的个数P；其中，P为正整数。示例性地，EC编码参数为(K，M)时，存储管理节点103分配给存储客户端用于存储数据分片的存储节点的数目可以为K+M+P个。

下面参照图2和图3对数据存储系统的执行流程进行说明。

图2为本申请实施例提供的数据存储系统的执行流程示例图一。本示例以直写EC场景下写入一个数据块的过程为例进行说明。其中，以EC采用Reed-Solomon算法，编码参数为(K，M)为例进行说明。而且，在本示例中，在存储客户端配置有数据写入过程中的可靠性参数N，用于决定在数据块的写入过程中，在确定写入成功且不丢失数据的情况下，最大能容忍宕掉存储节点的个数。

如图2所示，本示例包括以下流程：

S201、存储客户端确定第一次待写入的数据块；比如，存储客户端确定待写入的用户请求。

S202、存储客户端向存储管理节点请求分配存储节点；

本步骤中，存储客户端可以向存储管理节点发送存储节点分配请求，该存储节点分配请求中可以携带编码参数(K，M)；存储管理节点接收到存储节点分配请求之后，可以确定需要分配的存储节点的数目，即K+M个，然后，根据设定的存储节点分配策略，确定给该存储客户端分配哪些存储节点，并向该存储客户端返回分配的存储节点的信息；其中，存储管理节点确定分配的存储节点之后，在整个写入过程中，该存储客户端的数据块通过EC编码后得到的数据分片不再变更存储节点。

S203、存储客户端对该数据块进行EC编码，得到对应的K+M个数据分片；并将数据分片分别写入对应分配的存储节点；其中，一个存储节点对应写入一个数据分片。

本示例中，对一个数据块进行EC编码可以得到K个数据块分片以及M个校验分片，其中，K个数据块分片由该数据块分割得到，M个校验分片通过冗余算法对K个数据块分片进行校验编码得到。

S204、存储客户端确定成功写入数据分片的存储节点的个数；

在本步骤中，存储客户端可以确定第一设定时长内数据分片对应的存储节点写入成功的个数。其中，第一设定时长可以根据直写EC场景下存储节点写入数据分片的超时平均值的经验值或统计值确定。然而，本申请对此并不限定。

在本示例中，若一个存储节点成功写入数据分片，则该存储节点会向存储客户端返回写入成功响应消息，否则，返回写入失败响应消息或不返回响应消息；存储客户端根据第一设定时长内接收到的写入成功响应消息，确定成功写入数据分片的存储节点的个数，进而根据成功写入数据分片的存储节点的个数来确定该数据块是否写入成功。

本示例中，若存储客户端在写入过程中的第一设定时长内，确定成功写入数据分片的存储节点的个数等于K+M，即该数据块对应的数据分片全部写入成功，则存储客户端确认完成数据写入，可以向用户返回写入成功。若存储客户端在写入过程中的第一设定时长内，确定成功写入数据分片的存储节点的个数小于K+M且大于或等于K+N，则可以执行S205。若存储客户端在写入过程中的第一设定时长内，确定成功写入数据分片的存储节点的个数小于K+N，则可以执行S206。

S205、若存储客户端在写入过程中的第一设定时长内，确定成功写入数据分片的存储节点的个数小于K+M且大于或等于K+N，则存储客户端确定该数据块写入成功，可以返回用户写入成功，并且对于写入超时的M-N个存储节点，进行异步后台重试写入。

S207、存储客户端会判断在一定时长内进行的重试写入是否成功；若重试成功，则确认完成数据写入，即成功写入的存储节点恢复为K+M；若重试失败，则执行S208，即对该数据块进行Seal操作，保证该数据块不会有后续的追加更新操作，然后，由存储管理节点对该数据块进行后台Rebuild(重建)并进行数据恢复。其中，存储管理节点可以自动发起数据重建，然后在相应的存储节点进行数据恢复。

其中，Seal操作过程可以为：向分布式存储的存储管理节点持久化数据块的只读标记，使得该数据块标记为只读，不允许对该数据块的后续更新。

S206、若存储客户端在写入过程中的第一设定时长内，确定成功写入数据分片的存储节点的个数小于K+N，此时说明当前分配的存储节点的故障率较高，则可以在后台对该数据块进行Seal操作，保证该数据块不会有后续的追加更新操作，然后返回S201重新执行新的数据块的写入流程，其中，重新分配的新的数据块的数据内容与标记为只读的原数据块的数据内容一致。换言之，对未成功写入的数据内容重新执行写入过程。在重新写入过程中，存储管理节点重新分配写入数据分片的存储节点，然后，同样地根据成功写入数据分片的存储节点的个数来执行对应的操作处理。

在本示例中，若在第二设定时长内，成功写入的存储节点的个数仍小于K+N，则存储客户端确定数据块写入失败，可以向用户返回写入失败。其中，第二设定时长可以根据存储客户端向用户返回结果的最大超时时长确定。第二设定时长大于第一设定时长。

在本示例中，针对一个数据块，写入K+M个数据分片时，若K+N个存储节点成功写入数据分片，则存储客户端返回用户写入成功；由于K+N小于或等于K+M，所以写入过程中能够容忍M-N个存储节点出现故障；针对出现故障的存储节点可以通过异步方式追加数据，从而可以大幅降低写入延迟，从而保证直写EC场景下的性能稳定性。

图3为本申请实施例提供的数据存储系统的执行流程示例图二。本示例中以直写EC场景下写入一个数据块的过程为例进行说明。其中，以EC采用Reed-Solomon算法，编码参数为(K，M)为例进行说明。而且，在本示例中，在存储客户端配置有数据写入过程中的可靠性参数N以及备份存储节点的个数P；其中，N用于决定在数据块写入过程中，在确认写入成功且不丢失数据的情况下，最大能容忍宕掉存储节点的个数。

如图3所示，本示例包括以下流程：

S301、存储客户端确定第一次待写入的数据块；比如，存储客户端确定待写入的用户请求。

S302、存储客户端向存储管理节点请求分配存储节点；

本步骤中，存储客户端可以向存储管理节点发送存储节点分配请求，该存储节点分配请求中可以携带参数(K，M，P)；存储管理节点接收到存储节点分配请求之后，可以确定需要分配的存储节点的数目，即K+M+P个，然后，根据设定的存储节点分配策略，确定给该存储客户端分配哪些存储节点，并向该存储客户端返回分配的存储节点的信息；其中，存储管理节点确定分配的存储节点之后，在整个写入过程中，该存储客户端的数据块通过EC编码后得到的数据分片不再变更存储节点。

S303、存储客户端对该数据块进行EC编码，得到对应的K+M个数据分片；并将数据分片分别写入对应分配的存储节点；其中，一个存储节点对应写入一个数据分片。

S304、存储客户端确定成功写入数据分片的存储节点的个数。

本示例中，若存储客户端在写入过程中的第一设定时长内，确定成功写入数据分片的存储节点的个数等于K+M，即该数据块对应的数据分片全部写入成功，则存储客户端确认完成数据写入，可以向用户返回写入成功。若存储客户端在写入过程中的第一设定时长内，确定成功写入数据分片的存储节点的个数小于K+M且大于或等于K+N，则可以执行S305。若存储客户端在写入过程中的第一设定时长内，确定成功写入数据分片的存储节点的个数小于K+N，则可以执行S306。

关于本步骤的其他说明可以参照图2中的S204的描述，故于此不再赘述。

S305、若存储客户端在写入过程中的第一设定时长内，确定成功写入数据分片的存储节点的个数小于K+M且大于或等于K+N，即在第一设定时长内存在M-N个存储节点因超时或者故障写入失败时，存储客户端将未成功写入的数据分片写入到额外分配的P个备份存储节点中，并在存储管理节点持久化记录上述存储关系的元数据；在成功写入P个备份存储节点后，则存储客户端确定该数据块写入成功，可以向用户返回写入成功。

示例性地，P可以设置为3。比如，可以将未成功写入的数据分片写成三个副本，分别存储在三个存储节点。或者，可以依次将未成功写入的数据分片写入三个备份存储节点。然而，本申请对此并不限定。

关于S306的说明可以参照图2中的S206，故于此不再赘述。

图4为本申请实施例提供的数据存储方法的流程图。如图4所示，本实施例提供的数据存储方法，包括：

S401、对数据块进行EC编码，得到对应的多个数据分片；

S402、将多个数据分片分别写入对应分配的存储节点；

S403、若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则确定该数据块写入成功；其中，设定值大于或等于数据分片中的数据块分片的个数且小于或等于数据分片的个数。

本实施例提供的数据存储方法可以由数据存储系统中的存储客户端执行。

在示例性实施方式中，在S403之后，本实施例的数据存储方法还可以包括：对于未成功写入存储节点的数据分片进行异步重新写入。

示例性地，对于未成功写入存储节点的数据分片进行异步重新写入，可以包括：

向未成功写入数据分片的存储节点，重新写入数据分片；

若重新写入失败，则对该数据块进行密封(Seal)操作，将该数据块标记为只读，并通过存储管理节点对该数据块进行数据重建和恢复。

在示例性实施方式中，在S402之后，本实施例的数据存储方法还可以包括：

若第一设定时长内成功写入数据分片的存储节点的个数小于设定值，则对该数据块进行Seal操作，将该数据块标记为只读；

分配新的数据块，并确定新的数据块进行EC编码后得到的对应的多个数据分片；其中，新的数据块携带的数据内容与标记为只读的该数据块携带的数据内容相同；

将新的数据块对应的数据分片分别写入重新分配的存储节点。

在示例性实施方式中，在S402之后，本实施例的数据存储方法还可以包括：若第二设定时长内成功写入数据分片的存储节点的个数小于设定值，则确定数据块写入失败；其中，第二设定时长大于第一设定时长。

在示例性实施方式中，S403可以包括：

若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则在将未成功写入存储节点的数据分片成功写入已分配的备份存储节点后，确定数据块写入成功。

在示例性实施方式中，在S401之前，本实施例的数据存储方法还可以包括：确定以下参数：任一数据块进行纠删码编码得到的数据块分片的个数K、任一数据块进行纠删码编码得到的校验分片的个数M、在任一数据块写入过程中的可靠性参数N；其中，K、M均为正整数，N为大于或等于0且小于或等于M的整数。

以EC编码采用Reed-Solomon算法为例，编码参数可以为(K，M)，M决定了完整的数据块在不丢失数据的情况下，最大能容忍宕掉存储节点的个数。N决定了在任一数据块的写入过程中，在确定写入成功且不丢失数据的情况下，最大能容忍宕掉存储节点的个数；其中，N的取值为大于或等于0且小于或等于M的整数。即上述的设定值可以为K+N。

示例性地，上述参数还可以包括：备份存储节点的个数。

关于本实施例提供的数据存储方法的相关说明可以参照上述系统实施例的描述，故于此不再赘述。

图5为本申请实施例提供的数据存储装置的示意图。如图5所示，本实施例提供的数据存储装置，包括：

编码模块501，适于对数据块进行EC编码，得到对应的多个数据分片；

写入模块502，适于将多个数据分片分别写入对应分配的存储节点；

处理模块503，适于若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则确定该数据块写入成功；其中，设定值大于或等于数据分片中的数据块分片的个数且小于或等于数据分片的个数。

示例性地，处理模块503，还可以适于在确定该数据块写入成功之后，对于未成功写入存储节点的数据分片进行异步重新写入。

示例性地，处理模块503，还适于若第一设定时长内成功写入数据分片的存储节点的个数小于设定值，则对该数据块进行密封(Seal)操作，将该数据块标记为只读；分配新的数据块，并确定新的数据块进行EC编码后得到的对应的多个数据分片；其中，新的数据块携带的数据内容与标记为只读的该数据块携带的数据内容相同；以及将该新的数据块对应的数据分片分别写入重新分配的存储节点。

示例性地，处理模块503，可以适于若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则在将未成功写入存储节点的数据分片成功写入已分配的备份存储节点后，确定数据块写入成功。

示例性地，本实施例的数据存储装置还可以包括：参数确定模块，适于确定以下参数：任一数据块进行纠删码编码得到的数据块分片的个数K、任一数据块进行纠删码编码得到的校验分片的个数M、在任一数据块写入过程中的可靠性参数N；其中，K、M均为正整数，N为大于或等于0且小于或等于M的整数。

关于本实施例提供的数据存储装置的相关说明可以参照上述方法及系统实施例的描述，故于此不再赘述。

图6为本申请实施例提供的计算设备的示意图。如图6所示，本实施例提供的计算设备600，包括：存储器601和处理器602，存储器601适于存储数据存储程序，该数据存储程序被处理器602执行时实现图4对应实施例提供的数据存储方法的步骤。

其中，处理器602可以包括但不限于微处理器(MCU，Microcontroller Unit)或可编程逻辑器件(FPGA，Field Programmable Gate Array)等的处理装置。存储器601可用于存储应用软件的软件程序以及模块，如本实施例中的数据存储方法对应的程序指令或模块，处理器602通过运行存储在存储器601内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的数据存储方法。存储器601可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器601可包括相对于处理器602远程设置的存储器，这些远程存储器可以通过网络连接至上述计算设备600。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

示例性地，计算设备600还可以包括通信单元603；通信单元603可以经由一个网络接收或者发送数据。在一个实例中，通信单元603可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网络进行通信。

此外，本申请实施例还提供一种计算机可读介质，存储有数据存储程序，该数据存储程序被处理器执行时实现上述数据存储方法的步骤。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

以上显示和描述了本申请的基本原理和主要特征和本申请的优点。本申请不受上述实施例的限制，上述实施例和说明书中描述的只是说明本申请的原理，在不脱离本申请精神和范围的前提下，本申请还会有各种变化和改进，这些变化和改进都落入要求保护的本申请范围内。

Claims

一种数据存储方法，其特征在于，包括：

对数据块进行纠删码编码，得到对应的多个数据分片；

将所述多个数据分片分别写入对应分配的存储节点；

若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则确定所述数据块写入成功；其中，所述设定值大于或等于所述数据分片中的数据块分片的个数且小于或等于所述数据分片的个数。
根据权利要求1所述的方法，其特征在于，所述确定所述数据块写入成功之后，所述方法还包括：对于未成功写入存储节点的数据分片进行异步重新写入。
根据权利要求2所述的方法，其特征在于，所述对于未成功写入存储节点的数据分片进行异步重新写入，包括：

向未成功写入数据分片的存储节点，重新写入所述数据分片；

若重新写入成功，则更新成功写入数据分片的存储节点的个数；

若重新写入失败，则对所述数据块进行密封操作，将所述数据块标记为只读，并通过存储管理节点对所述数据块进行数据重建和恢复。
根据权利要求1所述的方法，其特征在于，所述将所述多个数据分片分别写入对应分配的存储节点之后，所述方法还包括：

若所述第一设定时长内成功写入数据分片的存储节点的个数小于所述设定值，则对所述数据块进行密封操作，将所述数据块标记为只读；

分配新的数据块，并确定所述新的数据块进行纠删码编码后得到的对应的多个数据分片；其中，所述新的数据块携带的数据内容与标记为只读的所述数据块携带的数据内容相同；

将所述新的数据块对应的数据分片分别写入重新分配的存储节点。
根据权利要求1所述的方法，其特征在于，所述将所述多个数据分片分别写入对应分配的存储节点之后，所述方法还包括：若第二设定时长内成功写入数据分片的存储节点的个数小于所述设定值，则确定所述数据块写入失败；其中，所述第二设定时长大于所述第一设定时长。
根据权利要求1所述的方法，其特征在于，所述若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则确定所述数据块写入成功，包括：若所述第一设定时长内成功写入数据分片的存储节点的个数大于或等于所述设定值，则在将未成功写入存储节点的数据分片成功写入已分配的备份存储节点后，确定所述数据块写入成功。
根据权利要求1所述的方法，其特征在于，所述对数据块进行纠删码编码，得到对应的多个数据分片之前，所述方法还包括：确定以下参数：任一数据块进行纠删码编码得到的数据块分片的个数K、任一数据块进行纠删码编码得到的校验分片的个数M、在任一数据块写入过程中的可靠性参数N；其中，K、M均为正整数，N为大于或等于0且小于或等于M的整数。
根据权利要求7所述的方法，其特征在于，所述参数还包括：备份存储节点的个数。
一种数据存储装置，其特征在于，包括：

编码模块，适于对数据块进行纠删码编码，得到对应的多个数据分片；

写入模块，适于将所述多个数据分片分别写入对应分配的存储节点；

处理模块，适于若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则确定所述数据块写入成功；其中，所述设定值大于或等于所述数据分片中的数据块分片的个数且小于或等于所述数据分片的个数。
根据权利要求9所述的装置，其特征在于，所述处理模块，还适于在确定所述数据块写入成功之后，对于未成功写入存储节点的数据分片进行异步重新写入。
根据权利要求9所述的装置，其特征在于，所述处理模块，还适于若所述第一设定时长内成功写入数据分片的存储节点的个数小于所述设定值，则对所述数据块进行密封操作，将所述数据块标记为只读；分配新的数据块，并确定所述新的数据块进行纠删码编码后得到的对应的多个数据分片；其中，所述新的数据块携带的数据内容与标记为只读的所述数据块携带的数据内容相同；以及将所述新的数据块对应的数据分片分别写入重新分配的存储节点。
根据权利要求9所述的装置，其特征在于，所述处理模块，适于若所述第一设定时长内成功写入数据分片的存储节点的个数大于或等于所述设定值，则在将未成功写入存储节点的数据分片成功写入已分配的备份存储节点后，确定所述数据块写入成功。
根据权利要求9所述的装置，其特征在于，所述装置还包括：参数确定模块，适于确定以下参数：任一数据块进行纠删码编码得到的数据块分片的个数K、任一数据块进行纠删码编码得到的校验分片的个数M、在任一数据块写入过程中的可靠性参数N；其中，K、M均为正整数，N为大于或等于0且小于或等于M的整数。
一种数据存储系统，其特征在于，包括：

存储客户端以及至少两个存储节点；

其中，所述存储客户端适于对数据块进行纠删码编码，得到对应的多个数据分片；将所述多个数据分片分别写入对应分配的存储节点；若第一设定时长内成功写入数据分片的存储节点的个数大于或等于设定值，则所述存储客户端确定所述数据块写入成功；其中，所述设定值大于或等于所述数据分片中的数据块分片的个数且小于或等于所述数据分片的个数。
根据权利要求14所述的系统，其特征在于，所述存储客户端，还适于在确定所述数据块写入成功之后，对于未成功写入存储节点的数据分片进行异步重新写入。
根据权利要求14所述的系统，其特征在于，所述系统还包括：存储管理节点，适于接收所述存储客户端的存储节点分配请求，并根据所述存储节点分配请求，给所述存储客户端分配存储所述数据分片的存储节点。
一种计算设备，其特征在于，包括存储器以及处理器，所述存储器适于存储数据存储程序，所述数据存储程序被所述处理器执行时实现如权利要求1至8中任一项所述的数据存储方法的步骤。
一种计算机可读介质，其特征在于，存储有数据存储程序，所述数据存储程序被处理器执行时实现如权利要求1至8中任一项所述的数据存储方法的步骤。