CN114296648B - 分布式云存储数据的维护方法、装置、设备和可读介质 - Google Patents

分布式云存储数据的维护方法、装置、设备和可读介质 Download PDF

Info

Publication number
CN114296648B
CN114296648B CN202111609620.1A CN202111609620A CN114296648B CN 114296648 B CN114296648 B CN 114296648B CN 202111609620 A CN202111609620 A CN 202111609620A CN 114296648 B CN114296648 B CN 114296648B
Authority
CN
China
Prior art keywords
data
mds
coupling
codes
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111609620.1A
Other languages
English (en)
Other versions
CN114296648A (zh
Inventor
李家伟
陈孝委
吴学含
李贵斌
薛强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Cloud Technology Co Ltd
Original Assignee
Tianyi Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Cloud Technology Co Ltd filed Critical Tianyi Cloud Technology Co Ltd
Priority to CN202111609620.1A priority Critical patent/CN114296648B/zh
Publication of CN114296648A publication Critical patent/CN114296648A/zh
Application granted granted Critical
Publication of CN114296648B publication Critical patent/CN114296648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本公开提供一种分布式云存储数据的维护方法、装置、设备和可读介质,其中,分布式云存储数据的维护方法包括:采用MDS纠删码将原始数据划分为K份;根据K份的原始数据生成M份校验数据,K与M的和值为存储原始数据的节点的总数;对MDS纠删码进行分层处理;对分层处理后的MDS纠删码进行耦合处理;通过耦合处理后的MDS纠删码进行数据修复。通过本公开实施例,提高了数据恢复的效率,缩短了恢复时间,降低了恢复数据所需的带宽。

Description

分布式云存储数据的维护方法、装置、设备和可读介质
技术领域
本公开涉及分布式存储技术领域,具体而言,涉及一种分布式云存储数据的维护方法、装置、设备和可读介质。
背景技术
目前,随机云计算技术的兴起,分布式存储系统以其高性能、大规模、可扩展性强等优势得到广泛的应用。为了保证分布式存储系统的可靠性和可用性,大多数云存储系统会引用多副本技术和纠删码。
随着数据的持续增长,在PB、EB级别的分布式存储系统中,多副本技术比纠删码引入更大的存储开销,例如三副本策略,这将占用原始数据的3倍存储空间。
在相关技术中,RS编码(Reed-Solomon code),即MDS码(Maximum DistanceSeparable)是目前被广泛使用的纠删码方案,它将k个数据块按照一定的编码规则,生成m个校验块,对于这k+m个编码块,其编码性质保证通过任意k个编码块均能重建出所有数据。以RS(8,4)编码为例,占用1.5倍的存储空间,就具有与三副本技术相同的容错能力。
但是,MDS技术虽然可以在保证容错能力的同时节省存储空间,但是也至少存在以下技术缺陷:
1、当数据失效时,修复数据需要从k个节点读取k份数据以重建原始数据,然后再编码生成失效数据,占用更多的磁盘IO和网络传输带宽,且恢复数据的效率低下。
2、MDS码技术数据修复的速度没有多副本快,多副本技术只需拷贝对应数据的冗余副本,不需要额外的操作,对于RS(n,k)纠删码来说,需要从k个节点读取k块数据,从k块数据解码生成失效的数据,再进行编码,占用了更多的CPU资源,引入了额外的计算开销。
3、在大规模集群环境下,磁盘异常已经成为常态,为了保持数据可靠性,存储系统需要频繁进行修复操作,进一步加重了纠删码修复给系统带来的压力。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种分布式云存储数据的维护方法、装置、设备和可读介质,用于至少在一定程度上克服由于相关技术的限制和缺陷而导致的分布式云存储数据的恢复效率差的问题。
根据本公开实施例的第一方面,提供一种分布式云存储数据的维护方法,包括:采用MDS纠删码将原始数据划分为K份;根据所述K份的原始数据生成M份校验数据,所述K与所述M的和值为存储所述原始数据的节点的总数;对所述MDS纠删码进行分层处理;对分层处理后的MDS纠删码进行耦合处理;通过耦合处理后的MDS纠删码进行数据修复。
在本公开的一种示例性实施例中,对所述MDS纠删码进行分层处理包括:确定所述MDS纠删码在所述节点的分层分布;将所述分层分布的MDS纠删码转换至高斯平面直角坐标系,所述高斯平面直角坐标系的z轴坐标以二进制表示。
在本公开的一种示例性实施例中,对分层处理后的MDS纠删码进行耦合处理包括:确定所述分层分布的MDS纠删码对应的矩阵,并记作MDS纠删码分层矩阵;根据预设的耦合矩阵对所述MDS纠删码分层矩阵进行耦合处理。
在本公开的一种示例性实施例中,通过耦合处理后的MDS纠删码进行数据修复包括:检测到任一所述节点失效;根据存在耦合关系的分层分布的MDS纠删码对失效的所述节点的数据进行修复。
在本公开的一种示例性实施例中,存在所述耦合关系的两个MDS纠删码之间的y轴坐标相同。
在本公开的一种示例性实施例中,存在所述耦合关系的两个MDS纠删码之间的x轴坐标不相同。
在本公开的一种示例性实施例中,还包括:在对失效的所述节点的数据进行修复后,对修复后的数据进行归一化处理。
根据本公开实施例的第二方面,提供一种分布式云存储数据的维护装置,包括:划分模块,设置为采用MDS纠删码将原始数据划分为K份;生成模块,设置为根据所述K份的原始数据生成M份校验数据,所述K与所述M的和值为存储所述原始数据的节点的总数;分层模块,设置为对所述MDS纠删码进行分层处理;耦合模块,设置为对分层处理后的MDS纠删码进行耦合处理;修复模块,设置为通过耦合处理后的MDS纠删码进行数据修复。
根据本公开的第三方面,提供一种电子设备,包括:存储器;以及耦合到所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上述任意一项所述的方法。
根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如上述任意一项所述的分布式云存储数据的维护方法。
本公开实施例,通过采用MDS纠删码将原始数据划分为K份,并根据所述K份的原始数据生成M份校验数据,所述K与所述M的和值为存储所述原始数据的节点的总数,进而对所述MDS纠删码进行分层处理,然后对分层处理后的MDS纠删码进行耦合处理,最后通过耦合处理后的MDS纠删码进行数据修复,提高了数据恢复的效率,缩短了恢复时间,降低了恢复数据所需的带宽。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本发明实施例的分布式云存储数据的维护方法或装置的示例性系统架构的示意图;
图2是本公开示例性实施例中一种分布式云存储数据的维护方法的流程图;
图3是本公开示例性实施例中另一种分布式云存储数据的维护方法的流程图;
图4是本公开示例性实施例中一种分布式云存储数据的维护方法的流程图;
图5是本公开示例性实施例中另一种分布式云存储数据的维护方法的流程图;
图6是本公开示例性实施例中一种分布式云存储数据的维护方法的流程图;
图7是本公开示例性实施例中另一种分布式云存储数据的维护方法的流程图;
图8是本公开示例性实施例中一种分布式云存储数据的维护方法的流程图;
图9是本公开示例性实施例中另一种分布式云存储数据的维护方法的流程图;
图10是本公开示例性实施例中一种分布式云存储数据的维护方法的流程图;
图11是本公开示例性实施例中另一种分布式云存储数据的维护方法的流程图;
图12是本公开示例性实施例中一种分布式云存储数据的维护装置的方框图;
图13是本公开示例性实施例中一种电子设备的方框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本发明实施例的分布式云存储数据的维护方法或装置的示例性系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一种或多种,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。
在一些实施例中,本发明实施例所提供的分布式云存储数据的维护方法一般由服务器105执行,相应地,分布式云存储数据的维护装置一般设置于终端设备103(也可以是终端设备101或102)中。在另一些实施例中,某些服务器可以具有与终端设备相似的功能从而执行本方法。因此,本发明实施例所提供的分布式云存储数据的维护方法不限定在终端设备执行。
下面结合附图对本公开示例实施方式进行详细说明。
图2是本公开示例性实施例中分布式云存储数据的维护方法的流程图。
参考图2,分布式云存储数据的维护方法可以包括:
步骤S202,采用MDS纠删码将原始数据划分为K份。
步骤S204,根据所述K份的原始数据生成M份校验数据,所述K与所述M的和值为存储所述原始数据的节点的总数。
步骤S206,对所述MDS纠删码进行分层处理。
步骤S208,对分层处理后的MDS纠删码进行耦合处理。
步骤S210,通过耦合处理后的MDS纠删码进行数据修复。
本公开实施例,通过采用MDS纠删码将原始数据划分为K份,并根据所述K份的原始数据生成M份校验数据,所述K与所述M的和值为存储所述原始数据的节点的总数,进而对所述MDS纠删码进行分层处理,然后对分层处理后的MDS纠删码进行耦合处理,最后通过耦合处理后的MDS纠删码进行数据修复,提高了数据恢复的效率,缩短了恢复时间,降低了恢复数据所需的带宽。
下面,对分布式云存储数据的维护方法的各步骤进行详细说明。
在本公开的一种示例性实施例中,如图3所示,对所述MDS纠删码进行分层处理包括:
步骤S302,确定所述MDS纠删码在所述节点的分层分布。
步骤S304,将所述分层分布的MDS纠删码转换至高斯平面直角坐标系,所述高斯平面直角坐标系的z轴坐标以二进制表示。
在本公开的一种示例性实施例中,后文将MDS纠删码简称为MDS码,确定MDS码在4个节点上的分布,MDS纠删码将原始数据分成K份,通过K份原始数据生成M份校验数据,生成m=2份的校验数据,将k+m=4份数据分别保存到4个节点,通过其中任意k=2份数据就可以还原所有节点的数据。
在本公开的一种示例性实施例中,多个MDS码在4个节点上的分层分布,可以将MDS码的分布视为xyz坐标系。其中,z坐标可以使用二进制表示,z=(0,0)表示0层,z=(1,0)表示1层,z=(0,1)表示2层,z=(1,1)表示3层,归纳为z=(z0,z1),层数z=2z0+z1
在本公开的一种示例性实施例中,如图4所示,对分层处理后的MDS纠删码进行耦合处理包括:
步骤S402,确定所述分层分布的MDS纠删码对应的矩阵,并记作MDS纠删码分层矩阵。
步骤S404,根据预设的耦合矩阵对所述MDS纠删码分层矩阵进行耦合处理。
在本公开的一种示例性实施例中,选择不需要耦合的节点数据,其选取办法是x=zy,即选取码的x坐标取决于z坐标,在y∈{0,1}取值,即每层选取的结果为{z0,0}和{z1,1},这两个节点可以代表z={z0,z1}层。剩下的纠删码就是需要耦合的MDS码。
在本公开的一种示例性实施例中,选取好需要耦合的MDS码之后,就需要对MDS码进行耦合,耦合是两个MDS码的线性运算,具有可逆过程,并且是在不同的层级进行的,且耦合的码的xy坐标满足y坐标相同且x坐标不相同的特点,以使尽可能多的不相关数据耦合到一个码字中,使该码字包含更多的信息,将耦合好的码分别代替其原MDS码,这样就构成了新的分层耦合MDS码。
在本公开的一种示例性实施例中,分层耦合MDS码的数学表达方式如下公式一、公式二和公式三所示:
|G|=|GM|×|C|,公式一
其中,|G|为MSR码生成矩阵,|C|为耦合矩阵,|GM|为MDS码生成矩阵,C(p)C*(p)是MSR码,U(p)U*(p)为分层后的MDS码,γ为预设参数值或预设参数矩阵。
在本公开的一种示例性实施例中,如图5所示,通过耦合处理后的MDS纠删码进行数据修复包括:
步骤S502,检测到任一所述节点失效。
步骤S504,根据存在耦合关系的分层分布的MDS纠删码对失效的所述节点的数据进行修复。
在本公开的一种示例性实施例中,本公开的实施例的数据恢复的数学表达式为公式四和公式五所示:
其中,|U|为解耦矩阵。
在本公开的一种示例性实施例中,存在所述耦合关系的两个MDS纠删码之间的y轴坐标相同。
在本公开的一种示例性实施例中,存在所述耦合关系的两个MDS纠删码之间的x轴坐标不相同。
在本公开的一种示例性实施例中,如图6所示,分布式云存储数据的维护方法还包括:
步骤S602,在对失效的所述节点的数据进行修复后,对修复后的数据进行归一化处理。
在本公开的一种示例性实施例中,如图7所示,分布式云存储数据的维护方法中的MDS码分层耦合过程包括:
步骤S702,进行MDS编码。
步骤S704,对多个MDS编码进行分层。
步骤S706,选取、耦合MDS码。
如图8所示,在本公开的一种示例性实施例中,多个MDS码在4个节点上的分层分布,可以将MDS码800的分布视为xyz坐标系。
如图9所示,分层MDS码900的z坐标可以使用二进制表示,z=(0,0)表示0层编码902,z=(1,0)表示1层编码904,z=(0,1)表示2层编码906,z=(1,1)表示3层编码908,归纳为z=(z0,z1),层数z=2z0+z1
选择不需要耦合的节点数据,其选取办法是x=zy,即选取码的x坐标取决于z坐标,在y∈{0,1}取值,即每层选取的结果为{z0,0}和{z1,1},这两个节点可以代表z={z0,z1}层。剩下的纠删码就是需要耦合的MDS码。
在本公开的一种示例性实施例中,如图10所示,分布式云存储数据的维护方法中的MDS码解耦修复过程包括:
步骤S1002,解耦MDS码。
步骤S1004,根据MDS解码的结果进行数据修复。
如图11所示,第0层编码1102包括失效节点对应的耦合码a2_b0和耦合码a3_c1,未被选中耦合的原始码a0和原始码a1。第1层编码1104包括失效节点对应的原始码b2和原始码b1,耦合码a2_b0和耦合码b3_d1。第2层编码1106包括失效节点对应的耦合码c2_d0和耦合码a3_c1,未被选中耦合的原始码c0和原始码c1。第3层编码1108包括失效节点对应的原始码d2,耦合码b3_d1和耦合码c2_d0,未被选中耦合的原始码d3。
若节点2为失效节点,则需要恢复的数据包括第0层编码1102的耦合码a2_b0、第1层编码1104的原始码b2、第2层编码1106的耦合码c2_d0以及第3层编码1108的原始码d2,分层耦合的MDS码1100的解码修复过程包括:
(1)从第1层编码1104上传a2_b0就可以恢复第0层的耦合码a2_b0。
(2)第1层编码1104和第3层编码1108的耦合码b3_d1解耦可以得到数据b3和数据d1,第1层编码1104的数据b1和数据b3传给节点2可以恢复数据b2。
(3)第3层编码1108的数据d1和数据d3传输给节点2可以恢复d2,第3层编码1108上传耦合码c2_d0就可以恢复第2层编码1106的耦合码c2_d0。
至此,失效节点2的数据全部恢复,需要归一化的数据量为6,而通用的RS码需要8。
在本公开的一种示例性实施例中,选取好需要耦合的MDS码之后,就需要对MDS码进行耦合,耦合是两个MDS码的线性运算,具有可逆过程,并且是在不同的层级进行的,且耦合的码的xy坐标满足y坐标相同且x坐标不相同的特点,以使尽可能多的不相关数据耦合到一个码字中,使该码字包含更多的信息,将耦合好的码分别代替其原MDS码,这样就构成了新的分层耦合MDS码。
基于本公开的实施例与现有技术相比,在带宽方面的效果说明如下:
首先,设置B为需要恢复的数据量,λ为数据恢复消耗的带宽,α为分配到每个节点的数据量,β为每个节点为了恢复传输的数据,d为某个节点数据失效帮助节点的总数,k为MDS码将原数据分割的数据块,m为MDS码的校验数据块,n=k+m,n为存储节点的数量。
由上述定义可知λ=dβ。
一般情况下,λ随着d的增加而减少,这是因为随着d的增加,β减小,并且β减小的速度大于d增加的速度,所以为了使λ最小,d一般取最大,即d=n-1。
对于一般的MSR码的计算方式如下公式六所示:
当取到最小存储消耗时的,计算方式如下公式七所示:
(α,λ)=(B/k,Bd/(k(d-k+1))),公式七
对于分层耦合MSR码有β/α=k/(k-m+1)成立。
经过推导可以得出消耗带宽和磁盘io消耗的公式八如下:
λ=dβ=dkα/(d-k+1))=(k+m-1)B/m,公式八
对比RS码的消耗公式λ=kB可知,分层耦合码可以大大降低带宽消耗和磁盘IO消耗。
例如,对于(12,8)的MDS码,当失效节点的数据为10M时,其消耗为λ=8×10=80M,对于分层耦合码,其消耗为λ=(8+4-1)×10/4=27.5M,只占MDS码的34%。另外,在得盘率方面,(12,8)的MDS码和分层耦合MSR码的得盘率是60%,对比三副本的33.3%的得盘率提升近两倍。
对应于上述方法实施例,本公开还提供一种分布式云存储数据的维护装置,可以用于执行上述方法实施例。
图12是本公开示例性实施例中一种分布式云存储数据的维护装置的方框图。
参考图12,分布式云存储数据的维护装置1200可以包括:
划分模块12021,设置为采用MDS纠删码将原始数据划分为K份。
生成模块1204,设置为根据所述K份的原始数据生成M份校验数据,所述K与所述M的和值为存储所述原始数据的节点的总数。
分层模块1206,设置为对所述MDS纠删码进行分层处理。
耦合模块1208,设置为对分层处理后的MDS纠删码进行耦合处理。
修复模块1210,设置为通过耦合处理后的MDS纠删码进行数据修复。
在本公开的一种示例性实施例中,对所述MDS纠删码进行分层处理包括:确定所述MDS纠删码在所述节点的分层分布;将所述分层分布的MDS纠删码转换至高斯平面直角坐标系,所述高斯平面直角坐标系的z轴坐标以二进制表示。
在本公开的一种示例性实施例中,对分层处理后的MDS纠删码进行耦合处理包括:确定所述分层分布的MDS纠删码对应的矩阵,并记作MDS纠删码分层矩阵;根据预设的耦合矩阵对所述MDS纠删码分层矩阵进行耦合处理。
在本公开的一种示例性实施例中,通过耦合处理后的MDS纠删码进行数据修复包括:检测到任一所述节点失效;根据存在耦合关系的分层分布的MDS纠删码对失效的所述节点的数据进行修复。
在本公开的一种示例性实施例中,存在所述耦合关系的两个MDS纠删码之间的y轴坐标相同。
在本公开的一种示例性实施例中,存在所述耦合关系的两个MDS纠删码之间的x轴坐标不相同。
在本公开的一种示例性实施例中,还包括:在对失效的所述节点的数据进行修复后,对修复后的数据进行归一化处理。
由于分布式云存储数据的维护装置1200的各功能已在其对应的方法实施例中予以详细说明,本公开于此不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图13来描述根据本发明的这种实施方式的电子设备1300。图13显示的电子设备1300仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图13所示,电子设备1300以通用计算设备的形式表现。电子设备1300的组件可以包括但不限于:上述至少一个处理单元1310、上述至少一个存储单元1320、连接不同系统组件(包括存储单元1320和处理单元1310)的总线1330。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1310执行,使得所述处理单元1310执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元1310可以执行如本公开实施例所示的方法。
存储单元1320可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)13201和/或高速缓存存储单元13202,还可以进一步包括只读存储单元(ROM)13203。
存储单元1320还可以包括具有一组(至少一个)程序模块13205的程序/实用工具13204,这样的程序模块13205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1330可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1300也可以与一个或多个外部设备1340(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1300交互的设备通信,和/或与使得该电子设备1300能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1350进行。并且,电子设备1300还可以通过网络适配器1360与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1360通过总线1330与电子设备1300的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1300使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
根据本发明的实施方式的用于实现上述方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和构思由权利要求指出。

Claims (10)

1.一种分布式云存储数据的维护方法,其特征在于,包括:
采用MDS纠删码将原始数据划分为K份;
根据所述K份的原始数据生成M份校验数据,所述K与所述M的和值为存储所述原始数据的节点的总数;
对所述MDS纠删码进行分层处理;
对分层处理后的MDS纠删码进行耦合处理,分层耦合MDS码的数学表达方式如下公式一、公式二和公式三所示:
,公式一
,公式二
,公式三
其中,所述|G|为MSR码生成矩阵,所述|C|为耦合矩阵,所述|GM|为MDS码生成矩阵,所述C(p)和C*(p)是MSR码,所述U(p)和U*(p)为分层后的MDS码,所述γ为预设参数值或预设参数矩阵;
通过耦合处理后的MDS纠删码进行数据修复,所述数据修复的数学表达式为公式四和公式五所示:
,公式四
,公式五
其中,所述|U|为解耦矩阵。
2.如权利要求1所述的分布式云存储数据的维护方法,其特征在于,对所述MDS纠删码进行分层处理包括:
确定所述MDS纠删码在所述节点的分层分布;
将所述分层分布的MDS纠删码转换至高斯平面直角坐标系,所述高斯平面直角坐标系的z轴坐标以二进制表示。
3.如权利要求2所述的分布式云存储数据的维护方法,其特征在于,对分层处理后的MDS纠删码进行耦合处理包括:
确定所述分层分布的MDS纠删码对应的矩阵,并记作MDS纠删码分层矩阵;
根据预设的耦合矩阵对所述MDS纠删码分层矩阵进行耦合处理。
4.如权利要求3所述的分布式云存储数据的维护方法,其特征在于,通过耦合处理后的MDS纠删码进行数据修复包括:
检测到任一所述节点失效;
根据存在耦合关系的分层分布的MDS纠删码对失效的所述节点的数据进行修复。
5.如权利要求4所述的分布式云存储数据的维护方法,其特征在于,
存在所述耦合关系的两个MDS纠删码之间的y轴坐标相同。
6.如权利要求4所述的分布式云存储数据的维护方法,其特征在于,
存在所述耦合关系的两个MDS纠删码之间的x轴坐标不相同。
7.如权利要求1-6中任一项所述的分布式云存储数据的维护方法,其特征在于,还包括:
在对失效的所述节点的数据进行修复后,对修复后的数据进行归一化处理。
8.一种分布式云存储数据的维护装置,其特征在于,包括:
划分模块,设置为采用MDS纠删码将原始数据划分为K份;
生成模块,设置为根据所述K份的原始数据生成M份校验数据,所述K与所述M的和值为存储所述原始数据的节点的总数;
分层模块,设置为对所述MDS纠删码进行分层处理;
耦合模块,设置为对分层处理后的MDS纠删码进行耦合处理,分层耦合MDS码的数学表达方式如下公式一、公式二和公式三所示:
,公式一
,公式二
,公式三
其中,所述|G|为MSR码生成矩阵,所述|C|为耦合矩阵,所述|GM|为MDS码生成矩阵,所述C(p)和C*(p)是MSR码,所述U(p)和U*(p)为分层后的MDS码,所述γ为预设参数值或预设参数矩阵;
修复模块,设置为通过耦合处理后的MDS纠删码进行数据修复,所述数据修复的数学表达式为公式四和公式五所示:
,公式四
,公式五
其中,所述|U|为解耦矩阵。
9.一种电子设备,其特征在于,包括:
存储器;以及
耦合到所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1-7中任一项所述的分布式云存储数据的维护方法。
10.一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如权利要求1-7中任一项所述的分布式云存储数据的维护方法。
CN202111609620.1A 2021-12-24 2021-12-24 分布式云存储数据的维护方法、装置、设备和可读介质 Active CN114296648B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111609620.1A CN114296648B (zh) 2021-12-24 2021-12-24 分布式云存储数据的维护方法、装置、设备和可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111609620.1A CN114296648B (zh) 2021-12-24 2021-12-24 分布式云存储数据的维护方法、装置、设备和可读介质

Publications (2)

Publication Number Publication Date
CN114296648A CN114296648A (zh) 2022-04-08
CN114296648B true CN114296648B (zh) 2023-08-08

Family

ID=80970239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111609620.1A Active CN114296648B (zh) 2021-12-24 2021-12-24 分布式云存储数据的维护方法、装置、设备和可读介质

Country Status (1)

Country Link
CN (1) CN114296648B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102843212A (zh) * 2012-08-03 2012-12-26 中兴通讯股份有限公司 编解码处理方法及装置
US8869001B1 (en) * 2012-06-27 2014-10-21 Amazon Technologies, Inc. Layered redundancy encoding schemes for data storage
WO2016058289A1 (zh) * 2015-01-20 2016-04-21 北京大学深圳研究生院 一种能修复多个节点失效的mds纠删码
CN105721611A (zh) * 2016-04-15 2016-06-29 西南交通大学 一种由极大距离可分存储码生成最小存储再生码的一般方法
CN110764950A (zh) * 2019-10-31 2020-02-07 深圳信息职业技术学院 基于rs码和再生码的混合编码方法、数据修复方法、及其系统
CN112256471A (zh) * 2020-10-19 2021-01-22 北京京航计算通讯研究所 基于网络数据转发与控制层面分离的纠删码修复方法
CN112860475A (zh) * 2021-02-04 2021-05-28 山东云海国创云计算装备产业创新中心有限公司 基于rs纠删码的校验块恢复方法、装置、系统及介质
CN113505021A (zh) * 2021-05-26 2021-10-15 南京大学 基于多主节点主从分布式架构的容错方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8869001B1 (en) * 2012-06-27 2014-10-21 Amazon Technologies, Inc. Layered redundancy encoding schemes for data storage
CN102843212A (zh) * 2012-08-03 2012-12-26 中兴通讯股份有限公司 编解码处理方法及装置
WO2016058289A1 (zh) * 2015-01-20 2016-04-21 北京大学深圳研究生院 一种能修复多个节点失效的mds纠删码
CN105721611A (zh) * 2016-04-15 2016-06-29 西南交通大学 一种由极大距离可分存储码生成最小存储再生码的一般方法
CN110764950A (zh) * 2019-10-31 2020-02-07 深圳信息职业技术学院 基于rs码和再生码的混合编码方法、数据修复方法、及其系统
CN112256471A (zh) * 2020-10-19 2021-01-22 北京京航计算通讯研究所 基于网络数据转发与控制层面分离的纠删码修复方法
CN112860475A (zh) * 2021-02-04 2021-05-28 山东云海国创云计算装备产业创新中心有限公司 基于rs纠删码的校验块恢复方法、装置、系统及介质
CN113505021A (zh) * 2021-05-26 2021-10-15 南京大学 基于多主节点主从分布式架构的容错方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Two New Classes of Two-Parity MDS Array Codes With Optimal Repair";Yan Wang 等;《IEEE》;第1293-1296页 *

Also Published As

Publication number Publication date
CN114296648A (zh) 2022-04-08

Similar Documents

Publication Publication Date Title
US10740183B1 (en) Recovering failed devices in distributed data centers
CN108733314B (zh) 用于独立冗余阵列(raid)重建的方法、设备和计算机可读存储介质
CN109643258B (zh) 使用高速率最小存储再生擦除代码的多节点修复
CN111149093B (zh) 分布式存储系统的数据编码、解码及修复方法
CN112860475B (zh) 基于rs纠删码的校验块恢复方法、装置、系统及介质
KR102592121B1 (ko) 분산 저장 시스템에서 엑스에프 소거 코드를 구현하기 위한 장치 및 방법
CN111697976B (zh) 一种基于分布式存储的rs纠删快速解码方法及系统
US11074146B2 (en) Method, device and computer program product for managing redundant arrays of independent drives
US10007456B1 (en) Efficient scrubbing of mirrored memory
WO2023116238A1 (zh) 基于纠删码的编码方法、分布式系统、设备及存储介质
CN114816837B (zh) 一种纠删码融合方法、系统、电子设备及存储介质
CN113505019A (zh) 一种纠删码数据及校验恢复方法、装置、设备及可读介质
CN111682874A (zh) 一种数据恢复的方法、系统、设备及可读存储介质
Chiu et al. A new diskless checkpointing approach for multiple processor failures
US10331519B2 (en) Application of secret sharing schemes at multiple levels of a dispersed storage network
CN114296648B (zh) 分布式云存储数据的维护方法、装置、设备和可读介质
CN111506450B (zh) 用于数据处理的方法、设备和计算机程序产品
CN111966644A (zh) 超级计算机数据存储方法、装置、系统及存储介质
CN114564337A (zh) 一种基于x码的分布式存储系统容错方法及系统
US20160156525A1 (en) Dynamic conversion of hardware resources of a server system
CN104025056B (zh) 一种数据恢复的方法及设备
US20230132242A1 (en) Method, device and computer program product for managing extent in storage system
US11855656B2 (en) Detection circuit and detection method, electronic device, and computer-readable storage medium
CN114564144B (zh) 在存储系统中创建区块阵列的方法、设备和程序产品
US20220179743A1 (en) Method, device and computer program product for storage management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant