CN112732164A - 跨节点的数据组管理方法、装置及介质 - Google Patents

跨节点的数据组管理方法、装置及介质 Download PDF

Info

Publication number
CN112732164A
CN112732164A CN201911029694.0A CN201911029694A CN112732164A CN 112732164 A CN112732164 A CN 112732164A CN 201911029694 A CN201911029694 A CN 201911029694A CN 112732164 A CN112732164 A CN 112732164A
Authority
CN
China
Prior art keywords
data
group
data blocks
node
groups
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911029694.0A
Other languages
English (en)
Inventor
李树龙
张炎泼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baishanyun Technology Co ltd
Original Assignee
Beijing Baishanyun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baishanyun Technology Co ltd filed Critical Beijing Baishanyun Technology Co ltd
Priority to CN201911029694.0A priority Critical patent/CN112732164A/zh
Publication of CN112732164A publication Critical patent/CN112732164A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0617Improving the reliability of storage systems in relation to availability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本文是关于一种跨节点的数据组管理方法、装置及介质。跨节点的数据组管理方法包括将i组EC组数据按预设算法生成j组结果数据;将所述i组EC组数据和j组结果数据存储在i+j个节点中,其中,i为≥2的整数,j为≥1的整数。即使多个节点瘫痪,依然能够快速将原始数据恢复出来。

Description

跨节点的数据组管理方法、装置及介质
技术领域
本文涉及分布式存储,尤其涉及跨节点的数据组管理方法、装置及介质。
背景技术
EC,即Erasure Code,是一种通过冗余数据来提高实际数据可靠性的方法。通过实际数据和选定的EC算法,即刻创建包含冗余数据和实际数据的EC组。在系统中同时存储冗余数据和实际数据。当出现数据丢失,损坏的情况下,通过现存的实际数据和冗余数据来恢复丢失和损坏的数据。提高数据安全性的同时,降低存储成本。
相关技术中,对EC组数据的管理方式分为单节点存储和多节点分散存储,单节点存储将EC组数据存储在单个节点中,多节点分散存储将EC组数据分散存储到多个节点中。
单节点存储的方式,当存储EC组数据的节点瘫痪或者因为网络原因与系统其它部分失联,极易导致数据不可访问,系统可用性降低。这种存储方式要求节点极其稳定,并且在可接受的时间内即可恢复工作。而多节点分散存储的方式,数据的创建,更新,恢复都要通过跨节点的方式,读取或者发送数据,导致效率低,失败率高。
发明内容
为克服相关技术中存在的问题,本文提供一种跨节点的数据组管理方法、装置及介质。
根据本文的第一方面,提供一种跨节点的数据组管理方法,包括:
将i组EC组数据按预设算法生成j组结果数据;
将所述i组EC组数据和j组结果数据存储在i+j个节点中,其中,i为≥2的整数,j为≥1的整数。
所述EC组数据包括m个实际数据块和n个冗余数据块;所述将i组EC组数据按预设算法生成j组结果数据包括:
对所述i组EC组数据中每组EC组数据中的m个实际数据块和n个冗余数据块按相同顺序编号,对每一编号对应的i个数据块按预设算法得到j个结果数据块,将m+n个编号对应的m+n个结果数据块作为一组结果数据,得到j组结果数据。
同一EC组数据存储在一个节点中,同一组结果数据存储在一个节点中。
所述同一EC组数据存储在一个节点中包括:将所述同一EC组的m个实际数据块和n个冗余数据块分别存储在m+n个存储服务器中;
所述同一组结果数据存储在一个节点中包括:将所述同一组结果数据的m+n个结果数据块存储在m+n个存储服务器中。
j=1,所述预设算法为:异或运算。
当所述EC组数据部分损毁,通过所处节点中m+n个存储服务器内现存的实际数据块和冗余数据块恢复所述损毁数据;
当所述损毁数据无法通过所处节点中的m+n个存储服务器内的实际数据块和冗余数据块恢复或所处节点故障时,通过其他节点中的其他EC组中的数据块和j个节点中的结果数据块恢复所述损毁数据。
根据本文的另一方面,提供一种跨节点的数据组管理装置,包括:
结果数据生成模块,用于将i组EC组数据按预设算法生成j组结果数据;
分布存储模块,用于将所述i组EC组数据和j组结果数据存储在i+j个节点中,其中,i为≥2的整数,j为≥1的整数。
所述EC组数据包括m个实际数据块和n个冗余数据块;所述分布存储模块生成j组结果数据包括:
对所述i组EC组数据中每组EC组数据中的m个实际数据块和n个冗余数据块按相同顺序编号,对每一编号对应的i个数据块按预设算法得到j个结果数据块,将m+n个编号对应的m+n个结果数据块作为一组结果数据,得到j组结果数据。
同一EC组数据存储在一个节点中,同一组结果数据存储在一个节点中。
所述同一EC组数据存储在一个节点中包括:将所述同一EC组的m个实际数据块和n个冗余数据块分别存储在m+n个存储服务器中;
所述同一组结果数据存储在一个节点中包括:将所述同一组结果数据的m+n个结果数据块存储在m+n个存储服务器中。
j=1,所述预设算法为:异或运算。
当所述EC组数据部分损毁,通过所处节点中m+n个存储服务器内现存的实际数据块和冗余数据块恢复所述损毁数据;
当所述损毁数据无法通过所处节点中的m+n个存储服务器内的实际数据块和冗余数据块恢复或所处节点故障时,通过其他节点中的其他EC组中的数据块和j个节点中的结果数据块恢复所述损毁数据。
根据本文的另一方面,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现跨节点的数据组管理方法的步骤。
本文通过跨节点的多个数据组管理方法,可以降低系统对节点环境的要求,在节点和网络环境一般的情况下,仍能够提供较高的数据可靠性。即使单个节点瘫痪,通过异或运算的方式,依然能够将原始数据恢复出来。同时兼顾EC构建,更新和恢复数据的效率以及系统可用性。EC方式的构建,更新和数据恢复均发生在本地节点之内,提高了数据传输的效率,去除了跨节点进行数据拉取和结果保存可能导致失败的可能性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本文。
附图说明
构成本文的一部分的附图用来提供对本文的进一步理解,本文的示意性实施例及其说明用于解释本文,并不构成对本文的不当限定。
图1是根据一示例性实施例示出的一种跨节点的数据组管理方法的流程图。
图2是根据一示例性实施例示出的一种跨节点的数据组管理装置的框图。
具体实施方式
为使本文实施例的目的、技术方案和优点更加清楚,下面将结合本文实施例中的附图,对本文实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本文一部分实施例,而不是全部的实施例。基于本文中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文保护的范围。需要说明的是,在不冲突的情况下,本文中的实施例及实施例中的特征可以相互任意组合。
图1是根据一示例性实施例示出的一种跨节点的数据组管理方法的流程图。参考图1,跨节点的数据组管理方法包括:
步骤S11,将i组EC组数据按预设算法生成j组结果数据;
步骤S12,将i组EC组数据和j组结果数据存储在i+j个节点中,其中,i为≥2的整数,j为≥1的整数。
本实施中,将i组EC组数据按预设算法生成j组结果数据,并将i+j组EC组数据和结果数据存储在i+j个节点中,实现分布式存储,提高数据安全性,即使单个节点瘫痪,依然能够快速将原始数据恢复出来。
在一实施例中,EC组数据包括m个实际数据块和n个冗余数据块,其中,m>n,m为≥2的整数,n为≥1的整数。将i组EC组数据按预设算法生成j组结果数据包括:
对i组EC组数据中每组EC组数据中的m个实际数据块和n个冗余数据块按相同顺序编号,对每一编号对应的i个数据块按预设算法得到j个结果数据块,将m+n个编号对应的m+n个结果数据块作为一组结果数据,得到j组结果数据。
结果数据是i组EC组数据中,对应编号的i个数据块的结果数据块,是对应编号的i个数据块按预设算法生成的,预设算法可以是异或算法,也可以是EC算法,还可以是其他算法,本发明不做限制。在本实施例中,结果数据可以看作i个数据块的冗余数据块,根据实际环境,设定结果数据块的组数为j。当对应编号的i个数据块中有小于j个数据块损毁,例如,数据块损坏,丢失,或者由于系统故障无法读取,可以通过i个数据块中现存的数据块和结果数据块恢复损毁的数据块的内容。
在一实施例中,步骤S11将i组EC组数据和j组结果数据存储在i+j个节点中包括:
将i组EC组数据存储在i个节点中,其中,同一EC组数据存储在同一个节点中;将j组结果数据存储在不同于i个节点的j个节点中,其中,同一组结果数据存储在同一个节点中。
同一EC组数据存储在同一个节点中包括:将同一EC组的m个实际数据块和n个冗余数据块分别存储在同一节点的m+n个存储服务器中。
同一组结果数据存储在一个节点中包括:将同一组结果数据的m+n个结果数据块存储在同一节点的m+n个存储服务器中。
当EC组数据中有损毁数据块时,通过所处节点中m+n个存储服务器内现存的实际数据块和冗余数据块恢复损毁数据块;如果EC组数据中有小于等于n个数据块损毁,都可以通过现存的实际数据块和冗余数据块进行恢复,同时由于同一EC组数据的数据块在同一节点中,创建,更新,恢复EC组的数据在同一节点中进行,避免了跨节点的数据读取和传输,提高效率和成功率。
当损毁数据块无法通过所处节点中的m+n个存储服务器内的实际数据块和冗余数据块恢复或所处节点故障时,通过其他节点中的其他EC组数据中的数据块和j个节点中的结果数据块恢复损毁数据块。如果在同一EC组数据中,有多个数据块损毁,损毁的数据块大于n个时,损毁的数据块将无法通过该EC组数据中现存的数据块进行恢复,可以通过其他节点中其他EC组数据和结果数据中对应的数据块恢复损毁数据块。
或者,当节点出现故障,整个EC组数据都无法读取时,可以通过其他节点中的其他EC组数据和结果数据将无法读取的整个EC组恢复出来。
在一实施例中,j=1,预设算法为:异或运算。本实施例中,考虑存储成本,只产生一组结果数据,并将结果数据存储在单独的节点中。结果数据通过预设的异或运算生成,充分利用异或运算速度快的特点。对应编号的i个数据块存储在i个节点中,如果某个节点发生故障,可以通过未故障的节点中的i-1个数据块,和结果数据块,通过异或运算快速恢复出故障节点中对应的数据块,进而快速恢复出故障节点中存储的整个EC组数据。
为更好的理解本文跨节点的数据组管理方法,举例说明:
根据EC组策略,设定每组EC组包括4个实际数据块和2个冗余数据块。以3个EC组数据的存储为例,将3个EC组的数据分别存储在三个节点中。
在节点-a中,数据块0000,0001,0002,0003为实际数据块,0004,0005为冗余数据块;
在节点-b中,数据块0100,0101,0102,0103为实际数据块,0104,0105为冗余数据块;
在节点-c中,数据块0200,0201,0202,0203为实际数据块,0204,0205为冗余数据块;
对每组EC组数据中的实际数据块和冗余数据块按相同顺序编号,例如,实际数据块的编号为1,2,3,4。冗余数据块的编号为5,6。
在3个EC组中,对应编号为1的数据块为:0000,0100,0200,对此3个数据块进行异或运算,得到结果数据块0300。同样地,可以得到其他对应编号的数据块的结果数据块:0301,0302,0303,0304,0305。
将以上6个结果数据块存储在节点-d中,0300,0301,0302,0303为3个EC组中实际数据块对应的结果数据块,0304,0305为3个EC组中冗余数据块对应的结果数据块。
当以上3个EC组数据中,任一EC组数据中的数据块出现损毁或无法读取,如果损毁数据块个数不大于2个,则可通过现存的数据块恢复损毁的数据块,由于该EC组数据的现存数据块存在于一个节点中,可以快速恢复损毁数据,去除了跨节点进行数据拉取和结果保存可能导致失败的可能性。当以上3个EC组数据中,任一EC组数据中有大于2个的数据块损毁,例如以节点-a为例,0001,0002,0003三个数据损毁,则不能通过现存的0000,0004,0005恢复原有数据;此时可以由数据块0101,0201,0301通过异或算法恢复出数据块0001;由数据块0102,0202,0302通过异或算法恢复出0002;由数据块0103,0203,0303通过异或算法恢复出数据块0003;
或者,当节点-a机房出现故障,整个EC组的数据都无法读取的时候,可以通过节点-b,节点-c,节点-d中的数据通过异或运算恢复出整个节点-a中存储的EC组数据。
由以上实施例可知,通过本文中的跨节点的多个数据组管理方法,可以降低系统对节点环境的要求,在节点和网络环境一般的情况下,仍能够提供较高的数据可靠性。即使单个节点瘫痪,通过异或运算的方式,依然能够将原始数据恢复出来。同时兼顾EC构建,更新和恢复数据的效率以及系统可用性。EC组数据的构建,更新和数据恢复均发生在本地节点之内,提高了数据传输的效率,去除了跨节点进行数据拉取和结果保存可能导致失败的可能性。
图2是根据一示例性实施例示出的一种跨节点的数据组管理装置的框图。参考图2,跨节点的数据组管理装置包括结果数据生成模块201,分布存储模块202。
该结果数据生成模块201被设置为用于将i组EC组数据按预设算法生成j组结果数据。
该分布存储模块202被设置为用于用于将所述i组EC组数据和j组结果数据存储在i+j个节点中,其中,i为≥2的整数,j为≥1的整数。
EC组数据包括m个实际数据块和n个冗余数据块;分布存储模块生成j组结果数据包括:
对i组EC组数据中每组EC组数据中的m个实际数据块和n个冗余数据块按相同顺序编号,对每一编号对应的i个数据块按预设算法得到j个结果数据块,将m+n个编号对应的m+n个结果数据块作为一组结果数据,得到j组结果数据。
将i组EC组数据和j组结果数据存储在i+j个节点中包括:
将i组EC组数据存储在i个节点中,其中,同一EC组数据存储在同一个节点中;将j组结果数据存储在不同于上述i个节点的j个节点中,其中,同一组结果数据存储在同一个节点中。
同一EC组数据存储在同一个节点中包括:将同一EC组的m个实际数据块和n个冗余数据块分别存储在同一节点的m+n个存储服务器中;
同一组结果数据存储在同一个节点中包括:将同一组结果数据的m+n个结果数据块存储在同一节点的m+n个存储服务器中。
j=1,所述预设算法为:异或运算。
当所述EC组数据中有损毁数据块时,通过所处节点中m+n个存储服务器内现存的实际数据块和冗余数据块恢复所述损毁数据块;
当所述损毁数据块无法通过所处节点中的m+n个存储服务器内的实际数据块和冗余数据块恢复或所处节点故障时,通过其他节点中的其他EC组数据中的数据块和j个节点中的结果数据块恢复所述损毁数据块。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本领域技术人员应明白,本文的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本文可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本文可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质,包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质等。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
本文是参照根据本文实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。
尽管已描述了本文的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本文范围的所有变更和修改。
显然,本领域的技术人员可以对本文进行各种改动和变型而不脱离本文的精神和范围。这样,倘若本文的这些修改和变型属于本文权利要求及其等同技术的范围之内,则本文的意图也包含这些改动和变型在内。

Claims (13)

1.一种跨节点的数据组管理方法,其特征在于,包括:
将i组EC组数据按预设算法生成j组结果数据;
将所述i组EC组数据和j组结果数据存储在i+j个节点中,其中,i为≥2的整数,j为≥1的整数。
2.如权利要求1所述的跨节点的数据组管理方法,其特征在于,所述EC组数据包括m个实际数据块和n个冗余数据块,所述将i组EC组数据按预设算法生成j组结果数据包括:
对所述i组EC组数据中每组EC组数据中的m个实际数据块和n个冗余数据块按相同顺序编号,对每一编号对应的i个数据块按预设算法得到j个结果数据块,将m+n个编号对应的m+n个结果数据块作为一组结果数据,得到j组结果数据。
3.如权利要求2所述的跨节点的数据组管理方法,其特征在于,所述将所述i组EC组数据和j组结果数据存储在i+j个节点中包括:
将所述i组EC组数据存储在i个节点中,其中,同一EC组数据存储在同一个节点中;将所述j组结果数据存储在不同于所述i个节点的j个节点中,其中,同一组结果数据存储在同一个节点中。
4.如权利要求3所述的跨节点的数据组管理方法,其特征在于,所述同一EC组数据存储在同一个节点中包括:将所述同一EC组数据的m个实际数据块和n个冗余数据块分别存储在同一节点的m+n个存储服务器中;
所述同一组结果数据存储在同一个节点中包括:将所述同一组结果数据的m+n个结果数据块分别存储在同一节点的m+n个存储服务器中。
5.如权利要求4所述的跨节点的数据组管理方法,其特征在于,j=1,所述预设算法为:异或运算。
6.如权利要求1-5任一所述的跨节点的数据组管理方法,其特征在于,当所述EC组数据中有损毁数据块时,通过所处节点中m+n个存储服务器内现存的实际数据块和冗余数据块恢复所述损毁数据块;
当所述损毁数据块无法通过所处节点中的m+n个存储服务器内的实际数据块和冗余数据块恢复或所处节点故障时,通过其他节点中的其他EC组数据中的数据块和j个节点中的结果数据块恢复所述损毁数据块。
7.一种跨节点的数据组管理装置,其特征在于,所述装置包括:
结果数据生成模块,用于将i组EC组数据按预设算法生成j组结果数据;
分布存储模块,用于将所述i组EC组数据和j组结果数据存储在i+j个节点中,其中,i为≥2的整数,j为≥1的整数。
8.如权利要求7所述的跨节点的数据组管理装置,其特征在于,所述EC组数据包括m个实际数据块和n个冗余数据块;所述分布存储模块生成j组结果数据包括:
对所述i组EC组数据中每组EC组数据中的m个实际数据块和n个冗余数据块按相同顺序编号,对每一编号对应的i个数据块按预设算法得到j个结果数据块,将m+n个编号对应的m+n个结果数据块作为一组结果数据,得到j组结果数据。
9.如权利要求8所述的跨节点的数据组管理装置,其特征在于,
所述将所述i组EC组数据和j组结果数据存储在i+j个节点中包括:
将所述i组EC组数据存储在i个节点中,其中,同一EC组数据存储在同一个节点中;将所述j组结果数据存储在不同于所述i个节点的j个节点中,其中,同一组结果数据存储在同一个节点中。
10.如权利要求9所述的跨节点的数据组管理装置,其特征在于,所述同一EC组数据存储在同一个节点中包括:将所述同一EC组的m个实际数据块和n个冗余数据块分别存储在同一节点的m+n个存储服务器中;
所述同一组结果数据存储在同一个节点中包括:将所述同一组结果数据的m+n个结果数据块存储在同一节点的m+n个存储服务器中。
11.如权利要求10所述的跨节点的数据组管理装置,其特征在于,j=1,所述预设算法为:异或运算。
12.如权利要求7-10任一所述的跨节点的数据组的管理装置,其特征在于,
当所述EC组数据中有损毁数据块时,通过所处节点中m+n个存储服务器内现存的实际数据块和冗余数据块恢复所述损毁数据块;
当所述损毁数据块无法通过所处节点中的m+n个存储服务器内的实际数据块和冗余数据块恢复或所处节点故障时,通过其他节点中的其他EC组数据中的数据块和j个节点中的结果数据块恢复所述损毁数据块。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1-6中任意一项所述方法的步骤。
CN201911029694.0A 2019-10-28 2019-10-28 跨节点的数据组管理方法、装置及介质 Pending CN112732164A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911029694.0A CN112732164A (zh) 2019-10-28 2019-10-28 跨节点的数据组管理方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911029694.0A CN112732164A (zh) 2019-10-28 2019-10-28 跨节点的数据组管理方法、装置及介质

Publications (1)

Publication Number Publication Date
CN112732164A true CN112732164A (zh) 2021-04-30

Family

ID=75589132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911029694.0A Pending CN112732164A (zh) 2019-10-28 2019-10-28 跨节点的数据组管理方法、装置及介质

Country Status (1)

Country Link
CN (1) CN112732164A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644215A (zh) * 2023-07-27 2023-08-25 北京亿中邮信息技术有限公司 一种跨组织结构的数据更新方法以及更新系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009039336A2 (en) * 2007-09-21 2009-03-26 Hewlett-Packard Development Company, L.P. Generating a parallel recovery plan for a data storage system
CN101840377A (zh) * 2010-05-13 2010-09-22 上海交通大学 基于rs纠删码的数据存储方法
CN103761195A (zh) * 2014-01-09 2014-04-30 浪潮电子信息产业股份有限公司 一种利用分布式数据编码的存储方法
CN109426590A (zh) * 2017-09-01 2019-03-05 阿里巴巴集团控股有限公司 用于数据节点存储数据的方法和用于恢复数据的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009039336A2 (en) * 2007-09-21 2009-03-26 Hewlett-Packard Development Company, L.P. Generating a parallel recovery plan for a data storage system
CN101840377A (zh) * 2010-05-13 2010-09-22 上海交通大学 基于rs纠删码的数据存储方法
CN103761195A (zh) * 2014-01-09 2014-04-30 浪潮电子信息产业股份有限公司 一种利用分布式数据编码的存储方法
CN109426590A (zh) * 2017-09-01 2019-03-05 阿里巴巴集团控股有限公司 用于数据节点存储数据的方法和用于恢复数据的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周松: "面向数据密集型超级计算的基于纠删码的容错存储技术研究", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》, no. 03, pages 6 - 8 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644215A (zh) * 2023-07-27 2023-08-25 北京亿中邮信息技术有限公司 一种跨组织结构的数据更新方法以及更新系统
CN116644215B (zh) * 2023-07-27 2023-09-29 北京亿中邮信息技术有限公司 一种跨组织结构的数据更新方法以及更新系统

Similar Documents

Publication Publication Date Title
US10055216B2 (en) Minimizing image copying during partition updates
EP3321819B1 (en) Device, method and program for securely reducing an amount of records in a database
US20190188086A1 (en) Redundancy reduction in blockchains
US9250946B2 (en) Efficient provisioning of cloned virtual machine images using deduplication metadata
JP2021528883A (ja) 符号化ブロックチェーンデータのインデックス化および復元
CN111149093A (zh) 分布式存储系统的数据编码、解码及修复方法
CN109492049B (zh) 用于区块链网络的数据处理、区块生成及同步方法
CN111226206B (zh) 拍摄区块链数据的快照
CN109634932A (zh) 一种智能合约存储方法及存储系统
CN111400267B (zh) 记录日志的方法和装置
US11196633B2 (en) Generalized correlation of network resources and associated data records in dynamic network environments
US20160350188A1 (en) Method and apparatus of recovering and encoding for data recovery in storage system
CN103810061A (zh) 一种高可用云存储方法
CN111309523A (zh) 数据读写方法、数据远程复制方法及装置、分布式存储系统
CN106899654A (zh) 一种序列值生成方法、装置及系统
CN112087530B (zh) 一种将数据上传至区块链系统的方法、装置、设备及介质
CN108470039A (zh) 区块链中的数据处理方法和装置
CN111984735A (zh) 一种数据归档方法、装置、电子设备和存储介质
CN111984732A (zh) 在区块链上实现去中心化检索的方法、节点及区块链网络
US10673624B2 (en) Communication control device, communication control method, and computer program product
CN115756955A (zh) 一种数据备份、数据恢复的方法、装置及计算机设备
CN112732164A (zh) 跨节点的数据组管理方法、装置及介质
US9684668B1 (en) Systems and methods for performing lookups on distributed deduplicated data systems
CN110298031B (zh) 一种词典服务系统及模型版本一致性配送方法
CN112947847B (zh) 用于存储数据的方法、设备和计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination