CN111858146B - 用于恢复数据的方法、设备和计算机程序产品 - Google Patents
用于恢复数据的方法、设备和计算机程序产品 Download PDFInfo
- Publication number
- CN111858146B CN111858146B CN201910345777.4A CN201910345777A CN111858146B CN 111858146 B CN111858146 B CN 111858146B CN 201910345777 A CN201910345777 A CN 201910345777A CN 111858146 B CN111858146 B CN 111858146B
- Authority
- CN
- China
- Prior art keywords
- node identifiers
- child
- nodes
- data blocks
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000004590 computer program Methods 0.000 title claims abstract description 21
- 230000004044 response Effects 0.000 claims abstract description 12
- 238000012795 verification Methods 0.000 abstract 1
- 238000013500 data storage Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0613—Improving I/O performance in relation to throughput
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1451—Management of the data involved in backup or backup restore by selection of backup contents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1464—Management of the backup or restore process for networked environments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1469—Backup restoration techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0611—Improving I/O performance in relation to response time
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/065—Replication mechanisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computer Security & Cryptography (AREA)
Abstract
本公开的实施例涉及用于恢复数据的方法、设备和计算机程序产品。该方法包括获取与一组数据块有关的索引,索引包括用于获取一组数据块的多级节点。该方法还包括确定与要恢复的多个数据块相对应的索引中的多个节点的节点标识符集合,一组数据块包括多个数据块。该方法还包括基于索引和节点标识符集合,确定是否用多个节点中的第一组子节点的父节点的父节点标识符替换节点标识符集合中与第一组子节点有关的第一组子节点标识符;响应于用父节点标识符替换第一组子节点标识符,向备份服务器发送用于获取多个数据块的请求以用于从备份服务器获取多个数据块,请求包括父节点标识符。该方案减少了从备份服务器发送的流的数目,缩短了数据的验证时间。
Description
技术领域
本公开的实施例涉及数据的管理领域,具体地涉及用于恢复数据的方法、设备和计算机程序产品。
背景技术
随着信息技术的发展,需要存储的数据量变得越来越大。为了将存储这些数据,开发了各种大容量的存储装置。为了提高数据的存储效率和利用率,设计人员开发了各种平台、硬件部件、软件部件来加快数据的处理。
为了保证数据的安全性,存储数据时一般会对存储的数据进行备份。这种对数据进行备份的方式是便于在部分数据丢失时,可以通过备份的数据来恢复丢失的数据。然而,在数据存储和恢复过程中还存在许多需要处理的问题。
发明内容
本公开的实施例提供一种用于恢复数据的方法、设备和计算机程序产品。
根据本公开的第一方面,提供了一种用于恢复数据的方法。该方法包括获取与一组数据块有关的索引,索引包括用于获取一组数据块的多级节点。该方法还包括确定与要恢复的多个数据块相对应的索引中的多个节点的节点标识符集合,一组数据块包括多个数据块。该方法还包括基于索引和节点标识符集合,确定是否用多个节点中的第一组子节点的父节点的父节点标识符替换节点标识符集合中与第一组子节点有关的第一组子节点标识符。该方法还包括响应于用父节点标识符替换第一组子节点标识符,向备份服务器发送用于获取多个数据块的请求以用于从备份服务器获取多个数据块,请求包括父节点标识符。
根据本公开的第二方面,提供了一种用于恢复数据的方法。该方法包括从存储设备接收用于获取多个数据块的请求,请求包括对应于索引中的多个节点中的第一组子节点的父节点的父节点标识符,索引包括用于获取一组数据块的多级节点,一组数据块包括多个数据块,多个数据块对应于索引中的多个节点。该方法还包括基于父节点标识符,获取与父节点标识符有关的数据块子集,多个数据块包括数据块子集。该方法还包括向存储设备发送数据块子集以作为对请求的响应。
根据本公开的第三方面,提供了一种用于恢复数据的电子设备。该电子设备包括处理器;以及存储器,存储有计算机程序指令,处理器运行存储器中的计算机程序指令控制电子设备执行动作,该动作包括:获取与一组数据块有关的索引,索引包括用于获取一组数据块的多级节点;确定与要恢复的多个数据块相对应的索引中的多个节点的节点标识符集合,一组数据块包括多个数据块;基于索引和节点标识符集合,确定是否用多个节点中的第一组子节点的父节点的父节点标识符替换节点标识符集合中与第一组子节点有关的第一组子节点标识符;以及响应于用父节点标识符替换第一组子节点标识符,向备份服务器发送用于获取多个数据块的请求以用于从备份服务器获取多个数据块,请求包括父节点标识符。
根据本公开的第四方面,提供了一种用于恢复数据的电子设备。该电子设备包括处理器;以及存储器,存储有计算机程序指令,处理器运行存储器中的计算机程序指令控制电子设备执行动作,该动作包括:从存储设备接收用于获取多个数据块的请求,请求包括对应于索引中的多个节点中的第一组子节点的父节点的父节点标识符,索引包括用于获取一组数据块的多级节点,一组数据块包括多个数据块,多个数据块对应于索引中的多个节点;基于父节点标识符,获取与父节点标识符有关的数据块子集,多个数据块包括一组数据块;以及向存储设备发送数据块子集以作为对请求的响应。
根据本公开的第五方面,提供了一种计算机程序产品,该计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令,该机器可执行指令在被执行时使机器执行本公开的第一方面中的方法的步骤。
根据本公开的第六方面,提供了一种计算机程序产品,该计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令,该机器可执行指令在被执行时使机器执行本公开的第二方面中的方法的步骤。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1图示了根据本公开的实施例的设备和/或方法可以在其中被实施的示例环境100的示意图;
图2图示了根据本公开的实施例的与备份的数据块有关的索引的示例200的示意图;
图3图示了根据本公开的实施例的用于恢复数据的方法300的流程图;
图4A和图4B图示了根据本公开的实施例的与备份的数据块有关的索引的示例400的示意图;
图5图示了根据本公开的实施例的用于恢复数据的方法500的流程图;
图6图示了适于用来实施本公开内容的实施例的示例设备600的示意性框图。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
下面将参考附图中示出的若干示例实施例来描述本公开的原理。虽然附图中显示了本公开的优选实施例,但应当理解,描述这些实施例仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。
在数据存储领域,来自数据存储设备的数据被备份到后端的备份服务器。当后端的备份服务器接收到用于恢复数据的请求时,备份服务器会提供基于目标的数据恢复,其中每个目标对应于与备份的数据有关的索引中的一个节点。这种基于目标的数据恢复方法会对针对索引中的每个节点发送一个流。然而,在要恢复的数据对应的节点比较多时,会产生很多针对节点的流。由于针对每个节点都需要取回节点的数据、验证它的存在和大小。因此,这样节点越多需要耗费时间量越大。此外,由于与节点对应的流的数目较多,也会导致后端的备份服务器浪费较多的资源。
因此,为了至少解决上述问题,本公开提出了一种用于恢复数据的方案。根据本公开的各个实施方式,获取与要恢复的数据块有关的索引和要恢复的数据块的节点标识符。基于索引和该节点标识符的比较,来用节点标识符中的一组节点标识符的父节点标识符替换该一组节点标识符。通过这种方式,能够减少向备份服务器发送的与要恢复的数据块有关的节点标识符的数目,从而减少从备份服务器接收的流的数目。流的数目的减少使得目标验证时间被减少,并且还减少了取回每个节点的元数据的开销,同时也减少了备份服务器的资源消耗。
下面图1图示了根据本公开的实施例的设备和/或方法可以在其中被实施的示例环境100的示意图。
在示例环境100中包括数据存储设备102。数据存储设备102为用于存储数据的装置。为了数据安全性,数据存储设备102需要对数据进行备份。在一些实施例中,数据存储设备102可以为网络附加存储NAS设备。NAS设备可以连接到网络上,并从网络上接收大量的数据。在一些实施例中,数据存储设备102可以是直连式存储(DAS)设备、存储网络(SAN)设备以及其它存储数据并对数据进行备份的设备。上述示例仅是用于描述本公开,而非对本公开的具体限定,本领域技术人员可以基于需要设置任意合适的设备作为数据存储设备102。
数据存储设备102包括控制器106。控制器106用于控制数据存储设备102进行各种操作。在一些实施例中,控制器106可以包括硬件处理器,其包括但不限于硬件中央处理单元(CPU)、现场可编程门阵列(FPGA)、复合可编程逻辑器件(CPLD)、专用集成电路(ASIC)、片上系统(SoC)或其组合等。上述示例仅是用于描述本公开,而非对本公开的具体限定。本领域技术人员可以基于需要将控制器106设备为任意合适的形式。
数据存储设备102还包括存储器108。存储器108可用于存储用于数据存储设备102的指令和数据。在一些实施例中,存储器108可以包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EEPROM)、闪速存储器或其它存储器技术、光盘只读存储器CD-ROM)、DVD或其他光学存储器等。上述示例仅是用于描述本公开,而非对本公开的具体限定。本领域技术人员可以基于需要将存储器108设置为任意合适的形式。
在数据存储系统中,索引通常被设置为用于指示已备份的数据块的存储路径。在一些实施例中,存储器108可以存储与已经备份的数据有关的索引。在一些实施例中,与已经备份的数据有关的索引可以存储在其他设备中,例如用于存储元数据的元数据服务器。上述示例仅是用于描述本公,而非对本公开的具体限定。与备份的数据块有关的索引可以存储在与数据存储设备相关联的任意设备中。
在一些实施例中,索引的数据结构可以呈现为树结构的形式。在一些实施例中,索引的数据结构可以呈现为链表的形式。在一些实施例中,索引中可以具有根节点(父节点)和叶子节点。叶子节点指示已存储的数据块,例如文件等;而父节点指示下一级子节点。上述索引的示例仅是用于描述本公开,而非对本公开的具体限定,本领域技术人员可以基于需要将索引设置为任意合适的形式。
示例环境100还包括备份服务器104。备份服务器104用于存储备份的数据块。备份服务器104可以包括各种易失性和/或非易失性数据存储介质。存储介质的示例可以包括但不限于磁盘、光盘、硬盘、固态硬盘(SSD)、高速缓存。上述示例仅是用于描述本公开,而非对本公开的具体限定。本领域技术人员可以基于将任意合适的设置为备份服务器104。
上面图1示出了根据本公开的实施例的设备和/或方法可以在其中被实施的示例环境100的示意图,下面结合图2描述与已备份到备份服务器104的数据块有关的索引的示例200。
如图2所示,该索引200的结构例如为树结构,其包括多级节点。在该示例200中,其包括第一级节点:节点202,也称为根节点,第二级节点:节点204和节点206,节点204为叶节点;第三级节点:节点208、210、212和214,这些节点为父节点206的子节点。在一些实施例中,索引200中的叶节点内存储一些数据块的存储地址,父节点中内存储到子节点的路径。通过索引的叶节点可以找到相应的已备份的数据块。要恢复的数据对对应于节点204、210、212和214
上述示例仅是用于描述本公开,而非对本公开的具本限定。本领域技术人员可以将索引设置为任意合适的形式。
上面图2描述了根据本公开的实施例的与备份的数据块有关的索引的示例200的示意图,下面结合图3描述根据本公开的实施例的用于恢复数据的方法300的流程图。
如图3所示,数据存储设备102可以确定用户需要恢复的数据内容。基于用户的恢复操作求或数据存储设备102发起的数据恢复操作,在框302处,数据存储设备102获取与一组数据块有关的索引,该索引包括与一组数据块对应的多级节点,可以使用索引中的节点来获取数据块。
在一些实施例中,在数据存储设备102进行了一次数据备份操作时可以生成与此次备份的所有数据有关的索引。索引的节点可以为文件名或目录等。在一些实施例中,也可以对备份的任意数量的数据生成索引。上述示例仅是用于描述本公开,而非对本公开的具体限定。本领域技术人员可以依据需要设置索引与已备份的数据之间的关系。
在框304处,确定与要恢复的多个数据块相对应的索引中的多个节点的节点标识符集合,与索引对应的一组数据块包括要恢复的多个数据块。在恢复数据时,确定与要需要恢复的数据块对应的索引中的多个节点的节点标识符。
在框306处,基于索引和节点标识符集合,确定是否用多个节点中的一组子节点的父节点的父节点标识符替换节点标识符集合中与一组子节点有关的一组子节点标识符。
在节点标识符集合中确定出具有相同父节点的一组子节点。然后根据索引确定是否用父节点标识符替换节点标识符集合中的一组子节点标识符。使用父节点标识符替换一组子节点标识符,则可以将从备份服务器104获得的针对一组子节点的一组流替换为针对父节点的一个流。如何基于索引和节点标识符集合来确定就否用父节点标符替换子节点标识符的过程将在后面结合图4A和图4B进行详细描述。
在框308处,数据存储设备102确定是否用父节点标识符替换第一组子节点标识符。如果确定用父节点标识符替换第一组子节点标识符,在框310处,向备份服务器104发送用于获取多个数据块的请求以用于从备份服务器104获取多个数据块,该请求包括父节点标识符。
备份服务器104接收到该请求后,会发送针对父节点的流,而不会针对要恢复的数据块中每个块产生一个流。通过上述方法,可以减少由备份服务器发送的流的数目,从而减少了由于针对每个节点都需要取回节点的数据、验证它的存在和大小的时间成本,并且也减少了对后端备份服务器的资源的使用。
上述图3描述了根据本公开的实施例的用于恢复数据的方法300的流程图,下面结合图4A和图4B详细描述在框306处的操作。
如图4A所示,与备份的数据块有关的索引包括第一级节点:节点402,第二级节点:节点404和节点406,第三级节点:节点408、410、412和414。与要恢复的数据块对应的节点为节点408、节点410、节点412和节点414。
数据存储设备102获得了索引和要恢复的数据块的数据块标识符集合。如图4A所示,获得了索引400,以及与要恢复的数据块相对应的节点408、节点410、节点412和节点414的节点标识符。
然后,数据存储设备102确定与要恢复的多个数据块相应的多个节点中的一组子节点中的子节点的数目。为了便于描述,在标识符集合中获得的一组子节点中子节点的数目被称为第一数目。在一些实施例中,数据存储设备102基于节点标识符的标识信息确定哪些节点标识符属于一个组,即它们具有相同的父节点。备选地或附加地,通过对表示节点标识符的路径进行划分来确定节点标识符是否属于同一组。上述示例仅是用于描述本公开,而非对本公开的具体限定。本领域技术人员可以采用任意合适的方式来确定具有相同父节点的一组子节点。
在图4A中,与要恢复的数据块对应的节点408、节点410、节点412和节点414组成一组子节点,其子节点数目为4。
基于确定的一组子节点确定出其父节点。然后,从索引中确定与该父节点有关的子节点的数目。为了便于描述,从索引中获得的子节点的目被称为第二数目。如图4A所示,可以通过节点408、节点410、节点412和节点414相对应的标识符信息确定出其父节点。然后在索引400中确定父节点中子节点的数目为4。
根据第一数目和第二数目,确定是否用父节点标识符替换第一组子节点标识符。在一些实施例中,确定父节点在标识符集合中具有的子节点的第一数目和父节点在索引中具有的子节点的第二数目的比值。然后,确定比值是否大于阈值;以及该比值大于阈值时,用父节点标识符替换第一组子节点标识符。备选地或附加地,该阈值被设置为0.8。在一些实施例中,确定第二数目和第一数目的差值,然后基于差值的大小来确定中否用父节点标识符替换子节点标识符。上述示例仅是用于描述本公开,而非对本公开的具体限定,本领域技术人员可以基于任意合适的方式来使用第一数目和第二数目来确定是否用父节点标识符来替换一组子节点标识符。
如图4A所示,与要恢复的数据有关的节点408、节点410、节点412和节点414的父节点在索引中也只具有4个子节点。因此,如图4B所示,用父节点的父节点标识符替换节点标识符集合中节点408、节点410、节点412和节点414的节点标识符。
在上述方法中,通过标识符集合中与父节点有关的一组子节点的第一数目和索引中与父节点有关的子节点的第二数目来确定实现用父节点标识符代替子节点标识符,不仅可以在减少接收到的流,还防止由于替换过程而产生较大的开销。
为了描述方便,与要恢复的数据块有关的一组节点标识符在下文中被称为第一组子节点描述符。在一些实施例中,在索引中的父节点下面还存在与要恢复的数据块无关的节点。此时用父节点标识符替换一组子节点标识符,会将不需要的数据传送回来。因此,需要确定索引中的父节点是否存在与第一组子节点不同的第二组子节点。如果存在第二组子节点,则确定出与第二组子节点有关的第二组子节点标识符。然后,将第二组子节点标识符添加到向备份服务器104发送的请求中以用于使得备份服务器104不传送与第二组子节点标识符有关的数据块。
在一些实施例中,在确定用父节点标识符替换节点标识符合集合中的第一组子节点标识符后,还可以在节点标识符合集合用上述方法继续确定节点标识符集合中的新的一组子节点是否需要用其父节点标识符替换。
通过根据本公开的各个实施例,可以在用父节点标识符获取一组子节点的数据时,而不需要传送不需要被恢复的子节点的数据,从而减少了数据传输的量,并且减少了数据处理的时间,提高了数据处理的效率。
上面结合图4描述了确定是否用父节点标识符替换子节点标识符的过程,下面结合图5描述根据本公开的实施例的用于恢复数据的方法500的流程图。该方法在备份服务器104侧执行。
在框502处,备份服务器104从数据存储设备102接收用于获取多个数据块的请求。在一些实施例中,在该请求中包括与要恢复的多个数据块相对应的节点标识符。该节点标识符包括对应于索引中的多个节点中的第一组子节点的父节点的父节点标识符。其中,索引包括用于获取已在备份服务器104备份的一组数据块的多级节点。要恢复的多个数据块是这一组数据块中的数据块。此外,要恢复的多个数据块对应于索引中的多个节点。备选地或附加地,该请求中还包括与获取数据的节点标识符有关的被排除的节点标识符。
在框504处,备份服务器104基于父节点标识符,获取与接收到的父节点标识符有关的数据块子集。其中,要获取的多个数据块包括该数据块子集。该数据块子集是基于父节点标识符从备份服务器104中获取的。
在一些实施例中,该请求中包括父节点标识符,并且不含有指示与父节点有关的被排除的子节点的子节点标识符。然后,获得与父节点标识符相对应的数据块子集。通过针对父节点标识符的流来发送与父节点相对应的数据块子集。
在一些实施例中,请求还包括第二组子节点标识符。第二组子节点标识符对应于索引中的父节点的第二组子节点,其中该请求指示不传送与第二组子节点有关的数据块。第二组子节点不同于第一组子节点。因此,在获取与父节点标识符相对应的数据块子集时,不获取与第二组子节点有关的数据块。然后将获得的数据块子集发送到数据存储设备102。上述示例仅是用于描述本公开,而非对本公开的具体限定。
在框506处,备份服务器104向存储设备发送数据块子集以作为对请求的响应。备份服务器104针对接收到的父节点标识符来形成针对父节点标识符的流,来传送与父节点标识符相对应的数据块子集。备选地或附加地,在传送的数据块中不包括针对每个节点标识符的排除子节点的数据块。在一些实施例中,针对接收到的请求中的标识符集合中的其他节点标识符形成传送与其他节点标识符相对应的数据块的流。上述示例仅是用于描述本公开,而非对本公开的具体限定。
通过发送与父节点标识符相对应的流,而不是与父节点的一组子节点相对应的一组流,减少了发送的流的数目,提高了备份服务器处的资源利用率,并且减少了数据检验的次数。
图6示出了可以用来实施本公开内容的实施例的示例设备600的示意性框图。例如,如图1所示的102、104中的任一项可以由设备600来实施。如图所示,设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的计算机程序指令或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序指令,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法300和500可由处理单元601执行。例如,在一些实施例中,方法300和500可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序被加载到RAM 603并由CPU 601执行时,可以执行上文描述的方法300和500的一个或多个动作。
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (7)
1.一种用于恢复数据的方法,包括:
获取与一组数据块有关的索引,所述索引包括用于获取所述一组数据块的多级节点;
确定与要恢复的多个数据块相对应的所述索引中的多个节点的节点标识符集合,所述一组数据块包括所述多个数据块;
基于所述索引和所述节点标识符集合,确定用第一组子节点的父节点的父节点标识符替换与所述第一组子节点有关的第一组子节点标识符,其中所述第一组子节点标识符在所述节点标识符集合中,其中确定用父节点标识符替换所述第一组子节点标识符还包括:
确定所述第一组子节点中的子节点的第一数目和所述索引中与所述父节点有关的子节点的第二数目;以及
基于所述第一数目和所述第二数目,确定用所述父节点标识符替换所述第一组子节点标识符;以及
响应于用所述父节点标识符替换所述第一组子节点标识符,向备份服务器发送请求以用于从所述备份服务器获取所述多个数据块,所述请求包括所述父节点标识符。
2.根据权利要求1所述的方法,其中基于所述第一数目和所述第二数目,确定用所述父节点标识符替换所述第一组子节点标识符包括:
确定所述第一数目和所述第二数目的比值;
确定所述比值是否大于阈值;以及
响应于所述比值大于所述阈值,用所述父节点标识符替换所述第一组子节点标识符。
3.根据权利要求1所述的方法,其中向所述备份服务器发送请求以用于获取所述多个数据块包括:
响应于用所述父节点标识符替换所述第一组子节点标识符,确定所述索引中的所述父节点是否存在与所述第一组子节点不同的第二组子节点;
响应于确定存在所述第二组子节点,确定与所述第二组子节点有关的第二组子节点标识符;以及
将所述第二组子节点标识符添加到所述请求以用于使得所述备份服务器不传送与所述第二组子节点标识符有关的数据块。
4.一种用于恢复数据的电子设备,所述电子设备包括:
处理器;以及
存储器,存储有计算机程序指令,处理器运行存储器中的所述计算机程序指令控制所述电子设备执行动作,所述动作包括:
获取与一组数据块有关的索引,所述索引包括用于获取所述一组数据块的多级节点;
确定与要恢复的多个数据块相对应的所述索引中的多个节点的节点标识符集合,所述一组数据块包括所述多个数据块;
基于所述索引和所述节点标识符集合,确定用所述多个节点中的第一组子节点的父节点的父节点标识符替换与所述第一组子节点有关的第一组子节点标识符,其中所述第一组子节点标识符在所述节点标识符集合中,其中确定用父节点标识符替换所述第一组子节点标识符还包括:
确定所述第一组子节点中的子节点的第一数目和所述索引中与所述父节点有关的子节点的第二数目;以及
基于所述第一数目和所述第二数目,确定用所述父节点标识符替换所述第一组子节点标识符;以及
响应于用所述父节点标识符替换所述第一组子节点标识符,向备份服务器发送请求以用于从所述备份服务器获取所述多个数据块,所述请求包括所述父节点标识符。
5.根据权利要求4所述的电子设备,其中基于所述第一数目和所述第二数目,确定用所述父节点标识符替换所述第一组子节点标识符包括:
确定所述第一数目和所述第二数目的比值;
确定所述比值是否大于阈值;以及
响应于所述比值大于所述阈值,用所述父节点标识符替换所述第一组子节点标识符。
6.根据权利要求4所述的电子设备,其中向所述备份服务器发送请求以用于获取所述多个数据块包括:
响应于用所述父节点标识符替换所述第一组子节点标识符,确定所述索引中的所述父节点是否存在与所述第一组子节点不同的第二组子节点;
响应于确定存在所述第二组子节点,确定与所述第二组子节点有关的第二组子节点标识符;以及
将所述第二组子节点标识符添加到所述请求以用于使得所述备份服务器不传送与所述第二组子节点标识符有关的数据块。
7.一种计算机程序产品,所述计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令,所述机器可执行指令在被执行时使机器执行根据权利要求1至3中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910345777.4A CN111858146B (zh) | 2019-04-26 | 2019-04-26 | 用于恢复数据的方法、设备和计算机程序产品 |
US16/558,098 US11210003B2 (en) | 2019-04-26 | 2019-08-31 | Method, device and computer program product for restoring data based on replacing child node identifiers with parent node identifier |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910345777.4A CN111858146B (zh) | 2019-04-26 | 2019-04-26 | 用于恢复数据的方法、设备和计算机程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111858146A CN111858146A (zh) | 2020-10-30 |
CN111858146B true CN111858146B (zh) | 2024-05-28 |
Family
ID=72921678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910345777.4A Active CN111858146B (zh) | 2019-04-26 | 2019-04-26 | 用于恢复数据的方法、设备和计算机程序产品 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11210003B2 (zh) |
CN (1) | CN111858146B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113038291B (zh) * | 2021-02-07 | 2024-02-23 | 网宿科技股份有限公司 | 一种盒子类型的设定方法及服务器 |
CN115190136B (zh) * | 2021-04-21 | 2024-03-01 | 统信软件技术有限公司 | 一种数据存储方法、数据传输方法及计算设备 |
CN113934742B (zh) * | 2021-10-26 | 2023-07-04 | 冷杉云(北京)科技股份有限公司 | 数据更新方法、节点信息存储方法、电子设备及介质 |
KR20230163041A (ko) * | 2022-05-23 | 2023-11-30 | 주식회사 티맥스티베로 | 액티브-액티브 데이터베이스 클러스터 환경에서 수행되는 인덱스를 관리하는 방법 및 장치 |
CN116881052B (zh) * | 2023-09-07 | 2023-11-24 | 上海凯翔信息科技有限公司 | 一种分布式存储的数据修复系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5682519A (en) * | 1995-04-24 | 1997-10-28 | Cadence Design Systems, Inc. | Method for reducing power consumption of switching nodes in a circuit |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7574445B2 (en) * | 2006-01-03 | 2009-08-11 | Emc Corporation | Generating a selection representation for items in tree structures |
US20130246347A1 (en) * | 2012-03-15 | 2013-09-19 | Ellen L. Sorenson | Database file groups |
US10108687B2 (en) * | 2015-01-21 | 2018-10-23 | Commvault Systems, Inc. | Database protection using block-level mapping |
US10049121B2 (en) * | 2015-03-30 | 2018-08-14 | International Business Machines Corporation | Clone file backup and restore |
US10642784B2 (en) * | 2016-09-15 | 2020-05-05 | International Business Machines Corporation | Reducing read operations and branches in file system policy checks |
US10884980B2 (en) * | 2017-07-26 | 2021-01-05 | International Business Machines Corporation | Cognitive file and object management for distributed storage environments |
-
2019
- 2019-04-26 CN CN201910345777.4A patent/CN111858146B/zh active Active
- 2019-08-31 US US16/558,098 patent/US11210003B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5682519A (en) * | 1995-04-24 | 1997-10-28 | Cadence Design Systems, Inc. | Method for reducing power consumption of switching nodes in a circuit |
Also Published As
Publication number | Publication date |
---|---|
US11210003B2 (en) | 2021-12-28 |
US20200341674A1 (en) | 2020-10-29 |
CN111858146A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111858146B (zh) | 用于恢复数据的方法、设备和计算机程序产品 | |
CN108733507B (zh) | 文件备份和恢复的方法和设备 | |
US20190188086A1 (en) | Redundancy reduction in blockchains | |
US11604808B2 (en) | Methods, electronic devices and computer program product for replicating metadata | |
US10795579B2 (en) | Methods, apparatuses, system and computer program products for reclaiming storage units | |
CN111880967A (zh) | 云场景下的文件备份方法、装置、介质和电子设备 | |
CN114327239B (zh) | 存储和访问数据的方法、电子设备和计算机程序产品 | |
CN109726039B (zh) | 用于管理虚拟机的方法和设备 | |
CN111045856A (zh) | 用于管理应用系统的方法、设备和计算机程序产品 | |
CN111506450B (zh) | 用于数据处理的方法、设备和计算机程序产品 | |
US9684668B1 (en) | Systems and methods for performing lookups on distributed deduplicated data systems | |
CN113448770B (zh) | 用于恢复数据的方法、电子设备和计算机程序产品 | |
US20210240350A1 (en) | Method, device, and computer program product for recovering based on reverse differential recovery | |
CN111857549B (zh) | 用于管理数据的方法、设备和计算机程序产品 | |
CN111857560B (zh) | 用于管理数据的方法、设备和计算机程序产品 | |
US10761940B2 (en) | Method, device and program product for reducing data recovery time of storage system | |
US10169394B2 (en) | Managing data sets of a storage system | |
US10291700B2 (en) | Network optimized scan with dynamic fallback recovery | |
CN113220501B (zh) | 用于数据备份的方法、设备和计算机程序产品 | |
CN112667434B (zh) | 用于恢复数据的方法、装置和计算机程序产品 | |
CN110968649B (zh) | 用于管理数据集的方法、设备和计算机程序产品 | |
CN113626251A (zh) | 用于迁移备份系统的方法、设备和计算机程序产品 | |
CN113297003A (zh) | 管理备份数据的方法、电子设备和计算机程序产品 | |
CN111858145B (zh) | 数据备份与恢复的方法、设备和计算机程序产品 | |
US11340811B2 (en) | Determining reclaim information for a storage block based on data length and matching write and delete parameters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |