CN108958983B - 基于数据差异的还原方法、装置、存储介质及用户设备 - Google Patents

基于数据差异的还原方法、装置、存储介质及用户设备 Download PDF

Info

Publication number
CN108958983B
CN108958983B CN201810889567.7A CN201810889567A CN108958983B CN 108958983 B CN108958983 B CN 108958983B CN 201810889567 A CN201810889567 A CN 201810889567A CN 108958983 B CN108958983 B CN 108958983B
Authority
CN
China
Prior art keywords
data block
data
characteristic value
backup
disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810889567.7A
Other languages
English (en)
Other versions
CN108958983A (zh
Inventor
程方全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Clerware Technology Co ltd
Original Assignee
Shenzhen Clerware Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Clerware Technology Co ltd filed Critical Shenzhen Clerware Technology Co ltd
Priority to CN201810889567.7A priority Critical patent/CN108958983B/zh
Publication of CN108958983A publication Critical patent/CN108958983A/zh
Application granted granted Critical
Publication of CN108958983B publication Critical patent/CN108958983B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于数据差异的还原方法、装置、存储介质及用户设备。本发明在第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块,在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中,从而减少从备份服务器拷贝的数据量,缩短数据还原的时间。

Description

基于数据差异的还原方法、装置、存储介质及用户设备
技术领域
本发明涉及数据安全技术领域,尤其涉及一种基于数据差异的还原方法、装置、存储介质及用户设备。
背景技术
数据备份是指为防止系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从应用主机的存储介质复制到其它存储介质的过程,复制后的数据称为备份点,存储介质也称为磁盘。
而数据还原即为把备份点的数据复制回原主机的存储介质,或者复制到新主机存储介质的过程,这里的原主机和新主机统称为目标机,复制数据回原主机存储介质的还原操作称为原机还原。
在进行数据还原的时候,现有的技术方案都是把备份点中的数据全部复制到目标机上,备份点的数据量决定了还原过程需要传输的数据量。如果数据量很大,那么传输的数据量就很多,特别是通过互联网来传输,消耗了大量的时间,但在某些还原的场景下,特别是原机还原,备份点中很多的数据在存储介质上已经存在,但现有的技术方案仍然传输所有的备份点的数据,导致还原的时间过长。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于数据差异的还原方法、装置、存储介质及用户设备,旨在解决现有技术中还原时间过长的技术问题。
为实现上述目的,本发明提供一种基于数据差异的还原方法,所述方法包括以下步骤:
响应于用户的数据还原指令,根据所述数据还原指令确定待还原备份点,并从备份服务器获取所述待还原备份点的磁盘区域信息,所述磁盘区域信息包括所述待还原备份点对应各数据块的数据块编号;
对所述磁盘区域信息中的各数据块编号进行遍历,确定遍历到的当前数据块编号对应数据块中数据的第一特征值;
从所述备份服务器的备份映射表中查找所述当前数据块编号对应数据块中数据的第二特征值,所述备份映射表由所述备份服务器在形成所述待还原备份点时生成,所述备份映射表中包括所述数据块编号以及所述数据块编号对应数据块中数据的特征值之间的对应关系;
在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块;
在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中。
优选地,所述在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块之后,所述方法还包括:
在所述本地磁盘不存在与所述第二特征值匹配的目标数据块时,从所述备份服务器获取与所述当前数据块对应的数据,并将获取的数据写入所述当前数据块编号对应的当前数据块中。
优选地,所述对所述磁盘区域信息中的各数据块编号进行遍历,确定遍历到的当前数据块编号对应数据块中数据的第一特征值,具体包括:
对所述磁盘区域信息中的各数据块编号进行遍历,在映射关系表中确定遍历到的当前数据块编号对应数据块中数据的第一特征值。
优选地,所述对所述磁盘区域信息中的各数据块编号进行遍历,在映射关系表中确定遍历到的当前数据块编号对应数据块中数据的第一特征值之前,所述方法还包括:
获得本地磁盘中的有效区域信息,所述有效区域信息包括所述本地磁盘中具有有效数据的各数据块的数据块编号;
将所述有效区域信息与所述磁盘区域信息进行合并,获得待扫描区域信息;
对所述待扫描区域信息进行扫描,分别计算所述待扫描区域信息对应各数据块中数据的特征值,并根据所述待扫描区域信息中的数据块编号以及计算的特征值建立所述映射关系表。
优选地,所述在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块,具体包括:
在所述第一特征值与第二特征值不一致时,在所述映射关系表中查找本地磁盘是否存在与所述第二特征值匹配的目标数据块。
优选地,所述在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中之后,所述方法还包括:
将所述映射关系表中与所述当前数据块编号对应的记录进行删除。
优选地,所述在所述本地磁盘不存在与所述第二特征值匹配的目标数据块时,从所述备份服务器获取与所述当前数据块对应的数据,并将获取的数据写入所述当前数据块编号对应的当前数据块中之后,所述方法还包括:
将所述映射关系表中与所述当前数据块编号对应的特征值修改为所述第二特征值。
此外,为实现上述目的,本发明还提供一种用户设备,所述用户设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于数据差异的还原程序,所述基于数据差异的还原程序配置为实现如上所述的基于数据差异的还原方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于数据差异的还原程序,所述基于数据差异的还原程序被处理器执行时实现如上所述的基于数据差异的还原方法的步骤。
此外,为实现上述目的,本发明还提供一种基于数据差异的还原装置,所述装置包括:
信息获取模块,用于响应于用户的数据还原指令,根据所述数据还原指令确定待还原备份点,并从备份服务器获取所述待还原备份点的磁盘区域信息,所述磁盘区域信息包括所述待还原备份点对应各数据块的数据块编号;
编号遍历模块,用于对所述磁盘区域信息中的各数据块编号进行遍历,确定遍历到的当前数据块编号对应数据块中数据的第一特征值;
特征查找模块,用于从所述备份服务器的备份映射表中查找所述当前数据块编号对应数据块中数据的第二特征值,所述备份映射表由所述备份服务器在形成所述待还原备份点时生成,所述备份映射表中包括所述数据块编号以及所述数据块编号对应数据块中数据的特征值之间的对应关系;
数据块查找模块,用于在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块;
数据写入模块,用于在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中。
本发明在第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块,在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中,从而减少从备份服务器拷贝的数据量,缩短数据还原的时间。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的用户设备结构示意图;
图2为本发明基于数据差异的还原方法第一实施例的流程示意图;
图3为本发明基于数据差异的还原方法第二实施例的流程示意图;
图4为本发明实施例中需要拷贝数据的磁盘区域示意图;
图5为本发明实施例中本地存有有效数据的磁盘区域示意图;
图6为本发明实施例中待扫描区域信息示意图;
图7为本发明基于数据差异的还原装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的用户设备的结构示意图。
如图1所示,该用户设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对用户设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于数据差异的还原程序。
在图1所示的用户设备中,网络接口1004主要用于与外部网络进行数据通信;用户接口1003主要用于接收用户的输入指令;所述用户设备通过处理器1001调用存储器1005中存储的基于数据差异的还原程序,并执行以下操作:
响应于用户的数据还原指令,根据所述数据还原指令确定待还原备份点,并从备份服务器获取所述待还原备份点的磁盘区域信息,所述磁盘区域信息包括所述待还原备份点对应各数据块的数据块编号;
对所述磁盘区域信息中的各数据块编号进行遍历,确定遍历到的当前数据块编号对应数据块中数据的第一特征值;
从所述备份服务器的备份映射表中查找所述当前数据块编号对应数据块中数据的第二特征值,所述备份映射表由所述备份服务器在形成所述待还原备份点时生成,所述备份映射表中包括所述数据块编号以及所述数据块编号对应数据块中数据的特征值之间的对应关系;
在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块;
在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中。
进一步地,处理器1001可以调用存储器1005中存储的基于数据差异的还原程序,还执行以下操作:
在所述本地磁盘不存在与所述第二特征值匹配的目标数据块时,从所述备份服务器获取与所述当前数据块对应的数据,并将获取的数据写入所述当前数据块编号对应的当前数据块中。
进一步地,处理器1001可以调用存储器1005中存储的基于数据差异的还原程序,还执行以下操作:
对所述磁盘区域信息中的各数据块编号进行遍历,在映射关系表中确定遍历到的当前数据块编号对应数据块中数据的第一特征值。
进一步地,处理器1001可以调用存储器1005中存储的基于数据差异的还原程序,还执行以下操作:
获得本地磁盘中的有效区域信息,所述有效区域信息包括所述本地磁盘中具有有效数据的各数据块的数据块编号;
将所述有效区域信息与所述磁盘区域信息进行合并,获得待扫描区域信息;
对所述待扫描区域信息进行扫描,分别计算所述待扫描区域信息对应各数据块中数据的特征值,并根据所述待扫描区域信息中的数据块编号以及计算的特征值建立所述映射关系表。
进一步地,处理器1001可以调用存储器1005中存储的基于数据差异的还原程序,还执行以下操作:
在所述第一特征值与第二特征值不一致时,在所述映射关系表中查找本地磁盘是否存在与所述第二特征值匹配的目标数据块。
进一步地,处理器1001可以调用存储器1005中存储的基于数据差异的还原程序,还执行以下操作:
将所述映射关系表中与所述当前数据块编号对应的记录进行删除。
进一步地,处理器1001可以调用存储器1005中存储的基于数据差异的还原程序,还执行以下操作:
将所述映射关系表中与所述当前数据块编号对应的特征值修改为所述第二特征值。
本实施例通过上述方案,在第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块,在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中,从而减少从备份服务器拷贝的数据量,缩短数据还原的时间。
基于上述硬件结构,提出本发明基于数据差异的还原方法实施例。
参照图2,图2为本发明基于数据差异的还原方法第一实施例的流程示意图。
S10:响应于用户的数据还原指令,根据所述数据还原指令确定待还原备份点,并从备份服务器获取所述待还原备份点的磁盘区域信息,所述磁盘区域信息包括所述待还原备份点对应各数据块的数据块编号;
需要说明的是,数据备份是指为防止系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从应用主机的存储介质复制到其它存储介质的过程,复制后的数据称为备份点,存储介质也称为磁盘。
可理解的是,本实施例的方法的执行主体可理解为数据还原过程中的目标机。
在具体实现中,数据块是一组按顺序连续排列在一起的几组记录,是主存储器与输入、输出设备或外存储器之间进行传输的一个数据单位,其属于数据的物理记录,所述数据块编号即为用于区分数据块的标识。
S20:对所述磁盘区域信息中的各数据块编号进行遍历,确定遍历到的当前数据块编号对应数据块中数据的第一特征值;
需要说明的是,由于所述磁盘区域信息中通常包括多个数据块编号,为便于获取所述磁盘区域信息中的各数据块编号对应数据块中数据的第一特征值,可对所述磁盘区域信息中各数据块编号进行遍历,并确定遍历到的当前数据块编号对应数据块中数据的第一特征值。
在具体实现中,所述第一特征值可以为哈希值,当然,也可以为其他可唯一标识数据的值。
S30:从所述备份服务器的备份映射表中查找所述当前数据块编号对应数据块中数据的第二特征值,所述备份映射表由所述备份服务器在形成所述待还原备份点时生成,所述备份映射表中包括所述数据块编号以及所述数据块编号对应数据块中数据的特征值之间的对应关系;
在具体实现中,所述第二特征值可以为哈希值,当然,也可以为其他可唯一标识数据的值。
可理解的是,所述备份映射表可由所述备份服务器在形成所述待还原备份点时生成,所述备份映射表中包括所述数据块编号以及所述数据块编号对应数据块中数据的特征值之间的对应关系,也就是说,在做数据备份的时候,先把原主机上需要拷贝的数据(即有效数据)划分成一系列大小相同的数据块,然后再把数据块的数据、磁盘区域信息一起传给备份服务器。备份服务器收到之后,会计算数据块的特征值,这个特征值可以唯一标识数据。之后备份服务器会根据这个特征值和磁盘区域信息生成所述备份映射表,并将所述备份映射表及数据块中的数据等信息一起保存到备份点中。
S40:在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块;
可理解的是,由于特征值是可以唯一标识数据,因此,与所述第二特征值匹配的目标数据块中数据与所述备份服务器中所述当前数据块对应的数据一致,无需从所述备份服务器中获取该数据。
S50:在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中。
当然,在所述本地磁盘不存在与所述第二特征值匹配的目标数据块时,可从所述备份服务器获取与所述当前数据块对应的数据,并将获取的数据写入所述当前数据块编号对应的当前数据块中。
本实施例在第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块,在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中,从而减少从备份服务器拷贝的数据量,缩短数据还原的时间。
进一步地,如图3所示,基于第一实施例提出本发明基于数据差异的还原方法第二实施例,在本实施例中,步骤S20具体包括:
S20’:对所述磁盘区域信息中的各数据块编号进行遍历,在映射关系表中确定遍历到的当前数据块编号对应数据块中数据的第一特征值。
需要说明的是,可预先建立一个映射关系表,在映射关系表中确定遍历到的当前数据块编号对应数据块中数据的第一特征值。
可理解的是,步骤S20’之前,所述方法还可包括:获得本地磁盘中的有效区域信息,所述有效区域信息包括所述本地磁盘中具有有效数据的各数据块的数据块编号;将所述有效区域信息与所述磁盘区域信息进行合并,获得待扫描区域信息;对所述待扫描区域信息进行扫描,分别计算所述待扫描区域信息对应各数据块中数据的特征值,并根据所述待扫描区域信息中的数据块编号以及计算的特征值建立所述映射关系表。
在具体实现中,所述步骤S40,可具体包括:在所述第一特征值与第二特征值不一致时,在所述映射关系表中查找本地磁盘是否存在与所述第二特征值匹配的目标数据块。
由于步骤S50中,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中后,所述目标数据块内的数据已经发生了变化,并且在本地磁盘的其他数据块中还存在该数据,为减少映射关系表的数据量,本实施例中,步骤S50之后,所述方法还包括:将所述映射关系表中与所述当前数据块编号对应的记录进行删除。
为保证所述映射关系表中特征值的及时性,本实施例中,所述在所述本地磁盘不存在与所述第二特征值匹配的目标数据块时,从所述备份服务器获取与所述当前数据块对应的数据,并将获取的数据写入所述当前数据块编号对应的当前数据块中之后,所述方法还包括:将所述映射关系表中与所述当前数据块编号对应的特征值修改为所述第二特征值。
下面以另一个具体的实例来对本发明进行说明,但不限定本发明的保护范围。
假设磁盘一共有20000个数据块,从备份服务器获取到的磁盘区域信息中的数据块编号是1到10000号,这个区域信息中指明了磁盘的1到10000号数据块需要从备份服务器的备份点中拷贝数据,参照图4。之后会遍历目标机磁盘上的数据,识别出存有有效数据的磁盘区域和空闲的磁盘区域,假设遍历到结果是磁盘的5000到15000号数据块存有有效的数据,参照图5。接下来可将前面获取到的1到10000号数据块和扫描到的5000到15000号数据块进行合并,得到1到15000号数据块的待扫描区域信息,参照图6,这些区域的数据块可分别计算特征值,并根据所述待扫描区域信息中的数据块编号以及计算的特征值建立所述映射关系表。
可启动两个线程来实现数据还原,两个线程中的1号线程负责计算1到15000号数据块的特征值,建立映射关系表,两个线程中的2号线程负责1到10000号数据块的还原,2个线程可同时进行。
假设1号线程建立的部分映射关系表如下:
0001 AAAAA
0002 BBBBB
0003 CCCCC
0004 DDDDD
…… ……
0999 XXXXX
…… ……
此时,2号线程的数据还原流程可按照如下处理逻辑:
A、向备份服务器查询1号数据块的特征值,查询的结果是AAAAA,接着它会从映射关系表中检查1号数据块的特征值,结果也是AAAAA。说明该数据块和备份点中的是一样的,不需要拷贝,接着进行下一个数据块的还原。
B、接着向备份服务器查询2号数据块的特征值,查询的结果是XXXXX,它再去映射关系表检查2号数据块的特征值,结果是BBBBB,匹配不上。这个情况下需要再次查询映射关系表,看看有没有数据块的特征是XXXXX,假设匹配到的结果是999号数据块。那么就把999号数据块的数据拷贝到2号数据块,同时通知1号线程把映射关系表中2号数据块的映射记录“0002:BBBBB”删除掉(因为数据已经被修改,特征值发生了改变),再进行下一个数据块的还原。删掉2号数据块的映射记录之后的部分映射关系表如下:
0001 AAAAA
0003 CCCCC
0004 DDDDD
…… ……
0999 XXXXX
…… ……
C、接着向备份服务器查询3号数据块的特征值,查询的结果是YYYYY,然后去映射关系表查询3号数据块的特征值,不是YYYYY,并且从映射关系表中也找不到特征值为YYYYY的数据块。这个情况需要从备份服务器的备份点去获取3号数据块的数据,然后写入到磁盘的3号数据块中。之后通知1号线程把映射关系表中3号数据块的映射记录改成“0003:YYYYY”,再进行下一个数据块的还原。修改后的部分映射关系表如下:
0001 AAAAA
0003 YYYYY
0004 DDDDD
…… ……
0999 XXXXX
…… ……
D、当还原到2000号数据块的时候,向备份服务器查询到的特征值是NNNNN,这个时候映射关系表可能还没建立2000号数据块的映射记录,同时也查询不到特征值为NNNNN的数据块。这个时候需要向备份服务器获取该数据块的数据,写入到2000号数据块中,同时通知1号线程在映射关系表中添加“2000:NNNNN”映射项,再进行下一个数据块的还原。添加映射项之后的部分映射关系表是:
Figure BDA0001755703060000111
Figure BDA0001755703060000121
E、2号还原线程会重复上面的流程,一直到全部的数据块还原完毕。
当然,在还原的过程中,映射关系表的数据会越来越多,因此,可以使用磁盘的空闲区域来存放所述映射关系表。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有基于数据差异的还原程序,所述基于数据差异的还原程序被处理器执行时实现如下操作:
响应于用户输入的对象选取指令,根据所述对象选取指令确定待还原存储对象;
响应于用户输入的时刻选取指令,根据所述时刻选取指令确定对应的目标时刻,根据所述目标时刻确定待还原备份数据;
将所述待还原存储对象中的当前数据与所述待还原备份数据进行比较,以确定所述待还原存储对象中的有效数据差异区域和无效数据差异区域,所述有效数据差异区域为所述当前数据与所述待还原备份数据具有差异,并且需要进行数据还原的区域,所述无效数据差异区域为所述当前数据与所述待还原备份数据具有差异,并且不需要进行数据还原的区域;
根据所述待还原备份数据对所述待还原存储对象中的有效数据差异区域进行数据复制,对所述待还原存储对象中的无效数据差异区域进行数据重置,以实现对所述待还原存储对象进行数据还原。
此外,本发明实施例还提出一种基于数据差异的还原装置,参照图7,所述装置包括:
信息获取模块701,用于响应于用户的数据还原指令,根据所述数据还原指令确定待还原备份点,并从备份服务器获取所述待还原备份点的磁盘区域信息,所述磁盘区域信息包括所述待还原备份点对应各数据块的数据块编号;
编号遍历模块702,用于对所述磁盘区域信息中的各数据块编号进行遍历,确定遍历到的当前数据块编号对应数据块中数据的第一特征值;
特征查找模块703,用于从所述备份服务器的备份映射表中查找所述当前数据块编号对应数据块中数据的第二特征值,所述备份映射表由所述备份服务器在形成所述待还原备份点时生成,所述备份映射表中包括所述数据块编号以及所述数据块编号对应数据块中数据的特征值之间的对应关系;
数据块查找模块704,用于在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块;
数据写入模块705,用于在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于数据差异的还原方法,其特征在于,所述方法包括以下步骤:
响应于用户的数据还原指令,根据所述数据还原指令确定待还原备份点,并从备份服务器获取所述待还原备份点的磁盘区域信息,所述磁盘区域信息包括所述待还原备份点对应各数据块的数据块编号;
对所述磁盘区域信息中的各数据块编号进行遍历,确定遍历到的当前数据块编号对应数据块中数据的第一特征值;
从所述备份服务器的备份映射表中查找所述当前数据块编号对应数据块中数据的第二特征值,所述备份映射表由所述备份服务器在形成所述待还原备份点时生成,所述备份映射表中包括所述数据块编号以及所述数据块编号对应数据块中数据的特征值之间的对应关系;
在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块;
在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中。
2.如权利要求1所述的方法,其特征在于,所述在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块之后,所述方法还包括:
在所述本地磁盘不存在与所述第二特征值匹配的目标数据块时,从所述备份服务器获取与所述当前数据块对应的数据,并将获取的数据写入所述当前数据块编号对应的当前数据块中。
3.如权利要求2所述的方法,其特征在于,所述对所述磁盘区域信息中的各数据块编号进行遍历,确定遍历到的当前数据块编号对应数据块中数据的第一特征值,具体包括:
对所述磁盘区域信息中的各数据块编号进行遍历,在映射关系表中确定遍历到的当前数据块编号对应数据块中数据的第一特征值。
4.如权利要求3所述的方法,其特征在于,所述对所述磁盘区域信息中的各数据块编号进行遍历,在映射关系表中确定遍历到的当前数据块编号对应数据块中数据的第一特征值之前,所述方法还包括:
获得本地磁盘中的有效区域信息,所述有效区域信息包括所述本地磁盘中具有有效数据的各数据块的数据块编号;
将所述有效区域信息与所述磁盘区域信息进行合并,获得待扫描区域信息;
对所述待扫描区域信息进行扫描,分别计算所述待扫描区域信息对应各数据块中数据的特征值,并根据所述待扫描区域信息中的数据块编号以及计算的特征值建立所述映射关系表。
5.如权利要求4所述的方法,其特征在于,所述在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块,具体包括:
在所述第一特征值与第二特征值不一致时,在所述映射关系表中查找本地磁盘是否存在与所述第二特征值匹配的目标数据块。
6.如权利要求4所述的方法,其特征在于,所述在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中之后,所述方法还包括:
将所述映射关系表中与所述当前数据块编号对应的记录进行删除。
7.如权利要求4所述的方法,其特征在于,所述在所述本地磁盘不存在与所述第二特征值匹配的目标数据块时,从所述备份服务器获取与所述当前数据块对应的数据,并将获取的数据写入所述当前数据块编号对应的当前数据块中之后,所述方法还包括:
将所述映射关系表中与所述当前数据块编号对应的特征值修改为所述第二特征值。
8.一种用户设备,其特征在于,所述用户设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于数据差异的还原程序,所述基于数据差异的还原程序配置为实现如权利要求1至7中任一项所述的基于数据差异的还原方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于数据差异的还原程序,所述基于数据差异的还原程序被处理器执行时实现如权利要求1至7中任一项所述的基于数据差异的还原方法的步骤。
10.一种基于数据差异的还原装置,其特征在于,所述装置包括:
信息获取模块,用于响应于用户的数据还原指令,根据所述数据还原指令确定待还原备份点,并从备份服务器获取所述待还原备份点的磁盘区域信息,所述磁盘区域信息包括所述待还原备份点对应各数据块的数据块编号;
编号遍历模块,用于对所述磁盘区域信息中的各数据块编号进行遍历,确定遍历到的当前数据块编号对应数据块中数据的第一特征值;
特征查找模块,用于从所述备份服务器的备份映射表中查找所述当前数据块编号对应数据块中数据的第二特征值,所述备份映射表由所述备份服务器在形成所述待还原备份点时生成,所述备份映射表中包括所述数据块编号以及所述数据块编号对应数据块中数据的特征值之间的对应关系;
数据块查找模块,用于在所述第一特征值与第二特征值不一致时,查找本地磁盘是否存在与所述第二特征值匹配的目标数据块;
数据写入模块,用于在所述本地磁盘存在与所述第二特征值匹配的目标数据块时,将所述目标数据块内的数据写入所述当前数据块编号对应的当前数据块中。
CN201810889567.7A 2018-08-06 2018-08-06 基于数据差异的还原方法、装置、存储介质及用户设备 Active CN108958983B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810889567.7A CN108958983B (zh) 2018-08-06 2018-08-06 基于数据差异的还原方法、装置、存储介质及用户设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810889567.7A CN108958983B (zh) 2018-08-06 2018-08-06 基于数据差异的还原方法、装置、存储介质及用户设备

Publications (2)

Publication Number Publication Date
CN108958983A CN108958983A (zh) 2018-12-07
CN108958983B true CN108958983B (zh) 2021-03-26

Family

ID=64468312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810889567.7A Active CN108958983B (zh) 2018-08-06 2018-08-06 基于数据差异的还原方法、装置、存储介质及用户设备

Country Status (1)

Country Link
CN (1) CN108958983B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101820426A (zh) * 2010-04-22 2010-09-01 华中科技大学 一种在线备份服务软件中的数据压缩方法
CN103870362A (zh) * 2014-03-21 2014-06-18 华为技术有限公司 一种数据恢复方法、装置及备份系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7055008B2 (en) * 2003-01-22 2006-05-30 Falconstor Software, Inc. System and method for backing up data
CN101387976B (zh) * 2008-11-07 2010-06-02 清华大学 一种基于数据差异的逻辑卷快速同步方法
US9436558B1 (en) * 2010-12-21 2016-09-06 Acronis International Gmbh System and method for fast backup and restoring using sorted hashes
CN102033962B (zh) * 2010-12-31 2012-05-30 中国传媒大学 一种快速去重的文件数据复制方法
CN102184218B (zh) * 2011-05-05 2012-11-21 华中科技大学 一种基于因果关系的重复数据删除方法
CN102799598A (zh) * 2011-05-25 2012-11-28 英业达股份有限公司 重复数据删除的数据复原方法
TWI442223B (zh) * 2011-08-10 2014-06-21 Inventec Corp 重複數據刪除的數據復原方法
CN103118104B (zh) * 2013-01-28 2017-12-26 刘海峰 一种基于版本矢量的数据还原方法及服务器
US10678654B2 (en) * 2016-10-26 2020-06-09 Acronis International Gmbh Systems and methods for data backup using data binning and deduplication

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101820426A (zh) * 2010-04-22 2010-09-01 华中科技大学 一种在线备份服务软件中的数据压缩方法
CN103870362A (zh) * 2014-03-21 2014-06-18 华为技术有限公司 一种数据恢复方法、装置及备份系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"支持数据去重的网络备份系统中数据恢复的性能优化方法";杜飞;《中国优秀硕士学位论文全文数据库》;20140615(第06期);第I138-58页 *

Also Published As

Publication number Publication date
CN108958983A (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
CN108388604B (zh) 用户权限数据管理装置、方法及计算机可读存储介质
CN107688664B (zh) 图表生成方法、装置、计算机设备和存储介质
US11100047B2 (en) Method, device and computer program product for deleting snapshots
US9454561B2 (en) Method and a consistency checker for finding data inconsistencies in a data repository
WO2022252510A1 (zh) 资源管理方法、装置及设备
CN107368513B (zh) 客户端数据库更新的方法及装置
JP2009217426A (ja) 情報処理装置、リソース同定プログラム、リソース同定方法
CN108121774B (zh) 一种数据表备份方法及终端设备
CN112860953A (zh) 图数据库的数据导入方法、装置、设备及存储介质
US11151088B2 (en) Systems and methods for verifying performance of a modification request in a database system
CN115757629A (zh) 多源异构数据增量同步方法、系统、存储介质和电子设备
CN108958983B (zh) 基于数据差异的还原方法、装置、存储介质及用户设备
CN112579591B (zh) 数据校验方法、装置、电子设备及计算机可读存储介质
CN108959548B (zh) 业务请求的处理方法及装置
CN116662355A (zh) 无效索引的标记方法、存储介质和计算机设备
CN110851437A (zh) 一种存储方法、装置及设备
CN115098503A (zh) 空值数据处理方法、装置、计算机设备以及存储介质
CN110413617B (zh) 一种根据数据量的大小动态调节哈希表组的方法
CN110336883B (zh) 镜像数据传输方法、装置、设备及计算机可读存储介质
CN111209304B (zh) 数据处理方法、装置及系统
CN113806365A (zh) 一种单数据源数据管理方法、装置及存储介质
CN114579530A (zh) 表空间迁移方法、装置、电子设备及计算机可读存储介质
CN112306551B (zh) 历史配置信息获取方法、系统和装置
JP4628830B2 (ja) Dbmsに格納されたデータの整合性を担保するためのシステム
US20240086185A1 (en) Fingerprint inference of software artifacts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant