CN112380061A - 数据恢复方法、装置、计算机设备及可读存储介质 - Google Patents
数据恢复方法、装置、计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN112380061A CN112380061A CN202011284150.1A CN202011284150A CN112380061A CN 112380061 A CN112380061 A CN 112380061A CN 202011284150 A CN202011284150 A CN 202011284150A CN 112380061 A CN112380061 A CN 112380061A
- Authority
- CN
- China
- Prior art keywords
- sample
- file
- sector
- cluster
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011084 recovery Methods 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000006870 function Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1456—Hardware arrangements for backup
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1469—Backup restoration techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了数据恢复方法、装置、计算机设备及可读存储介质。该方法包括:获取各扇区文件的第一样本与第二样本,得到第一样本队列和第二样本队列;根据两种样本的大小信息对所述第一样本队列与第二样本队列进行样本匹配,若大小信息相等则判定样本匹配,直至得到至少两组匹配样本;基于两组匹配样本的簇号与扇区号,根据预置关系函数计算存储设备的每簇扇区数和首簇开始扇区号;从所述第一样本队列中获取目标恢复文件的目标簇号,按所述关系函数计算所述目标恢复文件的目标扇区号;根据所述目标扇区号及所述目标簇号,恢复所述目标恢复文件。该方法结合两种样本获取方式的优点,提供用户完整的属性和数据的文件恢复结果。
Description
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种数据恢复方法、装置、计算机设备及存储介质。
背景技术
数据恢复(Data recovery)是指通过技术手段,将保存在台式机硬盘、笔记本硬盘、服务器硬盘、存储磁带库、移动硬盘、U盘、数码存储卡、Mp3等等设备上丢失的电子数据进行抢救和恢复的技术。
ExFAT文件系统是目前外部设备,如U盘,移动盘,SD卡常用的文件系统类型,该文件系统具有支持大容量,大文件,文件定位快速,跨操作系统支持与应用范围广等特点。目前,常用的恢复技术主要包括快速恢复、格式化恢复及深度恢复。
但是,经过对恢复产品使用场景的研究,用户常常因为错误操作,导致格式化存储设备后,数据恢复失败,文件无法打开,恢复成功率低下;或者在进行深度恢复时,即使能将文件数据恢复,但却丢失了该文件的关键属性,或因为实际应用场景中深度恢复的文件数目巨大,用户很难直接找到想要恢复的文件,遍历所有文件进行恢复,效率低下。
发明内容
本发明实施例提供了一种数据恢复方法、装置、计算机设备及可读存储介质,旨在解决现有技术中文件恢复成功率低,效率不高的问题。
第一方面,本发明实施例提供了一种数据恢复方法,其包括:
对存储设备各扇区进行一次扫描,获取各扇区内文件的第一样本,并按文件类型存储到对应类型的第一样本队列,所述第一样本至少包括文件的簇号及大小信息;
对存储设备各扇区进行二次扫描,获取各扇区内文件的第二样本,并按文件类型存储到对应类型的第二样本队列,所述第二样本至少包括文件的扇区号及大小信息;
根据大小信息对同类型的所述第一样本队列与第二样本队列进行样本匹配,得到至少两组匹配样本;
分别获取所述匹配样本中每组样本的簇号与所述扇区号,并根据预置关系函数计算存储设备的每簇扇区数和首簇开始扇区号;
从所述第一样本队列中获取目标恢复文件的目标簇号,按所述关系函数以及所述每簇扇区数和首簇开始扇区号,计算所述目标恢复文件的目标扇区号;
根据所述目标扇区号及所述目标簇号,恢复所述目标恢复文件。
第二方面,本发明实施例提供了一种数据恢复装置,其包括:
一次扫描模块,用于对存储设备各扇区进行一次扫描,获取各扇区内文件的第一样本,并按文件类型存储到对应类型的第一样本队列,所述第一样本至少包括文件的簇号及大小信息;
二次扫描模块,用于对存储设备各扇区进行二次扫描,获取各扇区内文件的第二样本,并按文件类型存储到对应类型的第二样本队列,所述第二样本至少包括文件的扇区号及大小信息;
匹配模块,用于根据大小信息对同类型的所述第一样本队列与第二样本队列进行样本匹配,得到至少两组匹配样本;
第一计算模块,用于分别获取所述匹配样本中每组匹配样本的所述簇号与所述扇区号,并根据预置关系函数计算存储设备的每簇扇区数和首簇开始扇区号;
第二计算模块,用于从所述第一样本队列中获取目标恢复文件的目标簇号,按所述关系函数以及所述每簇扇区数和首簇开始扇区号,计算所述目标恢复文件的目标扇区号;
文件恢复模块,用于根据所述目标扇区号及所述目标簇号,恢复所述目标恢复文件。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的数据恢复方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的数据恢复方法。
本发明实施例提供了一种数据恢复方法、装置、计算机设备及存储介质。该方法包括获取各扇区文件的第一样本与第二样本,得到第一样本队列和第二样本队列;根据所述第一样本与第二样本的大小信息对所述第一样本队列与第二样本队列进行样本匹配,若大小信息相等则判定样本匹配,直至得到至少两组匹配样本;基于两组匹配样本的簇号与扇区号,根据预置关系函数计算所述存储设备的每簇扇区数和首簇开始扇区号;从所述第一样本队列中获取目标恢复文件的目标簇号,按所述关系函数以及所述存储设备的每簇扇区数和首簇开始扇区号,计算所述目标恢复文件的目标扇区号;根据所述目标扇区号及所述目标簇号,恢复所述目标恢复文件。该方法结合第一样本和第二样本的获取方式的优点,最终提供用户完整的属性和数据的文件恢复结果,同时结合上述两类恢复技术的优点,解决、规避各自的缺点。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的数据恢复方法的流程示意图;
图2为本发明实施例提供的数据恢复方法的子流程示意图;
图3为本发明实施例提供的数据恢复方法的另一子流程示意图;
图4为本发明实施例提供的数据恢复方法的另一子流程示意图;
图5为本发明实施例提供的数据恢复方法的另一子流程示意图;
图6为本发明实施例提供的数据恢复装置的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
经过对恢复产品使用场景的研究,发现用户常常因为错误操作,导致格式化外部存储设备后,丢失了原有ExFAT文件系统的关键信息的情况,其中包括每簇扇区数(简称SPC),首簇开始扇区号(简称FCS)。这种情况利用下前面提到的恢复技术进行格式化扫描,即使获得丢失文件的属性如:前面提到的数据存储位置,但该位置是以文件系统最小单位:簇进行记录,此时无法直接对应到磁盘的具体扇区位置,最终导致能恢复出丢失文件的属性信息(名称、大小、时间),但具体的文件数据恢复失败,导致文件无法打开,恢复成功率不高。另一方面,在进行深度恢复中,由于只是针对文件的数据区域进行恢复,故而即使能将文件数据恢复成功,但却丢失了该文件的关键属性如名称属性和创建、修改等时间属性,而实际用户场景中由于深度恢复的文件数目巨大,如500G磁盘深度恢复能达到百万级别的文件数,用户很难直接找到想要恢复的文件,逐个遍历效率低下。
本发明实施例提供的方法结合深度扫描及格式化扫描的优点,最终提供用户完整的属性和数据的文件恢复结果,同时结合上述两类恢复技术的优点,解决、规避各自的缺点。
请参阅图1为本发明实施例提供的数据恢复方法的流程示意图,该方法包括步骤S110~S160。
S110、获取各扇区文件的第一样本,存储所述第一样本至第一样本队列,所述第一样本至少包括文件的簇号及大小信息。
在本实施例中,存储设备可以是台式机硬盘、笔记本硬盘、服务器硬盘、存储磁带库、移动硬盘、U盘、数码存储卡、Mp3等。样本获取方式为格式化扫描或深度扫描,本实施例使用格式化扫描。对存储设备每个扇区逐一进行格式化扫描,得到文件的簇号及大小信息作为第一样本,将第一样本存储在第一样本队列中,进而得到记录有多个文件的簇号及大小信息的第一样本队列。
例如,格式化扫描计算机硬盘,发现A文件、B文件,得到A文件、B文件的簇号及文件的大小信息,将A文件和B文件的簇号及文件的大小信息作为第一样本存储到第一样本队列中。
在一实施例中,如图2所示,步骤S110包括:
S111、格式化扫描各扇区内的文件,匹配出各扇区内文件的目录项;
S112、从所述目录项中提取文件的属性信息,所述属性信息至少包括文件的簇号、大小信息及类型信息;
S113、根据各文件的类型信息将所有文件的簇号及大小信息作为第一样本存储于对应类型的第一样本队列中;
S114、将多个类型的所述第一样本队列进行组合,得到第一样本队列组;
S115、继续读取所述存储设备下一扇区内的文件,直至扫描完所述存储设备的所有扇区。
在本实施例中,格式化扫描存储设备各扇区内的文件信息,获取各扇区内每个文件的目录项。其中,目录项中记录有对应文件在存储设备内存储位置的簇号、文件的大小信息以及文件的类型信息,从目录项中提取文件每个文件的簇号及大小信息作为第一样本存储到对应文件类型的第一样本队列,最后汇总不同文件类型的第一样本队列,得到格式化扫描的扫描结果即第一样本队列组。然后接着扫描存储设备的下一扇区的文件,直至扫描完存储设备的全部扇区,得到存储有所有扇区第一样本的格式化扫描样本队列组。
例如,格式化扫描存储设备,得到A文件、B文件的目录项,从目录项中得到A文件的文件类型为PDF,B文件的文件类型为JPG,则从目录项中提取A文件的簇号及大小信息,存储到PDF的格式化扫描样本队列;提取B文件的簇号及大小信息,存储到JPG类型的格式化扫描样本队列中,最后汇总A文件和B文件的格式化扫描样本队列,构建存储设备的格式化扫描样本队列组。
S120、获取各扇区文件的第二样本,存储所述第二样本至第二样本队列,所述第二样本至少包括文件的扇区号及大小信息。
本实施例中,样本的获取方式为深度扫描。深度扫描存储设备各扇区的文件,记录各文件的文件类型、文件所在的扇区号与文件的大小信息,然后提取文件的扇区号与文件的大小信息作为第二样本,将第二样本存储到第二样本队列中。
例如,深度扫描存储设备各扇区,得到A文件的类型信息为PDF、文件所在的扇区号02及文件的大小信息200M,将扇区号01及文件大小200M组成二元组信息,存储到PDF类型的深度扫描样本队列中。
在一实施例中,如图3所示,步骤S120包括:
步骤S121、深度扫描各扇区内的文件,记录指定文件类型的文件所在的扇区号及大小信息;
步骤S122、根据各文件的类型信息将所有文件的扇区号及大小信息作为第二样本存储于对应类型的第二样本队列中;
步骤S123、将多个类型的所述第二样本队列进行组合,得到第二样本队列组;
步骤S124、继续读取所述存储设备下一扇区内的文件,直至扫描完所述存储设备的所有扇区。
本实施例中,深度扫描各扇区内的文件,获取用户指定读取的文件类型,记录文件所在的扇区号及大小信息,根据文件的类型信息,将文件的扇区号及大小信息作为第二样本存储在对应类型的第二样本队列中,最后汇总不同文件类型的第二样本队列,构建存储有当前扇区第二样本的第二样本队列组。其中,指定读取的文件类型可以是PDF、Word、JPG或PNG。读取完当前读取的扇区后,继续读取存储设备的下一个扇区,下一个扇区的扫描步骤与上一扇区的扫描步骤一样,此处不再赘述。直至扫描完存储设备的所有扇区为止。
例如,当前指定读取的文件类型为PDF,则扫描存储设备时,若匹配到PDF文件类型的A文件,即记录A文件在存储设备的扇区号1与大小信息200M,并存储到PDF文件类型的深度扫描样本队列中。继续扫描当前扇区,若匹配到其他PDF文件类型的B文件和C文件,同样记录B文件和C文件的扇区号及大小信息,并存储到PDF文件类型的深度扫描样本队列中。
S130、根据所述第一样本与第二样本的大小信息对所述第一样本队列与第二样本队列进行样本匹配,得到至少两组匹配样本。
本实施例中,提取相同文件类型的第一样本队列和第二样本队列,根据第一样本和第二样本的的大小信息对第一样本队列与第二样本队列进行样本匹配。若存在大小信息相同的文件,文件类型相同,则判定第一样本与第二样本为匹配样本。继续进行匹配,从格式化扫描样本队列和深度扫描样本队列中匹配出至少两组匹配的样本。
在一实施例中,如图4所示,步骤S130包括:
步骤S131、按顺序从所述第一样本队列中提取第一样本;
步骤S132、按顺序从所述第二样本队列中提取第二样本,并将提取出的第二样本的大小信息与提取出的第一样本的大小信息进行比较;
步骤S133、若提取出的第一样本与提取出的第二样本的大小信息相等,则判定第一样本与所述第二样本属于一组匹配样本;
步骤S134、若提取出的第一样本与提取出的第二样本的大小信息不相等,则继续按顺序从所述深度扫描样本队列中提取第二样本并进行比较,直至得到至少两组匹配样本。
本实施例中,为了保证第一样本队列与第二样本队列的匹配准确度,预设按顺序从第一样本队列中提取出第一个第一样本,再从相同文件类型的第二样本队列中提取出第一个第二样本,比较第一样本和第二样本的大小信息是否相等,若这两个样本的大小信息相等,则表明这两个样本属于同一个文件,确定为一组匹配样本;若这两个样本的大小信息不相等,则继续从第二样本队列中提取第二个第二样本并与第一个一次扫描样本进行比较,直到匹配出与第一个第一样本匹配的第二样本或者匹配完所有的第二样本。然后继续提取第二个一次扫描样本,接着按顺序从第二样本队列中提取未匹配的第二样本与第二个第一样本进行大小信息比较,直至得到两组匹配样本。
例如,当前提取出格式化扫描样本队列A中的第一个样本A1的大小信息为20M,按顺序从深度扫描样本队列B中提取深度扫描样本B1到Bn与样本A1进行大小信息比较,匹配得到B4与A1的大小信息相等,则A1与B4为一组匹配样本。然后按顺序从格式化扫描样本队列中提取A2,按顺序从深度扫描样本队列中提取除B4以外的所有深度扫描样本与A2进行大小信息比较。
S140、分别获取所述匹配样本中每组匹配样本的所述簇号与所述扇区号,并根据预置关系函数计算存储设备的每簇扇区数和首簇开始扇区号。
本实施例中,基于上述步骤确定两组匹配的样本,获取两组匹配样本的簇号及扇区号,根据预置的关系函数,计算存储设备的每簇扇区数和首簇开始扇区号,其中,预置关系函数如下:
式中,S1为第一组匹配样本的扇区号,S2为第二组匹配样本的扇区号,C1为第一组匹配样本的簇号,C2为第二组匹配样本的簇号,FCS为首簇开始扇区号,SPC为每簇扇区数。
S150、从所述第一样本队列中获取目标恢复文件的目标簇号,按所述关系函数以及所述每簇扇区数和首簇开始扇区号,计算所述目标恢复文件的目标扇区号;
S160、根据所述目标扇区号及所述目标簇号,恢复所述目标恢复文件。
本实施例中,基于上述步骤计算得到的存储设备的首簇开始扇区号与每簇扇区数,则确定了关系函数。从第一样本队列中获取目标恢复文件的目标簇号,根据目标恢复文件的簇号以及存储设备的首簇开始扇区号和每簇扇区数,按关系函数计算目标恢复文件存储位置的目标扇区号,进而根据目标扇区号恢复目标恢复文件。
在一实施例中,如图5所示,步骤S160包括:
S161、根据所述目标扇区号及目标簇号,查询所述目标恢复文件的文件运行记录;
S162、根据所述文件运行记录恢复所述目标恢复文件。
本实施例中,根据目标扇区号和目标簇号,查询目标恢复文件的文件运行记录找到目标恢复文件,更改目标恢复文件文件头的删除标记,进而恢复目标恢复文件。
该方法结合深度扫描及格式化扫描的优点,最终提供用户完整的属性和数据的文件恢复结果,同时结合上述两类恢复技术的优点,解决、规避各自的缺点。
本发明实施例还提供一种数据恢复装置,该数据恢复装置用于执行前述数据恢复方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的数据恢复装置的示意性框图。该数据恢复装置100可以配置于服务器中。
如图6所示,数据恢复装置100包括第一获取模块110、第二获取模块120、匹配模块130、第一计算模块140、第二计算模块150、文件恢复模块160。
第一获取模块110,用于获取各扇区文件的第一样本,存储所述第一样本至第一样本队列,所述第一样本至少包括文件的簇号及大小信息;
第二获取模块120,用于获取各扇区文件的第二样本,存储所述第二样本至第二样本队列,所述第二样本至少包括文件的扇区号及大小信息;
匹配模块130,用于根根据所述第一样本与第二样本的大小信息对所述第一样本队列与第二样本队列进行样本匹配,得到至少两组匹配样本;
第一计算模块140,用于分别获取所述匹配样本中每组匹配样本的所述簇号与所述扇区号,并根据预置关系函数计算存储设备的每簇扇区数和首簇开始扇区号;
第二计算模块150,用于从所述第一样本队列中获取目标恢复文件的目标簇号,按所述关系函数以及所述每簇扇区数和首簇开始扇区号,计算所述目标恢复文件的目标扇区号;
文件恢复模块160,用于根据所述目标扇区号及所述目标簇号,恢复所述目标恢复文件。
在一实施例中,第一获取模块110包括:
格式化扫描单元,用于格式化扫描各扇区内的文件,匹配出各扇区内文件的目录项;
提取单元,用于从所述目录项中提取文件的属性信息,所述属性信息至少包括文件的簇号、大小信息及类型信息;
第一存储单元,用于根据各文件的类型信息将所有文件的簇号及大小信息作为第一样本存储于对应类型的第一样本队列中;
组合单元,用于将多个类型的第一样本队列进行组合,得到第一样本队列组;
格式化扫描单元,用于继续读取所述存储设备下一扇区内的文件,直至扫描完所述存储设备的所有扇区。
在一实施例中,第二获取模块120包括:
深度扫描单元,用于深度扫描各扇区内的文件,记录指定文件类型的文件所在的扇区号及大小信息;
第二存储单元,用于根据各文件的类型信息将所有文件的扇区号及大小信息作为第二样本存储于对应类型的第二样本队列中;
第二组合单元,用于将多个类型的所述第二样本队列进行组合,得到第二样本队列组;
深度扫描单元,用于继续读取所述存储设备下一扇区内的文件,直至扫描完所述存储设备的所有扇区。
在一实施例中,匹配模块130包括:
提取单元,用于按顺序从所述第一样本队列中提取第一样本;
比较单元,用于按顺序从所述第二样本队列中提取第二样本,并将提取出的第二样本的大小信息与提取出的第一样本的大小信息进行比较;
判定单元,用于若提取出的第一样本与提取出的第二样本的大小信息相等,则判定第一样本与所述第二样本属于同一文件;若提取出的第一样本与提取出的第二样本的大小信息不相等,则继续按顺序从所述第二样本队列中提取第二样本并进行比较,直至得到至少两组匹配样本。
在一实施例中,文件恢复模块160包括:
查询单元,用于根据所述目标扇区号及目标簇号,查询所述目标恢复文件的文件运行记录;
恢复单元,用于根据所述文件运行记录恢复所述目标恢复文件。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述的数据恢复方法。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如上所述的数据恢复方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种数据恢复方法,其特征在于,包括:
获取各扇区文件的第一样本,存储所述第一样本至第一样本队列,所述第一样本至少包括文件的簇号及大小信息;
获取各扇区文件的第二样本,存储所述第二样本至第二样本队列,所述第二样本至少包括文件的扇区号及大小信息;
根据所述第一样本与第二样本的大小信息对所述第一样本队列与第二样本队列进行样本匹配,得到至少两组匹配样本;
分别获取所述匹配样本中每组匹配样本的所述簇号与所述扇区号,并根据预置关系函数计算存储设备的每簇扇区数和首簇开始扇区号;
从所述第一样本队列中获取目标恢复文件的目标簇号,按所述关系函数以及所述每簇扇区数和首簇开始扇区号,计算所述目标恢复文件的目标扇区号;
根据所述目标扇区号及所述目标簇号,恢复所述目标恢复文件。
2.根据权利要求1所述的数据恢复方法,其特征在于,所述获取各扇区文件的第一样本,存储所述第一样本至第一样本队列包括:
格式化扫描各扇区内的文件,匹配出各扇区内文件的目录项;
从所述目录项中提取文件的属性信息,所述属性信息至少包括文件的簇号、大小信息及类型信息;
根据各文件的类型信息将所有文件的簇号及大小信息作为第一样本存储于对应类型的第一样本队列中;
将多个类型的所述第一样本队列进行组合,得到第一样本队列组;
继续读取所述存储设备下一扇区内的文件,直至扫描完所述存储设备的所有扇区。
3.根据权利要求1所述的数据恢复方法,其特征在于,所述获取各扇区文件的第二样本,存储所述第二样本至第二样本队列包括:
深度扫描各扇区内的文件,记录指定文件类型的文件所在的扇区号及大小信息;
根据各文件的类型信息将所有文件的扇区号及大小信息作为第二样本存储于对应类型的第二样本队列中;
将多个类型的所述第二样本队列进行组合,得到第二样本队列组;
继续读取所述存储设备下一扇区内的文件,直至扫描完所述存储设备的所有扇区。
4.根据权利要求1所述的数据恢复方法,其特征在于,所述根据所述第一样本与第二样本的大小信息对所述第一样本队列与第二样本队列进行样本匹配,得到至少两组匹配样本包括:
按顺序从所述第一样本队列中提取第一样本;
按顺序从所述第二样本队列中提取第二样本,并将提取出的第二样本的大小信息与提取出的第一样本的大小信息进行比较;
若提取出的第一样本与提取出的第二样本的大小信息相等,则判定第一样本与所述第二样本属于一组匹配样本;
若提取出的第一样本与提取出的第二样本的大小信息不相等,则继续按顺序从所述第二样本队列中提取第二样本并进行比较,直至得到至少两组匹配样本。
5.根据权利要求1所述的数据恢复方法,其特征在于,所述根据所述目标扇区号及所述目标簇号,恢复所述目标恢复文件,包括:
根据所述目标扇区号及目标簇号,查询所述目标恢复文件的文件运行记录;
根据所述文件运行记录恢复所述目标恢复文件。
6.一种数据恢复装置,其特征在于,包括:
第一获取模块,用于获取各扇区文件的第一样本,存储所述第一样本至第一样本队列,所述第一样本至少包括文件的簇号及大小信息;
第二获取模块,用于获取各扇区文件的第二样本,存储所述第二样本至第二样本队列,所述第二样本至少包括文件的扇区号及大小信息;
匹配模块,用于根据所述第一样本与第二样本的大小信息对所述第一样本队列与第二样本队列进行样本匹配,得到至少两组匹配样本;
第一计算模块,用于分别获取所述匹配样本中每组匹配样本的所述簇号与所述扇区号,并根据预置关系函数计算存储设备的每簇扇区数和首簇开始扇区号;
第二计算模块,用于从所述第一样本队列中获取目标恢复文件的目标簇号,按所述关系函数以及所述每簇扇区数和首簇开始扇区号,计算所述目标恢复文件的目标扇区号;
文件恢复模块,用于根据所述目标扇区号及所述目标簇号,恢复所述目标恢复文件。
7.根据权利要求6所述的数据恢复装置,其特征在于,所述第一获取模块包括:
格式化扫描单元,用于格式化扫描各扇区内的文件,匹配出各扇区内文件的目录项;
提取单元,用于从所述目录项中提取文件的属性信息,所述属性信息至少包括文件的簇号、大小信息及类型信息;
第一存储单元,用于根据各文件的类型信息将所有文件的簇号及大小信息作为第一样本存储于对应类型的第一样本队列中;
第一组合单元,用于将多个类型的第一样本队列进行组合,得到第一样本队列组;
格式化扫描单元,用于继续读取所述存储设备下一扇区内的文件,直至扫描完所述存储设备的所有扇区。
8.根据权利要求6所述的数据恢复装置,其特征在于,所述第二获取模块包括:
深度扫描单元,用于深度扫描各扇区内的文件,记录指定文件类型的文件所在的扇区号及大小信息;
第二存储单元,用于根据各文件的类型信息将所有文件的扇区号及大小信息作为第二样本存储于对应类型的第二样本队列中;
第二组合单元,用于将多个类型的所述第二样本队列进行组合,得到第二样本队列组;
深度扫描单元,用于继续读取所述存储设备下一扇区内的文件,直至扫描完所述存储设备的所有扇区。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的数据恢复方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的数据恢复方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011284150.1A CN112380061B (zh) | 2020-11-17 | 2020-11-17 | 数据恢复方法、装置、计算机设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011284150.1A CN112380061B (zh) | 2020-11-17 | 2020-11-17 | 数据恢复方法、装置、计算机设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112380061A true CN112380061A (zh) | 2021-02-19 |
CN112380061B CN112380061B (zh) | 2024-10-11 |
Family
ID=74584907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011284150.1A Active CN112380061B (zh) | 2020-11-17 | 2020-11-17 | 数据恢复方法、装置、计算机设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112380061B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6173291B1 (en) * | 1997-09-26 | 2001-01-09 | Powerquest Corporation | Method and apparatus for recovering data from damaged or corrupted file storage media |
CN102254048A (zh) * | 2011-08-24 | 2011-11-23 | 深圳市万兴软件有限公司 | 数据恢复方法和系统 |
CN104794024A (zh) * | 2015-04-15 | 2015-07-22 | 四川神琥科技有限公司 | 一种数据恢复方法 |
CN105760244A (zh) * | 2016-02-02 | 2016-07-13 | 厦门市美亚柏科信息股份有限公司 | 一种基于假设验证的exFAT格式化恢复方法和装置 |
CN106201783A (zh) * | 2016-07-15 | 2016-12-07 | 广东欧珀移动通信有限公司 | 一种数据恢复方法和装置 |
-
2020
- 2020-11-17 CN CN202011284150.1A patent/CN112380061B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6173291B1 (en) * | 1997-09-26 | 2001-01-09 | Powerquest Corporation | Method and apparatus for recovering data from damaged or corrupted file storage media |
CN102254048A (zh) * | 2011-08-24 | 2011-11-23 | 深圳市万兴软件有限公司 | 数据恢复方法和系统 |
CN104794024A (zh) * | 2015-04-15 | 2015-07-22 | 四川神琥科技有限公司 | 一种数据恢复方法 |
CN105760244A (zh) * | 2016-02-02 | 2016-07-13 | 厦门市美亚柏科信息股份有限公司 | 一种基于假设验证的exFAT格式化恢复方法和装置 |
CN106201783A (zh) * | 2016-07-15 | 2016-12-07 | 广东欧珀移动通信有限公司 | 一种数据恢复方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112380061B (zh) | 2024-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220012231A1 (en) | Automatic content-based append detection | |
CN110502664B (zh) | 视频标签索引库创建方法、视频标签生成方法及装置 | |
US20160034201A1 (en) | Managing de-duplication using estimated benefits | |
CN109753382B (zh) | 一种数据库删除记录的恢复方法及系统 | |
CN109271545B (zh) | 一种特征检索方法及装置、存储介质和计算机设备 | |
WO2020103493A1 (zh) | 基于fat32文件系统的删除文件恢复方法及系统 | |
KR20140083556A (ko) | SQLite 데이터베이스에서 삭제된 데이터의 복원 방법 및 장치 | |
CN112115002B (zh) | 从损坏或不可信机械硬盘恢复文件的方法及装置 | |
US20180210784A1 (en) | Metadata Recovery Method and Apparatus | |
CN109496292A (zh) | 一种磁盘管理方法、磁盘管理装置及电子设备 | |
CN108628885A (zh) | 一种数据同步方法、装置及存储设备 | |
CN113488106A (zh) | 一种快速获取目标基因组区域比对结果数据的方法 | |
Sari et al. | A review of graph theoretic and weightage techniques in file carving | |
CN115565222A (zh) | 人脸识别方法、人脸识别系统、终端设备及存储介质 | |
CN112380061B (zh) | 数据恢复方法、装置、计算机设备及可读存储介质 | |
CN107220146B (zh) | 一种文件扫描恢复方法及装置 | |
MX2007011691A (es) | Metodos y medios legibles por computadora, y estructuras de datos para desarrollar una base de datos autoritaria de elementos identificadores de audio digitales y articulos de medios de identificacion. | |
KR20110023580A (ko) | 데이터를 복구하기 위한 방법 및 시스템 | |
CN107818136B (zh) | 用于回收垃圾对象数据的方法和装置 | |
CN112559533B (zh) | 连续型数据库的归档方法、装置及电子设备 | |
US20130218851A1 (en) | Storage system, data management device, method and program | |
CN113065025A (zh) | 视频查重方法、装置、设备及存储介质 | |
CN112416657A (zh) | 一种系统克隆方法 | |
CN114138552B (zh) | 数据动态重删方法、系统、终端及存储介质 | |
CN110781160A (zh) | 基于VMware虚拟化文件系统损坏的数据恢复方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |