CN107220146B - 一种文件扫描恢复方法及装置 - Google Patents

一种文件扫描恢复方法及装置 Download PDF

Info

Publication number
CN107220146B
CN107220146B CN201710371751.8A CN201710371751A CN107220146B CN 107220146 B CN107220146 B CN 107220146B CN 201710371751 A CN201710371751 A CN 201710371751A CN 107220146 B CN107220146 B CN 107220146B
Authority
CN
China
Prior art keywords
file
header
record
records
acquiring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710371751.8A
Other languages
English (en)
Other versions
CN107220146A (zh
Inventor
谢智宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wondershare Technology Co ltd
Original Assignee
Wondershare Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wondershare Technology Co ltd filed Critical Wondershare Technology Co ltd
Priority to CN201710371751.8A priority Critical patent/CN107220146B/zh
Publication of CN107220146A publication Critical patent/CN107220146A/zh
Application granted granted Critical
Publication of CN107220146B publication Critical patent/CN107220146B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种文件扫描恢复方法及装置,该方法包括:获取磁盘分区的分配表;根据分配表包括的文件记录,建立文件头特征库;当检测到恢复文件指令时,根据文件头特征库和分配表,在磁盘分区的数据区恢复丢失文件。本发明通过对磁盘分区的分配表包括的文件记录进行分析,自动提取文件头特征,建立文件头特征库。如此建立的文件头特征库能够涵盖终端可以存储的所有文件类型,因此一定能覆盖用户丢失的文件的文件类型,减少文件恢复失败的情况。而且自动提取文件头特征,减少了人工干预,提高了文件恢复效率。且自动提取方式可扩展性强,支持文件头特征的不断更新。

Description

一种文件扫描恢复方法及装置
技术领域
本发明涉及数据恢复技术领域,具体而言,涉及一种文件扫描恢复方法及装置。
背景技术
目前,用户经常使用存储设备存储文件,但有时因为误删操作或病毒破坏等软件问题造成文件丢失,此时需要对文件进行恢复,以找回丢失的文件。
当前,相关技术中存在一种全盘扫描技术,在文件丢失时,对每个磁盘分区的数据区进行逐字节扫描,判断扫描到的信息与特定文件格式的文件头特征是否匹配,特定文件格式包括doc(文档格式)、rar(压缩格式)或mp3(音频编码格式)等。如果匹配,且确定磁盘分区的分配表中不包含该扫描到的信息,则恢复扫描到的信息。如果不匹配,或者匹配但磁盘分区的分配表中包含该扫描到的信息,则不进行恢复操作。
在上述全盘扫描技术中,文件头特征是通过人工分析提取的,文件头特征数量固定,不一定能覆盖用户可能丢失的文件类型,导致恢复质量不高。且人工分析提取,扩展性差,人工干预也降低了文件恢复的效率。
发明内容
有鉴于此,本发明实施例的目的在于提供一种文件扫描恢复方法及装置,以解决现有技术存在的以下问题:文件头特征是通过人工分析提取的,文件头特征数量固定,不一定能覆盖用户可能丢失的文件类型,导致恢复质量不高。且人工分析提取,扩展性差,人工干预也降低了文件恢复的效率。
第一方面,本发明实施例提供了一种文件扫描恢复方法,所述方法包括:
获取磁盘分区的分配表;
根据所述分配表包括的文件记录,建立文件头特征库;
当检测到恢复文件指令时,根据所述文件头特征库和所述分配表,在所述磁盘分区的数据区恢复丢失文件。
结合第一方面,本发明实施例提供了上述第一方面的第一种可能的实现方式,其中,所述根据所述分配表包括的文件记录,建立文件头特征库,包括:
遍历所述分配表包括的文件记录,判断所述分配表中是否存在多个第一文件记录,所述多个第一文件记录为文件格式相同的文件对应的文件记录;
如果是,获取每个所述第一文件记录对应的文件头数据;
从获取的所述文件头数据中提取相同的文件头特征,将所述文件格式与提取的所述文件头特征对应存储到文件头特征库中。
结合第一方面的第一种可能的实现方式,本发明实施例提供了上述第一方面的第二种可能的实现方式,其中,所述获取每个所述第一文件记录对应的文件头数据,包括:
确定所述多个第一文件记录中是否包括第二文件记录,所述第二文件记录为带有删除标记的第一文件记录;
如果是,则去除所述第二文件记录带有的删除标记,获取所述第二文件记录包括的文件位置,及分别获取所述多个第一文件记录中除所述第二文件记录外的其他每个第一文件记录包括的文件位置;
如果否,则分别获取所述多个第一文件记录中每个第一文件记录包括的文件位置;
根据获取的所述文件位置,从磁盘分区的数据区中获取对应的文件头数据。
结合第一方面的第二种实现方式,本发明实施例提供了上述第一方面的第三种可能的实现方式,其中,所述获取所述第二文件记录包括的文件位置之后,还包括:
在所述分配表中,为所述第二文件记录设置删除标记。
结合第一方面,本发明实施例提供了上述第一方面的第四种可能的实现方式,其中,所述根据所述文件头特征库和所述分配表,在磁盘分区的数据区恢复丢失文件,包括:
扫描所述磁盘分区的数据区,获取扫描到的文件的文件头数据;
查询所述文件头特征库中是否存在与获取的所述文件头数据匹配的文件头特征;
若存在,则确定所述分配表中扫描到的所述文件对应的文件记录是否带有删除标记;
如果是,则将扫描到的所述文件恢复至所述数据区中的空闲存储空间内。
结合第一方面,本发明实施例提供了上述第一方面的第五种可能的实现方式,其中,所述在所述磁盘分区的数据区恢复丢失文件后,还包括:
获取恢复后所述丢失文件在所述数据区的文件位置;
在所述分配表中,去除所述丢失文件对应的文件记录带有的删除标记;
将所述丢失文件对应的文件记录包括的文件位置更新为所述恢复后的文件位置。
结合第一方面,本发明实施例提供了上述第一方面的第六种可能的实现方式,其中,所述根据所述文件头特征库和所述分配表,在所述磁盘分区的数据区恢复丢失文件之前,还包括:
获取预设固定特征文件,所述预设固定特征文件包括文件格式与文件头特征的对应关系;
根据所述预设固定特征文件包括的文件格式,将所述预设固定特征文件包括的文件头特征添加到所述文件头特征库中。
第二方面,本发明实施例提供了一种文件扫描恢复装置,所述装置包括:
获取模块,用于获取磁盘分区的分配表;
建立模块,用于根据所述分配表包括的文件记录,建立文件头特征库;
恢复模块,用于当检测到恢复文件指令时,根据所述文件头特征库和所述分配表,在所述磁盘分区的数据区恢复丢失文件。
结合第二方面,本发明实施例提供了上述第二方面的第一种可能的实现方式,其中,所述建立模块包括:
判断单元,用于遍历所述分配表包括的文件记录,判断所述分配表中是否存在多个第一文件记录,所述多个第一文件记录为文件格式相同的文件对应的文件记录;
获取单元,用于当所述判断单元判断所述分配表中存在多个所述第一文件记录时,获取每个所述第一文件记录对应的文件头数据;
存储单元,用于从获取的所述文件头数据中提取相同的文件头特征,将所述文件格式与提取的所述文件头特征对应存储到文件头特征库中。
结合第二方面,本发明实施例提供了上述第二方面的第二种可能的实现方式,其中,所述获取单元包括:
确定子单元,用于确定所述多个第一文件记录中是否包括第二文件记录,所述第二文件记录为带有删除标记的第一文件记录;如果是,则去除所述第二文件记录带有的删除标记,获取所述第二文件记录包括的文件位置,及分别获取所述多个第一文件记录中除所述第二文件记录外的其他每个第一文件记录包括的文件位置;如果否,则分别获取所述多个第一文件记录中每个第一文件记录包括的文件位置;
获取子单元,用于根据获取的所述文件位置,从磁盘分区的数据区中获取对应的文件头数据。
在本发明实施例提供的方法及装置中,获取磁盘分区的分配表;根据分配表包括的文件记录,建立文件头特征库;当检测到恢复文件指令时,根据文件头特征库和分配表,在磁盘分区的数据区恢复丢失文件。本发明通过对磁盘分区的分配表包括的文件记录进行分析,自动提取文件头特征,建立文件头特征库。如此建立的文件头特征库能够涵盖终端可以存储的所有文件类型,因此一定能覆盖用户丢失的文件的文件类型,减少文件恢复失败的情况。而且自动提取文件头特征,减少了人工干预,提高了文件恢复效率。且自动提取方式可扩展性强,支持文件头特征的不断更新。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例1所提供的一种文件扫描恢复方法的流程图;
图2示出了本发明实施例1所提供的特征插件扫描模块的示意图;
图3示出了本发明实施例1所提供的NTFS文件特征插件模块的示意图;
图4示出了本发明实施例2所提供的一种文件扫描恢复装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到在现有的全盘扫描技术中,文件头特征是通过人工分析提取的,文件头特征数量固定,不一定能覆盖用户可能丢失的文件类型,导致恢复质量不高。且人工分析提取,扩展性差,人工干预也降低了文件恢复的效率。基于此,本发明实施例提供了一种文件扫描恢复方法及装置,下面通过实施例进行描述。
实施例1
本发明实施例提供了一种文件扫描恢复方法。
在用户使用终端存储文件的过程中,若因为误删操作或病毒破坏等软件问题导致文件丢失,则通过本发明实施例提供的方法自动提取文件头特征,根据自动提取的文件头特征对丢失的文件进行扫描恢复。本发明实施例对文件头特征进行自动提取,大大减少了文件扫描恢复过程中的人工干预,可扩展性强,提高了文件恢复效率。且自动提取文件头特征确保提取的文件头特征能覆盖终端存储的所有文件类型,因此一定能够覆盖用户可能丢失的文件类型。
参见图1,该方法具体包括以下步骤:
步骤101:获取磁盘分区的分配表。
本发明实施例的执行主体为终端。终端在划分磁盘分区后,每个磁盘分区都包括文件目录区、分配表和数据区。其中,文件目录区包括磁盘分区内存储的每个文件的文件目录,文件目录包括文件的名称、文件格式、数据量大小和存储时间等信息。分配表中包括磁盘分区内存储的每个文件的文件记录,文件记录包括文件的名称、文件格式及文件在数据区的文件位置等,文件位置用于表示文件在数据区的存储位置。数据区存储有每个文件的文件数据。
在通过本发明实施例提供的方法进行丢失文件恢复时,首先获取磁盘分区的分配表包括的所有文件记录。
步骤102:根据该分配表包括的文件记录,建立文件头特征库。
遍历该分配表包括的文件记录,判断该分配表中是否存在多个第一文件记录,这多个第一文件记录为文件格式相同的文件对应的文件记录;如果是,获取每个第一文件记录对应的文件头数据;从获取的文件头数据中提取相同的文件头特征,将该文件格式与提取的相同的文件头特征对应存储到文件头特征库中。
上述文件格式可以用文件记录中包括的文件后缀名来表示。获取分配表中每个文件记录包括的文件后缀名,确定分配表中是否包含文件后缀名相同的文件记录,如文件后缀名都为doc,或者文件后缀名都为rar等。若确定出包含文件后缀名相同的文件记录,则判断出该分配标中存在上述第一文件记录。若确定分配标中包括的所有文件记录包括的文件后缀名都各不相同,则判断出该分配表中不存在上述第一文件记录。
由于文件因误删操作或病毒破坏等软件原因丢失时,只是在磁盘分区的分配表中,在丢失文件对应的文件记录中标注了删除标记,数据区中仍然保留了丢失文件的完整数据,只是该丢失文件被隐藏,用户看不到该丢失文件了。通过上述方式判断分配表中存在多个第一文件记录后,还需确定这多个第一文件记录中是否包括第二文件记录,第二文件记录为带有删除标记的第一文件记录。即判断文件格式相同的这多个第一文件记录中是否包含丢失文件对应的文件记录。
若确定这多个第一文件记录中包括带有删除标记的第二文件记录,则去除第二文件记录带有的删除标记,获取第二文件记录包括的文件位置,及分别获取多个第一文件记录中除第二文件记录外的其他每个第一文件记录包括的文件位置。若确定这多个第一文件记录中不包括带有删除标记的第二文件记录,则分别获取这多个第一文件记录中每个第一文件记录包括的文件位置。
通过上述方式获取到每个第一文件记录对应的文件位置后,根据获取的每个文件位置,从磁盘分区的数据区中分别获取每个第一文件记录对应的文件头数据。具体地,根据获取的第一文件记录包括的文件位置,在磁盘分区的数据区中定位出存储的该第一文件记录对应的文件,从该文件中提取文件头数据。
当文件格式相同的多个第一文件记录中包括带有删除标记的第二文件记录时,通过上述方式获取到第二文件记录对应的文件头数据后,还在分配表中,为该第二文件记录设置删除标记,将第二文件记录对应的文件恢复为删除状态。即对于带有删除标记的第二文件记录,先将第二文件记录对应的文件恢复为未删除状态,获取到该文件的文件头数据后,再将该文件恢复为删除状态。
通过上述方式获取到文件格式相同的每个第一文件记录对应的文件头数据后,从每个第一文件记录对应的文件头数据中提取相同的文件头特征,将第一文件记录的文件格式与提取的相同的文件头特征对应存储到文件头特征库中。
对于磁盘分区存储过的文件涵盖的所有文件格式,都可以按照本步骤的操作,在文件头特征库中存储文件格式与文件头特征的对应关系。且终端通常划分多个磁盘分区,对于每个磁盘分区,都按照上述步骤101和102的操作根据每个磁盘分区的记录表建立文件头特征库。因此本发明实施例建立的文件头特征库能够涵盖终端可以存储的所有文件格式,减少了因文件格式覆盖不到导致文件恢复失败的情况。而且通过步骤101和102的操作来自动建立文件头特征库,大大减少了文件恢复过程中的人工干预,降低了恢复成本,提高了恢复效率。且自动提取文件头特征,使得本发明实施例提供的文件恢复方法可扩展性强,本发明实施例可以每隔预设时长自动按照上述方式提取文件头特征,查询文件头特征库中是否包含该文件头特征,若不包含则将该文件头特征添加到文件头特征库中,不断丰富文件头特征库,以确保文件头特征库能够涵盖终端可以存储的所有文件格式。
终端通常划分多个磁盘区间,对于每个磁盘区间都按照上述步骤101和102的操作来提取文件格式对应的文件头特征,并将提取的文件格式与文件头特征存储到文件头特征库中。
在本发明实施例中,还获取预设固定特征文件,该预设固定特征文件为现有技术中人工提取文件头特征生成的特征文件,该预设固定特征文件包括文件格式与文件头特征的对应关系。根据该预设固定特征文件包括的文件格式,将该预设固定特征文件包括的文件头特征添加到该文件头特征库中。实现本发明实施例提供的文件恢复方式与现有恢复方式的兼容。
在将预设固定特征文件包括的文件头特征添加到文件头特征库中时,对于预设固定特征文件包括的文件格式,查询文件头特征库中是否包含该文件格式,若包含,则从预设固定特征文件中获取该文件格式对应的文件头特征,若确定文件头特征库中不包含该文件格式对应的该文件头特征,则将该文件头特征添加到文件头特征库中该文件格式对应的文件头特征中。如果查询出文件头特征库中不包含该文件格式,则将预设固定特征文件中该文件格式与对应的文件头特征添加到文件头特征库中。
步骤103:当检测到恢复文件指令时,根据文件头特征库和磁盘分区的分配表,在磁盘分区的数据区恢复丢失文件。
当用户需要恢复丢失文件时,用户向终端提交恢复文件指令,终端检测到该恢复文件指令时,扫描磁盘分区的数据区,获取扫描到的文件的文件头数据;查询文件头特征库中是否存在与获取的文件头数据匹配的文件头特征;若存在,则确定磁盘分区的分配表中扫描到的文件对应的文件记录是否带有删除标记;如果是,则确定扫描到的文件为丢失文件,将该丢失文件恢复至数据区中的空闲存储空间内。
在本发明实施例中,可以通过上述方式将所有因软件问题删除的文件恢复。也可以通过如下方式只恢复一个或少数几个因软件问题删除的文件。具体地,用户在提交恢复文件指令时,提交恢复关键词,该恢复关键词可以为需恢复的丢失文件的名称包括的词或者为丢失文件的后缀名。终端检测到该恢复文件指令时,扫描磁盘分区的数据区,获取扫描到的文件的文件头数据;查询文件头特征库中是否存在与获取的文件头数据匹配的文件头特征;若存在,则确定磁盘分区的分配表中扫描到的文件对应的文件记录是否带有删除标记;如果是,则确定扫描到的文件为丢失文件,然后确定该丢失文件与上述恢复关键词是否匹配,若匹配,则表明该丢失文件为用户需要恢复的文件,将该丢失文件恢复至数据区中的空闲存储空间内。
在本发明实施例中,在磁盘分区的数据区恢复丢失文件后,还获取恢复后丢失文件在数据区的文件位置;在分配表中,去除丢失文件对应的文件记录带有的删除标记;将丢失文件对应的文件记录包括的文件位置更新为恢复后的文件位置。
为了便于理解本发明实施例提供的文件恢复方法,下面结合附图进行说明。终端上配置有如图2所示的特征插件扫描模块。在建立文件头特征库时,终端通过深度扫描分析器按照步骤101和102的操作对磁盘分区的分配表包括的文件记录进行扫描分析,将分析出的文件头特征记录在特征插件中,最终通过分析控制器对分析出来的文件头特征进行队列管理。以NTFS(New Technology File System,新技术文件系统)为例进行说明,如图3所示的NTFS文件特征插件扫描模块,文件头特征提取的执行由文件特征信息加载器完成,为了避免重复扫描分析,在第一次分析完后将提取的文件头特征保存到特征配置信息加载器,以后进行数据恢复扫描时可直接使用特征配置信息加载器中存储的文件头特征。同时为了兼容已经存在的人工文件头特征库,设计硬编码文件特征加载器来加载该人工文件头特征库,由组合特征加载器统筹管理本发明实施例建立的特征库和加载的人工文件头特征库。
本发明实施例提供的方法能够兼容已存在的全盘扫描技术,且自动提取文件头特征,支持文件头特征的来源可扩展,支持文件头特征更新。另外,本发明实施例预留了扩展接口,不同的文件存储系统都可以通过预留的扩展接口,按照本发明实施例提供的方法实现文件扫描恢复。
在本发明实施例中,获取磁盘分区的分配表;根据分配表包括的文件记录,建立文件头特征库;当检测到恢复文件指令时,根据文件头特征库和分配表,在磁盘分区的数据区恢复丢失文件。本发明通过对磁盘分区的分配表包括的文件记录进行分析,自动提取文件头特征,建立文件头特征库。如此建立的文件头特征库能够涵盖终端可以存储的所有文件类型,因此一定能覆盖用户丢失的文件的文件类型,减少文件恢复失败的情况。而且自动提取文件头特征,减少了人工干预,提高了文件恢复效率。且自动提取方式可扩展性强,支持文件头特征的不断更新。
实施例2
参见图4,本发明实施例提供了一种文件扫描恢复装置,该装置用于执行上述实施例1所提供的文件扫描恢复方法,该装置包括:
获取模块20,用于获取磁盘分区的分配表;
建立模块21,用于根据分配表包括的文件记录,建立文件头特征库;
恢复模块22,用于当检测到恢复文件指令时,根据文件头特征库和分配表,在磁盘分区的数据区恢复丢失文件。
上述建立模块21包括:
判断单元,用于遍历分配表包括的文件记录,判断分配表中是否存在多个第一文件记录,多个第一文件记录为文件格式相同的文件对应的文件记录;
获取单元,用于当判断单元判断分配表中存在多个第一文件记录时,获取每个第一文件记录对应的文件头数据;
存储单元,用于从获取的文件头数据中提取相同的文件头特征,将文件格式与提取的文件头特征对应存储到文件头特征库中。
上述获取单元包括:
确定子单元,用于确定多个第一文件记录中是否包括第二文件记录,第二文件记录为带有删除标记的第一文件记录;如果是,则去除第二文件记录带有的删除标记,获取第二文件记录包括的文件位置,及分别获取多个第一文件记录中除第二文件记录外的其他每个第一文件记录包括的文件位置;如果否,则分别获取多个第一文件记录中每个第一文件记录包括的文件位置;
获取子单元,用于根据获取的文件位置,从磁盘分区的数据区中获取对应的文件头数据。
在本发明实施例中,在上述获取单元获取第二文件记录包括的文件位置之后,该装置还包括:设置模块,用于在分配表中,为第二文件记录设置删除标记。
在本发明实施例中,恢复模块22,用于扫描磁盘分区的数据区,获取扫描到的文件的文件头数据;查询文件头特征库中是否存在与获取的文件头数据匹配的文件头特征;若存在,则确定分配表中扫描到的文件对应的文件记录是否带有删除标记;如果是,则将扫描到的文件恢复至数据区中的空闲存储空间内。
在本发明实施例中,该装置还包括:更新模块,用于获取恢复后丢失文件在数据区的文件位置;在分配表中,去除丢失文件对应的文件记录带有的删除标记;将丢失文件对应的文件记录包括的文件位置更新为恢复后的文件位置。
还包括添加模块,用于获取预设固定特征文件,预设固定特征文件包括文件格式与文件头特征的对应关系;根据预设固定特征文件包括的文件格式,将预设固定特征文件包括的文件头特征添加到文件头特征库中。
在本发明实施例中,获取磁盘分区的分配表;根据分配表包括的文件记录,建立文件头特征库;当检测到恢复文件指令时,根据文件头特征库和分配表,在磁盘分区的数据区恢复丢失文件。本发明通过对磁盘分区的分配表包括的文件记录进行分析,自动提取文件头特征,建立文件头特征库。如此建立的文件头特征库能够涵盖终端可以存储的所有文件类型,因此一定能覆盖用户丢失的文件的文件类型,减少文件恢复失败的情况。而且自动提取文件头特征,减少了人工干预,提高了文件恢复效率。且自动提取方式可扩展性强,支持文件头特征的不断更新。
本发明实施例所提供的文件扫描恢复装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (6)

1.一种文件扫描恢复方法,其特征在于,所述方法包括:
获取磁盘分区的分配表;
根据所述分配表包括的文件记录,建立文件头特征库;
当检测到恢复文件指令时,根据所述文件头特征库和所述分配表,在所述磁盘分区的数据区恢复丢失文件;
所述根据所述分配表包括的文件记录,建立文件头特征库,包括:
遍历所述分配表包括的文件记录,判断所述分配表中是否存在多个第一文件记录,所述多个第一文件记录为文件格式相同的文件对应的文件记录;
如果是,获取每个所述第一文件记录对应的文件头数据;
从获取的所述文件头数据中提取相同的文件头特征,将所述文件格式与提取的所述文件头特征对应存储到文件头特征库中;
所述获取每个所述第一文件记录对应的文件头数据,包括:
确定所述多个第一文件记录中是否包括第二文件记录,所述第二文件记录为带有删除标记的第一文件记录;
如果是,则去除所述第二文件记录带有的删除标记,获取所述第二文件记录包括的文件位置,及分别获取所述多个第一文件记录中除所述第二文件记录外的其他每个第一文件记录包括的文件位置;
如果否,则分别获取所述多个第一文件记录中每个第一文件记录包括的文件位置;
根据获取的所述文件位置,从磁盘分区的数据区中获取对应的文件头数据。
2.根据权利要求1所述的方法,其特征在于,所述获取所述第二文件记录包括的文件位置之后,还包括:
在所述分配表中,为所述第二文件记录设置删除标记。
3.根据权利要求1所述的方法,其特征在于,所述根据所述文件头特征库和所述分配表,在磁盘分区的数据区恢复丢失文件,包括:
扫描所述磁盘分区的数据区,获取扫描到的文件的文件头数据;
查询所述文件头特征库中是否存在与获取的所述文件头数据匹配的文件头特征;
若存在,则确定所述分配表中扫描到的所述文件对应的文件记录是否带有删除标记;
如果是,则将扫描到的所述文件恢复至所述数据区中的空闲存储空间内。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述在所述磁盘分区的数据区恢复丢失文件后,还包括:
获取恢复后所述丢失文件在所述数据区的文件位置;
在所述分配表中,去除所述丢失文件对应的文件记录带有的删除标记;
将所述丢失文件对应的文件记录包括的文件位置更新为所述恢复后的文件位置。
5.根据权利要求1所述的方法,其特征在于,所述根据所述文件头特征库和所述分配表,在所述磁盘分区的数据区恢复丢失文件之前,还包括:
获取预设固定特征文件,所述预设固定特征文件包括文件格式与文件头特征的对应关系;
根据所述预设固定特征文件包括的文件格式,将所述预设固定特征文件包括的文件头特征添加到所述文件头特征库中。
6.一种文件扫描恢复装置,其特征在于,所述装置包括:
获取模块,用于获取磁盘分区的分配表;
建立模块,用于根据所述分配表包括的文件记录,建立文件头特征库;
恢复模块,用于当检测到恢复文件指令时,根据所述文件头特征库和所述分配表,在所述磁盘分区的数据区恢复丢失文件;
所述建立模块包括:
判断单元,用于遍历所述分配表包括的文件记录,判断所述分配表中是否存在多个第一文件记录,所述多个第一文件记录为文件格式相同的文件对应的文件记录;
获取单元,用于当所述判断单元判断所述分配表中存在多个所述第一文件记录时,获取每个所述第一文件记录对应的文件头数据;
存储单元,用于从获取的所述文件头数据中提取相同的文件头特征,将所述文件格式与提取的所述文件头特征对应存储到文件头特征库中;
所述获取单元包括:
确定子单元,用于确定所述多个第一文件记录中是否包括第二文件记录,所述第二文件记录为带有删除标记的第一文件记录;如果是,则去除所述第二文件记录带有的删除标记,获取所述第二文件记录包括的文件位置,及分别获取所述多个第一文件记录中除所述第二文件记录外的其他每个第一文件记录包括的文件位置;如果否,则分别获取所述多个第一文件记录中每个第一文件记录包括的文件位置;
获取子单元,用于根据获取的所述文件位置,从磁盘分区的数据区中获取对应的文件头数据。
CN201710371751.8A 2017-05-24 2017-05-24 一种文件扫描恢复方法及装置 Active CN107220146B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710371751.8A CN107220146B (zh) 2017-05-24 2017-05-24 一种文件扫描恢复方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710371751.8A CN107220146B (zh) 2017-05-24 2017-05-24 一种文件扫描恢复方法及装置

Publications (2)

Publication Number Publication Date
CN107220146A CN107220146A (zh) 2017-09-29
CN107220146B true CN107220146B (zh) 2020-09-11

Family

ID=59944458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710371751.8A Active CN107220146B (zh) 2017-05-24 2017-05-24 一种文件扫描恢复方法及装置

Country Status (1)

Country Link
CN (1) CN107220146B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021698A (zh) * 2017-12-21 2018-05-11 努比亚技术有限公司 存储文件的删除方法、装置和计算机存储介质
CN108647116A (zh) * 2018-04-13 2018-10-12 深圳大普微电子科技有限公司 数据恢复方法和存储设备
CN108536554A (zh) * 2018-04-26 2018-09-14 威海海洋职业学院 一种数据文件的备份方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1567239A (zh) * 2003-07-09 2005-01-19 成都市赛刻亿文高科技开发有限公司 计算机文件恢复方法
CN104462433A (zh) * 2014-12-17 2015-03-25 四川效率源信息安全技术有限责任公司 一种恢复fat32分区数据的方法
CN106407038A (zh) * 2015-07-27 2017-02-15 四川效率源信息安全技术有限责任公司 一种碎片文件的数据恢复方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1567239A (zh) * 2003-07-09 2005-01-19 成都市赛刻亿文高科技开发有限公司 计算机文件恢复方法
CN104462433A (zh) * 2014-12-17 2015-03-25 四川效率源信息安全技术有限责任公司 一种恢复fat32分区数据的方法
CN106407038A (zh) * 2015-07-27 2017-02-15 四川效率源信息安全技术有限责任公司 一种碎片文件的数据恢复方法

Also Published As

Publication number Publication date
CN107220146A (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
CN109656934B (zh) 基于日志解析的源端Oracle数据库DDL同步方法及设备
KR101456757B1 (ko) SQLite 데이터베이스에서 삭제된 데이터의 복원 방법 및 장치
CN107220146B (zh) 一种文件扫描恢复方法及装置
CN106354884B (zh) 一种基于分布式文件系统的数据对象删除方法及装置
CN109522160B (zh) 通过保存文件信息摘要进行文件目录比较备份方法和系统
CN111190962B (zh) 一种文件同步方法、装置及本地终端
CN107783770B (zh) 页面配置更新方法、装置、服务器和介质
CN112115002B (zh) 从损坏或不可信机械硬盘恢复文件的方法及装置
CN112463026A (zh) 分布式对象存储系统中追加数据的重复删除的方法和设备
CN107402753B (zh) 一种硬盘固件的刷新方法及装置
CN109165175A (zh) 设备标识生成方法和装置
CN112230947A (zh) 一种操作系统的升级方法、升级系统
CN112433810B (zh) docker容器镜像存储、拉取方法、装置及计算机可读存储介质
CN103093213A (zh) 视频文件分类方法及终端
CN111698330B (zh) 存储集群的数据恢复方法、装置及服务器
KR20110023580A (ko) 데이터를 복구하기 위한 방법 및 시스템
CN110543575B (zh) 车载外置存储设备的媒体文件检索方法及装置
WO2015054992A1 (zh) 一种数据的备份方法、装置及系统
CN113886352A (zh) 分布式文件系统的元数据恢复方法、装置、设备及介质
CN110489432B (zh) 基于模型的数据库自动同步方法、介质、设备及装置
CN111026896B (zh) 特征值存储、处理方法、设备及存储装置
CN113553219B (zh) 应用于网络存储设备的数据恢复方法及相关设备
CN103312792A (zh) 从外接存储设备中读取文件的方法及系统
CN115168105A (zh) 一种恢复Windows删除图片的缩略图的方法以及相关装置
CN110109883B (zh) 一种文件滤重储存方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant