CN109697197B - 一种雕复Access数据库文件的方法 - Google Patents

一种雕复Access数据库文件的方法 Download PDF

Info

Publication number
CN109697197B
CN109697197B CN201811592824.7A CN201811592824A CN109697197B CN 109697197 B CN109697197 B CN 109697197B CN 201811592824 A CN201811592824 A CN 201811592824A CN 109697197 B CN109697197 B CN 109697197B
Authority
CN
China
Prior art keywords
elements
access database
data
partitions
data page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811592824.7A
Other languages
English (en)
Other versions
CN109697197A (zh
Inventor
梁效宁
许超明
陆宇轩
刘涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xly Salvationdata Technology Inc
Original Assignee
Xly Salvationdata Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xly Salvationdata Technology Inc filed Critical Xly Salvationdata Technology Inc
Priority to CN201811592824.7A priority Critical patent/CN109697197B/zh
Publication of CN109697197A publication Critical patent/CN109697197A/zh
Application granted granted Critical
Publication of CN109697197B publication Critical patent/CN109697197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种雕复Access数据库文件的方法,包括以下步骤:S1:提取所述Access数据库中数据源的空闲簇/块并计入集合A1;S2:检测所述集合A1的元素中所述Access数据库的数据页块并计入集合A2;S3:采用图论的方法对所述集合A2的元素进行重组;S4:根据所述集合A2的元素恢复所述Access数据库文件。本发明提供的方法能够快速检测Access数据库的数据页并高效雕复/重组Access数据库的数据页块。

Description

一种雕复Access数据库文件的方法
技术领域
本发明属于数据恢复领域,涉及一种雕复Access数据库文件的方法。
背景技术
随着计算机中数据存储管理技术的飞速发展,数据库的应用变得十分广泛,深入到各个领域。从小型单项事务处理系统到大型信息系统,从联机事务处理到联机分析处理,从一般企业管理到计算机辅助设计与制造,计算机集成制造系统,电子政务,电子商务地理信息系统等,越来越多的应用领域采用数据库技术来存储和处理信息资源。数据库已成为了现代信息系统的重要组成部分。
数据库中存储着重要重要而敏感的信息,因此数据库系统就成为了黑客们有价值的攻击对象。黑客可以通过口令入侵、特权提升、漏洞入侵、SQL注入和窃取备份等手段攻击数据库系统,窃取、篡改、破坏其中的数据或进行其他非法活动。从数据库中恢复出入侵者破坏的数据是取证中重要的一部分,也是本文的研究主题。数据库恢复相对于其它电子数据的恢复优点之一是存在很多冗余信息,具有很丰富的证据来源来恢复数据。
Access是微软推出的轻量级关系数据库,具有存储简单、易于维护、界面友好、无需专门服务器等优点,广泛应用于各种小型数据库应用。
Access数据库文件的存储是微软自定义的存储格式,传统的数据恢复技术无法应用到数据库文件中的数据记录提取与恢复。
市面上现有技术无法有效重组多片段的Access数据库文件,无法有效地恢复数据库中删除的数据记录数据。
发明内容
本发明针对现有技术的不足问题,提出了一种雕复Access数据库文件的方法,通过查找和提取空闲簇/块并采用有向无环图论技术雕复/重组数据页,从而实现基于图论的雕复Access数据库文件的目的,本发明可能涉及的术语如下:
簇/块:常规文件系统中分区的最小管理单元,由连续的固定个数的扇区组成;
数据库的数据文件:本文中特指记录数据库表结构及表实际数据的相关文件的总称;
数据页:数据库的数据文件的最小管理单元,由16个物理连续的扇区组成,具有特定的结构。
数据页块:由物理连续的一个或多个数据页组成的区段。
区:在同一种数据文件中由固定个数的数据页组成的结构,是数据库引擎存储分配的最小单元;
段:由一个或多个连续的区组成,具有独立存储结构的数据页对象的数据,根据需要存储的数据特性和用途不同常常分为索引段、数据段、回滚段、回退段、临时段。
图论:〔Graph Theory〕以图为研究对象,图论中的图是由若干给定的点及连接两点的线所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系,用点代表事物,用连接两点的线表示相应两个事物间具有这种关系。
本发明包括以下步骤:
S1:提取所述Access数据库中数据源的空闲簇/块并计入集合A1:解析待恢复的数据源所包含的文件系统结构,获取其分区信息,分区信息主要包括分区的数量、分区大小、分区的起始位置、分区的簇/块大小、分区的总簇/块数、分区的位图表等参数,根据分区的位图表信息来标记数据源中空闲簇/块,同时记录其空闲簇/块对应的LBA值;若未包含正常文件系统,则默认将待恢复的数据源的全部内容作为空闲簇处理,且簇的大小默认为8扇区,记录所有簇对应的LBA值,并将上述获取的空闲簇/块计入集合A1;
S2:检测所述集合A1的元素中所述Access数据库的数据页块并计入集合A2;
S3:采用图论的方法对所述集合A2的元素进行重组;
S4:根据所述集合A2的元素恢复所述Access数据库文件。
优选地,所述步骤S2的具体步骤如下:
S21:从所述集合A1的元素中读取数据页P;
S22:检查当前数据页P是否符合Access数据库的数据页结构;
S23:判断步骤S22的检查是否通过,如果是,执行步骤S24,否则执行步骤S25;
S24:将当前数据页P计入所述集合A2;
S25:判断所述集合A1的所有元素是否读取完毕,如果是,则执行步骤S27,否则执行步骤S26;
S26:设置读数据的偏移量,执行步骤S21;
S27:将所述集合A2的元素组合为所述Access数据库的数据页块。
优选地,步骤S3的具体步骤如下:
S31:通过所述集合A2构建有向无环图G;
S32:计算所述有向无环图G的边的权重;
S33:通过启发式搜索和贪婪算法在所述有向无环图G中寻找多源最优路径并计入集合A3;
S34:通过所述集合A3的元素重组所述集合A2的元素。
优选地,所述多源最优路径是指所述有向无环图G中权重之和最大且不相交的路径。
本发明的有益效果是:能够快速检测Access数据库的数据页并高效雕复/重组Access数据库的数据页块。
附图说明
图1为本发明所提供的方法的总流程图;
图2为本发明中检测数据页块的具体流程图;
图3为本发明中雕复/重组数据页块的具体流程图。
具体实施方式
图1示出了本发明所提供的方法的总流程图。如图1所示,本发明包括以下步骤:
S1:解析待恢复的数据源所包含的文件系统结构,获取其分区信息,分区信息主要包括分区的数量、分区大小、分区的起始位置、分区的簇/块大小、分区的总簇/块数、分区的位图表等参数,根据分区的位图表信息来标记数据源中空闲簇/块,同时记录其空闲簇/块对应的LBA值;若未包含正常文件系统,则默认将待恢复的数据源的全部内容作为空闲簇处理,且簇的大小默认为8扇区,记录所有簇对应的LBA值,并将上述获取的空闲簇/块计入集合A1。
S2:遍历集合A1的元素a1 i,检测a1 i中的Access数据页块并计入集合A2。图2示出了本发明中检测数据页块的具体流程图,如图2所示,步骤S2的具体步骤如下:
S21:从集合A1的元素中读取连续的16扇区作为数据页P;
S22:Access数据库的数据页具有特定结构的页头,根据页头中每个成员的取值范围,检查数据页P的正确性;
S23:若S22检查通过,则执行S24,否则执行S25;
S24:将数据页P计入集合A2;
S25:若集合A1的所有元素读取数据完毕,则执行S27,否则执行S26;
S26:若S22检查通过,则读数据偏移移动8扇区,否则移动1扇区,执行S21;
S27:将集合A2的物理和逻辑连续的数据页组合为数据页块,物理连续的条件为:数据页在数据源中的位置相差16扇区,逻辑连续的条件为:数据页I D相差1。
S3:通过集合A2构建有向无环图G,在有向无环图G中寻找多源最优路径(即,有向无环图G中权重之和最大且不相交的路径,下同)并计入集合A3,通过集合A3的元素a3i对集合A2的元素进行重组。
图3示出了本发明中雕复/重组数据页块的具体流程图。如图3所示,步骤S3的具体步骤如下:
S31:以集合A2的元素为顶点,以元素之间关系为边,构建有向无环图G;
S32:根据集合A2的元素之间的物理间距、错误关联页数、页总数等因子,计算边的权重。权重越大,元素之间关联越强,寻找路径时的优先级越高。
S33:通过启发式搜索和贪婪算法在有向无环图G中寻找多源最大权重无相交路径并计入集合A3,步骤S33的具体步骤如下:
S331:在队列Q1中查找第一个未标记的节点N1;
S332:在队列Q1中标记N1,将N1加入队列Q2尾部;
S333:若队列Q2的尾部节点N2为有向无环图G边界,则将Q2加入集合A3,执行步骤S336,否则执行步骤S334;
S334:在队列Q1中查找满足条件的节点N3,条件为:N3未标记;N3与队列Q2的尾部节点N2在有向无环图G中存在边E;边E的权重在N2的所有未标记边中最大;
S335:若步骤S334找到节点N3,在队列Q1中标记N3,在有向无环图G中标记边E,将N3加入队列Q2尾部,执行步骤S333,否则将Q2加入集合A3,执行步骤S336;
S336:若队列Q1中存在未标记节点,则执行步骤S331,否则结束步骤S33。
S34遍历集合A3的元素a3i,将集合A2的元素按a3i记录的顺序进行重组,其中,下标i表示集合A2的元素的顺序。本实施例中,集合A2为{a21,a22,a23,a24,a25},集合A3为{a31={1,3,5},a32={2,4}}。
S4:遍历集合A2的元素a2i,将a2i中的数据页块按顺序写入恢复文件,完成雕复。
遍历集合A3,根据A3中每个元素a3i中记录的块编号,从A2中取出对应页块,写入恢复文件中,例如,本实施例中,
a31={1,3,5},根据a31中的页块编号1,3,5,按顺序从A2中取出a21,a23,a25,写入恢复文件F1,换言之,a21,a23,a25属于文件F1;
a32={2,4},根据a32中的页块编号2,4,按顺序从A2中取出a22,a24,写入恢复文件F2,换言之,a22,a24属于文件F2。
通过本发明提供的方法,解决了现有技术中尚无一种雕复Access数据库文件的方法的技术问题。
应当理解的是,本发明不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (2)

1.一种雕复Access数据库文件的方法,其特征在于包括以下步骤:
S1:提取所述Access数据库中数据源的空闲簇/块并计入集合A1:解析待恢复的数据源所包含的文件系统结构,获取其分区信息,分区信息主要包括分区的数量、分区大小、分区的起始位置、分区的簇/块大小、分区的总簇/块数、分区的位图表等参数,根据分区的位图表信息来标记数据源中空闲簇/块,同时记录其空闲簇/块对应的LBA值;若未包含正常文件系统,则默认将待恢复的数据源的全部内容作为空闲簇处理,且簇的大小默认为8扇区,记录所有簇对应的LBA值,并将上述获取的空闲簇/块计入集合A1;
S2:检测所述集合A1的元素中所述Access数据库的数据页块并计入集合A2,步骤S2的具体步骤如下:
S21:从所述集合A1的元素中读取数据页P;
S22:检查当前数据页P是否符合Access数据库的数据页结构;
S23:判断步骤S22的检查是否通过,如果是,执行步骤S24,否则执行步骤S25;
S24:将当前数据页P计入所述集合A2;
S25:判断所述集合A1的所有元素是否读取完毕,如果是,则执行步骤S27,否则执行步骤S26;
S26:设置读数据的偏移量,执行步骤S21;
S27:将所述集合A2的元素组合为所述Access数据库的数据页块;
S3:采用图论的方法对所述集合A2的元素进行重组,步骤S3的具体步骤如下:
S31:通过所述集合A2构建有向无环图G;
S32:计算所述有向无环图G的边的权重;
S33:通过启发式搜索和贪婪算法在所述有向无环图G中寻找多源最优路径并计入集合A3;
S34:通过所述集合A3的元素重组所述集合A2的元素;
S4:根据所述集合A2的元素恢复所述Access数据库文件。
2.根据权利要求1所述的一种雕复Access数据库文件的方法,其特征在于,所述多源最优路径是指所述有向无环图G中权重之和最大且不相交的路径。
CN201811592824.7A 2018-12-25 2018-12-25 一种雕复Access数据库文件的方法 Active CN109697197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811592824.7A CN109697197B (zh) 2018-12-25 2018-12-25 一种雕复Access数据库文件的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811592824.7A CN109697197B (zh) 2018-12-25 2018-12-25 一种雕复Access数据库文件的方法

Publications (2)

Publication Number Publication Date
CN109697197A CN109697197A (zh) 2019-04-30
CN109697197B true CN109697197B (zh) 2023-05-02

Family

ID=66231994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811592824.7A Active CN109697197B (zh) 2018-12-25 2018-12-25 一种雕复Access数据库文件的方法

Country Status (1)

Country Link
CN (1) CN109697197B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364103B (zh) * 2020-12-08 2022-03-01 四川长虹电器股份有限公司 基于关系型数据库主从异步复制架构的数据同步方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053880A (zh) * 2011-01-07 2011-05-11 杭州电子科技大学 一种基于内容的Rar文件雕复方法
CN105574534A (zh) * 2015-12-17 2016-05-11 西安电子科技大学 基于稀疏子空间聚类和低秩表示的显著性目标检测方法
CN106407038A (zh) * 2015-07-27 2017-02-15 四川效率源信息安全技术有限责任公司 一种碎片文件的数据恢复方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477486B (zh) * 2009-01-22 2010-08-04 中国人民解放军国防科学技术大学 一种基于扇区重组的文件备份恢复方法
CN102467728A (zh) * 2010-11-09 2012-05-23 上海悦易网络信息技术有限公司 多方交易系统及交易方法
US20130246363A1 (en) * 2012-03-15 2013-09-19 Ellen L. Sorenson Idle point auditing for databases
CN103617277A (zh) * 2013-12-09 2014-03-05 山东瀚高基础软件股份有限公司 一种还原误删除的数据表内容的方法
CN104794024A (zh) * 2015-04-15 2015-07-22 四川神琥科技有限公司 一种数据恢复方法
CN105677797B (zh) * 2015-12-31 2019-07-12 四川秘无痕科技有限责任公司 一种基于jpeg图片文件中数据相似度的碎片重组方法
CN105677914A (zh) * 2016-02-29 2016-06-15 厦门市美亚柏科信息股份有限公司 一种mdb文件表格的恢复方法及其系统
CN108563535B (zh) * 2018-04-27 2021-12-24 四川巧夺天工信息安全智能设备有限公司 一种对MySQL数据库全库的恢复方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053880A (zh) * 2011-01-07 2011-05-11 杭州电子科技大学 一种基于内容的Rar文件雕复方法
CN106407038A (zh) * 2015-07-27 2017-02-15 四川效率源信息安全技术有限责任公司 一种碎片文件的数据恢复方法
CN105574534A (zh) * 2015-12-17 2016-05-11 西安电子科技大学 基于稀疏子空间聚类和低秩表示的显著性目标检测方法

Also Published As

Publication number Publication date
CN109697197A (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
US9043334B2 (en) Method and system for accessing files on a storage system
CN108319602B (zh) 数据库管理方法及数据库系统
US10417265B2 (en) High performance parallel indexing for forensics and electronic discovery
US8560500B2 (en) Method and system for removing rows from directory tables
US9063947B2 (en) Detecting duplicative hierarchical sets of files
US11176165B2 (en) Search and analytics for storage systems
KR20060050742A (ko) 합성 백업 및 복구에 대한 방법 및 시스템
JP2007012058A (ja) フラッシュ様媒体におけるトランザクションレコードを格納するファイルシステム
JP2007012056A (ja) データ保全の先送りされた認証を有するファイルシステム
JP2005267600A5 (zh)
CN101866358A (zh) 一种多维区间查询方法及系统
CN107665219B (zh) 一种日志管理方法及装置
WO2017166815A1 (zh) 一种用于分布式数据库系统的更新数据的方法及装置
CN107506466B (zh) 一种小文件存储方法及系统
CN109656929B (zh) 一种雕复关系型数据库文件的方法及装置
CN113672170A (zh) 一种冗余数据标记及去除方法
CN109697197B (zh) 一种雕复Access数据库文件的方法
CN113821630B (zh) 一种数据聚类的方法和装置
US20160275134A1 (en) Nosql database data validation
KR101688629B1 (ko) 메타데이터 및 데이터 클러스터를 이용하는 파일 시스템 복구 방법 및 장치
US20140250078A1 (en) Multiphase deduplication
Haraty et al. A matrix-based damage assessment and recovery algorithm
US10452496B2 (en) System and method for managing storage transaction requests
CN115454717A (zh) 数据库实时备份方法、装置、计算机设备和存储介质
CN109739689B (zh) 一种雕复SQL Server数据库文件的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant