CN103177112B - 一种备份文件浏览系统 - Google Patents

一种备份文件浏览系统 Download PDF

Info

Publication number
CN103177112B
CN103177112B CN201310112135.2A CN201310112135A CN103177112B CN 103177112 B CN103177112 B CN 103177112B CN 201310112135 A CN201310112135 A CN 201310112135A CN 103177112 B CN103177112 B CN 103177112B
Authority
CN
China
Prior art keywords
file
index
backup
module
browsing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310112135.2A
Other languages
English (en)
Other versions
CN103177112A (zh
Inventor
王旭
张道伟
吕万波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201310112135.2A priority Critical patent/CN103177112B/zh
Publication of CN103177112A publication Critical patent/CN103177112A/zh
Application granted granted Critical
Publication of CN103177112B publication Critical patent/CN103177112B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种备份文件浏览系统,核心是对备份文件列表建立索引,利用备份数据浏览系统对已备份数据进行浏览,以提高备份文件的浏览速度,备份数据浏览系统由四部份构成,分别为索引判定模块,文件列表提取模块,索引生成模块和索引查找模块。索引判定模块用于判定备份数据和当前的索引文件是否一致,如果一致,则直接进行索引查找,否则需要进行索引生成的操作。文件列表提取模块用于从备份数据中提取备份文件的路径。索引生成模块用于生成索引数据及索引文件。索引查找模块用于进行索引的查找。

Description

一种备份文件浏览系统
技术领域
本发明涉及计算机应用技术领域,具体地说是一种备份文件浏览系统。
背景技术
随着我国信息化建设的深入,数据量以指数级增涨,数据已成为企业的重要财富。数据丢失已成为影响企业发展的严重危险,因而,数据容灾已成为企业信息化建议中的重中之重。
数据容灾的本质即是数据备份。所谓的数据备份,即是将数据从当前存储介质移到其它存储介质,以保证在当前存储介质损坏时,可以从其它的存储介质上得到数据,以保证数据不会丢失。从数据备份的粒度及数据形式上,可以分为块级和文件级:块级是将整个分区/磁盘作为保护单位,将它们上面已经使用的数据块进行备份。块级备份不需要关心具体的备份文件形式,在它看来,所有的备份文件都是数据块;文件级备份是在文件系统之上,把若干个文件/文件夹作为保护对象。文件级备份需要关心具体的备份内容,并需要给用户提供一个视图来进行备份内容的浏览与选取。
块级备份与文件级备份在容灾备份领域都有着广泛的应用。块级备份主要应用在对RPO(恢复点目标)和RTO(恢复时间点目标)要求较高的灾备应用上;文件级备份则更为通用,可独立作为一种灾备的应用,也可作用一种块级备份的辅助措施应用于灾备领域。
在文件级备份中,需要对已备份的数据进行浏览,以便帮助用户决定需要恢复哪些数据。浏览模块应为用户提供备份文件的树形结构,应提供哪些文件在本次备份中进行了备份,哪些文件没有在本次备份中进行备份。在浏览的时候,当待浏览文件很多时(百万以上),通常的浏览方式就显得十分缓慢,需要为此设计一种索引结构以提高浏览速度。
发明内容
本发明的目的是提供一种备份文件浏览系统。
本发明的目的是按以下方式实现的,其核心是对备份文件列表建立索引,利用备份文件浏览系统对已备份文件进行浏览,以提高备份文件的浏览速度,备份文件浏览系统包括:索引生成模块,文件列表提取模块,索引查找模块和索引判定模块,其中:
索引生成模块,备份文件浏览系统通过文件列表提取模块获取到备份文件中的各文件路径及该文件是否在此次备份中,索引生成模块以此列表作为输入,构建出索引内存结构,再将索引内存结构写入索引文件中,即完成了索引文件的生成;文件列表提取模块用于从备份文件中提取备份文件的路径,索引生成模块用于生成索引数据及索引文件,索引查找模块用于进行索引的查找;
索引查找模块以文件路径作为输入,按照树形查找的方式,使用索引文件进行查找。如果索引文件中有相应的结点,则返回该结点下所有的子结点的名字,是否是文件夹及是否高亮显示;否则,返回空。
索引判定模块用于判定备份文件和当前的索引文件是否一致,如果一致,则直接进行索引查找,否则需要进行索引生成的操作;
文件浏览步骤如下:
在用户对已备份的数据进行浏览时,向备份文件浏览系统发送浏览请求,此浏览请求中包含用户需要浏览的目录,备份文件浏览系统需要将用户请求浏览目录下的子目录及其文件返回给用户;
备份文件浏览系统在收到浏览请求后,首先通过索引判定模块判定是否需要生成索引文件,索引判定模块判定备份文件和当前的索引文件是否一致,如果一致,则直接进行索引查找,否则需要重新通过索引生成模块进行索引生成的操作,
其具体判定方式是通过比较索引文件的修改日期是否大于备份文件的修改日期来判定索引文件的一致性;
如索引文件一致,则使用索引查找模块来查找请求的目录,如找到,返回此目录下的子目录和文件,否则返回空,如索引文件不一致,则进行索引文件生成的流程;备份文件浏览系统通过文件列表提取模块获取到备份文件中的各文件路径及该文件是否在此次备份中,索引生成模块以此列表作为输入,构建出所示的索引内存结构,再将索引内存结构写入索引文件中,即完成了索引文件的生成;
索引查找模块以文件路径作为输入,按照树形查找的方式,使用索引文件进行查找,如果索引文件中有相应的结点,则返回该结点下所有的子结点的名字,是否是文件夹及是否高亮显示;否则,返回空;
索引内存结构,是通过顺序的文件列表进行生成;
文件数据层次关系,按照文件夹,文件夹下文件的方式进行组织,将组织的索引数据存储在唯一的索引文件中。
备份文件浏览,按照根目录,子目录,目录中文件的方式自顶向下,逐级进行。备份文件浏览,在显示目录或文件时,提供一个显示方式的附加信息,以决定是实图标显示还是虚图标显示。
本发明的有益效果是:备份文件浏览系统由四部份构成,分别为索引判定模块,文件列表提取模块,索引生成模块和索引查找模块。索引判定模块用于判定备份文件和当前的索引文件是否一致,如果一致,则直接进行索引查找,否则需要进行索引生成的操作。文件列表提取模块用于从备份文件中提取备份文件的路径。索引生成模块用于生成索引数据及索引文件。索引查找模块用于进行索引的查找。本发明的核心是对备份文件列表建立索引,利用备份文件浏览系统对已备份文件进行浏览,以提高备份文件的浏览速度。
附图说明
图1是目录索引内存中的组织方式;
图2是目录索引文件中的组织方式;
图3是备份文件浏览系统结构图。
具体实施方式
下面参照附图3,详细描述本发明内容中四部份模块的功能及协作关系。
本发明涉及一种计算机应用领域中的灾备数据浏览方式,尤其涉及一种对备份文件索引结构。
本发明的备份文件浏览系统,包括索引判定模块,文件列表提取模块,索引生成模块及索引查找模块。其核心是对备份文件列表建立索引,以提高备份文件的浏览速度;
对所备份的文件数据按其层次关系建立索引,为备份文件浏览提供快速的文件定位方式;
所述的文件索引结构,是通过顺序的文件列表进行生成;
所述的文件数据层次关系,按照文件夹,文件夹下文件的方式进行组织,将组织的索引数据存储在唯一的索引文件中;
所述的备份文件浏览,按照根目录,子目录,目录中文件的方式自顶向下,逐级进行;
所述的备份文件浏览,在显示目录或文件时,提供一个显示方式的附加信息,以决定是实图标显示还是虚图标显示。
备份文件浏览系统由四部份构成,分别为索引判定模块,文件列表提取模块,索引生成模块和索引查找模块。索引判定模块用于判定备份文件和当前的索引文件是否一致,如果一致,则直接进行索引查找,否则需要进行索引生成的操作。文件列表提取模块用于从备份文件中提取备份文件的路径。索引生成模块用于生成索引数据及索引文件。索引查找模块用于进行索引的查找。
在用户对已备份的数据进行浏览时,向备份文件浏览系统发送浏览请求,此浏览请求中包含用户需要浏览的目录,备份文件浏览系统需要将用户请求浏览目录下的子目录及其文件返回给用户。
备份文件浏览系统在收到浏览请求后,首先通过索引判定模块判定是否需要生成索引文件。其具体判定方式是通过比较索引文件的修改日期是否大于备份文件的修改日期来判定索引文件的一致性。
如索引文件一致,则使用索引查找模块来查找请求的目录,如找到,返回此目录下的子目录和文件,否则返回空。如索引文件不一致,则进行索引文件生成的流程。备份文件浏览系统通过文件列表提取模块获取到备份文件中的各文件路径及该文件是否在此次备份中。索引生成模块以此列表作为输入,构建出如图1所示的索引内存结构,再将索引内存结构以图2的形式写入索引文件中,即完成了索引文件的生成。
索引查找模块以文件路径作为输入,按照树形查找的方式,使用索引文件进行查找。如果索引文件中有相应的结点,则返回该结点下所有的子结点的名字,是否是文件夹及是否高亮显示;否则,返回空。
实施例
在用户进行备份文件浏览时,需要为用户提供备份文件的树形结构,同时提供一个标识,以显示哪些文件在本此备份中进行了备份,哪些文件没有在本次备份中进行备份。同时,用户备份文件浏览不应受到备份文件规模的影响。
为了满足备份文件浏览的需要,并且将备份文件规模的增涨对备份文件浏览的影响降到最低,设计了一种备份文件的索引结构。
本发明采用备份文件浏览系统处理备份文件的浏览。备份文件浏览系统包括文件列表提取模块,索引生成模块,索引查找模块和索引判定模块。
在本发明中的索引结构按照树形的方式进行组织,根据备份文件的不同,可以是单一的树,也可以是多棵树构成的森林。在树形结构中,每个结点由其子结点指针,兄弟结点指针,本结点的名字,本结点是否高亮显示几个元素构成。
其具体组织方式如图1所示。
如图1所示,结点node1为根结点,它有两个子目录,分别为node2和node3;node2有两个子目录,为node4和node5;node3有一个子目录,为node6。
通过这种组织方式,可以把整个备份文件以树形的方式组织起来。
对于内存中的索引组织,需要以一定的格式把它存储在文件中,以便于保存和查找,更能节省内存的使用。其具体组织方式如图2所示。
如图2所示,在内存中按树形组织的6个节点在文件中以其广度优先的顺序逐层存储在文件中。每个节点都包括兄弟节点偏移,子节点偏移,是否是目录,是否高亮显示以及名字这几个元素。通过采用广度优先的方式进行,将对文件的随机读写转变为顺序读写,提高了索引生成与索引查找的速度。
此后,后续的文件浏览就变成了使用该索引文件进行文件名查找的操作。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (6)

1.一种备份文件浏览系统,其特征在于其核心是对备份文件列表建立索引,利用备份文件浏览系统对已备份文件进行浏览,以提高备份文件的浏览速度,备份文件浏览系统包括:索引生成模块,文件列表提取模块,索引查找模块和索引判定模块,其中:
索引生成模块,备份文件浏览系统通过文件列表提取模块获取到备份文件中的各文件路径及该文件是否在此次备份中,索引生成模块以此列表作为输入,构建出索引内存结构,再将索引内存结构写入索引文件中,即完成了索引文件的生成;文件列表提取模块用于从备份文件中提取备份文件的路径,索引生成模块用于生成索引数据及索引文件,索引查找模块用于进行索引的查找;
索引查找模块以文件路径作为输入,按照树形查找的方式,使用索引文件进行查找,如果索引文件中有相应的结点,则返回该结点下所有的子结点的名字,是否是文件夹及是否高亮显示;否则,返回空;
索引判定模块用于判定备份文件和当前的索引文件是否一致,如果一致,则直接进行索引查找,否则需要进行索引生成的操作;
文件浏览步骤如下:
在用户对已备份的数据进行浏览时,向备份文件浏览系统发送浏览请求,此浏览请求中包含用户需要浏览的目录,备份文件浏览系统需要将用户请求浏览目录下的子目录及其文件返回给用户;
备份文件浏览系统在收到浏览请求后,首先通过索引判定模块判定是否需要生成索引文件,索引判定模块判定备份文件和当前的索引文件是否一致,如果一致,则直接进行索引查找,否则需要重新通过索引生成模块进行索引生成的操作,其具体判定方式是通过比较索引文件的修改日期是否大于备份文件的修改日期来判定索引文件的一致性;
如索引文件一致,则使用索引查找模块来查找请求的目录,如找到,返回此目录下的子目录和文件,否则返回空,如索引文件不一致,则进行索引文件生成的流程;备份文件浏览系统通过文件列表提取模块获取到备份文件中的各文件路径及该文件是否在此次备份中,索引生成模块以此列表作为输入,构建出所示的索引内存结构,再将索引内存结构写入索引文件中,即完成了索引文件的生成;
索引查找模块以文件路径作为输入,按照树形查找的方式,使用索引文件进行查找,如果索引文件中有相应的结点,则返回该结点下所有的子结点的名字,是否是文件夹及是否高亮显示;否则,返回空。
2.根据权利要求1所述的浏览系统,其特征在于,对所备份的文件数据按其层次关系建立索引,为备份文件浏览提供快速的文件定位方式。
3.根据权利要求1所述的浏览系统,其特征在于索引内存结构,是通过顺序的文件列表进行生成。
4.根据权利要求1所述的浏览系统,其特征在于文件数据层次关系,按照文件夹,文件夹下文件的方式进行组织,将组织的索引数据存储在唯一的索引文件中。
5.根据权利要求1所述的浏览系统,其特征在于备份文件浏览,按照根目录,子目录,目录中文件的方式自顶向下,逐级进行。
6.根据权利要求3所述的浏览系统,其特征在于备份文件浏览,在显示目录或文件时,提供一个显示方式的附加信息,以决定是实图标显示还是虚图标显示。
CN201310112135.2A 2013-04-02 2013-04-02 一种备份文件浏览系统 Active CN103177112B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310112135.2A CN103177112B (zh) 2013-04-02 2013-04-02 一种备份文件浏览系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310112135.2A CN103177112B (zh) 2013-04-02 2013-04-02 一种备份文件浏览系统

Publications (2)

Publication Number Publication Date
CN103177112A CN103177112A (zh) 2013-06-26
CN103177112B true CN103177112B (zh) 2017-06-30

Family

ID=48636973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310112135.2A Active CN103177112B (zh) 2013-04-02 2013-04-02 一种备份文件浏览系统

Country Status (1)

Country Link
CN (1) CN103177112B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701194A (zh) * 2016-01-08 2016-06-22 四川秘无痕信息安全技术有限责任公司 一种灾难数据文件目录结构进行可视化展示的方法
CN108762979B (zh) * 2018-04-17 2021-08-10 厦门市美亚柏科信息股份有限公司 一种基于匹配树的终端信息备份方法及备份设备
CN112925671A (zh) * 2019-12-06 2021-06-08 伊姆西Ip控股有限责任公司 用于管理应用系统的方法、设备和计算机程序产品
CN111767263B (zh) * 2020-07-04 2022-08-30 武汉空心科技有限公司 一种工作平台文件存储方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070043705A1 (en) * 2005-08-18 2007-02-22 Emc Corporation Searchable backups
US9026512B2 (en) * 2005-08-18 2015-05-05 Emc Corporation Data object search and retrieval
EP1816568A4 (en) * 2005-08-22 2012-10-10 Sony Corp RECORDING DEVICE, RECORDING METHOD, PROGRAM AND COMPUTER READABLE RECORDING MEDIUM
CN101414277B (zh) * 2008-11-06 2010-06-09 清华大学 一种基于虚拟机的按需增量恢复容灾系统及方法
CN101576927B (zh) * 2009-06-18 2012-08-15 浙江大学 移动终端基于索引的信息检索方法
CN101599080B (zh) * 2009-07-22 2011-06-29 中国科学院计算技术研究所 一种备份数据的组织系统和方法
CN101697154A (zh) * 2009-10-28 2010-04-21 卓望数码技术(深圳)有限公司 一种创建索引的方法和创建索引的装置

Also Published As

Publication number Publication date
CN103177112A (zh) 2013-06-26

Similar Documents

Publication Publication Date Title
US10740319B2 (en) Graph-based data models for partitioned data
CN103282899B (zh) 文件系统中数据的存储方法、访问方法及装置
US10262004B2 (en) Native snapshots in distributed file systems
US8346722B2 (en) Replica placement strategy for distributed data persistence
CN105787093B (zh) 一种基于LSM-Tree结构的日志文件系统的构建方法
US9697258B2 (en) Supporting enhanced content searches in an online content-management system
US20110072062A1 (en) Method and System for Resolving Conflicts Between Revisions to a Distributed Virtual File System
WO2018201583A1 (zh) 文件管理方法、系统、电子装置及介质
CN106021031B (zh) 一种btrfs文件系统的删除数据恢复方法和装置
CN101980203A (zh) 一种用于高清媒体的嵌入式文件系统
CN105068856A (zh) 基于镜像快照的虚拟机备份系统及备份方法
CN102915278A (zh) 重复数据删除方法
CN106874481B (zh) 一种分布式文件系统元数据信息读取方法及系统
CN103177112B (zh) 一种备份文件浏览系统
US9720607B2 (en) Append-only storage system supporting open and closed extents
WO2014110940A1 (en) A method, apparatus and system for storing, reading the directory index
US20230222116A1 (en) Custom metadata tag inheritance based on a filesystem directory tree or object storage bucket
US20210191903A1 (en) Generating hash trees for database schemas
US20150169623A1 (en) Distributed File System, File Access Method and Client Device
CN107944041A (zh) 一种hdfs的存储结构优化方法
CA2710754C (en) Systems and methods for platform-independent data file transfers
CN103473337A (zh) 一种分布式存储系统中处理面向海量目录和文件的方法
CN103279489A (zh) 一种元数据的存储方法、装置
CN101866356B (zh) 一种磁盘目录信息的结构化管理方法
US11030153B2 (en) System and method for storing data with rules on containers for collections of data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant