CN103793666A - 一种数据文件的保护方法及系统 - Google Patents

一种数据文件的保护方法及系统 Download PDF

Info

Publication number
CN103793666A
CN103793666A CN201410037042.2A CN201410037042A CN103793666A CN 103793666 A CN103793666 A CN 103793666A CN 201410037042 A CN201410037042 A CN 201410037042A CN 103793666 A CN103793666 A CN 103793666A
Authority
CN
China
Prior art keywords
storage medium
storage
backup
networking
data file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410037042.2A
Other languages
English (en)
Inventor
邓吉
刘恒昌
李珅
郑维
谢之恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sino Cloud Data Storage Technology (beijing) Co Ltd
Original Assignee
Sino Cloud Data Storage Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sino Cloud Data Storage Technology (beijing) Co Ltd filed Critical Sino Cloud Data Storage Technology (beijing) Co Ltd
Priority to CN201410037042.2A priority Critical patent/CN103793666A/zh
Publication of CN103793666A publication Critical patent/CN103793666A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6209Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2107File encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种数据文件的保护方法,该保护方法包括:分割数据文件以形成多个数据块;选择存储网络中的多个存储介质,该多个存储介质中至少部分是光盘;将所述多个数据块分别写入所述多个存储介质中;生成所述数据文件的索引信息,并将该索引信息写入数据库中,其中,所述索引信息用于记录所述多个数据块的存储路径。相应地,本发明还提供了一种数据文件的保护系统。本发明一方面将数据文件以数据块的形式分散地写入存储网络的光盘(及硬盘)中以实现对数据文件的加密,进而达到对数据文件进行有效保护的目的。

Description

一种数据文件的保护方法及系统
技术领域
本发明涉及光盘存储技术领域,尤其涉及一种数据文件的保护方法及系统。
背景技术
据互联网数据中心(IDC,Internet Data Center)统计,2010年全球数据量不到1ZB,到2020年将达到35ZB以上。其中不经常使用的归档性数据占到总数据量的80%左右,即28ZB左右。如何对这些数据进行低成本、安全以及绿色地长期保存成为了数据存储业界的难题之一。在众多数据存储介质中,光盘介质由于是通过物理方法实现数据的存储,具有不会受到电磁辐射的干扰以及对温度和湿度不敏感的优势,因此被公认是归档数据保存的最终介质形式。
目前,利用光盘对一个数据文件进行存储时,常见的现有技术是将该数据文件整体记录在一张光盘内,该现有技术存在如下缺陷:一旦用于存储数据文件的光盘发生不慎遗失的情况,则该光盘内的数据文件将面临被他人获取的风险。也就是说,上述现有方式虽然实现了数据文件的存储功能,但是并不能对数据文件起到良好的保护作用。特别地,对于安全性要求较高的数据文件,采用现有方式存储该数据文件后,若出现光盘丢失而导致数据文件泄露的情况,将有可能给数据文件的所有者造成不堪设想的损失。因此,希望针对上述缺陷提出一种数据文件的保护方法及系统。
发明内容
为了克服现有技术中的上述缺陷,本发明提供了一种数据文件的保护方法,该保护方法包括:
分割数据文件以形成多个数据块;
选择存储网络中的多个存储介质,该多个存储介质中至少部分是光盘;
将所述多个数据块分别写入所述多个存储介质中;
生成所述数据文件的索引信息,并将该索引信息写入数据库中,其中,所述索引信息用于记录所述多个数据块的存储路径。
根据本发明的一个方面,该保护方法中选择存储网络中的多个存储介质包括:识别出所述存储网络中包括的所有可用存储介质;随机选择所述所有可用存储介质的一个子集,该子集内包括所述多个存储介质。
根据本发明的另一个方面,该保护方法中选择存储网络中的多个存储介质包括:识别出所述存储网络中包括的所有可用存储介质;判断所述所有可用存储介质的存储负载状况,并根据存储负载状况选择所述所有可用存储介质的一个子集,该子集内包括所述多个存储介质。
根据本发明的又一个方面,该保护方法中所述多个存储介质中除光盘外还包括硬盘。
根据本发明的又一个方面,该保护方法还包括:创建所述多个数据块的副本,其中,每一所述数据块具有至少一个副本;选择所述存储网络中的多个备份存储介质,该多个备份存储介质中至少部分是光盘;将所述副本分别写入所述多个备份存储介质中;生成所述数据文件的备份索引信息,并将该备份索引信息写入所述数据库中,其中,所述备份索引信息用于记录所述副本的存储路径。
根据本发明的又一个方面,该保护方法中选择所述存储网络中的多个备份存储介质包括:识别出所述存储网络中包括的所有可用备份存储介质;随机选择所述所有可用备份存储介质的一个子集,该子集内包括所述多个备份存储介质。
根据本发明的又一个方面,该保护方法中选择所述存储网络中的多个备份存储介质包括:识别出所述存储网络中包括的所有可用备份存储介质;判断所述所有可用备份存储介质的存储负载状况,并根据所述存储负载状况选择所述所有可用备份存储介质的一个子集,该子集内包括所述多个备份存储介质。
根据本发明的又一个方面,该保护方法中所述多个备份存储介质中除光盘外还包括硬盘。
根据本发明的又一个方面,该保护方法中所述硬盘是机械硬盘、固态硬盘或混合硬盘。
根据本发明的又一个方面,该保护方法中所述存储网络包括至少一个光盘库。
本发明还提供了一种数据文件的保护系统,该保护系统包括:
存储网络,该存储网络用于提供存储介质;
分割模块,用于分割数据文件以形成多个数据块;
选择模块,用于选择所述存储网络中的多个存储介质,该多个存储介质中至少部分是光盘;
写入模块,用于将所述多个数据块分别写入所述多个存储介质中;
索引模块,用于生成所述数据文件的索引信息,并将该索引信息写入数据库中,其中,所述索引信息用于记录所述多个数据块的存储路径;
所述数据库,用于存储所述索引信息。
根据本发明的一个方面,该保护系统中所述选择模块包括:第一识别单元,用于识别出所述存储网络中包括的所有可用存储介质;第一选择单元,用于随机选择所述所有可用存储介质的一个子集,该子集内包括所述多个存储介质。
根据本发明的另一个方面,该保护系统中所述选择模块包括:第二识别单元,用于识别出所述存储网络中包括的所有可用存储介质;第二选择单元,用于判断所述所有可用存储介质的存储负载状况,并根据所述存储负载状况选择所述所有可用存储介质的一个子集,该子集内包括所述多个存储介质。
根据本发明的又一个方面,该保护系统中所述多个存储介质中除光盘外还包括硬盘。
根据本发明的又一个方面,该保护系统还包括:备份创建模块,用于创建所述多个数据块的副本,其中,每一所述数据块具有至少一个副本;备份选择模块,用于选择所述存储网络中的多个备份存储介质,该多个备份存储介质中至少部分是光盘;备份写入模块,用于将所述副本分别写入所述多个备份存储介质中;备份索引模块,用于生成所述数据文件的备份索引信息,并将该备份索引信息写入所述数据库中,其中,所述备份索引信息用于记录所述副本的存储路径。
根据本发明的又一个方面,该保护系统中所述备份选择模块包括:第三识别单元,用于识别出所述存储网络中包括的所有可用备份存储介质;第三选择单元,用于随机选择所述所有可用备份存储介质的一个子集,该子集内包括所述多个备份存储介质。
根据本发明的又一个方面,该保护系统中所述备份选择模块包括:第四识别单元,用于识别出所述存储网络中包括的所有可用备份存储介质;第四选择单元,用于判断所述所有可用备份存储介质的存储负载状况,并根据所述存储负载状况选择所述所有可用备份存储介质的一个子集,该子集内包括所述多个备份存储介质。
根据本发明的又一个方面,该保护系统中所述多个备份存储介质中除光盘外还包括硬盘。
根据本发明的又一个方面,该保护系统中所述硬盘是机械硬盘、固态硬盘或混合硬盘。
根据本发明的又一个方面,该保护系统中所述存储网络包括至少一个光盘库。
本发明提供的数据文件的保护方法及系统将数据文件本发明提供的数据文件的保护方法及系统通过将数据文件以数据块的形式分散地存储至存储网络包括的存储介质中以实现对数据文件的加密,使得非数据文件的所有者即使获得部分存储介质也无法从中读取出完整的数据文件。此外,本发明还采用光盘作为数据文件的主要存储介质,充分地利用了光盘所具有的不会受到电磁辐射干扰以及对温度和湿度不敏感的优势,使得数据文件不会由于受到外界环境的影响而损坏丢失,从而进一步实现了对数据文件的保护。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是根据本发明的数据文件的保护方法的一个具体实施方式的流程图;
图2是根据本发明的数据块副本存储的一个具体实施方式的流程图;
图3是根据本发明的数据文件的保护系统的一个具体实施方式的结构示意图;
图4是根据本发明的数据文件的保护系统的另一个具体实施方式的结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
为了更好地理解和阐释本发明,下面将结合附图对本发明作进一步的详细描述。
请参考图1,图1是根据本发明的数据文件的保护方法的一个具体实施方式的流程图。如图所示,该保护方法包括:
在步骤S101中,分割数据文件以形成多个数据块;
在步骤S102中,选择存储网络中的多个存储介质,该多个存储介质中至少部分是光盘;
在步骤S103中,将所述多个数据块分别写入所述多个存储介质中;
在步骤S104中,生成所述数据文件的索引信息,并将该索引信息写入数据库中,其中,所述索引信息用于记录所述多个数据块的存储路径。
具体地,在步骤S101中,存储网络是指由通过互联网或局域网连接的多个存储设备所构成的用于提供存储空间的架构,其中,存储设备内设置存储介质,该存储介质利用电、磁和/或光学的特性对信息进行保存。由于光盘具有不会受到电磁辐射干扰以及对温度和湿度不敏感的优势,因此,在本发明所涉及的存储网络中部分或全部存储介质采用光盘。下文中,将以存储介质包括光盘和硬盘为例对本发明进行说明。本领域的技术人员可以理解的是,存储网络除了提供光盘和硬盘以外,还可以提供现有的其他类型的存储介质,为了简明起见,在此不再一一列举。
在将数据文件写入存储网络进行保存之前,首先需要将数据文件进行分割以形成多个数据块。在本实施例中,将数据文件分割成为大小相等的数据块,其中,数据块的大小等于预设值,例如512K、1M或5M等。在其他实施例中,也可以根据实际应用的需要将数据文件分割成为大小不等的数据块。
在步骤S102中,从存储网络中选择多个存储介质用于该多个数据块的存储,其中,在该多个存储介质中至少部分是光盘。一种情况是该多个存储介质全部是光盘。另一种可能是该多个存储介质除了光盘之外还包括硬盘。进一步地,所述硬盘可以是机械硬盘、固态硬盘或混合硬盘。在本实施例中,所述存储网络中包括至少一个光盘库,该至少一个光盘库用于提供光盘。
在进一步对如何选择存储网络中的多个存储介质进行说明之前,还需要对存储介质与存储设备之间的关系进行进一步说明,一个存储设备可能仅包括一个存储介质(例如存储设备内只设置有一块硬盘作为存储介质),也可能包括多个存储介质(例如光盘库作为存储设备包括上百张甚至上千张作为存储介质的光盘)。因此,与该多个存储介质相对应的存储设备的数目也许等于1(该多个存储介质均位于同一存储设备内),也许小于存储介质的数目(至少两个存储介质位于同一存储设备内),也许等于存储介质的数目(任意两个存储介质都不在同一存储设备内)。下面,对如何选择存储网络中的多个存储介质的过程进行具体描述。
在一个优选实施例中,选择存储网络中的多个存储介质的步骤包括:首先,识别出所述存储网络中包括的所有可用存储介质。在本实施例中,通过获取存储网络中包括的存储介质的存储状态信息来识别所有可用存储介质,其中,所述存储状态信息包括但不限于存储介质的闲忙状态以及存储介质内可用空间的大小。然后,随机选择所述所有可用存储介质的一个子集,该子集内包括所述多个存储介质。优选地,所述子集内包括的存储介质的数目等于所述数据块的数目,即所述多个数据块被存储至不同的存储介质内。更优选地,所述存储介质分布在不同的存储设备中,即所述数据块被存储至不同的存储设备内。
在另一个优选实施例中,选择存储网络中的多个存储介质的步骤包括:首先,识别出所述存储网络中包括的所有可用存储介质。在本实施例中,同样可以通过上述获取存储网络中包括的存储介质的存储状态信息的方法来识别所有可用存储介质。然后,判断所述所有可用存储介质的存储负载状况,并根据存储负载状况选择所述所有可用存储介质的一个子集,该子集内包括所述多个存储介质。同样地,所述子集内包括的存储介质的数目优选等于所述数据块的数目。更优选地,所述存储介质分布在不同的存储设备中。与上述随机选择可用存储介质的一个子集的方式相比,本实施例中的通过存储负载状况选择可用存储介质的一个子集的方式可以更好地使存储网络运行在一个负载均衡的状态下。
在步骤S103中,将分割数据文件所形成的多个数据块写入所述多个存储介质中。针对于多个数据块的写入方式,一种方式是等待所有存储介质均进入写入准备状态后同步并行地将该多个数据块写入多个存储介质中,另一种方式是一旦检测到任一存储介质进入写入准备状态后即写入向该存储介质写入与其对应的数据块。本领域的技术人员可以理解的是,本发明并不限于上述两种写入方式,凡是可以将该多个数据块相应写入到多个存储介质中的方式都包括在本发明所保护的范围内。
在步骤S104中,将多个数据块写入存储网络的多个存储介质中之后,生成数据文件的索引信息,其中,该索引信息用于记录所述多个数据块的存储路径;数据文件的索引信息生成之后,将该索引信息写入数据库中进行保存。优选地,数据库所在的存储设备独立于用于存储数据文件的存储介质所在的存储设备,即索引信息与数据文件分开存储,如此一来,即使非数据文件的所有者获得了用于存储数据文件的所有存储介质,也会因为缺少索引信息而无法对存储介质内的数据块进行组合以恢复数据文件。数据文件存储至存储网络中之后,当需要读取数据文件时,首先从数据库中获取数据文件的索引信息,然后根据该索引信息从存储网络中包括的存储介质中读取相应的数据块并组合形成数据文件。
需要说明的是,步骤S102中提及的存储介质的存储状态信息可以存储在上述数据库中,并根据存储网络中包括的存储介质的存储状态的变化相应进行更新。如此一来,在选择存储网络中的多个存储介质时只需要直接从数据库中读取该存储状态信息,而无需逐一对存储网络中包括的存储介质进行检测以获取其存储状态信息,从而提高了数据块写入的效率。本领域的技术人员可以理解的是,所述存储状态信息也可以与索引信息分别存储在不同的数据库中。
通过上述步骤S101至步骤S104可知,与现有技术中将数据文件完整地存储至一个存储介质中(例如一个硬盘内或一张光盘内)相比,本发明是将数据文件以数据块的形式分散地存储至存储网络包括的存储介质中,如此一来,起到了对数据文件进行加密的效果,即,非数据文件的所有者获得部分存储介质也无法从中读取出完整的数据文件。举例说明,存储网络中某一存储设备内设置一块硬盘,非法用户进入该硬盘读取数据,在这种情况下,由于该硬盘内存储的仅仅是部分数据块而非完整的数据文件,因此该非法用户无法获取完整的数据文件。此外,在上述将数据文件分散存储的基础上,本发明还采用光盘作为数据文件的主要存储介质,充分地利用了光盘所具有的不会受到电磁辐射干扰以及对温度和湿度不敏感的优势,使得数据文件不会由于受到外界环境的影响而损坏丢失,从而进一步实现了对数据文件的保护。
本发明所提供的数据文件的保护方法进一步地通过形成数据块的副本并将该副本存储至存储网络包括的存储介质中以达到对数据文件更好的保护效果。请参考图2,图2是根据本发明的数据块副本存储的一个具体实施方式的流程图。如图所示,形成数据块的副本并将该副本存储至存储网络包括的存储介质中包括以下步骤:
在步骤S201中,创建所述多个数据块的副本,其中,每一所述数据块具有至少一个副本;
在步骤S202中,选择所述存储网络中的多个备份存储介质,该多个备份存储介质中至少部分是光盘;
在步骤S203中,将所述副本分别写入所述多个备份存储介质中;
在步骤S204中,生成所述数据文件的备份索引信息,并将该备份索引信息写入所述数据库中,其中,所述备份索引信息用于记录所述副本的存储路径。
具体地,在步骤S201中,针对每一数据块创建至少一个副本,其中,副本的数目越多,数据块损坏丢失之后能被恢复的概率就越高,但是与此同时占用的存储空间也越多,因此,副本的具体数目根据实际应用的需求进行设定。
在步骤S202中,从存储网络中选择多个备份存储介质用于数据块副本的存储,其中,在该多个备份存储介质中至少部分是光盘。同样地,一种情况是该多个备份存储介质全部是光盘。另一种可能是该多个备份存储介质除了光盘之外还包括硬盘。进一步地,所述硬盘可以是机械硬盘、固态硬盘或混合硬盘。在本实施例中,所述光盘同样是通过光盘库提供。
在一个优选实施例中,选择存储网络中的多个备份存储介质的步骤包括:首先,识别出所述存储网络中包括的所有可用备份存储介质;然后,随机选择所述所有可用备份存储介质的一个子集,该子集内包括所述多个备份存储介质。在另一个优选实施例中,选择存储网络中的多个备份存储介质的步骤包括:首先,识别出所述存储网络中包括的所有可用备份存储介质;然后,判断所述所有可用备份存储介质的存储负载状况,并根据存储负载状况选择所述所有可用备份存储介质的一个子集,该子集内包括所述多个备份存储介质。本领域的技术人员可以理解的是,从存储网络中选择多个备份存储介质用于存储副本的步骤与选择多个存储介质用于存储数据块的步骤本质上是相同的,因此可以参考前述步骤S102中相应部分的说明,为了简明起见,在此就不再展开描述。
需要对用于存储数据块的存储介质与用于存储副本的备份存储介质之间的关系进行说明。将其二者视为两个集合,则该两个集合可以完全重合(即数据块及其副本采用相同的存储介质进行保存)、也可以部分重合(即部分数据块和部分副本采用相同的存储介质进行保存),还可以完全不重合(即数据块及副本分别存储在不同的存储介质中)。
在步骤S203中,将数据块的副本写入所述多个备份存储介质中。同样地,写入方式在此不做任何限定。
在步骤S204中,将数据块的副本写入存储网络的多个备份存储介质中之后,生成数据文件的备份索引信息,其中,该备份索引信息用于记录所述副本的存储路径;数据文件的备份索引信息生成之后,保存该备份索引信息。在一个实施例中,将该备份索引信息与前述步骤S104中数据文件的索引信息保存在同一数据库中,便于读取。
当数据块以及副本存储至存储网络中之后,若出现数据块损坏丢失的情况,此时可以从数据库中获取数据文件的备份索引信息,然后根据该备份索引信息从存储网络中包括的备份存储介质中读取出该数据块的副本并利用该副本对损坏丢失的数据块进行恢复,从而进一步对数据文件起到了保护作用。
需要说明的是,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
相应地,本发明还提供了一种数据文件的保护系统,请参考图3,图3是根据本发明的数据文件的保护系统的一个具体实施方式的结构示意图。如图3所示,该保护系统包括:
存储网络10,该存储网络10用于提供存储介质101;
分割模块201,用于分割数据文件以形成多个数据块;
选择模块202,用于选择所述存储网络10中的多个存储介质101,该多个存储介质101中至少部分是光盘;
写入模块203,用于将所述多个数据块分别写入所述多个存储介质101中;
索引模块204,用于生成所述数据文件的索引信息,并将该索引信息写入数据库30中,其中,所述索引信息用于记录所述多个数据块的存储路径;
所述数据库30,用于存储所述索引信息。
下面,对上述各模块的工作过程进行具体描述。
具体地,如图所示,存储网络10是指由通过互联网或局域网连接的多个存储设备(诸如图中存储设备1、存储设备2以及存储设备N所示)所构成的用于提供存储空间的架构,其中,存储设备内设置存储介质101,该存储介质101利用电、磁和/或光学的特性对信息进行保存。下文中,将以存储介质101包括光盘和硬盘为例对本发明进行说明。
分割模块201将数据文件进行分割以形成多个数据块。在本实施例中,分割模块201将数据文件分割成为大小相等的数据块,其中,数据块的大小等于预设值,例如512K、1M或5M等。在其他实施例中,分割模块201也可以根据实际应用的需要将数据文件分割成为大小不等的数据块。
选择模块202从存储网络10中选择多个存储介质101用于该多个数据块的存储,其中,在该多个存储介质101中至少部分是光盘。一种情况是该多个存储介质101全部是光盘。另一种可能是该多个存储介质101除了光盘之外还包括硬盘。进一步地,所述硬盘可以是机械硬盘、固态硬盘或混合硬盘。在本实施例中,所述存储网络10中包括至少一个光盘库,该至少一个光盘库用于提供光盘。
在一个优选实施例中,选择模块202包括第一识别单元2021以及第一选择单元2022,其中,所述第一识别单元2021用于识别出所述存储网络10中包括的所有可用存储介质101(可用存储介质本质上还是存储介质,因此也采用101编号表示)。在本实施例中,所述第一识别单元2021通过获取存储网络10中包括的存储介质101的存储状态信息来识别所有可用存储介质101,其中,所述存储状态信息包括但不限于存储介质101的闲忙状态以及存储介质101内可用空间的大小。所述第一选择单元2022用于随机选择所述所有可用存储介质101的一个子集,该子集内包括所述多个存储介质101。优选地,所述子集内包括的存储介质101的数目等于所述数据块的数目,即所述多个数据块被存储至不同的存储介质101内。更优选地,所述存储介质101分布在不同的存储设备中,即所述数据块被存储至不同的存储设备内。
在另一个优选实施例中,选择模块202包括第二识别单元2023以及第二选择单元2024,其中,所述第二识别单元2023用于识别出所述存储网络中包括的所有可用存储介质101,所述第二选择单元2024用于判断所述所有可用存储介质101的存储负载状况,并根据存储负载状况选择所述所有可用存储介质101的一个子集,该子集内包括所述多个存储介质101。
需要说明的是,如图所示,所述选择模块202同时包括第一识别单元2021和第一选择单元2022、以及第二识别单元2023和第二选择单元2024。在其他实施例中,所述选择模块202也可以仅包括第一识别单元2021和第一选择单元2022、或仅包括第二识别单元2023和第二选择单元2024。
写入模块203将分割数据文件所形成的多个数据块写入所述多个存储介质101中。针对于多个数据块的写入方式,一种方式是写入模块203等待所有存储介质101均进入写入准备状态后同步并行地将该多个数据块写入多个存储介质101中,另一种方式是写入模块203一旦检测到任一存储介质101进入写入准备状态后即写入向该存储介质101写入与其对应的数据块。
写入模块203将多个数据块写入存储网络10的多个存储介质101中之后,索引模块204生成数据文件的索引信息,其中,该索引信息用于记录所述多个数据块的存储路径;数据文件的索引信息生成之后,索引模块204将该索引信息写入数据库30中进行保存。优选地,数据库30所在的存储设备独立于用于存储数据文件的存储介质101所在的存储设备,即索引信息与数据文件分开存储,如此一来,即使非数据文件的所有者获得了用于存储数据文件的所有存储介质101,也会因为缺少索引信息而无法对存储介质101内的数据块进行组合以恢复数据文件。
需要说明的是,前述提及的存储介质的存储状态信息可以存储在上述数据库30中,并根据存储网络10中包括的存储介质101的存储状态的变化相应进行更新。如此一来,选择模块202在选择存储网络10中的多个存储介质101时只需要直接从数据库30中读取该存储状态信息,而无需逐一对存储网络10中包括的存储介质101进行检测以获取其存储状态信息,从而提高了数据块写入的效率。本领域的技术人员可以理解的是,所述存储状态信息也可以与索引信息分别存储在不同的数据库中。
与现有技术相比,本发明是将数据文件以数据块的形式分散地存储至存储网络10包括的存储介质101中,如此一来,起到了对数据文件进行加密的效果,即,非数据文件的所有者获得部分存储介质101也无法从中读取出完整的数据文件。举例说明,存储网络10中某一存储设备内设置一块硬盘,非法用户进入该硬盘读取数据,在这种情况下,由于该硬盘内存储的仅仅是部分数据块而非完整的数据文件,因此该非法用户无法获取完整的数据文件。此外,在上述将数据文件分散存储的基础上,本发明还采用光盘作为数据文件的主要存储介质101,充分地利用了光盘所具有的不会受到电磁辐射干扰以及对温度和湿度不敏感的优势,使得数据文件不会由于受到外界环境的影响而损坏丢失,从而进一步实现了对数据文件的保护。
请参考图4,图4是根据本发明的数据文件的保护系统的另一个具体实施方式的结构示意图。如图4所示,与图3所示系统相比,本发明所提供的数据文件的保护系统进一步还包括:
备份创建模块205,用于创建所述多个数据块的副本,其中,每一所述数据块具有至少一个副本;
备份选择模块206,用于选择所述存储网络10中的多个备份存储介质101(备份存储介质本质上还是存储介质,因此也采用101编号表示),该多个备份存储介质101中至少部分是光盘;
备份写入模块207,用于将所述副本分别写入所述多个备份存储介质101中;
备份索引模块208,用于生成所述数据文件的备份索引信息,并将该备份索引信息写入所述数据库30中,其中,所述备份索引信息用于记录所述副本的存储路径。
图4与图3中相同的附图标记代表相同的部件,为了简明起见,在此对于图4中与图3中具有相同附图标记的部件不再进行赘述,请参考前文中相关内容的描述。
下面,对备份创建模块205、备份选择模块206、备份写入模块207以及备份索引模块208的工作过程进行具体说明。
具体地,备份创建模块205针对每一数据块创建至少一个副本,其中,副本的具体数目根据实际应用的需求进行设定。
备份选择模块206从存储网络10中选择多个备份存储介质101用于数据块副本的存储,其中,在该多个备份存储介质101中至少部分是光盘。同样地,一种情况是该多个备份存储介质101全部是光盘。另一种可能是该多个备份存储介质101除了光盘之外还包括硬盘。进一步地,所述硬盘可以是机械硬盘、固态硬盘或混合硬盘。在本实施例中,所述光盘同样是通过光盘库提供。
在一个优选实施例中,备份选择模块206包括第三识别单元2061以及第三选择单元2062。其中,第三识别单元2061用于识别出所述存储网络10中包括的所有可用备份存储介质101(可用备份存储介质本质上还是存储介质,因此也采用101编号表示),第三选择单元2062用于随机选择所述所有可用备份存储介质101的一个子集,该子集内包括所述多个备份存储介质101。在另一个优选实施例中,备份选择模块206包括第四识别单元2063以及第四选择单元2064,其中,第四识别单元2063用于识别出所述存储网络10中包括的所有可用备份存储介质101,第四选择单元2064用于判断所述所有可用备份存储介质101的存储负载状况,并根据存储负载状况选择所述所有可用备份存储介质101的一个子集,该子集内包括所述多个备份存储介质。
需要说明的是,如图所示,所述备份选择模块206同时包括第三识别单元2061和第三选择单元2062、以及第四识别单元2063和第四选择单元2064。在其他实施例中,所述备份选择模块206也可以仅包括第三识别单元2061和第三选择单元2062、或仅包括第四识别单元2063和第四选择单元2064。
备份写入模块207将数据块的副本写入所述多个备份存储介质101中。同样地,写入方式在此不做任何限定。
备份写入模块207将数据块的副本写入存储网络的多个备份存储介质101中之后,备份索引模块208生成数据文件的备份索引信息,其中,该备份索引信息用于记录所述副本的存储路径;数据文件的备份索引信息生成之后,备份写入模块207将该备份索引信息写入所述数据库30中。
当数据块以及副本存储至存储网络中之后,若出现数据块损坏丢失的情况,可以根据备份索引信息从存储网络10中包括的备份存储介质101中读取出该数据块的副本并利用该副本对损坏丢失的数据块进行恢复,从而进一步对数据文件起到了保护作用。
需要说明的是,分割模块201、选择模块202、写入模块203、索引模块204、备份创建模块205、备份选择模块206、备份写入模块207和备份索引模块208及其包括的各部分优选地实施为一种计算机程序产品,且该计算机程序产品运行在一台服务器内。上述计算机程序产品的实施例可以通过使用用于计算机可读信息的任何记录介质来实现,所述记录介质包括磁介质、光介质或其他适合的介质。
本部分出现的术语和名词与前文中相同的术语或名词具有一致的含义,例如所述“存储网络”、“存储设备”、“存储介质”等,上述术语或名词及其涉及的工作原理均可参考前文中相关部分的描述和解释,为了简便起见在此不再赘述。
本发明提供的数据文件的保护方法可以使用可编程逻辑器件来实现,也可以实施为计算机程序软件,例如根据本发明的实施例可以是一种计算机程序产品,运行该程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质,该介质上包含计算机程序逻辑或代码部分,用于实现上述方法的各个步骤。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可从计算机主体拆卸的可移动介质(例如热拔插技术存储设备)。所述内置介质包括但不限于可重写的非易失性存储器,例如RAM、ROM、快闪存储器和硬盘。所述可移动介质包括但不限于:光存储媒体(例如CD-ROM和DVD)、磁光存储媒体(例如MO)、磁存储媒体(例如盒带或移动硬盘)、具有内置的可重写的非易失性存储器的媒体(例如存储卡)和具有内置ROM的媒体(例如ROM盒)。
本领域技术人员应当理解,任何具有适当编程装置的计算机系统都将能够执行包含在程序产品中的本发明的方法的诸步骤。尽管本说明书中描述的多数具体实施方式都侧重于软件程序,但是作为固件和硬件实现本发明提供的方法的替代实施例同样在本发明要求保护的范围之内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他部件、单元或步骤,单数不排除复数。装置权利要求中陈述的多个部件、单元或装置也可以由一个部件、单元或装置通过软件或者硬件来实现。
本发明提供的数据文件的保护方法及系统通过将数据文件以数据块的形式分散地存储至存储网络包括的存储介质中以实现对数据文件的加密,使得非数据文件的所有者即使获得部分存储介质也无法从中读取出完整的数据文件。此外,本发明还采用光盘作为数据文件的主要存储介质,充分地利用了光盘所具有的不会受到电磁辐射干扰以及对温度和湿度不敏感的优势,使得数据文件不会由于受到外界环境的影响而损坏丢失,从而进一步实现了对数据文件的保护。
以上所揭露的仅为本发明的一些较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (20)

1.一种数据文件的保护方法,该保护方法包括:
分割数据文件以形成多个数据块;
选择存储网络中的多个存储介质,该多个存储介质中至少部分是光盘;
将所述多个数据块分别写入所述多个存储介质中;
生成所述数据文件的索引信息,并将该索引信息写入数据库中,其中,所述索引信息用于记录所述多个数据块的存储路径。
2.根据权利要求1所述的保护方法,其中,选择存储网络中的多个存储介质包括:
识别出所述存储网络中包括的所有可用存储介质;
随机选择所述所有可用存储介质的一个子集,该子集内包括所述多个存储介质。
3.根据权利要求1所述的保护方法,其中,选择存储网络中的多个存储介质包括:
识别出所述存储网络中包括的所有可用存储介质;
判断所述所有可用存储介质的存储负载状况,并根据存储负载状况选择所述所有可用存储介质的一个子集,该子集内包括所述多个存储介质。
4.根据权利要求1所述的保护方法,其中,所述多个存储介质中除光盘外还包括硬盘。
5.根据权利要求1至3中任一项所述的保护方法,该保护方法还包括:
创建所述多个数据块的副本,其中,每一所述数据块具有至少一个副本;
选择所述存储网络中的多个备份存储介质,该多个备份存储介质中至少部分是光盘;
将所述副本分别写入所述多个备份存储介质中;
生成所述数据文件的备份索引信息,并将该备份索引信息写入所述数据库中,其中,所述备份索引信息用于记录所述副本的存储路径。
6.根据权利要求5所述的保护方法,其中,选择所述存储网络中的多个备份存储介质包括:
识别出所述存储网络中包括的所有可用备份存储介质;
随机选择所述所有可用备份存储介质的一个子集,该子集内包括所述多个备份存储介质。
7.根据权利要求5所述的保护方法,其中,选择所述存储网络中的多个备份存储介质包括:
识别出所述存储网络中包括的所有可用备份存储介质;
判断所述所有可用备份存储介质的存储负载状况,并根据所述存储负载状况选择所述所有可用备份存储介质的一个子集,该子集内包括所述多个备份存储介质。
8.根据权利要求5所述的保护方法,其中,所述多个备份存储介质中除光盘外还包括硬盘。
9.根据权利要求4或8所述的保护方法,其中,所述硬盘是机械硬盘、固态硬盘或混合硬盘。
10.根据权利要求1或5所述的保护方法,其中,所述存储网络包括至少一个光盘库。
11.一种数据文件的保护系统,该保护系统包括:
存储网络,该存储网络用于提供存储介质;
分割模块,用于分割数据文件以形成多个数据块;
选择模块,用于选择所述存储网络中的多个存储介质,该多个存储介质中至少部分是光盘;
写入模块,用于将所述多个数据块分别写入所述多个存储介质中;
索引模块,用于生成所述数据文件的索引信息,并将该索引信息写入数据库中,其中,所述索引信息用于记录所述多个数据块的存储路径;
所述数据库,用于存储所述索引信息。
12.根据权利要求11所述的保护系统,其中,所述选择模块包括:
第一识别单元,用于识别出所述存储网络中包括的所有可用存储介质;
第一选择单元,用于随机选择所述所有可用存储介质的一个子集,该子集内包括所述多个存储介质。
13.根据权利要求11所述的保护系统,其中,所述选择模块包括:
第二识别单元,用于识别出所述存储网络中包括的所有可用存储介质;
第二选择单元,用于判断所述所有可用存储介质的存储负载状况,并根据所述存储负载状况选择所述所有可用存储介质的一个子集,该子集内包括所述多个存储介质。
14.根据权利要求11所述的保护系统,其中,所述多个存储介质中除光盘外还包括硬盘。
15.根据权利要求11至13中任一项所述的保护系统,该保护系统还包括:
备份创建模块,用于创建所述多个数据块的副本,其中,每一所述数据块具有至少一个副本;
备份选择模块,用于选择所述存储网络中的多个备份存储介质,该多个备份存储介质中至少部分是光盘;
备份写入模块,用于将所述副本分别写入所述多个备份存储介质中;
备份索引模块,用于生成所述数据文件的备份索引信息,并将该备份索引信息写入所述数据库中,其中,所述备份索引信息用于记录所述副本的存储路径。
16.根据权利要求15所述的保护系统,其中,所述备份选择模块包括:
第三识别单元,用于识别出所述存储网络中包括的所有可用备份存储介质;
第三选择单元,用于随机选择所述所有可用备份存储介质的一个子集,该子集内包括所述多个备份存储介质。
17.根据权利要求15所述的保护系统,其中,所述备份选择模块包括:
第四识别单元,用于识别出所述存储网络中包括的所有可用备份存储介质;
第四选择单元,用于判断所述所有可用备份存储介质的存储负载状况,并根据所述存储负载状况选择所述所有可用备份存储介质的一个子集,该子集内包括所述多个备份存储介质。
18.根据权利要求15所述的保护系统,其中,所述多个备份存储介质中除光盘外还包括硬盘。
19.根据权利要求14或18所述的保护系统,其中,所述硬盘是机械硬盘、固态硬盘或混合硬盘。
20.根据权利要求11或15所述的保护系统,其中,所述存储网络包括至少一个光盘库。
CN201410037042.2A 2014-01-24 2014-01-24 一种数据文件的保护方法及系统 Pending CN103793666A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410037042.2A CN103793666A (zh) 2014-01-24 2014-01-24 一种数据文件的保护方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410037042.2A CN103793666A (zh) 2014-01-24 2014-01-24 一种数据文件的保护方法及系统

Publications (1)

Publication Number Publication Date
CN103793666A true CN103793666A (zh) 2014-05-14

Family

ID=50669315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410037042.2A Pending CN103793666A (zh) 2014-01-24 2014-01-24 一种数据文件的保护方法及系统

Country Status (1)

Country Link
CN (1) CN103793666A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268031A (zh) * 2014-09-28 2015-01-07 安徽中科大国祯信息科技有限责任公司 一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法
CN105224891A (zh) * 2015-09-22 2016-01-06 苏州互盟信息存储技术有限公司 磁盘光盘融合数据安全存储方法、系统及装置
CN105320613A (zh) * 2014-06-04 2016-02-10 贺利实公司 用于动态数据存储的系统及方法
CN106203128A (zh) * 2015-04-30 2016-12-07 宋青见 网页数据加解密方法、装置和系统
CN106355099A (zh) * 2016-08-31 2017-01-25 惠州学院 云备份方法及装置
CN106528334A (zh) * 2016-10-25 2017-03-22 广东欧珀移动通信有限公司 数据备份方法及装置
CN107430668A (zh) * 2015-01-03 2017-12-01 迈克菲股份有限公司 用于个人设备和云数据的安全分布式备份
CN108052843A (zh) * 2017-12-21 2018-05-18 北京连山时代科技有限公司 一种安全移动存储设备及其实现方法
CN110554843A (zh) * 2019-09-10 2019-12-10 深圳市得一微电子有限责任公司 一种文件数据多个存储设备存储的方法及系统
WO2019233259A1 (zh) * 2018-06-05 2019-12-12 京东数字科技控股有限公司 用于处理信息的方法和装置
CN117194348A (zh) * 2023-11-02 2023-12-08 深圳市领存技术有限公司 一种家用文件存储系统、方法、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090043978A1 (en) * 2007-08-06 2009-02-12 International Business Machines Corporation Efficient hierarchical storage management of a file system with snapshots
CN101902498A (zh) * 2010-07-02 2010-12-01 广州鼎甲计算机科技有限公司 一种基于网络技术的存储云备份方法
CN102004769A (zh) * 2010-11-12 2011-04-06 成都市华为赛门铁克科技有限公司 文件管理方法、设备及存储系统
CN102546755A (zh) * 2011-12-12 2012-07-04 华中科技大学 云存储系统的数据存储方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090043978A1 (en) * 2007-08-06 2009-02-12 International Business Machines Corporation Efficient hierarchical storage management of a file system with snapshots
CN101902498A (zh) * 2010-07-02 2010-12-01 广州鼎甲计算机科技有限公司 一种基于网络技术的存储云备份方法
CN102004769A (zh) * 2010-11-12 2011-04-06 成都市华为赛门铁克科技有限公司 文件管理方法、设备及存储系统
CN102546755A (zh) * 2011-12-12 2012-07-04 华中科技大学 云存储系统的数据存储方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320613A (zh) * 2014-06-04 2016-02-10 贺利实公司 用于动态数据存储的系统及方法
CN104268031A (zh) * 2014-09-28 2015-01-07 安徽中科大国祯信息科技有限责任公司 一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法
CN104268031B (zh) * 2014-09-28 2017-07-21 安徽中科大国祯信息科技有限责任公司 一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法
CN107430668B (zh) * 2015-01-03 2020-10-27 迈克菲有限公司 用于个人设备和云数据的安全分布式备份
CN107430668A (zh) * 2015-01-03 2017-12-01 迈克菲股份有限公司 用于个人设备和云数据的安全分布式备份
CN106203128B (zh) * 2015-04-30 2020-01-14 宋青见 网页数据加解密方法、装置和系统
CN106203128A (zh) * 2015-04-30 2016-12-07 宋青见 网页数据加解密方法、装置和系统
CN105224891A (zh) * 2015-09-22 2016-01-06 苏州互盟信息存储技术有限公司 磁盘光盘融合数据安全存储方法、系统及装置
CN106355099A (zh) * 2016-08-31 2017-01-25 惠州学院 云备份方法及装置
WO2018076879A1 (zh) * 2016-10-25 2018-05-03 广东欧珀移动通信有限公司 数据备份方法、装置、存储介质及终端
CN106528334A (zh) * 2016-10-25 2017-03-22 广东欧珀移动通信有限公司 数据备份方法及装置
CN108052843A (zh) * 2017-12-21 2018-05-18 北京连山时代科技有限公司 一种安全移动存储设备及其实现方法
WO2019233259A1 (zh) * 2018-06-05 2019-12-12 京东数字科技控股有限公司 用于处理信息的方法和装置
CN110554843A (zh) * 2019-09-10 2019-12-10 深圳市得一微电子有限责任公司 一种文件数据多个存储设备存储的方法及系统
CN117194348A (zh) * 2023-11-02 2023-12-08 深圳市领存技术有限公司 一种家用文件存储系统、方法、设备及存储介质
CN117194348B (zh) * 2023-11-02 2024-03-26 深圳市领存技术有限公司 一种家用文件存储系统、方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN103793666A (zh) 一种数据文件的保护方法及系统
CN102024059B (zh) 一种文件系统内实现独立磁盘冗余阵列保护的方法及装置
CN102929748B (zh) 数据备份方法及装置
CN103034458B (zh) 固态硬盘中实现独立磁盘冗余阵列的方法及装置
CN103064765A (zh) 数据恢复方法、装置及集群存储系统
CN104461390A (zh) 将数据写入叠瓦状磁记录smr硬盘的方法及装置
CN105183581A (zh) 一种数据库容灾系统
CN102326141A (zh) Raid配置信息的处理方法及装置、raid控制器
CN103177127A (zh) 基于光盘库的数据库存储系统及利用该系统的方法
CN103955433A (zh) 盖瓦磁记录硬盘、盖瓦磁记录硬盘写数据的方法及装置
US10572335B2 (en) Metadata recovery method and apparatus
CN103699457A (zh) 基于条带化的磁盘阵列修复方法及装置
CN103034592A (zh) 数据处理方法和装置
CN102959548B (zh) 数据存储方法、查找方法及装置
CN104239438A (zh) 基于分离存储的文件信息存储方法和文件信息读写方法
US20140379649A1 (en) Distributed storage system and file synchronization method
CN103064804A (zh) 磁盘数据的访问控制方法及装置
US10042570B2 (en) Tape backup and restore in a disk storage environment with intelligent data placement
CN102096613B (zh) 一种生成快照的方法及装置
CN105608150A (zh) 一种业务数据的处理方法及系统
US7600151B2 (en) RAID capacity expansion interruption recovery handling method and system
CN105354149A (zh) 一种内存数据查找方法和装置
CN104035886A (zh) 磁盘重映射方法、装置及电子设备
CN106599236A (zh) 一种文件系统的元数据存储方法和装置
JP2015520904A5 (zh)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140514