CN101501653A - 磁盘的长期备份 - Google Patents

磁盘的长期备份 Download PDF

Info

Publication number
CN101501653A
CN101501653A CN200780004556.6A CN200780004556A CN101501653A CN 101501653 A CN101501653 A CN 101501653A CN 200780004556 A CN200780004556 A CN 200780004556A CN 101501653 A CN101501653 A CN 101501653A
Authority
CN
China
Prior art keywords
copy
storage medium
computerized data
storage bin
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200780004556.6A
Other languages
English (en)
Other versions
CN101501653B (zh
Inventor
艾隆·科恩
艾维拉姆·科恩
伊拉恩·莱奇斯特恩
多尔·阿尔巴
伊里特·曼尼-梅塔夫
沃尔夫·奥里恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FilesX Inc
Original Assignee
FilesX Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FilesX Inc filed Critical FilesX Inc
Publication of CN101501653A publication Critical patent/CN101501653A/zh
Application granted granted Critical
Publication of CN101501653B publication Critical patent/CN101501653B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1004Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's to protect a block of data words, e.g. CRC or checksum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

一种用于计算机化数据的验证和恢复的备份装置,该备份装置包括附连至计算机网络的计算机、存储计算机化数据的主存储介质和辅助存储介质。辅助存储介质被划分为存储仓位。每个存储仓位或者可操作地附连(安装)至计算机或者可操作地从计算机拆卸(卸下)。计算机的处理器在一个存储仓位中存储计算机化数据的副本后,单独地针对读取操作可操作地附连或者安装存储仓位并且保持具有副本的参数(例如校验和)的存储值。处理器周期性地比较存储值和计算机化数据的校验和的相应值。在检测到存储值与相应值之间的差异后:当差异源自于计算机化数据时,则从副本恢复计算机化数据而当差异源自于副本时,或者(i)从计算机化数据恢复副本或者(ii)在另一个存储仓位中恢复计算机化数据的另一个副本。为了更新副本,单独地针对写入操作安装存储仓位。日志机构以文档形式记录每次针对写入操作可操作地附连(安装)存储仓位的情况。

Description

磁盘的长期备份
技术领域
本发明涉及计算机化数据的存储。具体地,本发明提供计算机化数据的长期备份和存储,同时针对审核目的并且针对历史数据的检索而保持数据在几年内可用。
背景技术
企业数据网络中的备份操作有时是费时的、昂贵的以及不可靠的工作。尽管普通企业中产生的数据量在增加,但可用于备份的时间在减少并且备份被更加频繁地实施。建立有效的数据保护系统需要在服务器、网络、磁带技术以及专业人员上的大量投入,以及数据存储介质(如磁带介质)的经常性成本。基于磁带的备份和恢复操作经常中断业务操作和数据可用性,花费金钱并且降低生产力。磁带恢复通常因为物理介质的低可靠性而失败。因为通常不存在自动检查程序并且因而存在很多旧磁带消失或者当需要恢复时不具有所需的全部相关数据的情况。
同样,数据恢复操作的一个问题是恢复操作极其缓慢并且需要大量劳动力:大部分恢复操作以少量数据,通常单个文件或者文件夹为目标。但是恢复那些数据需要找到适当的磁带或者磁带组,并且将其安装。为了恢复全部数据需要分配足够的磁盘空间,全部数据被恢复,并且接着需要找到期望的文件或者文件夹。通常,整个处理可能需要被重复直到期望的文件被找到。此外,恢复损坏的或者破坏的数据需要独立的、专用的块级备份和恢复处理,因为文件级备份不能恢复系统文件。
题为Fast Backup Storage and fast Recovery of Data(FBSRD)method的20050216788号美国专利申请通过用于所有目的的参考而被包括在本申请中,就如在本申请中被完整地陈述一样。FBSRD耦合至具有服务器和工作站的网络,并且以存储模式和恢复模式来操作。FBSRD包括主存储装置、储存库,和运行备份应用程序的备份装置(BA)计算机。当在存储模式下,通过采用快照从主存储装置获取数据以用于备份并且获取的数据以块格式保存到储存库中。在恢复模式下,从储存库获取备份数据并且以块格式和文件格式中的任意一种格式恢复至主存储装置中。BA与贮存在每个服务器和工作站上的代理计算机程序,以及由用户操作的备份用户接口管理计算机程序交互运行。
对法规的遵从和法律压力使得可靠的和可访问的长期商业数据存储成为必要。
美国卫生和公共服务部(“HHS”)发布了《个人健康信息隐私标准》(“隐私规则”)以实现1996年健康保险可携性与负责法案(“HIPAA”)的要求。该隐私规则标准解决了个人健康信息的使用和公开以及理解和控制他们的健康信息怎么被使用的个人隐私权利的标准。该隐私规则的一个主要目标是保证个人健康信息被适当地保护,同时允许需要提供的健康信息的流动以及促进高质量的卫生保健以及保护公共卫生和福利。
2002年的萨班斯-奥克斯利法案(Pub.L.No.107-204,116 Stat.745,也称为2002年公众公司会计改革和投资者保护法案,2002年7月30日)是响应多个大公司和财务丑闻而通过的美国联邦法律,这些大公司和财务丑闻导致了具有对存储的商业记录的完整性、可靠性和获取有特定需求的财务和报告工作的公信力的下降。
1934年的证券交易法的证券交易委员会(SEC)规则17a-4(结合17a-3)要求经纪自营商以容易访问的方式创建和保存每次证券交易和他们总体证券业务的全面记录。SEC使用这些保存的记录来监控对包括反商业欺诈规定和财务责任标准的可适用的证券法律的遵守。为了保证遵守SEC规则17a-4,经纪自营商必须在所需的保管期限内保持和保留特定记录,以防止记录被重写、擦除或者改变的方式来存储记录,放置于一个系统以显示每个记录的审核跟踪并且提供记录没有被改变的验证。
NASD(全国证券交易商协会)是获得证券交易委员会授权的、负责规范参与美国证券行业的个人和公司的主要自律组织。NASD3110要求所有的账本、账目、记录、买卖通知书和相应资料应当以SEC规则17a-4所述的相同格式(即,不可重写、不可擦除和时戳)来保留。与经纪自营商的业务有关的所有电子邮件和互联网通信必需保留至少三年,前两年位于容易访问的地方。
由美国食品和药物管理局(FDA)颁布的联邦法规汇编第21章第11部分“提出了管理机构认为电子记录、电子签名以及在电子记录上实施的手写签名是可信的、可靠的以及通常等同于纸件记录和在纸件上实施的手写签名的标准”。
因此,需要具有一种系统并且提供计算机化数据的备份和存储,该备份和存储在预先定义的几年期间内保证数据的完整性和可用性并且满足法规要求,保护数据同时针对审核目的而保持数据的直接可用性。这将有很大的优势。
定义:
以下定义了本申请中使用的术语:
操作系统(OS):一种软件程序,用来控制计算机资源如I/O操作、存储器资源和程序执行。
文件系统:操作系统的组件,用来以分层逻辑结构来组织、访问和修改信息。
文件系统卷:操作系统用来组织和记录文件系统数据(如目录和文件)的卷或者固定数量的存储。
内核:内核是大部分计算机操作系统(OS)的中心组件。内核管理系统资源以及硬件和软件组件之间的通信。作为操作系统的基本组件,内核提供资源(例如,存储器、处理器和I/O装置)的最低级抽象层,其中应用程序必须控制该资源以执行它们的功能并且通过进程间通信机构和系统调用而使得该资源对于应用程序进程是可用的。
(http://en.wikipedia.org/wiki/Kernel_%28computer_science%29)
SCSI(“小型计算机系统接口”)是用于在外部和内部计算机总线上的装置之间传输数据的标准接口和指挥台。SCSI最常用于硬盘和磁带存储装置,但同样连接各种其它装置,包括扫描仪、打印机、CD-ROM驱动器、CD刻录机和DVD驱动器。
校验和是一种冗余校验形式,用于通过用典型地增加指定的位来检测数据中的错误并且存储结果值来保护数据完整性。校验和的最简单形式(其在数据中增加指定的位)不能检测多种类型的错误。特别地,以下的情况不能改变这样的校验和:消息中字节的重新排序、0值字节的插入或者删除以及和为0的多个错误。更多复杂类型的冗余检验(包括Fletcher检查和、Adler-32和循环冗余校验(CRC))被设计成通过不仅考虑每个字节的值而且考虑其位置来解决这些缺点。检测更多类型错误的能力的代价是增加的计算冗余校验值的复杂度。这些类型的冗余校验在检测意外修改(如存储数据的损坏或者通信信道中的错误)时是有用的。
(http://en.wikipedia.org/wiki/Checksum)
单写多读(WORM)是允许信息被写入磁盘一次并且阻止驱动器擦写或者修改数据的数据存储技术。
计算机:一种机器,其执行记录在计算机可读介质上的计算机程序指令,还具有用于存储计算机程序的存储器,并且通常耦合至通信链路。
局域网(LAN)如以太网,用于位于物理上相邻(通常少于500m)的计算机之间的通信。
存储区域网络(SAN):用来连接多个具有存储装置的计算机的高速、专用网络。
工作站:附连于LAN而不附连于SAN的计算机。
服务器:附连于LAN和SAN的计算机。
数据块:被作为单个单元访问的具有多个连续扇区的固定大小单元。块格式的数据被组织为至少一个连续数据块并且标记有与数据一同保存的物理位置信息。块结构是扁平的,意味着不存在块关联到更高级结构。
主存储介质:计算机用来存储非易失性数据的存储装置(通常是诸如磁盘的块存储装置)。
辅助存储介质:用于存储从主存储装置备份的数据的存储装置或者储存库。
在此之前术语“恢复”用来涉及将原始数据恢复回附连于服务器和/或工作站的存储装置,所述服务器和/或工作站附连于网络。此后,术语“恢复”涉及作为本发明备份装置的一部分的主的和辅助存储介质之间恢复的数据。
此后,术语“计算机”涉及执行本发明实施例的备份、验证和恢复处理的机器,不是服务器计算机或者工作站计算机,除非被指明。
本申请中使用的涉及数据的术语“参数”是为了确定数据完整性而从数据获得的冗余检验或者其它值。
本申请中使用的术语“安装”(作为动词)和“可操作地附连”是可互换的。本申请中使用的术语“卸下”和“可操作地拆卸”是可互换的。
发明内容
根据本发明,提供了一种用于在附连于计算机网络的备份装置内存储的计算机化数据的验证和恢复的计算机方法。该备份装置包括附连于计算机网络的计算机和连接至计算机的存储计算机化数据的主存储介质。辅助存储介质被划分为存储仓位。每个存储仓位或者可操作地附连至计算机(即安装),或者可操作地从计算机拆卸(即卸下)。在一个或多个存储仓位中存储计算机化数据的副本后,单独地针对读取操作可操作地附连存储仓位。存储值被保持有参数,例如,副本的校验和。存储值周期性地与计算机化数据的参数的相应值进行比较。在检测到存储值与相应值之间的差异时,当差异源自于计算机化数据,则从副本恢复计算机化数据而当差异源自于副本:或者(i)从计算机化数据恢复副本或者(ii)在另一个存储仓位中恢复计算机化数据的另一个副本。优选地,为了更新副本,单独地针对写入操作可操作地附连存储仓位。出于审核目的,以日志或者文档形式记录针对写入操作的可操作地附连步骤。优选地,通过针对写入操作而可操作地附连存储仓位来执行备份。计算机化数据通过写入计算机化数据的更新副本至存储仓位来备份;并且一旦完成备份,单独地针对读取操作可操作地附连存储仓位。优选地,以具有时戳的日志形式记录辅助存储介质上的全部写入操作和来自辅助存储介质的全部读取操作。当存储仓位在存储数据副本时失败,数据的另一个副本优选地被恢复在另一个存储仓位中。
优选地,加密辅助存储介质并且阻止使用全部运行在计算机上的操作系统、文件系统管理器和卷管理器中的任何一种对该存储介质的直接访问。加密优选地通过使用软件驱动器(例如控制对辅助存储介质的每次读取和写入操作的专用块级内核驱动器)经由单输入/输出接口单独地访问辅助存储介质来执行。加密还优选地通过在辅助存储介质中放置私有签名,从而相对于操作系统、文件系统管理器和卷管理器隐藏辅助存储介质的内容来执行。存储值和参数的相应值包括副本和计算机化数据的全部文件的各自的校验和。
根据本发明,提供了一种包括计算机、主存储装置和被划分为存储仓位的辅助存储装置的备份装置,该装置执行本申请所公开的方法。
根据本发明,提供了一种用于计算机化数据的验证和恢复的备份装置,所述备份装置包括附连至计算机网络的计算机、存储计算机化数据的主存储介质以及辅助存储介质。辅助存储介质被划分为存储仓位。每个存储仓位或者可操作地附连(安装)至计算机或者可操作地从计算机拆卸(卸下)。计算机的处理器在一个存储仓位中存储计算机化数据的副本后,单独地针对读取操作可操作地附连或者安装存储仓位并且保持副本的参数(例如校验和)的存储值。处理器周期性地比较存储值和计算机化数据的校验和的相应值。在检测到存储值与相应值之间的差异时:当差异源自于计算机化数据,则从副本恢复计算机化数据而当差异源自于副本,或者:(i)从计算机化数据恢复副本或者(ii)在另一个存储仓位中恢复计算机化数据的另一个副本。存储值和参数的相应值优选地包括副本和计算机化数据的全部文件的各自的校验和或者另一个冗余校验。备份装置优选地包括为了更新副本单独地针对写入操作可操作地附连(安装)存储仓位的机构,以文档形式记录针对写入操作可操作地附连(安装)存储仓位的每次情形的日志机构以及加密辅助存储介质并且从而阻止使用全部运行在计算机上的操作系统、文件系统管理器和卷管理器中的任何一种对辅助存储机构的访问的加密机构。加密机构优选地包括控制经由单输入/输出接口到辅助存储介质的每次读取和写入操作的软件驱动器。加密机构优选地在辅助存储介质中放置私有签名,从而相对于全部运行在计算机上的操作系统、文件系统管理器和卷管理器隐藏辅助存储介质的内容。
根据本发明,提供一种可由机器可读的程序存储装置,有形地包含可由机器执行的指令程序,以执行用于在主存储介质中存储的计算机化数据的验证和恢复的方法,该主存储介质可操作地连接至计算机,该方法如本申请所公开的一样。
附图说明
参考附图,仅仅以示例的方式在这里描述本发明,附图中:
图1是图解根据本发明实施例的网络环境的简化系统图;
图2是根据本发明实施例的简化系统图;
图3是根据本发明实施例的计算机结构抽象层的简化图;
图4是根据本发明实施例的备份过程的简化流程图;
图5是根据本发明实施例的验证和恢复过程的简化流程图;
图6是根据本发明实施例的日志记录过程的简化流程图;
图7是根据本发明实施例的修复/复制过程的简化流程图;以及
图8是根据本发明实施例的清除过程的简化流程图。
具体实施方式
本发明是用于提供计算机化数据的备份和存储的系统和方法。本发明提供一种计算机化数据的长期备份和存储,其具有简单和快速地数据恢复,同时在预先定义的长达几年的时间内保证数据完整性和可用性并遵守管理机构针对数据完整性、数据隐私和安全的要求。具体地,本发明的实施例使用包括一组两个存储介质(例如磁盘:主磁盘和辅助磁盘)的存储库。通常,按照传统方式如由文件系统来管理主磁盘。辅助磁盘在创新的存储仓位或者小磁盘分区中存储主磁盘数据的副本,其以静态和密封的形式存储数据组件并且根据法规而被打开和写入。存储仓位不以使用卷管理器和/或文件系统管理器的传统方式来与操作系统交互。存储仓位仅仅在需要时才是可访问的,通过使用在物理级别上与存储介质的硬件接口(例如SCSI)交互的创新软件驱动器来访问该存储仓位。作为一对的主磁盘和辅助磁盘可以位于不同的存储装置上。这些装置可以物理的位于分离的空间并且连接至不同的电源以允许更多的冗余。
本发明的实施例执行用于在主磁盘和辅助磁盘的存储仓位中存储的数据的自动验证和自恢复处理。通常通过使用数据的诸如冗余检验的参数(例如通常使用在辅助磁盘的存储仓位中存储的文件的全部副本和在主磁盘中存储的类似文件的校验和)来检测在磁盘上存储的备份快照中的问题和/或损坏。如果校验和指示了存储仓位中一个或多个文件的损坏或者篡改,那么可以从主磁盘中对等的文件恢复存储仓位的文件。类似地,如果主磁盘中的一个或多个文件被损坏,可以从存储仓位中的副本恢复文件。优选地,在计算机系统相对不活动的背景下定期执行自动验证和自恢复处理。
本发明的某些实施例执行磁盘和数据生命管理(DDLM),所述磁盘和数据生命管理监控磁盘的物理状况或者“健康”、使用寿命或者甚至逐渐逼近的磁盘故障并且基于磁盘的物理状况执行自动数据再查找和/或延长(override)预置的过期期限。
本发明的某些实施例检测文件系统损坏并且阻止存储行为的继续直到问题被识别和解决。
本发明的实施例优选地包括报告机构以出于法规目的和拥有者内心的平静而指示储存库中的数据有效。
每个磁盘库存储具有有效日期的数据,并且当达到有效期或者存在存储装置可能马上有故障的指示时将数据从一个物理磁盘移动到另一个。
应当注意虽然本申请的讨论指向作为独立备份和存储系统的直接连接至本地区域或者企业网络的备份和存储介质,但本发明的原理可以适合于在连接至存储区域网络或者广域网的备份和存储系统中使用并提供好处。而且,存储机构可以是任何现有技术中已知的这些机构。
参考附图和后附描述可以更好地理解根据本发明的用于提供计算机化数据的备份和存储的系统和方法的原理和操作。
在详细解释本发明的实施例之前,应当理解本发明的应用不限于下面描述所阐述的或者附图所图解的组件的详细设计和安排。本发明能够是其它实施例或者以各种方式来实现或实施。同样,应当理解本申请所使用的词语和术语是出于描述目的而不应当被认为是限制。
本发明的实施例可以包含具有各种计算机硬件组件的通用或者专用计算机系统,其在下面被更加详细地讨论。本发明保护范围内的实施例还包括计算机可读介质用以执行或者具有存储在其上的计算机可执行指令、计算机可读指令或者数据结构。这样的计算机可读介质可以是任何可用的介质,其可被通用或者专用计算机系统访问。以示例的方式而不是限制,这样的计算机可读介质包括物理存储介质(例如RAM、ROM、EPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储装置),或者任何其它介质,所述任何其它介质能够用来执行或者存储以计算机可执行指令、计算机可读指令或者数据结构的形式的期望程序代码单元并且可被通用或者专用计算机系统访问。
在该描述以及下面的权利要求中,“网络”被定义为两个或更多计算机系统可以交换数据的任何结构体系。交换的数据可以是对于两个或更多计算机系统有意义的电子信号形式。当通过网络或者其它通信连接(或者硬连线、无线或者硬连线或无线的组合)传输或者提供数据给计算机系统或者计算机装置时,连接可以被适当地看作计算机可读介质。因此,任何这样的连接可以被适当地定义为计算机可读介质。上述的组合也应当被包括在计算机可读介质的范围内。计算机可执行指令包含,例如,导致通用计算机系统或者专用计算机系统执行特定功能或者一组功能的指令和数据。
在该描述和下面的权利要求中,术语“计算机”或者“计算机系统”被定义为一个或多个软件模块、一个或多个硬件模块、或者它们的组合,所述模块或组合共同工作以在电子数据上执行操作。例如,计算机系统的定义包括个人计算机的硬件组件,以及软件模块(如个人计算机的操作系统)。模块的物理布置不重要。计算机系统可以包括经由计算机网络耦合的一个或多个计算机。同样,计算机系统可以包括内部模块(如存储器和处理器)共同工作以在电子数据上执行操作的单个物理装置(如移动电话或者个人数字助理“PDA”)。
本领域技术人员将会理解本发明可以被实现在具有多种类型的计算机系统结构的网络计算环境中,包括移动电话、PDA、传呼机、手持装置、膝上型电脑、个人计算机、多处理器系统、基于微处理器或者可编程消费电子装置、网络PC、小型计算机、大型计算机等等。本发明还可以实现在本地和远程计算机系统通过通信网络连接(或者通过硬连线连接、无线连接,或者硬连线或无线连接的组合)共同执行任务的分布式计算环境中。在分布式计算环境中,程序模块可以位于本地和远程存储器和存储装置中。
本发明的系统和方法的实现包括以手动、自动或其组合的方式来执行或者完成所选任务或步骤。而且,根据本发明的系统和方法的优选实施例的实际装置和设备,多个所选步骤可以由硬件或者由软件在任何固件的任何操作系统或其组合上实现。例如,作为硬件,本发明的所选步骤可以实现为芯片或者电路。作为软件,本发明的所选步骤可以实现为由计算机使用任何合适的操作系统来执行的多个软件指令。在任何情况下,本发明的系统和方法的所选步骤可以被描述为由数据处理器(如用于执行多指令的计算平台)来执行。
现在参考附图,图1图解了根据本发明实施例的网络环境10。网络环境10包括网络100(例如LAN),工作站计算机106,服务器108,以及备份和存储系统101,根据本发明的实施例,所述备份和存储系统101执行在附连至服务器108的产品存储装置114上存储的产品数据的备份。备份和存储系统101或者库存储装置101通过网络接口104附连至网络100,并且包括主存储介质110和辅助存储介质112,例如,磁存储盘。适合于本发明实施例的服务器108是HP ProLiant DL380G4服务器。实现主存储介质110和辅助存储介质112的库存储装置例如是,提供多达64T字节存储的EMC CLARiiON CX500(EMC公司,Hopkinton,马萨诸塞州,美国)。
现在参考图2,其图解了简化示意的备份和存储系统101。备份和存储系统101包括:处理器201,包括存储器总线207以在随机访问存储器209中存储信息的存储机构,以及通过外设总线203可操作地连接至处理器201的网络接口104。备份和存储系统101还包括数据输入机构205,例如来自程序存储装置213(例如光盘)的磁盘驱动。数据输入机构205通过外设总线203可操作地连接至处理器201。接口215(例如SCSI)通过外设总线203连接主存储介质110和辅助存储介质112至处理器201。辅助存储介质112被示意性地显示为被划分为存储仓位217。存储仓位可以实现为辅助存储介质112内共同管理的多个单独磁盘或者单个大磁盘中的不同分区。
现在参考图3,其是系统101中的抽象层30的简化图。最低抽象层是包括物理操作(例如主存储介质110和辅助存储介质112上的读取和写入)的物理层309。物理层309操作由接口层307(例如SCSI)来控制。上述接口层307是内核层、管理卷的卷管理器305以及管理主存储介质110上的文件的文件系统管理器303。应用层301对于用户应用程序是可访问的。根据本发明的实施例,仅限于层307来访问辅助存储介质112并且来自层301、303和305的对辅助存储介质112的访问仅仅由接口层307中操作的驱动器(例如SCSI)仲裁后才被许可。用于辅助存储介质112的WORM管理器优选地由SCSI驱动器在层307中实现。SCSI驱动器用来控制和监控对辅助存储介质112的全部读取/写入操作。
对储存库数据的另一层次的保护通过辅助存储介质112的保护来获得,所述辅助存储介质112的保护是在允许本发明实施例识别为存储装置的辅助存储介质112中放置签名。
现在参考图4,一个根据本发明实施例的备份程序40的简化流程图。备份通常是存储在主存储介质110上的一个或多个数据文件。备份经常在快照启动时执行,并且存储在主存储介质中的文件被复制到辅助存储介质112的存储仓位。当备份程序启动(步骤401),在辅助存储介质112分配一个或多个存储仓位217(步骤403)。如果使用中的活动存储仓位217已满,新的存储仓位可选地被创建和分配。针对读取和写入操作安装(步骤405)存储仓位217。以直接附连到服务器计算机108的存储装置114为例执行备份(步骤407)并且复制数据文件至主储存库110以及相应的文件至辅助存储介质112上所分配的存储仓位217。当所有指定的文件被备份和验证,备份程序结束(步骤409)并且一个或多个存储仓位217被拆卸(步骤411)以阻止任何进一步的读取或者写入操作。
现在参考图5,图解了根据本发明示例性实施例的验证和恢复过程50的流程图。在数据的备份副本被保持在辅助存储介质112的很长一段时间期间内,存在处理数据的多个程序。优选地,数据的备份副本被保持在拆卸的存储仓位217中,并且仅仅在需要时针对读取操作而被访问和安装。在辅助存储介质112中存储仓位217被分区(步骤502)和分配,存储仓位217针对读取/写入操作被安装(步骤405)并且来自主存储介质110的数据文件的副本被存储在存储仓位217中。周期性地,经过很长的一段时间期间(例如几年),并且优选地作为背景任务,存储仓位217仅仅针对读取操作被安装(步骤508)。针对存储在主存储介质110的原始数据和存储在存储仓位217的副本计算冗余校验(例如校验和)或者指示完整性的其它参数。如果校验和相同,存储仓位被拆卸(未示出)并且接着在一段时间期间后存储仓位217仅仅针对读取操作被安装(步骤508)并且再次比较校验和(步骤510)。然而,如果校验和不同(判断框512),那么有关校验和已经改变的确定出现(判断框514),这指示或者存储在主存储介质110的数据或者辅助存储介质112上的副本损坏或者被篡改。如果辅助存储介质112上的副本具有改变的校验和,那么存储仓位217针对读取/写入操作被安装(步骤405),并且从存储在主存储介质110的数据恢复副本(步骤520)。如果存储在主存储介质110的数据具有改变的校验和(判断框514),那么从辅助存储介质112上的副本恢复数据(步骤518)。在验证和恢复过程50的步骤之间,没有用于读取和写入的存储仓位优选地被拆卸(未示出)。
现在参考图6,其图解了根据本发明实施例的日志记录过程60。当存储仓位217针对只读操作被安装时(步骤508),日志记录过程60优选地满足WARM(单写多读)的规定要求,优选地以具有时戳的方式打开日志并且优选地日志记录全部读取操作(步骤607)。当存储仓位217针对读取/写入操作被打开(步骤405),针对读取和写入操作打开日志。写入操作被日志记录(步骤605)并且读取操作被日志记录(步骤607)。在读取或者写入操作完成后,可选地以时戳的方式,关闭该一个或多个日志(步骤609),并且存储仓位217被拆卸(步骤609)。
出于审核目的,以日志(步骤605、607)和/或文档形式记录针对写入操作的存储仓位217的安装通常通过写入仅仅由执行读取和写入操作的专用内核驱动器来访问的一个或多个存储仓位217L来执行。可替换地,针对审核目的的日志(步骤605、607)或其它文档形式的记录可以通过写入其它WORM介质(如没有擦除能力的读/写光盘驱动器205中的光盘213)来执行。
现在参考图7,图解了根据本发明实施例的存储仓位修复过程70。当在存储仓位217中检测到或者怀疑有故障时(步骤701),修复过程70被启动。新存储仓位217被分配(步骤703),新分配的存储仓位217针对读取/写入操作被安装(步骤405)。从主存储介质110复制数据至新存储仓位217(步骤707)。新存储仓位在需要时被拆卸(步骤709)或者针对只读而安装。
图8图解了根据本发明实施例的清除操作。存储仓位217针对读取/写入操作被安装并且删除存储仓位和可选地存储仓位217的分区中的数据(步骤803)。
虽然结合有限数目的实施例描述了本发明,但会理解本发明的许多变化、修改和其它应用可以被做出。

Claims (20)

1.一种用于在包括附连至计算机网络的计算机的备份装置中存储的计算机化数据的验证和恢复的计算机方法,所述备份装置包括可操作地连接至计算机的主存储介质,所述主存储介质存储所述计算机化数据,所述方法包含如下步骤:
(a)将辅助存储介质分区为多个存储仓位,其中每个所述存储仓位可选地或者可操作地附连至所述计算机或者可操作地从所述计算机拆卸;
(b)在至少一个所述存储仓位中存储所述计算机化数据的副本后,单独地针对读取操作可操作地附连所述至少一个存储仓位并且保持具有所述副本的至少一个参数的存储值;
(c)周期性地比较所述存储值和所述计算机化数据的所述至少一个参数的相应值;以及
(d)在检测到所述存储值和所述相应值之间的差异时:其中所述差异源自于所述计算机化数据时从所述副本恢复计算机化数据,并且其中所述差异源自于所述副本时,可选地或者:(i)从计算机化数据恢复所述副本或者(ii)在另一个至少一个所述存储仓位中恢复计算机化数据的另一个副本。
2.如权利要求1所述的方法,进一步包含步骤:
(e)为了更新所述副本,单独地针对写入操作可操作地附连所述至少一个存储仓位。
3.如权利要求2所述的方法,进一步包含步骤:
(f)出于审核目的,以文档形式记录每次所述(e)步骤可操作地附连的情况。
4.如权利要求1所述的方法,在所述存储之前,进一步包含步骤:
(e)针对写入操作可操作地附连所述至少一个存储仓位;
(f)通过写入所述计算机化数据的更新副本至所述至少一个存储仓位来备份所述计算机化数据;以及
(g)在完成所述备份后,单独地针对读取操作可操作地附连所述至少一个存储仓位。
5.如权利要求1所述的方法,进一步包含步骤:
(h)以具有时戳的日志形式记录所述辅助存储介质上的全部写入操作。
6.如权利要求1所述的方法,进一步包含步骤:
(h)以具有时戳的日志形式记录来自所述辅助存储介质的全部读取操作。
7.如权利要求1所述的方法,其中当写入所述至少一个存储仓位时检测到故障时,则执行所述(ii)步骤恢复另一个副本。
8.如权利要求1所述的方法,进一步包含步骤:
(e)加密所述辅助存储介质,从而阻止使用全部运行在计算机上的操作系统、文件系统管理器和卷管理器中的任何一种对所述辅助存储机构的访问。
9.如权利要求8所述的方法,进一步包含步骤:
(f)通过使用控制所述辅助存储介质的每次读取和写入操作的软件驱动器经由单输入/输出接口单独地访问所述辅助存储介质来执行所述加密。
10.如权利要求8所述的方法,进一步包含步骤:
(f)通过在所述辅助存储介质中放置私有签名来执行所述加密,从而相对于操作系统、文件系统管理器和卷管理器而隐藏所述辅助存储介质的内容。
11.如权利要求1所述的方法,其中所述存储值和所述至少一个参数的所述相应值包含所述副本和所述计算机化数据的全部文件的各自的校验和。
12.一种包含计算机、主存储装置和被划分为多个存储仓位的辅助存储装置的备份装置,其执行如权利要求1所述的方法步骤。
13.一种包括附连至计算机网络的计算机的备份装置,所述备份装置包括可操作地连接至计算机的主存储介质,所述主存储介质存储计算机化数据,所述备份装置包含:
(a)被划分为多个存储仓位的辅助存储介质,其中每个所述存储仓位可选择地或者可操作地附连至所述计算机或者可操作地从所述计算机拆卸;以及
(b)所述计算机的处理器,其在至少一个所述存储仓位中存储所述计算机化数据的副本后,单独地针对读取操作可操作地附连所述至少一个存储仓位并且保持具有所述副本的至少一个参数的存储值,其中所述处理器周期性地比较所述存储值和计算机化数据的所述至少一个参数的相应值并且在检测到所述存储值和所述相应值之间的差异时:其中所述差异源自于所述计算机化数据时从所述副本恢复计算机化数据并且其中所述差异源自于所述副本时,可选地或者:(i)从计算机化数据恢复所述副本或者(ii)在另一个至少一个所述存储仓位中恢复计算机化数据的另一个副本。
14.如权利要求13所述的备份装置,其中所述存储值和所述至少一个参数的所述相应值包含所述副本和所述计算机化数据的全部文件的各自的校验和。
15.如权利要求13所述的备份装置,进一步包含:
(c)为了更新所述副本,针对写入操作可操作地附连所述至少一个存储仓位的机构。
16.如权利要求13所述的备份装置,进一步包含:
(c)以文档形式记录每次针对写入操作可操作地附连所述至少一个存储仓位的情况的日志机构。
17.如权利要求13所述的备份装置,进一步包含:
(c)加密所述辅助存储介质并且从而阻止使用全部运行在计算机上的操作系统、文件系统管理器和卷管理器中的任何一种对所述辅助存储机构的访问的加密机构。
18.如权利要求17所述的备份装置,其中所述加密机构包括控制通过单输入/输出接口到所述辅助存储介质的每次读取和写入操作的软件驱动器。
19.如权利要求17所述的备份装置,其中所述加密机构在所述辅助存储介质中放置私有签名,从而对于全部运行在计算机上的操作系统、文件系统管理器和卷管理器而隐藏所述辅助存储介质的内容。
20.一种机器可读的程序存储装置,有形地实现可由权利要求1的计算机执行的程序指令,以执行权利要求1的方法步骤,用于计算机化数据的验证和恢复。
CN200780004556.6A 2006-02-06 2007-01-25 磁盘的长期备份 Expired - Fee Related CN101501653B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US76518906P 2006-02-06 2006-02-06
US60/765,189 2006-02-06
PCT/IL2007/000099 WO2007091237A2 (en) 2006-02-06 2007-01-25 Long term backup on disk

Publications (2)

Publication Number Publication Date
CN101501653A true CN101501653A (zh) 2009-08-05
CN101501653B CN101501653B (zh) 2012-04-04

Family

ID=38345530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780004556.6A Expired - Fee Related CN101501653B (zh) 2006-02-06 2007-01-25 磁盘的长期备份

Country Status (4)

Country Link
EP (1) EP1982261A2 (zh)
JP (1) JP2009526286A (zh)
CN (1) CN101501653B (zh)
WO (1) WO2007091237A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102356384A (zh) * 2011-08-23 2012-02-15 华为技术有限公司 一种检测数据可靠性的方法和装置
CN106375397A (zh) * 2016-08-30 2017-02-01 孟玲 一种适于大数据的消费信息备份管理系统
CN109362236A (zh) * 2018-08-31 2019-02-19 深圳大学 基于双云端的数据安全存储方法、装置、设备及存储介质
CN111179977A (zh) * 2018-11-09 2020-05-19 中天科技光纤有限公司 数据存储介质及其制备方法和应用方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5118499B2 (ja) * 2008-01-30 2013-01-16 日立コンピュータ機器株式会社 データ比較装置
JP2012511757A (ja) * 2008-12-12 2012-05-24 エフ.ホフマン−ラ ロシュ アーゲー 分析装置のデータ管理方法、分析装置、分析装置を備えるシステム
US8224780B2 (en) * 2010-06-15 2012-07-17 Microsoft Corporation Checkpoints for a file system
CN110703985B (zh) * 2016-10-25 2021-05-18 华为技术有限公司 一种数据同步方法及带外管理设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6785695B1 (en) * 2000-10-19 2004-08-31 International Business Machines Corporation System and method for operational assistance during system restoration
US6757695B1 (en) * 2001-08-09 2004-06-29 Network Appliance, Inc. System and method for mounting and unmounting storage volumes in a network storage environment
DE60321927D1 (de) * 2002-09-10 2008-08-14 Exagrid Systems Inc Datenschutzverfahren und vorrichtung
US7568080B2 (en) * 2002-10-07 2009-07-28 Commvault Systems, Inc. Snapshot storage and management system with indexing and user interface
US7278080B2 (en) * 2003-03-20 2007-10-02 Arm Limited Error detection and recovery within processing stages of an integrated circuit
JP2004355304A (ja) * 2003-05-29 2004-12-16 Hitachi Ltd 情報端末アップデートシステム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102356384A (zh) * 2011-08-23 2012-02-15 华为技术有限公司 一种检测数据可靠性的方法和装置
WO2012119410A1 (zh) * 2011-08-23 2012-09-13 华为技术有限公司 一种检测数据可靠性的方法和装置
CN102356384B (zh) * 2011-08-23 2013-04-24 华为技术有限公司 一种检测数据可靠性的方法和装置
US9195543B2 (en) 2011-08-23 2015-11-24 Huawei Technologies Co., Ltd. Method and device for detecting data reliability
CN106375397A (zh) * 2016-08-30 2017-02-01 孟玲 一种适于大数据的消费信息备份管理系统
CN109362236A (zh) * 2018-08-31 2019-02-19 深圳大学 基于双云端的数据安全存储方法、装置、设备及存储介质
CN111179977A (zh) * 2018-11-09 2020-05-19 中天科技光纤有限公司 数据存储介质及其制备方法和应用方法

Also Published As

Publication number Publication date
EP1982261A2 (en) 2008-10-22
JP2009526286A (ja) 2009-07-16
CN101501653B (zh) 2012-04-04
WO2007091237A2 (en) 2007-08-16
WO2007091237A3 (en) 2009-04-16

Similar Documents

Publication Publication Date Title
US8311985B2 (en) Remote backup and restore system and method
CN101501653B (zh) 磁盘的长期备份
US7509357B2 (en) Transparent file restore
US8037347B2 (en) Method and system for backing up and restoring online system information
US7523149B1 (en) System and method for continuous protection of working set data using a local independent staging device
US8335768B1 (en) Selecting data in backup data sets for grooming and transferring
US7461101B2 (en) Method for reducing data loss and unavailability by integrating multiple levels of a storage hierarchy
US7987325B1 (en) Method and apparatus for implementing a storage lifecycle based on a hierarchy of storage destinations
US20020056031A1 (en) Systems and methods for electronic data storage management
US7913116B2 (en) Systems and methods for incremental restore
US7401197B2 (en) Disk array system and method for security
US8301602B1 (en) Detection of inconsistencies in a file system
US7441153B1 (en) Method and system for secure and reliable event logging
US20080155319A1 (en) Methods and systems for managing removable media
US7529966B2 (en) Storage system with journaling
US9934106B1 (en) Handling backups when target storage is unavailable
US20140279913A1 (en) File system replication
Dudjak et al. Survey of database backup management
Mcdowall Computer (In) security–2: Computer system backup and recovery
Beech The evolving role of disk and tape in the data center
Bas Data Backup and Archiving
Stamenkovića et al. Privacy policy and data archiving in organizations of the Republic of Serbia and the countries of the European Union
Cathey et al. Backup and recovery
Nelson Introduction to Backup and Recovery
Bacik Tape Backup Considerations

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120404

Termination date: 20130125