CN1867902A - 仿真存储系统 - Google Patents

仿真存储系统 Download PDF

Info

Publication number
CN1867902A
CN1867902A CNA2004800254750A CN200480025475A CN1867902A CN 1867902 A CN1867902 A CN 1867902A CN A2004800254750 A CNA2004800254750 A CN A2004800254750A CN 200480025475 A CN200480025475 A CN 200480025475A CN 1867902 A CN1867902 A CN 1867902A
Authority
CN
China
Prior art keywords
data
file
numerous
backup
data files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800254750A
Other languages
English (en)
Other versions
CN100483365C (zh
Inventor
米克洛斯·桑多菲
蒂姆米·格兰特·瑞特
尤里·卢伯林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sepaton Inc
Original Assignee
Sepaton Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sepaton Inc filed Critical Sepaton Inc
Publication of CN1867902A publication Critical patent/CN1867902A/zh
Application granted granted Critical
Publication of CN100483365C publication Critical patent/CN100483365C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/06Addressing a physical block of locations, e.g. base addressing, module addressing, memory dedication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/16Protection against loss of memory contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99955Archiving or backup

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种包括以下步骤的方法,新建包括第一众多的数据文件(F1-F4)的完整备份数据集(230);新建包括第二众多的数据文件(F2′-F3′)的至少一个增量备份数据集(230a);确定第一和第二众多数据文件中的每一份数据文件(F1-F5)的最新拷贝,存储众多指示符,每个指示符都在完整的备份数据集和至少一个增量数据集之一中标示每一份数据文件的最新拷贝的存储位置,并且,在众多的指示符的基础上,新建与第一和第二众多数据文件中的每一份数据文件(F1-F5)的最新拷贝相对应的合成完整备份数据集(234)。

Description

仿真存储系统
背景
发明领域
本发明的各个方面涉及数据存储,更加确切地说,涉及用于仿真磁带存储系统以提供使用现有的完整备份和以后的增量完整备份的等同物,并使终端用户能够从所述备份中恢复数据。
现有技术
许多计算机系统包括一个或多个主机和一个或多个数据储存主机所使用的数据的存储系统。这些主机和存储系统一般通过例如光纤通道、以太网络或其他类型的通信网络的网络连接在一起。光纤通道是一种结合了以通道为基础的传送机制的速度和以网络为基础的传送机制的灵活性的标准,并允许多个启动通过网络与多个目标通信,所述启动和目标可以是与网络耦合的任何设备。光纤通道通常使用快速的传送介质执行,举例来说,光学纤维电缆,而且在传送大量数据的存储网络中,所述光纤通道是普遍的选择。
典型的网络化计算环境的实施例,包括如附图1所示的几个主机和备份存储系统。一个或多个应用程序服务器通过局域网103(LAN)耦合到多台用户计算机104上。应用程序服务器102和用户计算机104都可能被认为是“主机”。应用程序服务器102通过存储区域网络108(SAN)与一个或多个主存储设备106耦合。主存储设备106可能是,例如磁盘阵列,可以从例如EMC公司、IBM公司以及其他类似的公司获得。作为替代,数据传输总线(未显示)或其他网络连接可能提供应用程序服务器和主存储系统106之间的相互连接。数据传输总线和/或光纤通道网络的连接可以使用协议操作,例如小型计算机系统接口(SCSI)协议,SCSI控制某种格式的信息包在主机(例如,应用程序服务器102)和存储系统106之间传输。
人们将理解,附图1举例说明的网络化计算环境是大型系统的典型,例如,大的金融机构或大公司所使用的系统。人们将领会到许多网络化计算环境不是必须包括附图1中列举的所有部件。例如,较小的网络化计算环境可以简化为包括与主机直接连接的,或通过LAN连接的存储系统。另外,尽管附图1举例说明了单独的用户计算机104、应用程序服务器102和介质服务器114,这些功能可以合并为一台以上的计算机。
除了主存储设备106之外,许多网络化计算环境包括至少一个辅助或备份存储系统110。所述备份存储系统110通常是磁带库,尽管可能使用其他大容量的、可靠的辅助存储系统。典型地,这些辅助存储系统的速度比主存储系统的速度慢,但是包括可移动的介质的某些类型(例如,磁带、磁盘或光盘),所述可再移动的介质可以被移动和异地存储。
在解释性的实施例中,应用程序服务器102或许能够通过例如以太或其他通信连接112直接与备份存储系统110通信。然而,所述的连接可能相对慢并且占用资源,例如占用处理器时间或网络带宽。因此,用于举例说明的系统可能包括一个或多个介质服务器114,所述介质服务器114使用例如光纤通道介于SAN108和备份存储系统之间提供通信连接。
介质服务器114可以运行包括备份/恢复应用程序的软件,所述应用程序控制主机(例如用户计算机104,介质服务器114,和/或应用程序服务器102)、主存储设备106和备份存储系统110之间的数据的传输。备份/恢复应用程序可以从例如Veritas,Legato以及其他的公司获得。对于数据的保护,来自各种不同的主机和/或主存储设备的数据在网络化计算系统中可以通过备份/恢复应用程序被周期性地备份到备份存储系统110中,这在本领域内是公知的。
当然,正如上文中的讨论,人们将领会到与附图1中展示的作为典范的网络化计算环境相比,许多网络化计算环境可能是较小的并包括较少的部件。因此,人们仍将领会到,介质服务器114实际上与单独的主机中的应用程序服务器112连接,而且备份/恢复应用程序可以在任何与备份存储系统110耦合(直接地或间接地,例如通过网络)的主机上执行。
典型的备份存储系统的一个例子是磁带库,该磁带库包括若干磁带盒和至少一个磁带机,和控制磁带盒的载入磁带机和从磁带机上卸载的自动机械装置。备份/恢复应用程序对自动机械装置提供指令以确定特定磁带盒的位置,例如磁带号0001,和将磁带盒载入磁带机以致数据能够写入磁带中。备份/恢复应用程序也可控制写入磁带的数据的格式。典型地,备份/恢复应用程序可以使用SCSI命令,或其他标准化命令,以指令自动机械装置并控制磁带机将数据写入磁带和恢复来自磁带的已经写入的数据。
传统的磁带库备份系统存在若干问题,包括速度、可靠性和固定容量。许多大的公司每周需要备份万兆字节的数据。然而,即使昂贵的、高端磁带通常只能够以30-40兆字节/秒(MB/s)的速度读/写数据,转换为大约50千兆字节/小时(GB/hr)。因此,将一个或两个万兆字节的数据备份到磁带备份系统中可能需要至少10-20小时的连续的数据转换时间。
另外,大多数的磁带制造商不能保证存储(或恢复)数据到/从磁带的可能性,如果磁带丢失(在移动或载入操作期间磁带丢失,可能由于人们的操作或自动机械装置的原因相对频繁地发生在典型的磁带库中)或如果磁带暴露在非理想的环境,举例来说,极端的温度或湿度中。因此,需要大量的努力使存储磁带在一个能控制的环境中。而且,磁带库的复合机构(包括自动机械装置)的维护昂贵,而且个别的磁带盒相对昂贵而且具有有限的使用期限。
发明内容
本发明的实施方案提供的备份存储系统克服或缓解传统的磁带库系统的某些或全部问题,而且可以比传统的磁带库系统提供更多的灵活性。
概括地说,本发明的实施方案的各个方面提供以随机存储为基础的存储系统,所述存储系统仿效传统的磁带备份存储系统,以致备份/恢复应用程序所识别到的设备和介质与真实的磁带库一样。本发明的存储系统使用软件和硬件以仿真真实的磁带,并用一个或更多的随机存储磁盘阵列替代,将磁带格式、线性的、顺序数据转变适合于存储在磁盘上的数据。
依据本发明的实施方案的某些方面,提供的装置用于解码现有的备份数据集和将元数据(举例来说,表示用户信息的数据)储存于可查询的元数据高速缓冲存储器的装置,所述装置允许查询和/或阅读元数据高速缓冲存储器中的文件或目标,而且所述装置借助网络连接和典型的备份软件的操作,从现有的备份策略所存储的数据下载这些文件或目标。也可能包括通过现有的鉴别装置来鉴别用户的装置,和用于将元数据高速缓冲存储器的视图限制在当前用户的证书的基础上的装置。
依据本发明的其他方面和实施方案,提供用于完成元数据高速缓冲存储器中的多个编码磁带表达的逻辑合并的装置,和用于适当地标记和条形编码新的合成的磁带以致磁带可以被备份/恢复软件作为有效的数据集接受的装置。而且,依据本发明的实施方案的进一步的方面,提供的装置既存储表示合成的磁带的数据元素的多次拷贝,也可以用于只将指针存储在元数据高速缓冲存储器中的现有数据中。
依据一个实施方案,包括新建完整的备份数据集的步骤的方法,所述完整的备份数据集包含第一众多数据文件,新建至少一个包含第二众多数据文件的增量备份数据集,确定第一和第二众多数据文件中的每一份数据文件的最新拷贝,存储多个指示符,每一个指示符在完整的备份数据集和至少一个增量备份数据集之一中标示第一和第二众多数据文件中的每一份数据文件的最新拷贝的存储位置,并新建合成的完整的备份数据集,所述合成的完整的备份数据集对应于建立在多个指示符的基础上的第一和第二众多数据文件中的每一份数据文件。
在一个实施方案中,方法进一步包括存储元数据的步骤,所述元数据与在可查询的元数据高速缓冲存储器中的第一和第二众多数据文件中的每一份数据文件相关联。在另一个实施方案中,确定最新拷贝的步骤包括分析与第一和第二众多数据文件的每一份数据文件关联的元数据以确定第一和第二众多数据文件的每一份数据文件的最新拷贝。依据另一个实施方案,方法进一步包括提供界面的步骤,以允许用户查找可查询的元数据高速缓冲存储器以确定在第一和第二众多数据文件之一的至少一个数据文件的最新拷贝的位置,其中提供界面的步骤可能也包括提供允许用户使用该界面下载和恢复至少一份文件数据的最新拷贝的界面的步骤。
在其他的实施例中,方法进一步包括分析现有的完整备份数据集和增量数据集或分析两者之一的步骤,以提供第一和第二众多数据文件的每一份数据文件的列表。在一个实施例中,第一众多数据文件包括第一数据文件,和其中第二众多数据文件包括第一数据文件的修改的拷贝。在另一个实施例中,第二众多数据文件包括至少一份其版本并不包括在第一众多数据文件中的数据文件。
依据另一个实施方案,备份存储系统包括用于存储第一和第二众多数据文件的备份存储介质,和控制器,该控制器包括至少一个处理器,该处理器被配置以执行指令组运行上文中所描述的方法的实施方案。在另外一个实施方案中,计算机可读介质编有众多指令,所述指令在至少一个处理器(例如,存储系统的处理器)上运行上文中描述的实施方案。
在另外一个实施方案中,合成的完整备份数据集包括多个指示符,每一个指示符在现有的完整备份数据集和至少一个增量备份数据集之一中标示第一众多数据文件的最新拷贝的存储位置,其中现有的完整备份数据集包括多份数据文件中的至少一份数据文件的存储拷贝,以及其中包括众多数据文件中的保留部分的存储拷贝的至少一个增量数据集。
依据另外一个实施方案,提供从现有的完整备份数据集和增量备份数据集中新建合成的完整的备份数据集的方法,现有的完整的备份数据集包括第一众多数据文件,增量备份数据集包括第二众多数据文件。所述方法包括确定第一和第二众多数据文件的每一份数据文件的最新的版本,存储多个指示符,每一个指示符在现有的完整备份数据集和增量备份数据集之一中标示第一和第二众多数据文件的每一份数据文件的最新拷贝的存储位置,并新建对应于的第一和第二众多数据文件的每一份数据文件的最新拷贝的合成的完整的备份数据集,所述数据文件建立在多个指示符的基础上。
附图说明
附图不是根据比例绘制的。附图中,解释说明的各附图中的每一个相同的或基本相同的部分用同一数字表示。为了表示清楚,并不是每一部分都标注在每一份附图中。在附图中:
附图1是包括备份存储系统的大型网络化计算环境的一个实施例的方框图;
附图2是依据本发明的各个方面包括存储系统的网络化计算环境的一个实施方案的方框图;
附图3是依据本发明的各个方面的存储系统的一个实施方案的方框图;
附图4是举例说明依据本发明的各个方面的存储系统的一个实施方案的虚拟设计的方框图;
附图5是依据本发明的各个方面的系统文件的一个实施例的示意图;
附图6是依据本发明的各个方面的磁带目录的一个实施例;
附图7是依据本发明的各个方面新建合成完整备份的方法的一个实施例的图表描述;
附图8是依据本发明的各个方面包括合成的完整备份的备份数据集系列的一个实施例的示意图;
附图9是元数据高速缓冲存储器的结构的一个实施例的图表;
附图10是存储合成的完整备份数据集的虚拟编码磁带的一个实施例的图表;以及
附图11是存储合成的完整备份数据集的虚拟编码磁带的另一个实施例的图表。
具体实施方式
下面结合相应的附图对各种不同的实施方案和方面进行更加详细的描述。人们将领会到,本发明并不将其应用限制在下文中阐述的部件的结构和布置或附图中解释说明的细节中。本发明适用于其他的实施方案并能够以各种不同的方式实践和执行。而且,本文中使用的措辞和术语是出于描述的目的,而不能被认为是限制。“包括”、“包括”、“具有”、“包含”、“涉及”的使用和它们的联合使用,这些措辞和术语的使用是指包含其后所列出的项目和等同意思以及附件的项目。
正如本文中使用的术语“主机”是指任何至少具有处理器的计算机,举例来说,个人计算机、工作站、大型机、网络客户和服务器等等,所述主机能够与其他的设备通信,例如,存储系统或其他主机。主机可能包括介质服务器和应用程序服务器(如前面结合附图1的描述)以及用户计算机(可能是用户工作站、个人计算机、大型机等等)。另外,在公开的文件中,术语“网络化计算环境”包括任何计算环境,其中多台主机被连接到一个或多个共享的存储系统中,在这种方式中,存储系统可以与每一台主机通信。光纤通道是通信网络的一个实施例,所述通信网络可以用于本发明的实施方案中。然而,人们将领会到,本文描述的网络并不限于光纤通道,而且各种不同的网络部件可能通过任何的网络连接而互相通信,举例来说,Token Ring或以太,而不是,或者除光纤通道以外,或通过不同的网络连接的结合。而且,本发明的各个方面可能也被用在数据传输总线拓扑,例如,SCSI或并联的SCSI。
依据本发明的各种不同的实施方案和各个方面,提供的虚拟可移动介质库备份存储系统可以使用一个或多个磁盘阵列,以存储系统为基础模拟可移动的介质。使用本发明的实施方案,数据可以备份到磁盘阵列是通过使用类似的备份/恢复应用程序完成的,正如被用于备份数据到可移动的介质(举例来说,磁带、磁盘、光盘等等),免除了用户必须对现有的备份程序作出任何修改或调整或购买新的备份/恢复应用程序。在一个实施方案中,本文详细描述的,可再移动介质被仿真为磁带,而且本发明的备份存储系统仿效的磁带库系统包括磁带和在传统的磁带库系统中用于处理磁带的自动机械装置。
依据本发明的各个方面的存储系统包括界面与主机(运行备份/再保存应用)结合的硬件和软件,和备份存储介质。所述存储系统可以被设计为仿真磁带,或其他类型的可再移动存储介质,以致于备份/恢复应用程序将所述装置视为真实的磁带库,并将线性、顺序数据、磁带格式数据转换为适合于存储到随机存储磁盘中的数据。以所述方式,本发明的存储系统可以提供增加的功能(举例来说,允许用户查询个别备份的用户文件,如下文所讨论的)而不要求新的备份/恢复应用软件或策略。
参考附图2,以方框图的形式解释说明依据本发明的方面包括备份存储系统170的网络计算机环境的一个实施例。正如举例的那样,主机120通过网络连接121与存储系统170耦合。网络连接121可能是,例如,光纤通道连接以允许介于主机120和存储系统170之间的数据的高速传递。人们将领会到,主机120可能是,或可能包括一个或多个应用程序服务器102(参见附图1)和/或介质服务器114(参见附图1)并且可能促使数据或者从网络计算机环境中现有的任何一台计算机或者从主要的存储设备110(参见附件1)备份。另外,一个或多个用户计算机136可能通过另外的网络连接138与存储系统170耦合,例如以太连接。正如以下详细的讨论,存储系统可以使用户计算机136的用户阅读和选择性的从存储系统中恢复备份的用户文件。
存储系统包括备份存储介质126,所述备份存储介质126可能是,举例来说,一个或多个磁盘阵列,正如以下更为详细的解释。备份存储介质126为来自主机120的备份数据提供实际的存储空间。然而,存储系统170可能也包括软件和附加的硬件,所述硬件仿效可移动的介质存储系统,例如,磁带库,以致在主机120上运行备份/恢复应用程序,以致于数据看起来被备份到传统的可移动式存储介质。因此,正如附图2中的解释那样,存储系统170可能包括“仿真介质”134,表示例如,虚拟的或仿真的可移动存储介质(例如,磁带)。所述“仿真介质”134通过存储系统软件和/或硬件呈现于主机,并且作为物理存储介质呈现于主机120。介于仿真介质134和实际的备份存储介质126之间的进一步的界面可能是存储系统控制器(未显示)和开关网络132,所述开关网络132接收来自主机120的数据并在备份存储介质126上存储数据,正如以下更加详细的讨论。如此,存储系统“仿真”传统的磁带式存储系统到主机120。
依据一个实施方案,存储系统可以包括“逻辑元数据高速缓冲存储器”242,所述逻辑元数据高速缓冲存储器242存储涉及从主机120备份到存储系统170的用户数据的元数据。正如本文所使用的术语“元数据”是指表示用户数据的信息,和描述真实的用户数据的属性的数据。逻辑元数据高速缓冲存储器242表示可查询的数据集,使用户和/或软件应用能够随机确定备份用户文件的位置,对比计算机用户文件与另外一个文件,和访问和处理备份用户文件。可以使用存储在逻辑元数据高速缓冲存储器242中的数据的软件应用程序的两个实施例包括合成的完整备份应用程序240和下文中将要更加全面讨论的终端用户恢复应用程序300。
概括地说,合成的完整备份应用程序240具有从一个现有的完整备份数据集和一个或多个增量备份数据集中新建合成的完整备份数据集的能力。合成的完整备份可以免除完成周期性(举例来说,每周)完整备份的需要,因此,节省可观的时间和网络资源。合成的完整备份应用程序240的细节将在下文中做更进一步的讨论。终端用户恢复应用程序300,也将在下文中做更进一步的讨论,使终端用户(举例来说,用户计算机136的操作人员)能够浏览、查询、阅读和/或恢复以前从存储系统170中备份的用户文件。
正如上文所讨论的,存储系统170包括主机120和备份存储介质126之间的界面的硬件和软件。结合本发明的实施方案的硬件和软件可以仿真传统的磁带库备份系统,从主机的120的角度看,数据显然备份到磁带上,但是实际上备份到另外一个存储介质中,举例来说,例如,众多磁盘阵列。
参考附图3,用方框图的形式解释依据本发明的各方面的存储系统170的一个实施方案。在一个实施例中,存储系统170的硬件包括存储系统控制器122和连接存储系统控制器122到备份存储介质126的开关网络132。存储系统控制器122包括处理器127(可能是单个的处理器或多个处理器)和记忆器129(举例来说,RAM,ROM,PROM,EEPROM,闪存等等,或它们的结合)可以运行所有或部分存储系统软件。记忆器129也可以用于存储与储存在备份存储介质126中的元数据。软件(包括程序编码执行本发明的实施方案)通常存储在可读/可写的非易失性记录介质中,举例来说,RAM,ROM,光盘、磁盘或磁带等等,然后拷贝到记忆器129中,其中软件被处理器127执行。所述程序编码可能以多种编程语言中的任何一种语言来书写,举例来说,Java,Visual Basic,C,C#,或C++,Fortran,Pascal,Eiffel,Basic,COBAL,及其结合的语言,由于本发明不限于特殊的编程语言。典型地,在操作中,处理器127致使数据(举例来说,执行本发明的实施方案的编码)被从非易失性记录介质中读取到另外一种记忆形式,例如,RAM,允许以比非易失性记录介质更快的速度访问处理器的信息。
正如附图3所示,控制器122也包括一系列将控制器122和主机120连接到开关网络132的接口适配器。正如举例说明的那样,主机120通过接口适配器124a与存储系统耦合,所述接口适配器124a可能是,举例来说,光纤通道的接口适配器。通过存储系统的控制器122,主机120将数据备份到备份存储介质126中并能够恢复从备份存储介质126中备份的数据。
在示例性实施例中,开关网络132可能包括一个或多个光纤通道开关128a,128b。存储系统控制器122包括众多光纤通道接口适配器124b和124c将存储系统控制器耦合到光纤通道开关128a,128b。通过光纤通道开关128a,128b,存储系统的控制器122允许数据备份到备份存储介质126中。如附图3所举例的那样,开关网络132可以进一步包括一个或更多以太开关130a,130b,所述以太开关130a,130b通过以太接口适配器125a,125b与存储系统的控制器122耦合。在一个实施例中,存储系统控制器122进一步包括另外一种以太接口适配器125c,可以与,例如LAN103耦合,以促使存储系统170与主机(例如,用户计算机)通信,如下文中的讨论。
在附图3举例说明的实施例中,存储系统控制器122通过开关网络与备份存储介质126耦合,所述开关网络包括两种光纤通道开关和两种以太开关。提供至少两种存储系统170中的开关的每一种类型仿真任何单一的系统故障点。换句话说,即使一个开关(例如,光纤通道开关128a)失效,存储系统控制器122仍将能够通过另外一个开关与备份数据介质126通信。在稳定性和速度方面,所述安排有优势。举例来说,如上文中的讨论,稳定性通过提供备用元件和消除单一失效点得到改善。而且,在某些实施方案中,存储系统控制器能够通过使用某些或全部的并联的光纤通道开关将数据备份到备份存储介质126中,从而整体的备份数度。然而,人们将领会到,并不要求系统包括两种或更多的开关的每一种类型,也不要求开关网络既包括光纤通道也包括以太开关。更进一步,在包括单一磁盘阵列的备份存储介质126的实施例中,根本不需要开关。
正如上文中的讨论,在一个实施方案中,备份存储介质126可能包括一个或更多的磁盘阵列。在一个优选的实施方案中,备份存储介质126包括众多ATA或SATA磁盘。所述磁盘是“待售”商品,与传统的由例如EMC,IBM等制造商的存储阵列商品相比更便宜。而且,当可再移动介质(举例来说,磁带)的成本是一种因素和介质的使用寿命有限时,所述磁盘在成本上可与传统的磁带为基础的备份存储系统相比。另外,所述磁盘读/写数据实质上比磁带快。举例来说,通过单一的光纤网络连接,数据可以至少大约150MB/s的速度被备份到磁盘上,150MB/s转换为大约540GB/hr,明显快于磁带的备份速度(例如,通过磁盘顺序)。另外,几个光纤通道连接可以并联执行,从而进一步提高速度。依据本发明的实施方案,备份存储系统介质可以被集合执行任何一个RAID(廉价磁盘冗余阵列)序列。举例来说,在一个实施方案中,备份存储介质可以执行RAID-5任务。
正如上文所讨论的,本发明的实施方案仿真传统的磁带库备份系统时通过使用磁盘阵列代替磁带盒作为真实的备份存储介质来实现的,因此提供“虚拟磁带库”。真实的磁带盒出现在传统的磁带库中被本文中使用的术语“虚拟编码磁带”替代。人们将领会到,出于公开的目的,术语“虚拟磁带库”是指仿真磁带库可以在软件和/或物理硬件中执行,举例来说,作为一个或多个磁盘阵列。人们将进一步领会到,尽管讨论主要涉及仿真磁带,存储系统也可以仿真其他的存储介质,举例来说,CD-ROM或DVD-ROM,而且术语“虚拟编码磁带”一般是指仿真的存储介质,举例来说,仿真磁带或仿真CD。在一个实施方案中,虚拟编码磁带实际上对应于一个或更多的硬盘。
因此,在一个实施方案中,提供的软件界面仿真所述磁带库到备份/再保存应用,看起来数据被备份到磁带。然而,真实的磁带库被一个或多个磁盘阵列替代,以致数据实际上被备份到这些磁盘阵列中。人们将领会到,可移动介质再保存系统的其他类型可以被仿真,而且本发明不限于磁带库存储系统的仿真。以下的讨论将解释存储系统170中包括的各个方面,特征和软件的操作。
人们将认识到,尽管可能描绘的软件被“包括”在存储系统170中,并且可能被存储系统控制器122(参见附图3)的处理器127运行,并不要求所有的软件在存储系统控制器122中运行。软件程序,举例来说,合成完整备份的应用程序和终端用户恢复应用程序可以在主机和/或用户计算机上运行,在此部分可能通过全部或某些存储系统控制器、主机和用户计算机分配。因此,人们将认识到并不要求存储系统控制器包含物理实体,例如计算机。存储系统170与储存在主机中的软件通信,例如,举例来说,介质服务器114和应用程序服务器102。另外,存储系统可能包含几个能够在相同和不同的主机上运行和保留的应用软件。而且,人们将领会到,存储系统170并不限于装置的离散片断,尽管在某些实施方案中,存储系统170可以作为装置的离散片断体现。在一个实施例中,存储系统170可以提供作为自包含单元,起到“中止和开始”(举例来说,对现有的备份处理器和策略不需要作出的修改)的作用取代传统磁带库备份系统。所述存储系统单元可以被用于包括传统的备份系统的网络化计算环境以提供冗余或额外的存储能力。
正如上文中的讨论,依据一个实施方案,主机120(可能是,例如附图1中的应用程序服务器102或介质服务器114)可以通过网络连接121(举例来说,光纤连接)将数据备份到备份存储介质126中,所述网络连接121将主机120耦合到存储系统170中。人们将认识到,尽管以下的讨论将优先涉及数据在仿真介质中的备份,原理也适用于从仿真介质中再保存备份数据。主机120和仿真介质134之间的数据流可以被备份/恢复应用程序控制,正如上文中的讨论。从备份/恢复应用程序的观点来看,明显的是,数据实际上被备份到仿真介质的真实的版本中。
参考附图4,存储系统软件150可能包括一个或更多的表示仿真介质的逻辑抽象层,并提供固定在主机120中的备份/恢复应用程序140和备份存储介质126之间的界面。软件150接受来自备份/再保存应用140的磁带格式数据,并将所述数据翻译为适合于存储在随机访问磁盘(举例来说硬盘、光盘等类似的介质)中的数据。在一个实施例中,软件150在存储系统控制器122的处理器127中运行,而且可以被存储在记忆器129中(参见附图3)。
依据一个实施方案,软件150可以包括层、至于本文中涉及的虚拟磁带库(VTL)层142可以提供SCSI磁带的仿真、磁带机和用于将磁带转换为磁带机的格式和从磁带机转换为磁带的格式的自动机械装置。备份/再保存应用140可以与VTL142通信(举例来说,备份或将数据读入仿真介质中)使用例如,SCSI命令(用箭头144表示)。因此,VTL可以形成其他的存储系统软件和硬件和备份/恢复应用程序之间的软件界面,仿真存储系统介质134(附图2中)出现在备份/恢复应用程序中,并允许仿真介质作为传统的可再移动备份存储介质出现在备份/恢复应用程序中。
本文中提到的第二软件层,如文件系统层146可以提供仿真存储介质(在VTL中表示的)和真实的备份存储介质126之间的界面。在一个实施例中,文件系统146起到微调系统与备份的存储介质126之间的通信的作用,举例来说,使用SCSI命令,用箭头148表示,以从备份存储介质126中读和写数据。
在一个实施方案中,所述VTL提供一般的磁带库支持,而且可以支持任何SCSI介质的转换器。仿真的磁带设备可以包括,但不限于IBM LTO-1和LTO-2磁带设备、Quantum SuperDLT320磁带设备、Quantum P3000磁带库系统,或Storage TekL180磁带库系统。在VTL中,每一个虚拟编码磁带是文件,当数据存储时,所述文件动态增长。这与有固定尺寸的传统的磁带盒相反。一个或更多的虚拟编码磁带可以存储在系统文件中,正如下文中参考附图5的进一步描述。
在附图5中,举例说明的在文件系统软件146中数据结构的一个实施例,列举依据本发明的一个实施方案的系统文件200。在所述的实施方案中,系统文件200包括头202和数据204。所述头202可能包括标示每一个虚拟编码磁带的信息,虚拟编码磁带存储在系统文件中。不管虚拟编码磁带是否写保护,所述头可以包括的信息有,虚拟编码磁带的新建/修改数据等等。在一个实施例中,头202包括的信息唯一地标示每一个编码磁带,并从其他的储存在存储系统中的虚拟编码磁带中将每一个编码磁带区分开。举例来说,信息可能包括名称和虚拟编码磁带的标示码(对应于条形码通常在真实的磁带上表示的,以致磁带可以被自动机械装置标示的编码)。头202也可以包括额外的信息,举例来说,每一个虚拟编码磁带的容量,最近修改的数据等等。
依据本发明的一个实施方案,可以充分利用头202的大小以反映出存储数据的类型(举例来说,虚拟编码磁带表示数据从一个和更多的主机系统中备份数据)和一系列明显的系统可以跟踪的所述数据集(例如,虚拟编码磁带)。举例来说,通常备份到磁带存储系统的数据一般是用较大的数据集标识特征,代表数字系统和用户文件。由于数据集非常大,一系列被跟踪的离散数据文件可能相对小些。
相应地,在一个实施方案中,头202的大小的选择是建立在由于存储数据的太多而不能有效保持跟踪(例如,头太大)和没有空间用于存储足够数量的编码磁带的标示(例如,头太小)之间妥协的基础上。在一个可仿效的实施方案中,头202利用系统文件200的第一32MB。然而,人们将认识到,在系统需要和特征的基础上,头202可以有不同的尺寸,取决于系统的需求和容量,人们可以为头202选择不同的尺寸。
人们将领会到,从备份/恢复应用程序的观点来看,具有全部相同的属性和特征的虚拟编码磁带作为真实的磁带盒出现。换句话说,对于备份/恢复应用程序,虚拟编码磁带实质上作为写入磁带出现。然而,在一个优选的实施方案中,存储在虚拟编码磁带中的数据不是按照顺序格式储存到备份存储介质126中,而是,表面上被写入虚拟编码磁带的数据实际上是作为可以随机访问的,磁盘格式数据被储存在存储系统的文件中。元数据被用于连接存储数据到虚拟编码磁带,以致备份/恢复应用程序可以编码磁带格式来读和写。
因此,从一个优选的实施方案整体说来,用户和/或系统数据(本文中是指“文件数据”)被存储系统170从主机120上接收,并被存储在补充备份存储介质126的磁盘阵列中。软件150(参考附图4)和/或存储系统的硬件将这个文件数据以系统文件的格式写入到备份的存储介质126中,如下文中更加详细的描述。被存储系统控制器从备份文件数据中摘录的元数据用于跟踪用户和/或系统文件的属性被备份。举例来说,每一份文件的所述元数据可能包括文件名称、建立日期或文件的最近修改,任何关于文件的编有密码的信息,和其他信息。此外,通过存储系统为每一份文件建立元数据,所述元数据将文件连接到虚拟编码磁带。使用所述的元数据,软件向主机提供磁带盒的仿真;然而,实际上文件数据不是储存在磁带格式,而是存储在系统文件中,如下文中的描述。在系统文件中存储数据,而不是以顺序的编码磁带格式,可以有利于允许快速、有效和随机访问个别文件,而不要求扫描顺序数据以发现特别的文件。
正如上文中的讨论,依据一个实施方案,文件数据(例如,用户和/或系统数据)作为系统文件存储在备份存储介质中,每一个系统文件包括头和数据,数据是真实的用户和/或系统文件。每一份系统文件200的头202包括磁带目录206,所述磁带目录206包括将用户和/或系统文件连接到虚拟编码磁带的元数据。本文中术语“元数据”既不是指代用户也不是系统文件数据,而是描述真实的用户和/或系统数据的属性的数据。依据一个实施例,磁带目可以定义,向下到字节阶段,虚拟编码磁带中的数据布局。在一个实施方案中,磁带目录206具有表格结构,如附图6中所示。表格包括用于存储的信息的类型(例如数据,文件标记FM等等)的栏220,表示字节中使用的磁盘字节的大小的栏222,以及计算存储文件数据的磁盘字节的数量的栏224。因此,磁带目录允许控制器随机访问(以相反的顺序)任何存储在备份的存储介质126中的任何数据文件。举例来说,参考附图6,数据文件226可能在虚拟编码磁带中快速定位,是由于磁带目录指出了文件226的数据开始于系统文件200的初始阶段的框图。由于响应于文件标记,所述的一个框图没有大小。文件标记不是存储在系统中的,例如,文件标记对应于零数据。磁带目录包括文件标记是由于他们被传统的磁带和备份/恢复应用程序所使用,因此,沿着数据文件写入文件标记,并当浏览虚拟编码磁带时,希望看到文件标记。因此,在磁带目录中文件标记被跟踪。然而,文件标记并不代表任何数据,并因此不被存储在系统文件的数据部分。所以,文件226的数据开始于系统文件的数据部分的起始,用箭头205表示,而且它的长度是1024字节(例如,一个磁盘字节是1024字节)。人们将领会到,其他的文件数据可能存储在不是1024字节的字节中,这取决于数据的总量,例如,数据文件的大小。举例来说,对于效率而言,较大的数据文件可能使用较大的磁盘字节来存储。
在一个实施例中,磁带目录可能被包含在“文件描述符”中,所述文件描述符与备份到存储系统的每一份数据文件相联系。文件描述符包含与储存在存储系统中的数据文件204相关联的元数据。在一个实施方案中,文件描述符可能根据标准格式执行,举例来说,被大多数UNIX基础系统(多用户计算机操作系统)使用的磁带存档文件格式(一种压缩文件的扩展名)。每一个文件描述符可能包括例如,相应的用户文件的名称的信息、新建/修改的用户文件的数据、用户文件的大小,用户文件的任何访问限制等等。存储在文件描述符中的附加信息可以进一步包括描述目录结构的信息,从目录结构中可以拷贝数据。因此,文件描述符可以包括关于相应于数据文件的可查询的元数据,正如下文中更详细的讨论。
从备份/恢复应用程序的观点来看,任何虚拟的编码磁带可能包括多个文件数据和相对应的文件描述符。从存储系统软件的观点来看,数据文件存储在系统文件中,系统文件可以被链接,举例来说,特殊的备份工作。例如,备份被一台主机在特定的时间执行可以产生对应于一个或多个虚拟编码磁带的一个系统文件。虚拟编码磁带因此可能是任何大小的,当更多的用户文件被存储在虚拟编码磁带中时,虚拟编码磁带可以动态增长。
再次参考附图3,正如上文所述,存储系统170可能包括合成的完整备份软件应用240。在一个实施方案中,主机120将数据备份到仿真介质134中,形成一个或多个虚拟编码磁带。在某些计算机环境中,“完整备份”,举例来说,所有数据的备份拷贝存储在网络(参见附图1)主要的存储系统中,可能被周期性地执行(例如,每周)。由于大量的数据被拷贝,这一处理过程通常非常长。因此,在许多计算环境中,额外的备份,所说的增量备份,可能在连续的完整备份(例如,每天)之间执行。增量备份是一种过程,其中只有数据被改变,由于执行(不管是增量的或全部)最新的备份被保存。典型地,改变的数据是文件库中的备份,即使文件中的数据的大部分不被频繁地改变。因此,增量备份通常较小,从而可以比完整备份时较快完成。人们将领会到,尽管在通常每周一次执行完整备份和在一周中每天执行增量备份的许多环境,不要求使用时间表。举例来说,某种环境可能要求一天中增量备份几次。本发明的原理应用到任何使用完整备份(和随机的增量备份)的环境,而不考虑执行频率。
在完整备份处理期间,主机可以新建一个或更多的包括含有众多数据文件的备份数据的虚拟编码磁带。为了清楚说明,下面的讨论将假定完整备份只产生一个虚拟编码磁带。然而,人们将领会到,完整备份可以产生一个以上的虚拟编码磁带,本发明的原理可以应用到任何数量的虚拟编码磁带中。
依据一个实施方案,提供用于从一个现有的完整备份数据集和一个或多个的增量备份数据集新建合成完整备份数据集的方法。所述方法可以避免周期性(例如,每周)执行完整备份的要求,从而节约用户大量的时间和网络资源。更进一步说,正如本领域内的普通技术人员所知道的,在完整备份和一个或多个增量备份的基础上,恢复数据是耗时的过程,是由于,举例来说,如果文件的最新的版本存在于增量备份中,备份/恢复应用程序通常将在最新的完整备份的基础上储存文件,然后从增量备份中应用任何改变。因此,提供合成的完整备份可以具有允许备份存储应用在合成完整备份的基础上更快地保存数据文件的额外优势,不需要从完整备份和一个或更多的增量备份中完成多次保存。人们将领会到,本文中使用的词汇“最新版本”一般是指数据文件的最新拷贝(举例来说,数据文件在最近的保存时间),无论文件是否有新的版本编号。本文中使用的术语“版本”一般是指同一文件的拷贝,同一文件可以某种方式修改或可能被多次保存。
参考附图7,举例说明的合成完整备份程序的图表描述。主机120可以在第一时间执行完整备份230,举例来说,在周末。主机120可以执行连续增量备份232a,232b,232c,232d和232e,举例来说,一周中的每一天。存储系统170可以新建合成完整备份数据集234,正如下文中的描述。
依据一个实施方案,存储系统170可以包括软件应用,在本文中作为合成完整备份应用240(参考附图3)。合成完整备份应用240可以在存储系统控制器122(参考附图2)中运行或在主机120中运行。合成完整备份应用包括软件命令和新建合成完整备份数据集234所必要的界面。在一个实施例中,合成完整备份应用可以完成表示每一个完整备份数据集230和增量备份数据集232的元数据的逻辑合并,以产生新的包含合成完整备份数据集234的虚拟编码磁带。
举例来说,参考附图8,现有的完整备份数据集可以包括用户文件F1,F2,F3和F4。第一增量备份数据集232a可以包括用户文件F2′,F2的修改版本,和F3′,F3的修改版本。第二增量备份数据集232b可以包括用户文件F1′,F1的修改版本,和F2″,F2的进一步修改版本,和新的用户文件F5。因此,从完整备份数据集230和两个增量数据集232a和232b的逻辑合并中形成的合成完整备份数据集234包括每一份用户文件F1,F2,F3,F4和F5的最新版本。正如附图8所示,此处的合成完整备份数据集包括用户文件F1′,F2″,F3′,F4和F5。
再次参考附图3和4,文件系统软件146可以新建逻辑元数据高速缓冲存储器242,存储与储存在仿真介质134中每一份用户文件相关联的元数据。人们将领会到,逻辑元数据高速缓冲存储器不要求是真实的数据高速缓冲存储器,但是可能代替储存在存储介质126中的可查询收集数据。在另一个实例中,逻辑元数据高数缓冲存储器242可以作为数据库执行。元数据存储在数据库中,传统的数据库命令(例如,SQL命令)可以用于完成完整备份数据集和一个或多个增量备份数据集的逻辑合并以新建合成的完整备份数据集。
正如上文所讨论的,存储在仿真介质134上的每一份数据文件可能包括文件描述符,所述文件描述符包含与数据文件关联的元数据,包括备份存储介质126中的文件的位置。在一个实施方案中,在主机120中运行的备份/恢复应用程序保存在仿真介质134中的磁带流格式的数据。在数据结构250的实施例表现了在附图9中举例说明的磁带格式。正如上文讨论的,系统文件数据结构包括头,所述头可能包含关于数据文件的信息,例如,数据文件的文件描述符,新建和/或修改的文件数据,安全信息,文件来源的主系统的目录结构,以及其他将文件链接到虚拟编码磁带的信息。所述头与数据254关联,是真实的用户和系统文件,所述用户和系统文件已经从主机、主要的存储系统等等中备份。系统文件数据结构可能也随机地包括垫256,垫256可以适当地将下一个头对准到区域分界线。
如附图9所示,在一个实施方案中,头数据被放置在逻辑元数据高速缓冲存储器242中以允许快速的查询和随机访问连续的磁带数据格式。逻辑元数据高速缓冲存储器的使用,使用存储在系统控制器122中的文件系统软件148来完成,允许线性,连续磁带数据格式的翻译存储在仿真介质134中,进入存储在补充备份存储介质126的物理磁盘中的随机访问数据格式。逻辑元数据高速缓冲存储器242存储头252,所述头包括数据文件的文件描述符,安全信息,所述安全信息被用于控制对数据文件的访问,正如下文中更加详细的讨论,指示符256对于数据文件在虚拟编码磁带和备份存储介质126中的真实位置。在一个实施方案中,逻辑元数据高速缓冲存储器储存的数据涉及在完整备份数据集230中和增量数据集232中的每一份数据的所有的数据文件。
依据一个实施方案,合成完整备份应用软件240使用储存在逻辑元数据高速缓冲存储器中的信息来新建合成的完整备份数据集。所述合成完整备份数据集被链接到虚拟编码磁带,所述合成虚拟编码磁带由合成的完整备份应用240新建。对于备份/恢复应用程序,合成的完整备份数据集表面上看储存在合成的虚拟编码磁带中。正如上文中的讨论,合成的完整备份数据集可以通过执行现有的完整备份数据集和增量备份数据集的逻辑合并新建。逻辑合并可以包括对比每一份数据文件,每一份数据文件包含在每一个现有的完整备份数据集和增量备份数据集中,并新建每一份用户文件的最新修改的版本的合成,正如参考附图8的讨论。
依据一个实施方案,合成的虚拟编码磁带260包括指示符,所述指示符指出数据文件在其他的虚拟编码磁带中的定位,明显的是,所述虚拟编码磁带包括现有的完整备份数据集和增量备份数据集,如附图10所示。考虑到前面附图8给出的实施例,合成虚拟编码磁带260包括指示符266,该指示符266指出(用箭头268标出)用户文件F4(由于现有的完整备份数据集包括F4的最新版本)在虚拟编码磁带262中的现有完整备份数据集中的位置,和举例来说,用户文件F3′在虚拟编码磁带264中的增量数据集232a中的位置。
合成的虚拟编码磁带也可以包括包含所有的虚拟编码磁带的标示码(任选的名称)的列表270,所有的虚拟编码磁带包括被指示符266所指出数据。附属编码磁带列表270对于跟踪真实的数据是很重要的,而且防止附属的虚拟编码磁带被消磁。在所述实施方案中,合成的完整备份数据集并不包括任何真实的用户文件,但是另外的指示符组指出用户文件在备份的存储介质126中的位置。因此,需要防止真实的用户文件(存储在其他的虚拟编码磁带中)被删除。这可以通过保留包括数据的虚拟编码磁带的记录(附属编码磁带目录270),和保护所述虚拟编码磁带的每一个虚拟编码磁带免受过写或删除来部分实现。合成虚拟编码磁带也可以包括编码磁带数据272,例如,合成的虚拟编码磁带的大小,在备份存储介质126中的位置等等。另外,合成的虚拟编码磁带具有标示码和/或名称274。
依据另外一个实施方案,合成的虚拟编码磁带也可以包括指示符和真实存储的用户文件的结合。参考附图11,在一个实施例中,合成的虚拟编码磁带包括指示符266,指示符266指出数据文件(最新的版本,正如参考附图9时的讨论)在虚拟编码磁带262的现有完整备份数据集230中的位置。合成的虚拟编码磁带也可以包括数据278,数据278包含从增量数据集232中拷贝真实的数据文件,正如箭头280所示。以所述方式,在合成的完整备份数据集276新建之后,增量备份数据集可以被删除,从而节约存储空间。由于包括全部或部分指示符而不是所有用户文件的拷贝,合成的虚拟编码磁带相对小。
人们将领会到,合成的完整备份可以包括任何指示符和存储文件数据的结合,并不限于上文中给出的实施例。举例来说,合成的完整备份可以包括为一些存储在某种增量和/或完整的备份中的某些文件指出数据文件的指示符,和包括储存从其他现有的完整和/或增量备份中拷贝的数据文件。而且作为替换,合成的完整备份可以在现有的完整备份和任何相关的增量备份的基础上新建,所述增量备份不包括任何指示符,但是包括从优选的完整和/或增量备份中拷贝的真实数据文件的最新版本。
在一个实施方案中,合成完整的备份应用软件可以包括差分运算,所述差分运算能够为每一份现有的完整备份数据集和增量数据集比较用户和系统文件元数据,以确定每一份数据文件的最新版本的位置。举例来说,差分运算可以用于比较新建和/或修改的数据,版本号码(如果可用)等等,不同的备份集中的同一数据文件的不同版本选择最近的数据文件的版本。然而,用户可以打开用户文件和保存文件(从而改变修改的数据)而不需要真实的改变文件中的任何数据。因此,系统可以完成更加复杂的差分运算,可以分析系统或用户文件中的数据以确定数据是否确实被修改。所述差分运算的变换和其他可比较的运算法则的类型在本领域内是公知的。另外,正如上文中的讨论,当元数据被存储在数据库格式中,数据库命令,例如,SQL命令可以被用于执行逻辑合并。本发明可以运用任何一种所述的差分运算以确保每一份用户文件最近或最新版本被从全部的对比现有备份的数据集中挑选出来,以致适合地产生合成的完整备份数据集。
本领域内的普通技术人员将领会到,合成的完整备份应用能够新建完整的备份数据集,和可以获得而不需要主机执行真实的完整备份。不仅仅是避免加重将数据转换到备份的存储系统的主机与处理器的费用,而且在实施方案中合成的完整备份应用在存储系统中执行,可以显著减少网络宽带的利用。如附图7所示,进一步的合成完整备份数据集可以通过使用第一合成完整备份数据集234和随后的增量备份数据集236新建。在提供的显著的时间优势中,文件或目标没有被经常修改,频繁拷贝。实际上,合成的完整备份数据集可以在被刚刚拷贝的文件中保留指示符。
正如参考附图3的讨论,存储系统可以包括涉及终端用户恢复应用程序300的软件应用。因此,依据另一个实施方案,提供的用于终端用户的方法以确定和恢复备份数据,而不需要IT工作组的发明,以及不要求对现有的备份/恢复处理器和/或策略做任何改变。在典型的备份存储系统中,在主机120中运行的备份/恢复应用程序被IT工作组控制,而且对于终端用户在没有IT工作组的发明的情况下访问备份的数据来所说,是没有可能的或非常困难。依据本发明的实施方案的各个方面,提供的存储系统软件通过,举例来说,网络为基础的或其他的备份存储介质126的界面来允许终端用户确定位置和恢复文件。
人们将领会到,由于使用合成的完整的备份应用程序240,终端用户恢复应用程序300可以在存储系统的控制器122上运行(参考附图2)或在主机120上运行。终端恢复应用程序包括软件命令和允许被授权的用户查询逻辑元数据高数缓冲存储器、随机恢复、从备份存储介质126中备份的文件所必需的界面。
依据一个实施方案,提供的软件包括安装在用户计算机136上和/或在用户计算机136上执行的用户界面。用户界面可以是任何类型的允许用户确定文件在备份的存储介质中的位置的界面。举例来说,用户界面可以是绘制的用户界面,可以是以网络为基础的,或可以是正文界面。用户计算机通过网络连接138耦合到存储系统170,所述网络连接138可以是,例如,以太连接。通过网络连接138,用户计算机136的操作人员可以访问存储在存储系统170中的数据。
在一个实施例中,终端用户恢复应用程序300包括用户授权证和/或授权特征。举例来说,用户可以通过用户计算机上的用户界面,使用用户名和密码来注册。用户计算机可以与用户名和密码通信到存储系统(举例来说,到终端用户恢复应用程序)可以使用优选的用户授权装置,以决定用户是否访问过存储系统。一些用户授权装置的实施例可以包括,但是不限于,MicrosoftActive Directory服务器、Unix“黄页”服务器或标准目录访问协议。注册/用户授权装置可以与终端用户恢复应用程序通信以交换用户的特权。举例来说,某些用户可以被允许只能查询自身新建的文件,或拥有某些特权的或被当作所有人标示的文件。其他的用户,举例来说,系统操作人员或被授权的人可以访问所有的备份文件等等。
依据一个实施方案,终端用户恢复应用程序使用逻辑元数据高速缓冲存储器获得关于所有备份到备份存储介质的数据文件的信息。终端恢复应用程序通过用户界面出现在用户面前,用户文件存储的分等级的目录结构,举例来说,备份时间/数据、用户名、初始用户计算机目录结构(当文件备份时获得),或其他的文件特征。在一个实施例中,出现在用户面前的目录结构可根据用户特权来改变。终端用户恢复应用程序可以接收浏览的要求(举例来说,通过用户界面,用户可以浏览目录结构到需要的文件的位置)或用户可以通过名称、日期等查询文件。
依据一个实施方案,用户可以从存储系统中恢复备份文件。举例来说,一旦用户确定需要的文件的位置,正如上文中的讨论,用户可以通过网络连接138从存储系统中下载文件。在一个实施例中,如本领域内的普通技术人员所知的,下载程序可以对比与任何网络为基础的下载的方式进行下载。
通过允许终端用户访问允许浏览/下载的文件,和通过促使经过用户界面(例如,网络为基础的结束)的访问,终端用户恢复应用程序可以使用户查询和恢复自己的文件而无需改变任何备份策略或程序。
人们将领会到,尽管本发明的各个方面,例如合成的完整备份应用和终端用户恢复应用程序在本文中的描述主要是依据软件进行的,人们将认识到,可以改变软件、硬件或固件,或任何它们的结合。因此,举例来说,本发明的实施方案可以包括任何计算机可读介质(例如,计算机记忆器、软盘、压缩盘和磁带等等)与计算机程序编码(举例来说,众多的指令),当在存储系统的处理器上执行时,至少部分执行,完成合成的完整备份应用和/或终端用户恢复应用程序的功能如同上文中详细的描述。
一般所说,本发明的实施方案和各个方面从而包括存储系统和仿真传统的磁带备份系统的方法,但是可以提供增强的功能,举例来说,能够新建合成的备份和允许终端用户浏览和恢复备份文件。然而,人们将领会到,本发明的各个方面可以用于,而不是计算机数据的备份。因为本发明的存储系统可以用于经济地储存庞大的数据,和储存的数据可以在硬盘访问时间,以相反的顺序被随机访问,本发明的实施方案可以在传统的备份存储系统之外找到应用。举例来说,本发明的实施方案可以用于存储代表电影和音乐的更多的选择的视频或音频数据,并按照需要实现视频和/或音频。
如此描述的本发明至少一个实施方案的几个方面,人们将领会到,对于本领域内的普通技术人员来说各种改变,修改和改进将是容易发生的。所述改变,修改和改进是用来公开的一部分,在本发明的范围内。相应地,前面的描述和附图只是作为实施例。

Claims (13)

1.一种方法包括如下步骤:
新建包括第一众多数据文件的完整备份数据集;
新建包括第二众多数据文件的至少一个增量备份数据集;
确定第一和第二众多数据文件中的每一份数据文件的最新的拷贝;
存储众多指示符,每一个指示符在一个完整备份的数据集与至少一个增量数据集中标示在第一和第二众多数据文件中的每一份数据文件的最新的拷贝的存储位置;以及
新建合成的完整的备份数据集,所述的合成的完整备份数据集对应于建立在众多指示符的基础上的第一和第二众多数据文件中的每一份数据文件的最新拷贝。
2.根据权利要求1的方法,进一步包括存储元数据的步骤,所述元数据与在可查询的元数据高速缓冲存储器中的第一和第二众多数据文件中的每一份数据文件相关联。
3.根据权利要求2的方法,其中确定最新拷贝的步骤包括分析元数据以确定第一和第二众多数据文件中的每一份数据文件的最新拷贝,所述元数据与第一和第二众多数据文件中的每一份数据文件相关联。
4.根据权利要求2的方法,进一步包括提供界面以允许用户查找可查询的元数据高速缓冲存储器以确定在第一和第二众多数据文件之一的至少一个数据文件的最新拷贝的位置的步骤。
5.根据权利要求4的方法,其中提供界面的步骤包括提供允许用户使用界面下载和恢复至少一个数据文件的最新拷贝的步骤。
6.根据权利要求1的方法,进一步包括分析现有的完整备份数据集的步骤,以提供第一众多数据文件中的每一份数据文件的第一列表。
7.根据权利要求1的方法,进一步包括分析至少一个增量备份数据集的步骤,以提供第二众多数据文件中每一份数据文件的第二列表。
8.如权利要求1所要求保护的方法,其中第一众多数据文件包括第一数据文件,而且其中第二众多数据文件包括第一数据文件的修改拷贝。
9.如权利要求1所要求保护的方法,其中第二众多数据文件包括至少一份其版本并不包括在第一众多数据文件内的数据文件。
10.一种备份存储系统包括:
用于存储第一和第二众多数据文件的备份存储介质;
包括至少一个处理器的控制器,所述处理器经过配置用于执行指令组以实现权利要求1-9中任何一种方法。
11.编有众多指令编码的计算机可读介质,当所述众多指令编码在至少一个处理器上执行时实现权利要求1-9中任何一种方法。
12.编有众多指令编码的计算机可读介质,当所述众多指令编码在存储系统的至少一个处理器上执行时,实现权利要求1-9中任何一种方法。
13.合成的完整备份数据集,包括:
众多指示符,每一个指示符在现有的完整备份数据集和至少一个增量备份数据集之一中标示众多数据文件的最新拷贝的存储位置;
其中现有的完整备份数据集包括至少众多数据文件之一的存储拷贝;以及
其中至少一个增量备份数据集包括众多数据文件的剩余数据文件之一的存储拷贝。
CNB2004800254750A 2003-08-05 2004-08-05 仿真存储系统 Expired - Fee Related CN100483365C (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US49257603P 2003-08-05 2003-08-05
US60/492,576 2003-08-05
US49282703P 2003-08-06 2003-08-06
US60/492,827 2003-08-06
PCT/US2004/025283 WO2005017686A2 (en) 2003-08-05 2004-08-05 Emulated storage system

Publications (2)

Publication Number Publication Date
CN1867902A true CN1867902A (zh) 2006-11-22
CN100483365C CN100483365C (zh) 2009-04-29

Family

ID=34197950

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800254750A Expired - Fee Related CN100483365C (zh) 2003-08-05 2004-08-05 仿真存储系统

Country Status (6)

Country Link
US (4) US7146476B2 (zh)
EP (1) EP1654659A4 (zh)
KR (1) KR100890573B1 (zh)
CN (1) CN100483365C (zh)
HK (1) HK1096170A1 (zh)
WO (1) WO2005017686A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102023903B (zh) * 2009-09-10 2012-12-19 联想(北京)有限公司 一种数据备份的版本管理方法及装置
CN102959518A (zh) * 2009-12-22 2013-03-06 国际商业机器公司 使用多个同时装置流的完全系统备份和增量备份的恢复
CN103218276A (zh) * 2013-04-23 2013-07-24 深圳市京华科讯科技有限公司 多节点增量备份的方法及系统
WO2015024406A1 (zh) * 2013-08-23 2015-02-26 华为技术有限公司 一种数据文件的管理方法及装置
US9057722B2 (en) 2008-09-26 2015-06-16 University of Pittsburgh—of the Commonwealth System of Higher Education Urinary biomarkers for predicting long-term dialysis
CN113806611A (zh) * 2020-06-17 2021-12-17 海信集团有限公司 一种存储搜索引擎结果的方法及设备

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060190630A1 (en) * 2003-02-25 2006-08-24 Sepaton Inc. Apparatus and method to pass through data in a storage area network
US6973654B1 (en) 2003-05-27 2005-12-06 Microsoft Corporation Systems and methods for the repartitioning of data
JP4228288B2 (ja) * 2003-06-11 2009-02-25 ソニー株式会社 記録制御装置および方法、プログラム、並びにデータ記録方法
US20050108486A1 (en) * 2003-08-05 2005-05-19 Miklos Sandorfi Emulated storage system supporting instant volume restore
EP1654659A4 (en) * 2003-08-05 2007-05-09 Sepaton Inc EMULATED STORAGE SYSTEM
US8938595B2 (en) * 2003-08-05 2015-01-20 Sepaton, Inc. Emulated storage system
US20050193235A1 (en) * 2003-08-05 2005-09-01 Miklos Sandorfi Emulated storage system
US8280926B2 (en) 2003-08-05 2012-10-02 Sepaton, Inc. Scalable de-duplication mechanism
US7181647B2 (en) * 2003-10-15 2007-02-20 International Business Machines Corporation Error tracking method and system
JP4498867B2 (ja) * 2004-09-16 2010-07-07 株式会社日立製作所 データ保存管理方法およびデータライフサイクルマネージメントシステム
US7756833B2 (en) * 2004-09-22 2010-07-13 Microsoft Corporation Method and system for synthetic backup and restore
US8108599B2 (en) * 2004-11-03 2012-01-31 Spectra Logic Corporation Erasure techniques for emulating streamed data format for non tape media
US8201021B1 (en) 2005-01-31 2012-06-12 Symantec Corporation Method and apparatus for efficiently creating backup files with less redundancy
US7725438B1 (en) * 2005-01-31 2010-05-25 Veritas Operating Corporation Method and apparatus for efficiently creating backup files
US8271436B2 (en) * 2005-02-07 2012-09-18 Mimosa Systems, Inc. Retro-fitting synthetic full copies of data
US8799206B2 (en) 2005-02-07 2014-08-05 Mimosa Systems, Inc. Dynamic bulk-to-brick transformation of data
US8812433B2 (en) 2005-02-07 2014-08-19 Mimosa Systems, Inc. Dynamic bulk-to-brick transformation of data
US8918366B2 (en) 2005-02-07 2014-12-23 Mimosa Systems, Inc. Synthetic full copies of data and dynamic bulk-to-brick transformation
US8122191B2 (en) 2005-02-17 2012-02-21 Overland Storage, Inc. Data protection systems with multiple site replication
US20060248352A1 (en) * 2005-04-27 2006-11-02 Sbc Knowledge Ventures, L.P. Method and system of securing electronic data
CN100433880C (zh) * 2005-05-17 2008-11-12 中兴通讯股份有限公司 面向对象的对数据区资源进行主备增量备份保护的方法
US9075819B1 (en) * 2005-06-30 2015-07-07 Symantec Operating Corporation Method and apparatus for providing parallel backup set processing for creating a synthetic backup
GB2431770B (en) 2005-10-31 2011-09-21 Hewlett Packard Development Co Emulated tape-based storage media
US7483927B2 (en) * 2005-12-01 2009-01-27 International Business Machines Corporation Method for merging metadata on files in a backup storage
JP2007219611A (ja) * 2006-02-14 2007-08-30 Hitachi Ltd バックアップ装置及びバックアップ方法
US7398351B2 (en) * 2006-05-23 2008-07-08 International Business Machines Corporation Method and system for controlling access to data of a tape data storage medium using encryption/decryption of metadata
US7600059B2 (en) * 2006-05-31 2009-10-06 Quantum Corporation Multiple LUN support for SATA devices
GB2440561B (en) * 2006-07-28 2011-03-30 Hewlett Packard Development Co Data storage system
US7962499B2 (en) * 2006-08-18 2011-06-14 Falconstor, Inc. System and method for identifying and mitigating redundancies in stored data
US7941405B2 (en) * 2007-03-30 2011-05-10 Data Center Technologies Password protection for file backups
US8489830B2 (en) * 2007-03-30 2013-07-16 Symantec Corporation Implementing read/write, multi-versioned file system on top of backup data
US7835900B2 (en) 2007-04-27 2010-11-16 Hewlett-Packard Development Company, L.P. Emulated tape-based storage media
US7849354B2 (en) 2007-06-12 2010-12-07 Microsoft Corporation Gracefully degradable versioned storage systems
US7908246B2 (en) * 2008-03-06 2011-03-15 International Business Machines Corporation Separating file data streams to enhance progressive incremental processing
US8090917B2 (en) * 2008-05-09 2012-01-03 International Business Machines Corporation Managing storage and migration of backup data
US8244681B2 (en) * 2008-06-09 2012-08-14 Symantec Operating Corporation Creating synthetic backup images on a remote computer system
US8099572B1 (en) 2008-09-30 2012-01-17 Emc Corporation Efficient backup and restore of storage objects in a version set
US8990161B1 (en) * 2008-09-30 2015-03-24 Emc Corporation System and method for single segment backup
US8412905B2 (en) * 2009-01-01 2013-04-02 Sandisk Il Ltd. Storage system having secondary data store to mirror data
US8200926B1 (en) * 2009-05-28 2012-06-12 Symantec Corporation Methods and systems for creating full backups
US8234470B2 (en) * 2009-08-25 2012-07-31 International Business Machines Corporation Data repository selection within a storage environment
US8595188B2 (en) * 2009-11-06 2013-11-26 International Business Machines Corporation Operating system and file system independent incremental data backup
US8447741B2 (en) * 2010-01-25 2013-05-21 Sepaton, Inc. System and method for providing data driven de-duplication services
US9158653B2 (en) 2010-03-21 2015-10-13 Hewlett-Packard Development Company, L.P. Determining impact of virtual storage backup jobs
US9430155B2 (en) * 2010-03-25 2016-08-30 International Business Machines Corporation File index, metadata storage, and file system management for magnetic tape
US9275678B2 (en) * 2010-03-25 2016-03-01 International Business Machines Corporation Primary storage media with associated secondary storage media for efficient data management
US9063666B2 (en) * 2010-03-25 2015-06-23 International Business Machines Corporation File index, metadata storage, and file system management for magnetic tape
US9128948B1 (en) * 2010-09-15 2015-09-08 Symantec Corporation Integration of deduplicating backup server with cloud storage
US9009724B2 (en) 2010-09-24 2015-04-14 Hewlett-Packard Development Company, L.P. Load balancing data access in virtualized storage nodes
US8572434B2 (en) * 2010-09-29 2013-10-29 Sepaton, Inc. System health monitor
US8666944B2 (en) * 2010-09-29 2014-03-04 Symantec Corporation Method and system of performing a granular restore of a database from a differential backup
CN102063276A (zh) * 2010-12-23 2011-05-18 创新科存储技术有限公司 一种同时具有raid和vtl功能的存储设备及方法
US8635187B2 (en) 2011-01-07 2014-01-21 Symantec Corporation Method and system of performing incremental SQL server database backups
US8688651B2 (en) 2011-01-25 2014-04-01 Sepaton, Inc. Dynamic deduplication
US8843451B2 (en) * 2011-09-23 2014-09-23 International Business Machines Corporation Block level backup and restore
US9026496B1 (en) * 2011-09-30 2015-05-05 Emc Corporation Efficient building of restore list
US9912713B1 (en) 2012-12-17 2018-03-06 MiMedia LLC Systems and methods for providing dynamically updated image sets for applications
US9720627B2 (en) * 2013-01-17 2017-08-01 Western Digital Technologies, Inc. Data management for a data storage device
US9465521B1 (en) 2013-03-13 2016-10-11 MiMedia, Inc. Event based media interface
US9298758B1 (en) 2013-03-13 2016-03-29 MiMedia, Inc. Systems and methods providing media-to-media connection
US9183232B1 (en) 2013-03-15 2015-11-10 MiMedia, Inc. Systems and methods for organizing content using content organization rules and robust content information
US9766832B2 (en) 2013-03-15 2017-09-19 Hitachi Data Systems Corporation Systems and methods of locating redundant data using patterns of matching fingerprints
US10257301B1 (en) 2013-03-15 2019-04-09 MiMedia, Inc. Systems and methods providing a drive interface for content delivery
US9256611B2 (en) 2013-06-06 2016-02-09 Sepaton, Inc. System and method for multi-scale navigation of data
GB2514428B (en) * 2013-08-19 2016-01-13 Visa Europe Ltd Enabling access to data
WO2015047289A1 (en) * 2013-09-27 2015-04-02 Empire Technology Development, Llc Infrastructure migration tool
US9678973B2 (en) 2013-10-15 2017-06-13 Hitachi Data Systems Corporation Multi-node hybrid deduplication
US9727363B2 (en) 2014-04-30 2017-08-08 Dalian University Of Technology Virtual machine migration
US9626367B1 (en) 2014-06-18 2017-04-18 Veritas Technologies Llc Managing a backup procedure
US20160034602A1 (en) * 2014-08-01 2016-02-04 Lenovo (Singapore) Pte. Ltd. Storing and presenting data associating information in a file with the source of the information
JP6041839B2 (ja) * 2014-09-04 2016-12-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation メタ情報を保管する方法、プログラム、及びそのテープ記録システム
US20180181332A1 (en) * 2014-10-29 2018-06-28 International Business Machines Corporation Expanding a dispersed storage network memory beyond two locations
US10459792B2 (en) * 2014-10-29 2019-10-29 Pure Storage, Inc. Using an eventually consistent dispersed memory to implement storage tiers
US10095582B2 (en) * 2014-10-29 2018-10-09 International Business Machines Corporation Partial rebuilding techniques in a dispersed storage unit
US11297062B2 (en) * 2016-02-17 2022-04-05 Carrier Corporation Authorized time lapse view of system and credential data
CN106227621B (zh) * 2016-07-25 2019-03-01 北京飞杰信息技术有限公司 基于逻辑卷管理精简卷的数据备份方法及系统
US10496599B1 (en) 2017-04-30 2019-12-03 EMC IP Holding Company LLC Cloud data archiving using chunk-object mapping and synthetic full backup
US10860608B2 (en) * 2018-10-25 2020-12-08 EMC IP Holding Company LLC Any point in time replication to the cloud
US11620056B2 (en) 2019-06-28 2023-04-04 EMC IP Holding Company LLC Snapshots for any point in time replication

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5226141A (en) 1989-07-14 1993-07-06 Touch Technologies, Inc. Variable capacity cache memory
US5276867A (en) 1989-12-19 1994-01-04 Epoch Systems, Inc. Digital data storage system with improved data migration
US5276860A (en) * 1989-12-19 1994-01-04 Epoch Systems, Inc. Digital data processor with improved backup storage
FR2677513B1 (fr) * 1991-06-06 1997-05-23 Dassault Aviat Dispositif de commutation electronique pour antenne commutable dans les gammes de frequences vhf et uhf.
US5403639A (en) 1992-09-02 1995-04-04 Storage Technology Corporation File server having snapshot application data groups
US5454098A (en) * 1992-09-28 1995-09-26 Conner Peripherals, Inc. Method of emulating access to a sequential access data storage device while actually using a random access storage device
SE500656C2 (sv) 1992-12-08 1994-08-01 Ellemtel Utvecklings Ab System för backuptagning i en distribuerad databas
WO1996025801A1 (en) 1995-02-17 1996-08-22 Trustus Pty. Ltd. Method for partitioning a block of data into subblocks and for storing and communicating such subblocks
US5778395A (en) 1995-10-23 1998-07-07 Stac, Inc. System for backing up files from disk volumes on multiple nodes of a computer network
US5991862A (en) 1996-12-30 1999-11-23 Sun Microsystems, Inc. Modified indirect addressing for file system
US6098148A (en) 1997-05-29 2000-08-01 International Business Machines Corporation Storage and access of data using volume trailer
US6389503B1 (en) * 1997-08-04 2002-05-14 Exabyte Corporation Tape drive emulation by removable disk drive and media formatted therefor
US6070224A (en) 1998-04-02 2000-05-30 Emc Corporation Virtual tape system
US6329985B1 (en) * 1998-06-30 2001-12-11 Emc Corporation Method and apparatus for graphically displaying mapping of a logical object
US6366986B1 (en) * 1998-06-30 2002-04-02 Emc Corporation Method and apparatus for differential backup in a computer storage system
US6883063B2 (en) * 1998-06-30 2005-04-19 Emc Corporation Method and apparatus for initializing logical objects in a data storage system
US6317814B1 (en) 1998-07-01 2001-11-13 Storage Technology Corporation Method for selectively storing redundant copies of virtual volume data on physical data storage cartridges
US6094605A (en) 1998-07-06 2000-07-25 Storage Technology Corporation Virtual automated cartridge system
US6366987B1 (en) * 1998-08-13 2002-04-02 Emc Corporation Computer data storage physical backup and logical restore
GB2343768A (en) 1998-08-17 2000-05-17 Connected Place Limited Merging a sequence of delta files
US6247024B1 (en) 1998-09-25 2001-06-12 International Business Machines Corporation Method and system for performing deferred file removal in a file system
US6230190B1 (en) * 1998-10-09 2001-05-08 Openwave Systems Inc. Shared-everything file storage for clustered system
US6385706B1 (en) * 1998-12-31 2002-05-07 Emx Corporation Apparatus and methods for copying a logical object to a primary storage device using a map of storage locations
US6615327B1 (en) * 1999-02-19 2003-09-02 Hitachi, Ltd. Method and system for backing up data of data processing devices including fixed length block format data conversion to variable length block format
US6714952B2 (en) * 1999-11-10 2004-03-30 Emc Corporation Method for backup and restore of a multi-lingual network file server
US6647399B2 (en) * 1999-11-29 2003-11-11 International Business Machines Corporation Method, system, program, and data structures for naming full backup versions of files and related deltas of the full backup versions
US6526418B1 (en) * 1999-12-16 2003-02-25 Livevault Corporation Systems and methods for backing up data files
US6834324B1 (en) * 2000-04-10 2004-12-21 Storage Technology Corporation System and method for virtual tape volumes
US6779095B2 (en) 2000-06-19 2004-08-17 Storage Technology Corporation Apparatus and method for instant copy of data using pointers to new and original data in a data location
US20020124137A1 (en) 2001-01-29 2002-09-05 Ulrich Thomas R. Enhancing disk array performance via variable parity based load balancing
US6715098B2 (en) * 2001-02-23 2004-03-30 Falconstor, Inc. System and method for fibrechannel fail-over through port spoofing
US7058788B2 (en) * 2001-02-23 2006-06-06 Falconstor Software, Inc. Dynamic allocation of computer memory
US7093127B2 (en) * 2001-08-09 2006-08-15 Falconstor, Inc. System and method for computer storage security
US6718352B1 (en) * 2001-03-20 2004-04-06 Emc Corporation Methods and apparatus for managing a data set stored on a data storage device
US6957291B2 (en) * 2001-03-29 2005-10-18 Quantum Corporation Removable disk storage array emulating tape library having backup and archive capability
US7146524B2 (en) 2001-08-03 2006-12-05 Isilon Systems, Inc. Systems and methods for providing a distributed file system incorporating a virtual hot spare
CA2458416A1 (en) * 2001-08-31 2003-03-27 Arkivio, Inc. Techniques for restoring data based on contents and attributes of the data
EP1466246B1 (en) * 2001-11-23 2011-03-02 Commvault Systems, Inc. Selective data replication system and method
US20030105912A1 (en) * 2001-11-30 2003-06-05 Noren Gregory T. Space efficient backup technique in a storage system
US7024427B2 (en) 2001-12-19 2006-04-04 Emc Corporation Virtual file system
US7120631B1 (en) 2001-12-21 2006-10-10 Emc Corporation File server system providing direct data sharing between clients with a server acting as an arbiter and coordinator
US7310654B2 (en) 2002-01-31 2007-12-18 Mirapoint, Inc. Method and system for providing image incremental and disaster recovery
US6684308B2 (en) * 2002-01-31 2004-01-27 Mirapoint, Inc. Method and system for providing direct access recovery using seekable tape device
US7216135B2 (en) 2002-02-15 2007-05-08 International Business Machines Corporation File system for providing access to a snapshot dataset where disk address in the inode is equal to a ditto address for indicating that the disk address is invalid disk address
US6829617B2 (en) 2002-02-15 2004-12-07 International Business Machines Corporation Providing a snapshot of a subset of a file system
US20030177149A1 (en) * 2002-03-18 2003-09-18 Coombs David Lawrence System and method for data backup
US7073038B2 (en) 2002-05-22 2006-07-04 Storage Technology Corporation Apparatus and method for implementing dynamic structure level pointers
US6970155B2 (en) 2002-08-14 2005-11-29 Light Modulation, Inc. Optical resonant gel display
US7055008B2 (en) * 2003-01-22 2006-05-30 Falconstor Software, Inc. System and method for backing up data
US7165145B2 (en) * 2003-07-02 2007-01-16 Falconstor Software, Inc. System and method to protect data stored in a storage system
US7127575B2 (en) 2003-07-10 2006-10-24 Hitachi, Ltd. Offsite management using disk based tape library and vault system
US7155585B2 (en) * 2003-08-01 2006-12-26 Falconstor Software, Inc. Method and system for synchronizing storage system data
EP1654659A4 (en) 2003-08-05 2007-05-09 Sepaton Inc EMULATED STORAGE SYSTEM
US20050193235A1 (en) * 2003-08-05 2005-09-01 Miklos Sandorfi Emulated storage system
US8938595B2 (en) 2003-08-05 2015-01-20 Sepaton, Inc. Emulated storage system
US20050108486A1 (en) * 2003-08-05 2005-05-19 Miklos Sandorfi Emulated storage system supporting instant volume restore
US7299376B2 (en) 2004-08-25 2007-11-20 International Business Machines Corporation Apparatus, system, and method for verifying backup data
US7756833B2 (en) 2004-09-22 2010-07-13 Microsoft Corporation Method and system for synthetic backup and restore
US7574579B2 (en) * 2005-09-30 2009-08-11 Cleversafe, Inc. Metadata management system for an information dispersed storage system
US8131682B2 (en) 2006-05-11 2012-03-06 Hitachi, Ltd. System and method for replacing contents addressable storage
JP4749266B2 (ja) 2006-07-27 2011-08-17 株式会社日立製作所 情報資源の重複を省いたバックアップ制御装置及び方法
US20080034017A1 (en) 2006-08-04 2008-02-07 Dominic Giampaolo Links to a common item in a data structure
TW200846211A (en) 2007-05-17 2008-12-01 Sentec E & E Co Ltd External fuel vapor emission adjusting device for fuel tank

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9057722B2 (en) 2008-09-26 2015-06-16 University of Pittsburgh—of the Commonwealth System of Higher Education Urinary biomarkers for predicting long-term dialysis
US9389222B2 (en) 2008-09-26 2016-07-12 University Of Pittsburgh—Of The Commonwealth System Of Higher Learning Urinary biomarkers for predicting long-term dialysis
CN102023903B (zh) * 2009-09-10 2012-12-19 联想(北京)有限公司 一种数据备份的版本管理方法及装置
CN102959518A (zh) * 2009-12-22 2013-03-06 国际商业机器公司 使用多个同时装置流的完全系统备份和增量备份的恢复
CN102959518B (zh) * 2009-12-22 2016-01-13 国际商业机器公司 把文件系统恢复到目标存储器的计算机执行的方法和系统
CN103218276A (zh) * 2013-04-23 2013-07-24 深圳市京华科讯科技有限公司 多节点增量备份的方法及系统
WO2015024406A1 (zh) * 2013-08-23 2015-02-26 华为技术有限公司 一种数据文件的管理方法及装置
CN104424219A (zh) * 2013-08-23 2015-03-18 华为技术有限公司 一种数据文件的管理方法及装置
CN104424219B (zh) * 2013-08-23 2018-10-09 华为技术有限公司 一种数据文件的管理方法及装置
CN113806611A (zh) * 2020-06-17 2021-12-17 海信集团有限公司 一种存储搜索引擎结果的方法及设备

Also Published As

Publication number Publication date
CN100483365C (zh) 2009-04-29
KR20060132542A (ko) 2006-12-21
US20070112896A1 (en) 2007-05-17
WO2005017686A3 (en) 2005-04-14
WO2005017686A2 (en) 2005-02-24
US8200924B2 (en) 2012-06-12
US20050071392A1 (en) 2005-03-31
EP1654659A4 (en) 2007-05-09
US20090177661A1 (en) 2009-07-09
US7430647B2 (en) 2008-09-30
KR100890573B1 (ko) 2009-03-25
US7146476B2 (en) 2006-12-05
EP1654659A2 (en) 2006-05-10
US20080275911A1 (en) 2008-11-06
HK1096170A1 (en) 2007-05-25

Similar Documents

Publication Publication Date Title
CN1867902A (zh) 仿真存储系统
TWI709073B (zh) 分佈式儲存系統、分佈式儲存方法及分佈式設施
US20190196729A1 (en) Shared network-available storage that permits concurrent data access
US8938595B2 (en) Emulated storage system
US20050108486A1 (en) Emulated storage system supporting instant volume restore
US8280926B2 (en) Scalable de-duplication mechanism
US6880051B2 (en) Method, system, and program for maintaining backup copies of files in a backup storage device
CN101479944B (zh) 基于采样消除重复数据的系统和方法
US20040002934A1 (en) System and method for providing requested file mapping information for a file on a storage device
US20110078220A1 (en) Filesystem building method
CN101258493A (zh) 用于在顺序存取数据存储子系统中执行搜索操作的系统和方法
CN104541251A (zh) 在存储群集中的擦除编码和复制
CN101939737A (zh) 可扩展的重复数据删除机构
CN1495669A (zh) 建立和恢复图像文件的方法和系统
US7689626B2 (en) System and method for locating log records in multiplexed transactional logs
KR20060080239A (ko) 인스턴트 볼륨 복구를 지원하는 에뮬레이티드 스토리지시스템
JP2007527572A5 (zh)
US6684308B2 (en) Method and system for providing direct access recovery using seekable tape device
US8151053B2 (en) Hierarchical storage control apparatus, hierarchical storage control system, hierarchical storage control method, and program for controlling storage apparatus having hierarchical structure
CN1997972A (zh) 支持即时卷恢复的仿真存储系统
US20230393948A1 (en) Storage system and method of restoring storage system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1096170

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1096170

Country of ref document: HK

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090429

Termination date: 20110805