CN100485630C - 具有中央控制的数据备份的方法和系统 - Google Patents

具有中央控制的数据备份的方法和系统 Download PDF

Info

Publication number
CN100485630C
CN100485630C CNB2006101392424A CN200610139242A CN100485630C CN 100485630 C CN100485630 C CN 100485630C CN B2006101392424 A CNB2006101392424 A CN B2006101392424A CN 200610139242 A CN200610139242 A CN 200610139242A CN 100485630 C CN100485630 C CN 100485630C
Authority
CN
China
Prior art keywords
entity
data
activated
scheduling
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006101392424A
Other languages
English (en)
Other versions
CN1971527A (zh
Inventor
鲁塔·克劳迪奥
法布里·克劳迪奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1971527A publication Critical patent/CN1971527A/zh
Application granted granted Critical
Publication of CN100485630C publication Critical patent/CN100485630C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了一种在数据处理系统中使用的备份解决方案(300),其中不同的主机支持多个客户机。为此目的,主机中的一个主控主机拥有(306)调度文件,该调度文件指示激活哪些客系统以备份它们的数据,以及何时备份处理必须执行。每天,每个其他的主机验证(309-318)相应的客户机是否包含在当天的调度文件中。如果包含,则将需要备份的各个数据的路径增加(324-330)到该主控主机上的控制文件中。在该过程的最后,该主控主机可以随后备份不同的客户机的所需数据(如同控制文件中所指示的那样);同时,任何重要的客户机自动关机(342-345),以便确保相应的备份数据的一致性。

Description

具有中央控制的数据备份的方法和系统
技术领域
本发明涉及信息技术领域。更具体地说,本发明涉及数据备份。
背景技术
数据备份在对现代数据处理基础设施的管理中扮演着重要的角色。一般而言,备份数据的处理包括将原始资料的一个或多个另外的副本放到不同的设备上;出于安全的原因,优选地将备份副本存储在与原始数据的位置不同的位置。以这种方式,在基础设施发生任何故障(诸如存储器崩溃)、其他灾害(诸如火灾)或错误地意外删除的情况下可以保存数据;因此,无论何时数据的原始版本被破坏或丢失,都可以修复(即,恢复)数据。
备份处理是大型组织(尤其是当管理重要的数据和/或服务时)的例行活动。然而,设计适当的备份处理是非常复杂的任务。实际上,为了达到这一目的必须仔细考虑很多方面;例如,适当地选择备份介质、确保复制数据的一致性、定义有效的备份步骤、建立正确的恢复策略、验证备份副本的完整性和正确性等等都是非常重要的。
在需要备份的数据存储于多个计算机上的分布式基础设施中还存在着另外的问题。特别地,在这种环境中,控制整个备份处理是很困难的(由于其固有的分散性);例如,对在不同计算机上的备份处理的调度决不是一件小事。在计算机实现不同的硬件和/或软件平台的异类环境中问题更加突出。
应当注意,在上述的场景中,使备份处理完全由一个中央站点强制在不同计算机上执行通常是行不通的;实际上,在大多数实际的情形中,对需要备份的数据的定义必须始终保持在本地的控制下。
现有技术已知的解决方案的另一个缺点在于,这些解决方案完全是入侵的。实际上,备份处理一般要求每个计算机上的相对复杂的代理(该代理负责执行管理备份处理所需的所有操作)的可用性。然而,在基础设施的每个计算机上安装这种代理并不总是可行的;例如,这可能由于安全的考虑而被阻止。
在任一种情况下,都期望在备份处理中尽量少地依赖于人工干预;实际上,任何人工操作都几乎不可重复,倾向于带来错误,并且都在很大程度上依赖于个人技能。然而,上述问题使设计针对具有分布式体系结构的基础设施的自动备份处理受到阻碍。
发明内容
本发明提供了一种解决方案,其在独立权利要求中给出。在从属权利要求中描述了本发明的有利的实施例。
原理上,本发明提出一种具有中央控制的备份处理。
特别地,本发明的一个方面提供了一种用于在包括多个数据处理实体(诸如物理的和/或逻辑的机器)的系统中备份数据的方法。该方法包括用于一组实体(从一个实体到所有这些实体)的一系列步骤。首先,在从这些实体中选择的一个实体上提供一个调度结构(例如一个文件);该调度结构包括对被激活以备份相关数据的实体的指示。通过每个实体验证是否包含在该调度结构中,该方法继续。响应于包含在该调度结构中,每个被激活实体将对相应数据的指示增加到所选择实体上的控制结构(诸如另一个文件)中。直至在所选择实体的控制下对在控制结构中指示的数据进行备份,该方法结束。
在本发明的一个优选实施例中,调度文件还用于定义用于每个被激活实体的调度策略。
典型地,在每个实体的控制下定期地执行对于是否包含在调度文件中的验证。
作为又一个改进,实体彼此异相地执行该步骤。
又一个改进该解决方案的方法是使用调度结构为重要的实体设置关机时间。
在一个特定实施例中,本发明应用于实现在主机(其控制用于相应的客户机的上述操作的执行)上的客户机。
有利地,调度文件、控制文件以及需要备份的数据存储在共享的磁盘上。
作为又一个增强,所提出的解决方案阻止对同一共享磁盘(在控制文件中是重复的)的重复备份。
本发明的另一个方面提出了一种用于执行该方法的计算机程序。
本发明的又一个方面提出了一种相应的系统。
附图说明
结合附图,参考以下完全通过非限制性表示给出的详细描述,将获得对本发明本身及其另外的特征和优点的最好理解。
图1是可以实现根据本发明实施例的解决方案的数据处理基础设施的图形表示;
图2示出了可以用于实现根据本发明实施例的解决方案的主要软件部分;以及
图3a-图3b例示了描述与根据本发明实施例的解决方案的实现有关的活动的流程的示图。
具体实施方式
特别地参考图1,其例示了具有分布式体系结构的数据处理基础设施100。基础设施100包括多个物理计算机105(诸如IBM公司的“zSeries”或“AS/400”类型)。每个计算机105实现多个逻辑系统110;为了这一目的,将计算机105分成相应的逻辑分区(LPAR),每个逻辑分区包括计算机105的硬件资源的子集(其如同单独的计算机那样独立地操作)。接着,每个(主)系统110支持多个客系统115;特别地,主系统110提供相应的虚拟机,每个虚拟机包括表现得如同真实的计算机一样的抽象环境(虚拟机拥有对该抽象环境的独家控制)。
计算机105物理地共享直接访问存储设备(DASD)阵列120,典型地包括磁盘;共享的磁盘120提供对相当大数量的数据(例如,在IBM公司的3390-3类型的磁盘中是3G字节或者在IBM公司的3390-9类型的磁盘中是10G字节)的快速访问。共享磁盘120用于存储(逻辑)系统110、115的本地数据;本地数据根据不同文件系统(每一个都依赖于相应的逻辑系统110、115的软件平台)来组织。此外,共享磁盘120还可以存储可以由更多的逻辑系统110、115访问(读和/或写)的全局数据。为此目的,基础设施100实现共享的文件系统服务。共享的服务允许每个逻辑系统110、115输出其文件系统(或其分区)用于其他逻辑系统110、115;其他的逻辑系统110、115可以随后安装该输出的数据,将这些数据完全地整合到它们的文件系统中。通过运行在不同逻辑系统110、115上的相应的客户端/服务器模块可以获得这种结果,这些模块通过设计为平台独立的相应协议(诸如TCP/IP)来通信。合适的共享服务的例子是网络文件系统(NFS)。
如同在下文中详细描述的那样,共享磁盘120上的数据被备份到可移动介质125上,典型地包括磁带盒(或电子流);磁带125非常便宜,并且具有很大的(顺序访问)存储能力(例如,对于IBM公司的3590类型的磁带是10G字节)。可以直接从共享磁盘120到磁带125执行备份处理。可选地,对需要备份的数据进行适当地处理并将其保存到贮存磁盘阵列130上;随后将贮存磁盘130中的已处理数据复制到磁带125。
转向图2,用参考标号200总体上表示运行在上述基础设施上的主要软件部件。典型地将信息(程序和数据)存储在共享磁盘上并且当程序运行时将信息至少部分地载入每个计算机的工作存储器(即RAM)中。例如,最初是从磁带将程序安装到共享磁盘上。
特别地,通过将计算机105分为多个逻辑分区,每个逻辑分区控制计算机105的硬件资源的一个专用子集,每个计算机105上的分区层205对相应的主系统进行仿真。如同下文中将详细描述的那样,主系统中的一个(在此用主控系统110m来表示)控制对所有其他主系统(在此用从系统110s来表示)的备份处理。特别地,主控系统110m将不同的从系统110s的客系统115的备份处理调度为共享文件。定期地,每个从系统110s验证其是否必须备份其数据(根据该共享文件的内容);如果需要备份,则从系统110s确定需要备份到另一个共享文件中的数据。在该过程的最后,主控系统110m可以随后对不同的客系统115的所需数据进行备份。
所提出的解决方案允许中央地控制备份处理;特别地,有可能以非常有效的方式管理对不同的客系统115上的备份处理的调度。可以独立于由不同客系统115支持的文件系统而获得这一结果;换句话说,所设计的备份处理基本上是平台独立的。然而同时,对需要备份的数据的控制保持完全是本地的。
该技术只需要在不同的从系统110s上安装非常简单的程序,同时只在主控系统110m上需要备份处理的核心模块。作为结果,对从系统110s的影响是可以忽略的;此外,在不同的客系统115上根本不需要附加的部件。这使得所提出的解决方案很好地适用于具有严格安全要求的应用。
需要强调的是,上述备份处理不需要任何人工干预(在其初始化步骤之后)。作为结果,所提出的解决方案完全是自动的。这提高了结果的质量,并且在很大程度上减少了任何错误的风险。
现在更详细地考虑一般的从系统110s,虚拟化层210通过多个虚拟机对相应的客系统115进行仿真。提供这种功能性的商用虚拟化层的例子是IBM公司的“VMware”或微软公司的“微软虚拟服务器2005(MSVS)”。
在每个客系统115中,操作系统215(诸如IBM公司的“zOS”,或“Linux”)定义了其软件平台;如上所述,操作系统215工作得如同他被安装在真正的计算机(被虚拟化层210所仿真的)上。一个或多个软件应用220运行在操作系统215之上。每个软件应用220具有相应的工作数据225(诸如文件、数据库等等)。
通过虚拟化层210将运行在从系统110s上的所有客系统115的有关配置信息存储到相应的文件230中。典型地,配置文件230表示分配给每个客系统115的从系统110s的硬件资源;特别地,该配置信息包括由客系统115用来存储其数据(诸如操作系统215、软件应用220和工作数据225)的每个共享磁盘的标识符(即,其绝对路径)。
备份脚本235(运行在从系统110s中)作为备份处理客户端与主控系统110m接口连接;备份脚本235(例如,以REXX语言写入)包括小程序,其由一系列一般用于在没有任何用户干预的情况下执行的命令来形成。为此目的,备份脚本235访问配置文件230(以只读模式)。
现在转向主控系统110m,类似的虚拟化层210m同样模拟多个虚拟机。备份管理器240(运行于主控系统110m中)实现用于所有从系统110s的备份处理的服务器端;典型地,备份管理器240包括连续后台运行的代理。
备份管理器240控制调度文件245(例如,通过编辑器创建)。调度文件245指示不同的从系统110s上的哪些客系统115(由相应的标识符规定)被激活以备份其数据,并且何时必须执行备份处理;为此目的,调度文件245优选地存储用于每个(激活的)客系统115的备份处理的频率。此外,调度文件245还允许识别重要的客系统115,其中当关闭该客系统115时必须执行备份处理;这可能是必须的,以确保备份数据始终是一致的(例如,当处理程序可能影响不同存储器结构时)。对于每个重要的客系统115,调度文件245存储客系统115必须关机的时间(小时和分钟)。例如,考虑一种情况,其中名为“H1”的从系统110s上的名为“G1”的重要的客系统115必须每天进行备份;另一方面,另一个名为“H2”的从系统110s是较不重要的客系统115即名为“G2a”(其必须每周备份)的客系统115和名为“G2b”的客系统115(其必须每月备份)的主机。客系统“G1”是重要的,并且其关机时间是“22:00”。在这种情况下,一整年的调度文件245可以由下表定义:
 
主系统 客系统 关机时间 备份频率
H1 G1 22:00 1天
H2 G2a 1周
G2b 1月
每个从系统110s上的备份脚本235读取调度文件245。只要每个客系统115(以从系统110s为主机)在当天的调度文件245中被指出(根据备份频率),备份脚本235就从配置文件230中提取共享磁盘(由客系统115用于存储其数据的)的标识符。将该信息增加到控制文件250中,控制文件250也由主控系统110m所有。以这种方式,在过程的最后,控制文件250将包括基础设施中所有需要备份的共享磁盘的列表。
控制文件250由备份管理器240进行访问,备份管理器240相应地控制备份处理。为此目的,备份管理器240使用以主控系统110m为主机的专用虚拟机255(诸如4-8)的池。每个虚拟机255以本地模式运行机器人程序260;机器人程序260包括将所需数据复制到磁带125的程序(在没有任何人工干预的情况下自动地操作)。备份管理器240可以直接调用所选机器人程序260以对特定的大型共享磁盘(在控制文件250中指示的)进行备份,当较小的共享磁盘必须复制时,备份管理器240还开发一个以主控系统110m为主机的另外的的专用的虚拟机265(诸如8-15)的池。每个虚拟机265以自然模式运行压缩应用270;压缩应用270压缩多个共享磁盘并将它们组合成单个图像文件275(例如,CMS文件),将其存储在贮存磁盘上。压缩应用270接着将该映像文件275传递给所选的机器人程序260(其将其复制到磁带125上)。最后,备份管理器240将备份处理的结果保存到相应的备份日志280中。
现在参考图3a-图3b,用方法300表示在上述系统(用于管理备份处理)中实现的示例性方法的逻辑流程图。
该方法开始于主控系统的栏中的黑色起始圆圈303。继续到方框306,整个基础设施的管理员(主管备份处理)定义一个新的调度文件;例如,该操作可以在每年的结束时进行,用于整个下一年。
现在转向一般从系统的栏,定期(例如,每天)地执行验证步骤;优选地,在不同的从系统上异相地调用该验证步骤(诸如,在第一台上在12:00;在第二台上在12:15;在第三台上在12:30等等)。这种选择避免了对所需的共享资源(即,调度文件和控制文件)的任何争用。
更详细地,只要相应的超时届满(方框309),就在方框312中开始备份脚本;这触发从主控系统中读取调度文件,接着执行用于每个以该从系统为主机的客系统的循环。该循环开始于方框315,其中备份脚本验证当前的客系统(从第一台开始)是否包含在调度文件中。如果包含,则在方框318中进行进一步的测试,以确定当天是否符合在调度文件中针对该客系统而指定的备份频率。
在确认的情况下(意味着该客系统今天能够备份其数据),则该方法下降到方框321;在这一阶段,备份脚本(从配置文件中)提取由客系统使用的共享磁盘的标识符。现在在方框324中进行测试,以确定今天的控制文件是否已经存在于主控系统上(例如,由当前日期前的关键词所标识)。如果没有存在,则在方框327中创建新的控制文件并且操作的流程随后继续到方框330;相反地,直接从方框324到达方框330。在任一种情况下,在方框330中将共享磁盘(其中存储客系统的需要备份的数据)的标识符增加到控制文件中。
现在考虑方框333,如果在控制文件中针对该(重要)客系统指定了关机时间,则该方法下降到方框336;在这种状态下,用于该客系统的关机时间存储到从系统上(例如,在配置文件内的相应记录中)。
操作的流程又一次在方框339中汇合;从方框336、方框333(当在调度文件中没有规定用于该客系统的关机时间时)、方框318(当在调度文件中没有针对该客系统指定当前这一天时)或方框315(当客系统不包括在调度文件中时)到达方框339。如果还有更多的客系统需要处理,则该方法返回到方框315中,重复对下一个客系统的相同的操作;相反地,退出循环,由此结束定期的验证步骤。
以这种方式,在所有从系统上的验证步骤的最后,控制文件将包括今天需要备份的共享磁盘(用于不同的从系统上的激活的客系统)的完整列表。
操作的流程在每个从系统的栏中继续;对于以该从系统为主机的每个重要的客系统,只要相应的关机时间一到(方框342),就在方框345中关闭该重要的客系统。
同时,在方框348中相应超时的届满触发主控系统上的备份管理器进入方框351;在这一阶段,备份管理器寻找今天的配置文件(根据上述命名规则识别)。如果控制文件存在(判断方框354),则该方法继续到方框357,其中删除控制文件中任何重复的共享磁盘。这阻止了重复备份同一共享磁盘;以这种方式,对备份处理进行优化,以减少所需的操作(并且因此减少其长度)。
现在针对每个其余的需要备份共享磁盘(从第一台开始)执行循环。该循环开始于方框360,其中操作的流程根据当前共享磁盘的容量进行分流。当共享磁盘很大时(即,基本上具有与磁带相同的容量),执行方框363,而当共享磁盘较小时,则执行方框366-372;在两种情况下,方法在方框375中汇合。
特别地,考虑方框363(较大的共享磁盘,诸如具有在所讨论的例子中的10G字节容量),备份管理器从可用的机器人程序中选择一个(例如,根据负载平衡算法);命令所选的机器人程序使用称为直接向磁盘记录(DDR)的技术将共享磁盘复制到磁带上(磁带上的一个共享磁盘)。该方法随后继续到方框375。
作为代替,参考方框366(较小的共享磁盘,诸如具有在所讨论的例子中的3G字节的容量),则备份管理器从可用的压缩实用程序中选择一个(始终根据负载平衡算法);随后命令所选的压缩实用程序使用称为DDR2CMSX的不同技术来压缩共享磁盘并将其增加到当前映像文件(在贮存磁盘上)。现在在方框369中进行测试,以验证该映像文件是否是完整的;在所讨论的例子中,其中每个磁带具有10G字节的容量并且每个较小的共享磁盘具有3g字节的容量,当3个较小的共享磁盘已经被压缩成一个映像文件之后发生这种情况。如果该测试的结果是正确的,则备份管理器在方框372中同样地选择可用的机器人程序中的一个,并且现在命令其例如通过VM命令VMFPLC2将映像文件复制到磁带(一个磁带上有三个共享磁盘)上。该方法随后继续到方框375;当映像文件不完整时还从方框369直接到达方框375。
现在考虑方框375,进行测试以验证是否更多的共享磁盘仍然需要备份(在控制文件中)。如果是这样,则该方法返回方框360以在下一个共享磁盘上重新进行该步骤;相反地,退出循环,下降到方框378中。
在这一阶段,任何仍然不完整的(在不同的压缩应用的控制下)映像文件都同样地复制到相应的磁带上。前进到方框381中,将备份处理的结果保存到相应的日志中;同时,优选地通过电子邮件通知管理员备份处理已经结束(并附上其结果)。该方法在同心的白/黑停止圆384中结束。
自然地,为了满足本地和特定的要求,本领域的普通技术人员可以将上述解决方案应用到很多修改和变更。特别的,尽管已经参考其实施例在特定的某种程度上描述了本发明,但是应当理解,有可能存在在形式和细节以及其他实施例上的不同的省略、替换和改变;此外,明确地意味着,与本发明的任意公开实施例相关地描述的特定元件和/或方法步骤可以包含在任意其他的实施例中,作为设计选择的一般要素。
例如,如果基础设施具有不同的体系结构并且包括等价的单元,则可以应用类似的配置。此外,每个计算机可以具有另一结构或者可以包括类似的单元(诸如,临时存储程序或部分程序以减少在执行期间对共享磁盘的访问的高速缓存存储器);在任意情况下,可能用任意代码执行实体(诸如PDA、移动电话等等)来代替计算机。可选地,所提出的解决方案可以应用到指示在该基础设施中可用的主/客系统的一个子集。本发明的概念还适用于需要备份的任意其他数据(例如,诸如程序代码、多媒体任务等数据)。在本发明的不同实施例中,调度文件还可以包括对每个客系统需要备份的数据的指示(然而,具有总是被各个从系统增加到控制文件的相应访问路径)。
应当容易明白,所提出的调度文件和控制文件指示示例性的,并且它们可以用任意其他的等价结构(例如,只简单的列举备份日期)所代替。
还可以在调度程序中定义更复杂的策略(诸如关于特定事件的条件);在任何情况下,其中只可能指定需要备份的客系统(每当备份处理执行时)的本发明的基本实现都在本发明的范围之内。
即使在前面的描述中,已经参考了一种其中每天(由相应的从机器)执行对每个客系统是否包含在调度程序中的验证的备份处理,但是这不是限制性的方式。实际上,如果用任何其他的定期性或者甚至以更复杂的时间图来执行相同的操作,类似的考虑也适用;在任何情况下,其中由主控系统对客系统进行轮询的实现都不是排他的。
当(在不同从系统执行的每一对连续的验证步骤之间)的时间偏移具有其他的长度时,可以适用类似的考虑;可选地,使用通知技术(其中每个从系统通知下一个从系统其验证步骤已经结束了)也可以获得相同的结果。然而,还可以是基本的实现,在其中所有的从系统同时地执行验证步骤。
在不偏离本发明的原理的情况下,可以以任何其他的方式定义重要的客系统的关机时间。例如,在本发明的不同实施例中,在调度文件中没有指定关机时间;在这种情况下,每天恰好在备份处理开始(诸如在22:00)之前,每个从系统读取主控系统上的调度文件,并且无条件地关闭包括在内的所有相应的客系统。此外,在所提出的实现中,被关闭的客系统的重启由其所有者决定;可选地,还有可能实现自动的步骤,其中备份管理器通知从系统备份处理已经结束,以便使得它们自动地重启它们的重要的客系统。在任何情况下,需要强调的是,与客系统关机相关的特征不是严格必需的,并且其可以在某些实现(例如,当数据的一致性不是非常重要时)被省略掉。
尽管已经针对基于虚拟机的环境特定地设计了根据本发明的解决方案,但是不应以限制性的方式对其进行解释。实际上,相同的概念还适用于具有等效体系结构(其中一般的主机实现多个客户机)的系统;在任何情况下,可以预期将所提出的解决方案应用于任何其他的数据处理实体(诸如物理机器,每个机器直接控制所需操作的执行)。
所设计的解决方案优选地在上述基于共享磁盘(或任何其他的存储介质中)的基础设施中实现。然而,相同的解决方案还可以在网络基础设施中找到应用。
此外,利用等效的技术(例如,通过在备份期间跳过它们)可以获得避免重复备份同一共享磁盘(在控制文件中是重复的)的结果。在任何情况下,没有这一特征的简化实施例也在本发明的范围之内。
如果程序(其可以用于实现本发明的每个实施例)是以不同方式构造的,或者如果提供了附加的模块或功能,类似的考虑也适用;类似地,存储器结构可以是其他类型的,或者可以用等效的实体(不一定包括物理存储介质)来代替。此外,所提出的解决方案使其自身可以以等效方法来实现(具有类似的或附加的步骤,甚至以不同的次序)。在任何情况下,程序可以采取能够被任何数据处理系统使用或结合的任何形式,诸如外部或驻留软件、固件或微代码(在对象代码中或在源代码中)。此外,程序可以提供在任何计算机可用介质;该介质可以是任何适合于包含、存储、交换、传播或传送程序的单元。这些介质的例子是固定磁盘(其中程序是预先载入的)、可移动磁盘、磁带、卡、导线、光纤、无线连接、网络、广播波等等;例如,介质可以是电子、磁、光、电磁、红外或半导体类型的。
在任何情况下,根据本发明的解决方案使其自身可以以硬件结构(例如,集成在半导体材料的芯片内)、或以软件硬件组合的形式来实现。

Claims (16)

1.一种用于在包括多个数据处理实体(110,115)的系统(100)中备份数据的方法(300),对于一组所述实体,所述方法包括步骤:
在选择的一个所述实体(110m)上提供(306)调度结构(245),所述调度结构包含对被激活以备份相应数据(215-225)的实体的指示;
验证(309-318)每个实体是否包含在所述调度结构中;
响应于包含的情况,每个被激活实体将对所述相应数据的指示增加(324-330)到所选择实体上的控制结构(250)中;以及
在所选择实体的控制下对所述控制结构中指示的数据进行备份(348-381)。
2.根据权利要求1所述的方法(300),其中所述调度结构(245)还包括对用于每个被激活实体(110,115)的调度策略的指示,所述验证(309-318)每个实体是否包含在所述调度结构中的步骤包括:
验证(318)当前日期与相应的调度策略是否匹配。
3.根据权利要求1或2所述的方法(300),其中在每个实体(110,115)的控制下定期地执行(309)验证(309-318)每个实体是否包含在所述调度结构中的步骤。
4.根据权利要求3所述的方法(300),其中所述实体(110,115)彼此异相地执行验证(309-318)每个实体是否包含在所述调度结构中的步骤。
5.根据权利要求1、2或4所述的方法(300),其中对于至少一个重要的被激活实体(110,115),在调度结构(245)中存在关机时间指示,所述方法还包括步骤:
响应于所述包含的情况,每个被激活实体验证(333)相应的关机时间是否存在于所述调度结构中;以及
响应于存在的情况,每个重要的被激活实体在到达相应的关机时间时关机(342-345)。
6.根据权利要求1、2或4所述的方法(300),其中所述系统(100)包括多个主机(110),每个主机是多个客户机(115)的主机,所述实体包括所述客户机,以及其中所述验证(309-318)每个实体是否包含在所述调度结构中步骤和响应于包含的情况,每个被激活实体将对所述相应数据的指示增加(324-330)到所选择实体上的控制结构(250)中的步骤在每个用于相应的客户机的主机的控制下执行。
7.根据权利要求1、2或4所述的方法(300),其中所述实体(110,115)共享多个存储介质(120)、所述调度结构(245)、所述控制结构(150)以及被存储在所述共享存储介质上的数据(215-225)。
8.根据权利要求7所述的方法(300),其中所述控制结构(250)包括对存储每个被激活实体的数据(215-225)的存储介质(120)的指示,所述方法还包括步骤:
阻止(357)对在所述控制结构中重复的每个存储介质的重复备份。
9.一种包括多个数据处理实体(110,115)的系统(100),包括:
调度结构(245),其在选择的一个所述实体(110m)上,所述调度结构(245)包含对被激活以备份相应数据(215-225)的实体的指示;
控制结构(250),其在所述选择的实体上,所述控制结构(250)包括被激活实体的相应数据(215-225)的指示;
备份管理器(240),其在所选择实体的控制下对所述控制结构中指示的数据进行备份;
用于验证每个实体是否包含在所述调度结构中的装置;以及
用于响应于包含的情况,将每个被激活实体的所述相应数据的指示增加到所述选择的实体上的控制结构(250)中的装置。
10.根据权利要求9所述的系统(100),其中所述调度结构(245)还包括对用于每个被激活实体(110,115)的调度策略的指示,所述用于验证每个实体是否包含在所述调度结构中的装置还验证当前日期与相应的调度策略是否匹配。
11.根据权利要求9或10所述的系统(100),其中所述用于验证每个实体是否包含在所述调度结构中的装置在每个实体(110,115)的控制下定期地执行验证。
12.根据权利要求11所述的系统(100),其中所述用于验证每个实体是否包含在所述调度结构中的装置在所述实体(110,115)彼此异相地控制下执行验证。
13.根据权利要求9、10或12所述的系统(100),其中对于至少一个重要的被激活实体(110,115),在调度结构(245)中存在关机时间指示,并且其中,
所述用于验证每个实体是否包含在所述调度结构中的装置还响应于所述包含的情况,验证每个被激活实体相应的关机时间是否存在于所述调度结构中;以及
响应于存在的情况,每个重要的被激活实体在到达相应的关机时间时关机。
14.根据权利要求9、10或12所述的系统(100),其包括多个主机(110),每个主机是多个客户机(115)的主机,所述实体包括所述客户机,以及其中所述用于验证每个实体是否包含在所述调度结构中的装置和用于响应于包含的情况将每个被激活实体的所述相应数据的指示增加到所述选择的实体上的控制结构(250)中的装置在每个用于相应的客户机的主机的控制下执行操作。
15.根据权利要求9、10或12所述的系统(100),其中所述实体(110,115)共享多个存储介质(120)、所述调度结构(245)、所述控制结构(150)以及被存储在所述共享存储介质上的数据(215-225)。
16.根据权利要求15所述的系统(100),其中所述控制结构(250)包括对存储每个被激活实体的数据(215-225)的存储介质(120)的指示,所述系统还包括:
用于阻止对在所述控制结构中重复的每个存储介质的重复备份的装置。
CNB2006101392424A 2005-11-21 2006-09-20 具有中央控制的数据备份的方法和系统 Expired - Fee Related CN100485630C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP05111045.0 2005-11-21
EP05111045 2005-11-21

Publications (2)

Publication Number Publication Date
CN1971527A CN1971527A (zh) 2007-05-30
CN100485630C true CN100485630C (zh) 2009-05-06

Family

ID=38112362

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101392424A Expired - Fee Related CN100485630C (zh) 2005-11-21 2006-09-20 具有中央控制的数据备份的方法和系统

Country Status (3)

Country Link
US (1) US8015374B2 (zh)
JP (1) JP5186098B2 (zh)
CN (1) CN100485630C (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101399696B (zh) * 2007-09-24 2011-09-21 国际商业机器公司 通过网络为客户机安装软件的方法、系统及相应的客户机
US8201246B1 (en) 2008-02-25 2012-06-12 Trend Micro Incorporated Preventing malicious codes from performing malicious actions in a computer system
US8041987B2 (en) * 2008-11-10 2011-10-18 International Business Machines Corporation Dynamic physical and virtual multipath I/O
US9298563B2 (en) 2010-06-01 2016-03-29 Hewlett Packard Enterprise Development Lp Changing a number of disk agents to backup objects to a storage device
JP5750976B2 (ja) * 2011-04-04 2015-07-22 セイコーエプソン株式会社 情報処理システムおよび情報処理システムのバックアップ方法
US8738958B2 (en) * 2011-06-20 2014-05-27 QuorumLabs, Inc. Recovery node testing
US9411628B2 (en) * 2014-11-13 2016-08-09 Microsoft Technology Licensing, Llc Virtual machine cluster backup in a multi-node environment
US10061611B2 (en) * 2015-08-28 2018-08-28 Vmware, Inc. Virtual machine migration within a hybrid cloud system
CN110597778B (zh) * 2019-09-11 2022-04-22 北京宝兰德软件股份有限公司 一种分布式文件备份和监控的方法及装置
CN111538566A (zh) * 2020-04-24 2020-08-14 咪咕文化科技有限公司 镜像文件处理方法、装置、系统、电子设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717934A (en) * 1994-10-28 1998-02-10 Deltec Electronics Corporation Sequential computer network shutdown system and process therefor
JPH1031562A (ja) * 1996-07-17 1998-02-03 Hitachi Ltd 情報処理システム
ES2249450T3 (es) * 2000-07-05 2006-04-01 ERNST & YOUNG LLP Metodo y aparato para proporcionar servicios informaticos.
JP3938475B2 (ja) * 2001-03-29 2007-06-27 株式会社日立製作所 バックアップ処理方法及びその実施システム並びにその処理プログラム
JP4074442B2 (ja) * 2001-03-30 2008-04-09 株式会社日立製作所 データのバックアップのための方法、装置、システム、プログラム及び記憶媒体
JP4567293B2 (ja) * 2003-01-21 2010-10-20 株式会社日立製作所 ファイルサーバ
JP4278452B2 (ja) * 2003-08-04 2009-06-17 株式会社日立製作所 計算機システム
JP2005149106A (ja) * 2003-11-14 2005-06-09 Nec Corp バックアップシステム及びバックアップ運用制御プログラム
US7467267B1 (en) * 2004-07-23 2008-12-16 Sprint Communications Company L.P. Method and system for backing up or restoring data in remote devices over a communications network

Also Published As

Publication number Publication date
US8015374B2 (en) 2011-09-06
CN1971527A (zh) 2007-05-30
JP2007141231A (ja) 2007-06-07
JP5186098B2 (ja) 2013-04-17
US20070159974A1 (en) 2007-07-12

Similar Documents

Publication Publication Date Title
CN100485630C (zh) 具有中央控制的数据备份的方法和系统
CN105339939B (zh) 对在线热备份数据库的复制
US7024581B1 (en) Data processing recovery system and method spanning multiple operating system
EP1907935B1 (en) System and method for virtualizing backup images
US10067835B2 (en) System reset
CN100458716C (zh) 数据维护、备份和恢复方法
EP1402367B1 (en) Copying procedures including verification in data networks
US10592354B2 (en) Configurable recovery states
CN101398770A (zh) 迁移一个或多个虚拟机的系统和方法
CN102834822A (zh) 由虚拟机共享的群集的快速-完整备份
CN106062742A (zh) 用于改进快照性能的系统和方法
CN103562878A (zh) 在镜像虚拟机系统中的存储器检查点设置
CN106970856B (zh) 对数据进行备份、恢复及挂载的数据管理系统及方法
CN109690494A (zh) 系统存储装置中的分层容错
CN101086717B (zh) 存储瞬态信息的系统和方法
US20180189095A1 (en) Physical to virtual scheduling system and method
EP3769225B1 (en) Free space pass-through
US10891205B1 (en) Geographically dispersed disaster restart multitenancy systems
CN111989656B (zh) 可配置的恢复状态
CN108897561B (zh) 一种数据存储方法及存储系统
Tersoo et al. Practical Approach to Implement Koha Data Backup through Cloud Computing In Benue State University
CN115617575A (zh) 一种CDM场景下的VMware虚拟机备份方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090506

Termination date: 20160920