CN102591744A - 从任何群集节点的数据的备份和还原 - Google Patents

从任何群集节点的数据的备份和还原 Download PDF

Info

Publication number
CN102591744A
CN102591744A CN2011104401159A CN201110440115A CN102591744A CN 102591744 A CN102591744 A CN 102591744A CN 2011104401159 A CN2011104401159 A CN 2011104401159A CN 201110440115 A CN201110440115 A CN 201110440115A CN 102591744 A CN102591744 A CN 102591744A
Authority
CN
China
Prior art keywords
node
volume
trooping
data item
snapshot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104401159A
Other languages
English (en)
Other versions
CN102591744B (zh
Inventor
J·布拉戈海因
A·达马托
V·R·尚卡尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102591744A publication Critical patent/CN102591744A/zh
Application granted granted Critical
Publication of CN102591744B publication Critical patent/CN102591744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/82Solving problems relating to consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Abstract

本发明涉及从任何群集节点的数据的备份和还原。实现时间点备份。可以在分布式计算环境中实施一种方法。分布式计算环境包括多个计算系统节点。该方法包括在计算环境的第一节点处,拍摄群集卷的快照。群集卷存储数据项(例如,文件/块)。拍摄快照包括为卷中的数据项标记时间点。该方法还包括接收计算环境中与第一节点不同的节点已决定在所标记的时间点之后的点将群集卷中的数据项从数据项的旧版本变更至数据项的新版本的通知。该方法还包括在第一节点处,在修改前保存数据项的旧版本。

Description

从任何群集节点的数据的备份和还原
背景技术
背景和相关技术
计算机和计算系统已经影响到了现代生活的几乎每个方面。计算机通常在工作、消遣、保健、运输、娱乐、家政管理等中都有涉猎。
此外,计算系统功能还可以通过计算系统的经由网络连接互连到其他计算系统的能力来增强。网络连接可包括,但不仅限于,经由有线或无线以太网的连接,蜂窝式连接,或者甚至通过串行、并行、USB或其它连接的计算机到计算机的连接。这些连接允许计算系统访问其他计算系统上的服务,快速且有效地从其他计算系统接收应用程序数据,并允许计算系统以其他方式协作执行计算任务。
在一些实施例中,一组节点(例如,服务器)被安排成群集。在群集中,如果任何节点发生故障,那么群集的其他节点可透明地接管发生故障的节点的工作。其他节点可重启应用程序并由此继续服务客户机而没有显著中断。该操作一般被称为故障转移,或故障转移群集。
故障转移群集通常实现“无共享”存储模型。即,每一存储单元(例如,磁盘或其一部分)由单个节点拥有。只有该节点才可执行对该特定存储单元的直接输入/输出(I/O)。存储单元可通过展示一个或多个卷的逻辑单元号(LUN)来引用。
在该模型中,应用程序和磁盘资源是具有应用程序资源和磁盘资源之间显式依赖性的共有组(对应于LUN的故障转移单元)的一部分。这提供了某种保证:使磁盘在应用程序启动前上线并在应用程序退出之后下线。结果,经群集的应用程序被约束于该I/O模型,由此需要访问相同磁盘的任何应用程序都需要运行在相同的群集节点上。
如上所述,在分布式环境中节点可访问通常被称为LUN的共享数据存储。数据容器是数据存储上、通常被称为卷的逻辑分配。在群集的情况下,它们被称为群集卷。数据容器进而可挂载类似NTFS或FAT的文件系统,其中各个文件可作为逻辑单元来存储和管理。文件可以是此处所引用的数据项中的一种。类似地,卷/磁盘内的块可以是数据容器中的另一种数据项。
如群集共享卷(CSV)(从华盛顿州雷德蒙市的微软公司获得的一种技术)的一些群集技术在各节点之间协作,以经由代理群集卷向非所有者节点提供对数据存储设备的可直接I/O访问。
群集中的一个节点拥有该群集卷。群集在全部节点上展示代理群集卷以允许访问群集卷。群集卷保证了数据一致性,因而节点可以独立地访问和修改数据。使用代理群集卷,应用程序可直接对数据存储(在当前示例中是LUN)进行I/O。
实现群集卷的备份操作的现有方案使得用户将执行备份操作的节点指定为正在备份的群集卷的所有者节点。群集卷将被挂载在所有者节点处,并且其他节点将依赖所有者节点来在群集存储上执行操作。由于群集卷一次只能有一个所有者,这迫使在群集卷上的用户数据备份串行化,意味着在任何给定时间只有单个节点可通过向所有者节点发送更新来创建备份。为了备份期间的数据一致性,全部I/O被转发至所有者节点,导致网络通信量升高,造成显著降级的IO性能。
在此要求保护的主题不限于解决任何缺点或仅在诸如上述环境中操作的各个实施例。相反,提供该背景仅用以示出在其中可实践在此描述的部分实施例的一个示例性技术领域。
发明内容
此处所示的一个实施例包括可以在分布式计算环境中实施的方法。分布式计算环境包括多个计算系统节点。该方法包括用于实现时间点备份的动作。该方法包括,在计算环境的第一节点处经由代理群集卷拍摄群集卷的快照。该群集卷存储文件。拍摄快照包括在群集卷中标记时间点。该方法还包括接收计算环境中与第一节点不同的节点已决定在标记的时间点之后的点将群集卷中的数据项从数据项的旧版本变更至数据项的新版本的通知。该方法还包括在第一节点保存数据项的旧版本。
提供本发明内容以便以简化的形式介绍将在以下具体实施方式中进一步描述的一些概念。本发明内容并非旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
另外的特征和优点将在以下的描述中阐述,并且部分可从该描述中显而易见,或者可以从此处的教示实践中习得。本发明的各特征和优点可以通过在所附的权利要求书中特别指出的手段和组合来实现和获得。本发明的特征将从以下描述和所附权利要求书中变得完全显而易见,或者可通过如下所述对本发明的实践而获知。
附图说明
为了描述可获得本主题的上述和其它优点和特征的方式,将通过参考附图中示出的本主题的具体实施方式来呈现以上简要描述的本主题的更具体描述。应该理解,这些附图仅描绘了各典型实施例,因此其不应被认为是对范围的限制,各实施例将通过使用附图用附加特征和细节来描述并解释,在附图中:
图1示出了具有备份和还原功能的示例计算群集;以及
图2示出了实现分布式计算环境的时间点备份的方法。
具体实施方式
此处所述的一些实施例实现一插件(本文有时称为快照提供者)和可由群集中的任何节点使用来备份卷的系统备份基础架构。但仍保留有所有者节点,使得群集卷挂载在该所有者节点上。代理群集卷被展示来表示全部节点上的群集卷。节点能通过代理群集卷访问群集卷,并且备份可以是针对代理群集卷发起的。没有挂载群集卷的节点仍然可以执行备份功能。快照提供者和备份基础架构可用于创建时间点图像,诸如来自任何群集节点的群集卷的快照。实际的快照可以创建在与创建快照的节点不同的节点(诸如所有者节点)上。可实现各实施例以保证实际快照是时间一致的,与哪些节点正在修改群集卷的内容无关。
可实现各实施例以促进在进行备份方面对用户的透明性。例如,不知道关于代理群集卷的任何事情的传统备份应用程序能备份主存在这样的卷上的数据。可通过与可位于不同群集节点上的群集卷的真实快照协作来透明地维持代理群集卷的时间点图像。
现在参考图1,示出了一个基本示例。在由图1所示的示例中,示出了群集102。群集102包括多个节点,通过网络103连接的节点1、节点2、节点3和节点4。节点2包括底层群集卷104。例如,底层群集卷104可以是诸如FAT32或NTFS文件系统之类的文件系统。文件系统可以和底层数据存储设备相关。在图1所示的示例中,底层群集卷104可连接至数据存储设备105,数据存储设备105可以是群集卷104的底层数据存储设备。数据存储设备105例如可以是NAS(网络附接存储)、SAN(存储区域网络)等。在此处所示的示例中,群集卷104是数据存储设备105的一部分。群集卷被展示在诸如节点2之类的所有者节点上。所有者节点是对其挂载群集卷的节点,在此示例中是使用底层数据容器104的节点2。群集卷通过存在于群集102中的每一节点的代理群集卷(一般地引用为110,但对于节点n2、n3、n4和n1分别具体示为110-0、110-1、110-2和110-3)展示在群集102中的全部群集节点上。尽管各实施例可以允许其他节点通过向所有者节点(节点2)发送I/O来访问群集卷,但是此处所示的示例允许各节点(n3、n4、n2和n1)中的每一个通过代理群集卷110在数据存储设备105上直接执行I/O操作。
各群集节点的每一个包括用于备份或拍摄底层数据容器104(也称为群集卷)的快照的基础架构,一般地引用为112,但对于节点n2、n3、n4和n1分别在每一节点上示为112-0、112-1、112-2和112-3。在所示示例中,备份应用程序和/或基础架构112可以仅旨在与本地挂载的卷一起使用。在本示例中,底层群集卷104和数据存储设备105表现为本地挂载至备份应用程序和/或基础架构112-0的卷。可以通过创建卷的快照图像来执行备份。快照图像可以经由写时复制算法来实现。这意味着在创建原始快照图像时,快照图像的底层存储和群集卷是相同的。在要更改群集卷中的数据项时,在节点2处由基础架构112-0保存数据项较旧的版本。以这种方式,快照可呈现群集卷的时间点图像而并不制作该卷的完全副本。
现在示出节点参与使用数据存储设备105并具有用于在代理群集卷上执行备份操作的功能,现在请转向关注节点3。节点3包括代理群集卷110-1。代理群集卷110-1允许节点3直接访问数据存储设备105。代理群集卷110-1是表示挂载在节点2中的群集卷的代理卷。类似地,群集102中的全部节点都能够通过存在于那些节点处的代理群集卷110的实例(例如,110-0,110-2和110-3)来访问群集卷。
现在参考节点3示出了一具体示例,但应当理解,群集102中的任何其他节点(包括所有者节点节点2,其包括代理群集卷110-0和快照提供者114-0)可以采取类似的动作。节点3可以包括备份应用程序和/或基础架构112-1。备份应用程序和/或基础架构112-1可被配置为与诸如本地文件系统或本地卷之类的本地数据容器一起工作,并可能未被配置为与共享文件系统一起工作。由此,节点3包括快照提供者114-1,快照提供者114-1可被用作备份应用程序和/或基础架构112-1之间的接口以使共享文件系统能够与备份应用程序和/或基础架构112-1一起使用。快照提供者114-1具有两个组件,前端和后端。前端(其可称为代理快照提供者)是备份应用程序和/或基础架构112-1调用的入口点,后端是在节点2中运行的服务(群集基础架构的一部分),根据节点2是群集卷挂载的节点的事实,节点2是群集卷的所有者。在节点3处的备份应用程序和/或基础架构112-1仅与前端交互,并且可以不注意后端。
快照提供者114-1向备份应用程序和/或基础架构112-1通知快照提供者可创建快照图像并为代理群集卷管理它们的生命周期。由此,备份应用程序和/或基础架构112-1将调用代理快照提供者114-1以执行备份操作。快照提供者114-1前端将调用中继至所有者节点(节点2)上的后端,在那里真实的快照图像得以创建且在群集卷上管理它的生命周期。后端使用所有者节点上的基础架构112-0来创建真实快照图像。例如,来自节点3处的备份应用程序和/或基础架构112-1的备份请求被路由至代理快照提供者114-1,代理快照提供者114-1使得向节点2处的后端发送一消息。在节点2处,基础架构112-0用于在群集卷上设置快照时间点,这将导致对群集卷104中的数据的后续更改将被保存。
一旦在群集卷上创建了快照,从任何节点经由代理群集卷/代理卷对该卷的修改就将触发至所有者节点(节点2)的通知,以在与群集卷相关联的真实快照图像上执行任何必要的写时复制。每一群集节点代表群集卷将其自己的“写时复制”状态的视图维护在代理群集卷上。使用该状态,群集节点最小化了对所有者节点的写时复制请求的数量。由于所有者节点执行真实的写时复制,即使不同的节点发送重复或重叠请求也可维持正确性。
例如,如果节点3设法增加或更改群集卷104中的数据,其将通过代理群集卷110-1将数据发送至存储设备105。此外,节点3上的代理群集卷110-1将俘获对存储在群集104中的数据项的任何修改,并通过群集基础架构通知节点2在群集卷104中某样东西将被更改,这将使得基础架构112-0保存旧数据。
一些实施例可以使用从华盛顿州雷德蒙市的微软公司获得的卷阴影副本(VSS)架构来实现。现在示出示例。VSS是提供备份和还原基础架构的Windows组件。备份产品使用VSS基础架构向用户提供备份和还原功能。代理群集卷110是在具有相同接入点(即,具有相同的名称空间)的每个节点上的群集展示的卷。代理群集卷可支持来自全部群集节点的同时或近乎同时的读/写操作。代理快照提供者是承担创建代理群集卷的快照(时间点)图像的责任的VSS基础架构中的可插入模块。在所示示例中,代理快照提供者是快照提供者114-0。系统提供者是在VSS基础架构中创建快照图像的可插入模块。在所示示例中,插件114-4可以是系统提供者。群集服务提供Windows群集功能。在所示的实施例中,它运行在每个群集节点上。文件系统可挂载在代理卷上,并展示文件语义供应用程序使用。在所示的实施例中,这也运行在每个群集节点上。
通常,VSS基础架构具有单个节点视图。它仅能与本地卷(非网络共享)一起工作,并且还假定仅从那一个节点来访问卷。然而,不管存储的分布式特性,此处所述的一些实施例可以向VSS基础架构呈现单个节点视图并对VSS隐藏代理群集卷的分布式特性。分布式特性意味着对群集卷的I/O可能在任何时间来自任何群集节点。
各实施例可包括提供者以插入到群集节点的VSS框架中。该提供者具有两个组件,前端和后端。前端是VSS基础架构调用的入口点,后端是在为群集卷的“所有者”的群集节点中运行的服务。VSS基础架构仅与前端交互,并不注意后端。
由于提供者向VSS通知它可创建快照图像并为群集卷管理它们的生命周期,VSS基础架构将调用提供者。提供者前端将调用中继至“所有者”节点上的后端,在那里真实快照图像得以创建且它的生命周期在群集卷上管理。后端使用所有者节点上的VSS系统提供者在群集卷上创建真实的快照图像。
经由系统提供者创建的快照图像可以经由写时复制算法来实现。这意味着在快照图像被创建时,快照图像的底层文件存储和原始卷是相同的。在文件在原始卷中被更改时,数据的较旧版本被复制至快照图像中。由此,快照可呈现卷的时间点图像而并不制作原始卷的完全副本。再一次,此实现仅支持本地卷。
一旦在通过代理群集卷展示的群集卷上创建了快照,从任何节点对该卷的修改就将触发对“所有者”节点的通知,以在与群集卷相关联的真实快照图像上执行任何必要的写时复制。每一代理群集卷维护其自己的群集卷的“写时复制”状态的视图。使用该状态,群集节点最小化了对“所有者”节点的写时复制请求的数量。由于所有者节点执行真实的写时复制,即使不同的节点发送重复或重叠请求也可维持正确性。
展示给备份应用程序的快照图像也是容错的。这意味着如果所有者节点中的群集卷和/或相关联的快照图像离线并且然后重新上线(在原始节点或不同的节点上),那么展示给备份应用程序的快照图像将保持存活并且始终是可访问的。
各实施例也可以允许快照图像可从群集中的任何数量的节点访问。例如,如果备份应用程序需要快照图像展示在全部的群集节点或其子集上,那么不管哪个节点是真实快照图像的“所有者”,这样做都是可能的。
以下讨论现涉及可以执行的多种方法以及方法动作。虽然用特定次序讨论或用以特定次序发生的流程图示出了各个方法动作,但除非明确规定否则不需要特定次序,或因为一动作依赖于另一动作在执行该动作之前完成而需要特定次序。
此处所示的一个实施例包括可以在分布式计算环境中实施的方法200。分布式计算环境包括多个计算系统节点。该方法包括用于实现时间点备份的动作。该方法包括,在计算环境的第一节点处拍摄代理群集卷的快照(动作202)。代理群集卷存储数据项(例如,文件/块)。拍摄快照包括为后备群集卷中的数据项标记时间点。该方法还包括接收计算环境中与第一节点不同的节点已决定在所标记的时间点之后的点通过代理群集卷将群集卷中的数据项从数据项的旧版本变更至数据项的新版本的通知(动作204)。该方法还包括在第一节点处,存储数据项的旧版本(动作206)。
方法200可以被实施,其中第一节点是将群集卷挂载在第一节点处的所有者节点。例如,如图1所示,将群集卷104挂载至它的节点2可以是第一节点的示例。
方法200可以被实施,其中接收计算环境中不同于第一节点的节点已决定通过代理群集卷更改群集卷中的数据项的通知。代理群集卷用作不同节点处的应用程序或基础架构与拥有节点上的群集卷之间的接口。
在一些实施例中,插件被配置为通过对本身并不具有群集功能的备份应用程序或基础架构表现为逻辑存储,来对备份应用程序或基础架构实现透明性。例如,快照提供者114-1允许节点3中的代理群集卷110-1对备份应用程序表现为本地存储。在备份应用程序和/或基础架构112本身并不支持代理群集卷的实施例中,这尤其有用。
插件可包括前端和后端。前端可以是备份应用程序或基础架构调用的入口点,后端可以是运行在代理群集卷所有者节点中的服务。例如,在图1中,快照提供者114-1的前端可以是节点3中的入口点,而后端包括运行在节点2中的服务。后端可以使用所有者节点本机的基础架构来保存数据项的旧版本。在图1所示的示例中,后端可以使用基础架构112-0,其能通过底层代理群集卷104容易地访问数据存储设备105。
此外,该方法可以由包括一个或多个处理器和诸如计算机存储器等计算机可读介质的计算机系统来实施。具体而言,计算机存储器可以存储计算机可执行指令,计算机可执行指令在由一个或多个处理器执行时使得执行各种功能,如在各实施方式中所述的那些动作。
本发明的各实施例可以包括或利用含有计算机硬件的专用或通用计算机,这将在以下做出进一步讨论。本发明范围内的各实施例还包括用于携带或存储计算机可执行指令和/或数据结构的物理介质和其他计算机可读介质。这些计算机可读介质可以是通用或专用计算机系统能够访问的任何可用介质。存储计算机可执行指令的计算机可读介质是物理存储介质。携带计算机可执行指令的计算机可读介质是传输介质。由此,作为示例而非限制,本发明的各实施例可包括至少两种完全不同类型的计算机可读介质:物理计算机可读存储介质和传输计算机可读介质。
物理计算机存储介质包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储(如CD、DVD等)、磁盘存储或其他磁存储设备、或可用于存储计算机可执行指令或数据结构形式的所需程序代码装置且可由通用或专用计算机访问的任何其他介质。
“网络”被定义为允许在计算机系统和/或模块和/或其他电子设备之间传输电子数据的一个或多个数据链路。当信息通过网络或另一个通信连接(硬连线、无线、或者硬连线或无线的组合)传输或提供给计算机时,该计算机将该连接适当地视为传输介质。传输介质可包括可用于携带计算机可执行指令或数据结构形式的所需程序代码装置且可由通用或专用计算机访问的网络和/或数据链路。以上介质的组合也被包括在计算机可读介质的范围内。
此外,在到达各种计算机系统组件时,以计算机可执行的指令或数据结构的形式存在的程序代码装置可以自动地从传输计算机可读介质传输到物理计算机可读存储介质(或者反之亦然)。例如,通过网络或数据链路接收到的计算机可执行指令或数据结构可被缓存在网络接口模块(例如,“NIC”)内的RAM中,然后最终被传送到计算机系统RAM和/或计算机系统处的较不易失性的计算机可读物理存储介质。因此,计算机可读物理存储介质可被包括在同样(或甚至主要)利用传输介质的计算机系统组件中。
计算机可执行指令包括,例如使通用计算机、专用计算机、或专用处理设备执行某一功能或某组功能的指令和数据。计算机可执行指令可以是例如二进制代码、诸如汇编语言之类的中间格式指令、或甚至源代码。尽管用结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中定义的主题不必限于上述特征或动作。相反,上述特征和动作是作为实现权利要求的示例形式而公开的。
本领域的技术人员将理解,本发明可以在具有许多类型的计算机系统配置的网络计算环境中实践,这些计算机系统配置包括个人计算机、台式计算机、膝上型计算机、消息处理器、手持式设备、多处理器系统、基于微处理器的或可编程消费电子设备、网络PC、小型计算机、大型计算机、移动电话、PDA、寻呼机、路由器、交换机等等。本发明也可在其中通过网络链接(或者通过硬连线数据链路、无线数据链路,或者通过硬连线和无线数据链路的组合)的本地和远程计算机系统两者都执行任务的分布式系统环境中实施。在分布式系统环境中,程序模块可以位于本地和远程存储器存储设备二者中。
本发明可具体化为其他具体形式而不背离其精神或特征。所描述的实施例在所有方面都应被认为仅是说明性而非限制性的。因此,本发明的范围由所附权利要求书而非前述描述指示。落入权利要求书的等效方案的含义和范围内的所有改变被权利要求书的范围所涵盖。

Claims (15)

1.一种在包括多个计算系统节点的分布式计算环境中实现时间点备份的方法,所述方法包括:
在所述计算环境(102)的第一节点处,通过代理群集卷(110)拍摄群集卷(104)的快照,所述群集卷(104)存储数据项,其中拍摄快照包括标记时间点(202);
接收所述计算环境(102)中与所述第一节点不同的节点已决定在所标记的时间点之后的点通过所述代理群集卷(110)将所述群集卷(104)中的数据项从所述数据项的旧版本变更至所述数据项的新版本的通知(204);以及
在所述第一节点处,保存所述数据项的旧版本(206)。
2.如权利要求1所述的方法,其特征在于,所述第一节点是将所述群集卷挂载在所述第一节点处的所有者节点。
3.如权利要求1所述的方法,其特征在于,接收所述计算环境中不同于所述第一节点的节点已决定变更所述群集卷中的数据项包括:从所述不同的节点处的代理群集卷接收通知,所述代理群集卷用作应用程序和所述群集卷之间的接口。
4.如权利要求1所述的方法,其特征在于,插件被配置为通过对本身并不具有群集功能的备份应用程序或基础架构表现为逻辑存储来对所述备份应用程序或基础架构实现透明性。
5.如权利要求1所述的方法,其特征在于,插件包括前端和后端,其中所述前端是备份应用程序或基础架构调用的入口点,所述后端是运行在所述第一节点中的服务。
6.如权利要求5所述的方法,其特征在于,所述后端使用所述第一节点本机的基础架构来保存所述数据项的旧版本。
7.如权利要求1所述的方法,其特征在于,在所述计算环境的第一节点处,拍摄群集卷的快照是响应于在所述不同节点处的备份应用程序或基础架构指示应当在所述代理群集卷上拍摄快照,并且从所述不同的节点发送消息至所述第一节点以指示所述第一节点应当拍摄所述群集卷的快照而执行的。
8.一种包括计算机可执行指令的计算机可读介质,所述计算机可读指令在被一个或多个处理器执行时使得以下动作被执行:
在所述计算环境(102)的第一节点处,通过代理群集卷(110)拍摄群集卷(104)的快照,所述群集卷(104)存储数据项,其中拍摄快照包括标记时间点(202);
接收所述计算环境(102)中与所述第一节点不同的节点已决定在所标记的时间点之后的点通过所述代理群集卷(110)将所述群集卷(104)中的数据项从所述数据项的旧版本变更至所述数据项的新版本的通知(204);以及
在所述第一节点处,保存所述数据项的旧版本(206)。
9.如权利要求8所述的计算机可读介质,其特征在于,所述第一节点是将所述代理群集卷挂载在所述第一节点处的所有者节点。
10.如权利要求8所述的计算机可读介质,其特征在于,接收所述计算环境中不同于所述第一节点的节点已决定变更所述群集卷中的数据项包括:从所述不同的节点处的代理群集卷接收通知,所述代理群集卷用作在所述不同的节点处的应用程序或基础架构与所述群集卷之间的接口。
11.如权利要求8所述的计算机可读介质,其特征在于,插件被配置为通过对本身并不具有群集功能的备份应用程序或基础架构表现为逻辑存储来对所述备份应用程序或基础架构实现透明性。
12.如权利要求8所述的计算机可读介质,其特征在于,插件包括前端和后端,其中所述前端是备份应用程序或基础架构调用的入口点,所述后端是运行在所述第一节点中的服务。
13.如权利要求12所述的计算机可读介质,其特征在于,所述后端使用所述第一节点本机的基础架构保存所述数据项的旧版本。
14.如权利要求8所述的计算机可读介质,其特征在于,在所述计算环境的第一节点处,拍摄群集卷的快照是响应于在所述不同节点处的备份应用程序或基础架构指示应当拍摄快照,并且从所述不同的节点发送消息至所述第一节点以指示所述第一节点应当拍摄所述群集卷的快照而执行的。
15.一种在计算环境中用于实现时间点备份的计算系统,所述计算系统包括:
一个或多个处理器;
耦合至所述一个或多个处理器的一个或多个计算机可读介质,所述一个或多个计算机可读介质包括计算机可执行指令,所述计算机可执行指令在被处理器执行时使得一个或多个处理器执行以下动作:
在所述计算环境(102)的第一节点处,通过代理群集卷(110)拍摄群集卷(104)的快照,所述群集卷(104)存储数据项,其中拍摄快照包括标记时间点(202);
接收所述计算环境(102)中与所述第一节点不同的节点已决定在所标记的时间点之后的点通过所述代理群集卷(110)将所述群集卷(104)中的数据项从所述数据项的旧版本变更至所述数据项的新版本的通知(204);以及
在所述第一节点处,保存所述数据项的旧版本(206)。
CN201110440115.9A 2010-12-17 2011-12-16 从任何群集节点的数据的备份和还原 Active CN102591744B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/971,981 US8886609B2 (en) 2010-12-17 2010-12-17 Backup and restore of data from any cluster node
US12/971,981 2010-12-17

Publications (2)

Publication Number Publication Date
CN102591744A true CN102591744A (zh) 2012-07-18
CN102591744B CN102591744B (zh) 2015-05-06

Family

ID=46235712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110440115.9A Active CN102591744B (zh) 2010-12-17 2011-12-16 从任何群集节点的数据的备份和还原

Country Status (3)

Country Link
US (1) US8886609B2 (zh)
CN (1) CN102591744B (zh)
HK (1) HK1173246A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018091996A1 (en) * 2016-11-16 2018-05-24 International Business Machines Corporation Point-in-time backups via a storage controller to an object storage cloud
CN109542841A (zh) * 2018-10-25 2019-03-29 平安科技(深圳)有限公司 集群中创建数据快照的方法及终端设备
CN110442458A (zh) * 2012-11-26 2019-11-12 亚马逊科技公司 缩放计算群集
CN110704249A (zh) * 2016-12-30 2020-01-17 成都华为技术有限公司 一种保证应用一致性的方法、装置及系统
WO2020108623A1 (zh) * 2018-11-30 2020-06-04 腾讯科技(深圳)有限公司 数据备份方法、装置、服务器以及计算机可读存储介质
US10915410B2 (en) 2018-09-27 2021-02-09 International Business Machines Corporation Distributed system management using snapshots and packets

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8577842B1 (en) * 2011-09-19 2013-11-05 Amazon Technologies, Inc. Distributed computer system snapshots and instantiation thereof
US10417027B1 (en) * 2012-03-30 2019-09-17 EMC IP Holding Company LLC Virtual machine proxy server for hyper-V image backup and recovery
US9772909B1 (en) * 2012-03-30 2017-09-26 EMC IP Holding Company LLC Dynamic proxy server assignment for virtual machine backup
US10719562B2 (en) 2013-12-13 2020-07-21 BloomReach Inc. Distributed and fast data storage layer for large scale web data services
US11169958B2 (en) 2014-02-07 2021-11-09 International Business Machines Corporation Using a repository having a full copy of source data and point-in-time information from point-in-time copies of the source data to restore the source data at different points-in-time
US10176048B2 (en) * 2014-02-07 2019-01-08 International Business Machines Corporation Creating a restore copy from a copy of source data in a repository having source data at different point-in-times and reading data from the repository for the restore copy
US11194667B2 (en) 2014-02-07 2021-12-07 International Business Machines Corporation Creating a restore copy from a copy of a full copy of source data in a repository that is at a different point-in-time than a restore point-in-time of a restore request
US10372546B2 (en) 2014-02-07 2019-08-06 International Business Machines Corporation Creating a restore copy from a copy of source data in a repository having source data at different point-in-times
US9639428B1 (en) 2014-03-28 2017-05-02 EMC IP Holding Company LLC Optimized backup of clusters with multiple proxy servers
US10387446B2 (en) 2014-04-28 2019-08-20 International Business Machines Corporation Merging multiple point-in-time copies into a merged point-in-time copy
US9690670B1 (en) * 2014-06-30 2017-06-27 Veritas Technologies Llc Systems and methods for doing agentless backup in scale-out fashion
US10108502B1 (en) * 2015-06-26 2018-10-23 EMC IP Holding Company LLC Data protection using checkpoint restart for cluster shared resources
US10585599B2 (en) * 2015-07-01 2020-03-10 Oracle International Corporation System and method for distributed persistent store archival and retrieval in a distributed computing environment
US10180886B2 (en) 2015-11-16 2019-01-15 Red Hat, Inc. Recreating a computing environment using tags and snapshots
US10262004B2 (en) * 2016-02-29 2019-04-16 Red Hat, Inc. Native snapshots in distributed file systems
US10656863B1 (en) 2016-11-03 2020-05-19 Amazon Technologies, Inc. Lifecycle management of storage clusters
US10860427B1 (en) * 2016-12-23 2020-12-08 EMC IP Holding Company LLC Data protection in a large-scale cluster environment
CN106992890B (zh) * 2017-04-18 2020-09-04 广东浪潮大数据研究有限公司 一种多服务器切换方法及系统
US10587463B2 (en) 2017-12-20 2020-03-10 Hewlett Packard Enterprise Development Lp Distributed lifecycle management for cloud platforms
US20210397599A1 (en) * 2020-06-18 2021-12-23 Netflix, Inc. Techniques for generating a consistent view of an eventually consistent database
US11354161B2 (en) 2020-08-10 2022-06-07 Bank Of America Corporation Controlling memory utilization by a topic in a publish-subscribe environment
US11340828B2 (en) 2020-08-10 2022-05-24 Bank Of America Corporation Restoring messages to a memory utilized by a topic in a publish-subscribe environment
US20230126234A1 (en) * 2021-10-25 2023-04-27 Rubrik, Inc. Independent object data backup between clusters
US20230214302A1 (en) * 2022-01-04 2023-07-06 Pure Storage, Inc. Assessing Protection For Storage Resources
US20230231912A1 (en) * 2022-01-20 2023-07-20 Pure Storage, Inc. Mesh-aware storage systems

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050050115A1 (en) * 2003-08-29 2005-03-03 Kekre Anand A. Method and system of providing cascaded replication
CN101383028A (zh) * 2008-10-06 2009-03-11 四川正道天和信息科技有限公司 基于epc物联网的全国商品电子监管方法及其系统
US7587565B1 (en) * 2006-09-28 2009-09-08 Emc Corporation Generating automated and scheduled SAN copy sessions for ISB protocol systems

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6658589B1 (en) 1999-12-20 2003-12-02 Emc Corporation System and method for backup a parallel server data storage system
US6950833B2 (en) 2001-06-05 2005-09-27 Silicon Graphics, Inc. Clustered filesystem
US20040139125A1 (en) 2001-06-05 2004-07-15 Roger Strassburg Snapshot copy of data volume during data access
JP2003345525A (ja) * 2002-05-24 2003-12-05 Hitachi Ltd 計算機システム及びレプリケーション方法
US20070043969A1 (en) 2005-08-17 2007-02-22 Schneider Janet L Isolating and storing configuration data for disaster recovery for operating systems providing physical storage recovery
US7441092B2 (en) 2006-04-20 2008-10-21 Microsoft Corporation Multi-client cluster-based backup and restore
US8065272B2 (en) * 2008-05-30 2011-11-22 Symantec Corporation Systems and methods for tracking changes to a volume
US7840730B2 (en) 2008-06-27 2010-11-23 Microsoft Corporation Cluster shared volumes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050050115A1 (en) * 2003-08-29 2005-03-03 Kekre Anand A. Method and system of providing cascaded replication
US7587565B1 (en) * 2006-09-28 2009-09-08 Emc Corporation Generating automated and scheduled SAN copy sessions for ISB protocol systems
CN101383028A (zh) * 2008-10-06 2009-03-11 四川正道天和信息科技有限公司 基于epc物联网的全国商品电子监管方法及其系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442458A (zh) * 2012-11-26 2019-11-12 亚马逊科技公司 缩放计算群集
WO2018091996A1 (en) * 2016-11-16 2018-05-24 International Business Machines Corporation Point-in-time backups via a storage controller to an object storage cloud
US10346062B2 (en) 2016-11-16 2019-07-09 International Business Machines Corporation Point-in-time backups via a storage controller to an object storage cloud
GB2571484A (en) * 2016-11-16 2019-08-28 Ibm Point-in-time backups via a storage controller to an object storage cloud
GB2571484B (en) * 2016-11-16 2020-02-19 Ibm Point-in-time backups via a storage controller to an object storage cloud
US10936208B2 (en) 2016-11-16 2021-03-02 International Business Machines Corporation Point-in-time backups via a storage controller to an object storage cloud
US11366593B2 (en) 2016-11-16 2022-06-21 International Business Machines Corporation Point-in-time backups via a storage controller to an object storage cloud
CN110704249A (zh) * 2016-12-30 2020-01-17 成都华为技术有限公司 一种保证应用一致性的方法、装置及系统
US10915410B2 (en) 2018-09-27 2021-02-09 International Business Machines Corporation Distributed system management using snapshots and packets
CN109542841A (zh) * 2018-10-25 2019-03-29 平安科技(深圳)有限公司 集群中创建数据快照的方法及终端设备
CN109542841B (zh) * 2018-10-25 2023-05-26 平安科技(深圳)有限公司 集群中创建数据快照的方法及终端设备
WO2020108623A1 (zh) * 2018-11-30 2020-06-04 腾讯科技(深圳)有限公司 数据备份方法、装置、服务器以及计算机可读存储介质

Also Published As

Publication number Publication date
CN102591744B (zh) 2015-05-06
US8886609B2 (en) 2014-11-11
US20120158662A1 (en) 2012-06-21
HK1173246A1 (zh) 2013-05-10

Similar Documents

Publication Publication Date Title
CN102591744B (zh) 从任何群集节点的数据的备份和还原
CN103136073B (zh) 共享卷的应用一致的快照
JP6353924B2 (ja) ブロックベースストレージに対するデータボリュームの耐久性状態の低減
CN102037463B (zh) 使用全局确认的提交进行分布式事务的基于日志的复制
CN101061467B (zh) 远程存储数据副本
Zhang et al. Transaction chains: achieving serializability with low latency in geo-distributed storage systems
CN101952814B (zh) 用于在虚拟环境中实施虚拟存储池的方法和系统
CN101086714B (zh) 用于实施远程镜像操作的系统和方法
CN103620599B (zh) 云存储
JP5551749B2 (ja) フェイルオーバシステムおよび方法
CN101401073B (zh) 跨存储子系统的一致更新
CN107895253A (zh) 一种电力交易功能进行微服务改造的方法
CN109558215A (zh) 虚拟机的备份方法、恢复方法、装置及备份服务器集群
CN102594858B (zh) 云存储环境中的镜像解决方案
CN105324770A (zh) 有效读出副本
CN105187500A (zh) 一种基于容器的分布式存储系统部署方法
CN102246152A (zh) 保存程序执行状态
CN104641650B (zh) 在数据存储子系统中的源引用复制
CN103229171A (zh) 基于快照的复制
CN108038201B (zh) 一种数据整合系统及其分布式数据整合系统
CN102521073B (zh) 在故障恢复期间增加数据库的可用性
CN107430606A (zh) 具有并行持久性的消息代理系统
CN102667720A (zh) 没有排序依赖的一致性
Srinivasa et al. Guide to high performance distributed computing
CN106855834B (zh) 一种数据备份方法、装置和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1173246

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150728

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150728

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.

REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1173246

Country of ref document: HK