CN114201338A - 从多个云副本进行智能恢复 - Google Patents

从多个云副本进行智能恢复 Download PDF

Info

Publication number
CN114201338A
CN114201338A CN202110988197.4A CN202110988197A CN114201338A CN 114201338 A CN114201338 A CN 114201338A CN 202110988197 A CN202110988197 A CN 202110988197A CN 114201338 A CN114201338 A CN 114201338A
Authority
CN
China
Prior art keywords
backup
data
copies
location
downloaded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110988197.4A
Other languages
English (en)
Inventor
Y·萨阿德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC IP Holding Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC IP Holding Co LLC filed Critical EMC IP Holding Co LLC
Publication of CN114201338A publication Critical patent/CN114201338A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2058Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using more than 2 mirrored copies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • H04L41/0856Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information by backing up or archiving configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0888Throughput
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/14Multichannel or multilink protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Environmental & Geological Engineering (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本发明公开了包括恢复操作的数据保护操作。通过从要恢复的备份的多个相同副本下载所述备份来执行恢复操作。基于诸如吞吐量等因素,可从所述多个副本中的每一者下载最佳的数据量。从所述多个副本下载的部分一旦被下载便被重建构或重组合。随后向恢复目标呈现组合的备份。

Description

从多个云副本进行智能恢复
技术领域
本发明的实施方式大体上涉及数据保护。更明确地说,本发明的至少一些实施方式涉及用于数据保护操作(诸如从多个备份恢复的操作)的系统、硬件、软件、计算机可读介质和方法。
背景技术
数据是许多组织的关键方面。因为数据可能会丢失、损坏或受损,所以这些组织通常要确保以某一方式来保护它们的数据。大体上,这意味着数据的备份(副本)可用或可生成数据的备份(副本)。通常,数据的备份副本存储在云(例如,数据中心)中。
然而,备份可能会导致各种成本。除了与备份数据/应用程序(例如,软件、存储空间、时间)相关联的货币成本之外,还存在与复原数据相关联的在时间和金钱方面的成本。
例如,云的无处不在已使存储广泛可用。尽管云存储可用,但恢复操作要花费时间。在需要复原大量数据的情况下,可以从云恢复数据。这样导致需要经由网络,诸如广域网(WAN),来传送数据。因为WAN通常不如局域网(LAN)/存储区域网(SAN)连接那般快,所以可能需要大量时间。例如,在1Gb/s链路上恢复10太字节(TB)数据可能需要约27个小时。这可能对应于27个小时的停机时间。
附图说明
为了描述可获得本发明的至少一些优点和特征的方式,将通过参考本发明的特定实施方式来呈现本发明的实施方式的更具体描述,在附图中示出了所述特定实施方式。应理解,这些图式仅绘示本发明的典型实施方式且因此不应视为限制本发明的范围,将通过使用附图用额外的详情和细节来描述和阐释本发明的实施方式,在附图中:
图1公开了用于执行数据保护操作的环境的方面,所述数据保护操作包括从多个副本下载备份或其部分;
图2公开了用于执行数据保护操作的方法的方面,所述数据保护操作包括从多个副本恢复备份;以及
图3公开了物理计算环境的方面。
具体实施方式
本发明的实施方式大体上涉及数据保护操作,所述数据保护操作大体上被称为备份和复原操作。更明确地说,本发明的至少一些实施方式涉及用于从多个备份副本恢复或复原的操作的系统、硬件、软件、计算机可读介质和方法。
数据保护操作的示例包括但不限于备份操作、恢复操作、复原操作、存储操作、复制操作等或其组合。更具体地说,本发明的实施方式涉及执行恢复操作并且涉及用于下载备份或将数据从至少一个备份位点传送至生产位点的操作。本发明的实施方式从多个副本(在可用时)执行智能并行恢复。并行恢复操作被配置为在最短时间内下载备份或其他数据,使得停机时间减少或降至最少。
在一个实施方式中,可以将生产数据的多个副本或备份存储在数据保护系统中,或由数据保护系统存储生产数据的多个副本或备份。虽然这些副本中的一些可对应于不同的时间点,但是这些副本中的一些可对应于同一个时间点。例如,许多组织由于规章制度、内部程序或其他原因而可能存储相同备份的多个副本。例如,数据的相同备份或副本可存储在不同的云(例如,AWS和Azure)、同一个云的不同区域等中。
存储数据的方式可允许恢复任何时间点。根据本发明的实施方式,可使用两个或更多个不同备份位置或备份来恢复到同一个时间点。在一些示例中,可按相对离散的增量来存储备份。当选择特定备份来恢复时,可使用在各种备份位置处的相同备份。当以允许任何PiT(时间点)恢复的方式备份数据时,可从每个备份位置使用相同PiT。
本发明的实施方式在执行恢复操作时可以执行并行下载。换句话说,因为相同副本存在于多于一个位置,所以可以从这些位置中的每一者并行地下载数据。然而,从所述副本中的每一者下载不同的数据。并行下载操作可以被优化以减少总体下载时间。明确地说,数据保护系统可以考虑到来自各个云的有效下载吞吐量(所述吞吐量在一个云与另一个云之间可能不同)。例如,数据保护系统可能会考虑到多种因素或特性,诸如链路带宽、时延、成本等。这允许数据保护系统确定应从具有生产数据的副本的每个位置下载多少数据。
本发明的实施方式可以实现为独立代理机器,作为数据保护系统内的集成能力。示例数据系统包括但不限于PowerProtect数据管理器(PPDM)、VM(虚拟机)的恢复点等。
图1示出了生产位点或系统100的示例。该生产系统可以是本地部署系统、基于云的系统等或其组合。系统100还可以是地理上分散的。系统100与生产数据124相关联,所述生产数据表示系统100的实际或工作数据。生产数据124可以包括数据、应用程序等并且可以在物理系统和/或虚拟系统中实现。
数据保护系统120被配置为对生产数据124执行数据保护操作。这可以包括例如备份生产数据124,这可以包括备份虚拟机或其他数据系统或实现方式。
在该示例中,通过数据保护系统100来创建生产数据的每个备份的多于一个副本。备份110存储在云102中,并且备份112存储在云104中。在一个示例中,备份110和112为相同的备份。因此,备份112是备份110的副本。
云102和云104可以是同一个云、同一个云的不同区域、不同的云等。可以对应于不同的时间点的其他备份也可以存储在云102、104中。备份110和112可以被配置,使得可由其产生任何时间点(PiT)。因此,可以从不同的备份产生相同的PiT备份。
数据保护系统120可以包括硬件和/或软件。数据保护系统120可以实现为器具、软件等。备份110和112可以存储为对象、文件、块、块装置等。
在一个示例中,可能需要从备份恢复生产数据124。本发明的实施方式可以通过从备份110下载备份的一部分并且从备份112下载备份的一部分来减少与恢复操作相关联的停机时间。这些部分一旦被下载,随后便将所述部分组合或重建构。
然而,如先前所述,备份110与备份112相同或一样。在一个示例中,相同的数据可以存储在备份110和112中,即便格式不同(例如,由于云基础结构或系统)。
虽然图1仅示出了两个副本,但是可存在任何数量的备份副本。
数据保护系统120可以包括恢复引擎122,所述恢复引擎被配置为执行恢复操作或至少执行从多个副本下载备份的操作。
一开始,给恢复引擎122提供副本的位置(例如,地址、标识符等)。所述位置可以表示为Li:1≤i≤N。另外,每个相同副本的大小被定义为S个字节。
恢复引擎122可以与云102和云104连接,或更具体地说,可以连接到并访问备份110和112。恢复引擎122可以执行速度测试以验证来自每个位置的下载吞吐量。来自每个位置Li的吞吐量被称为Ti并且可以以字节/秒或其他度量为单位来进行测量。
在存在来自数据保护系统120的执行对象、文件或块装置的恢复的请求时,恢复引擎122可以确定相对于备份副本的最佳恢复配置,如下:
从位置j下载的量是:
Dj=S*Tj/∑Ti (i=1..N)。
恢复引擎122随后可以在逻辑上将副本分割为N个段,其中段j的大小为Dj。该分段可取决于存储类型。对于像文件或多个对象的单独实体,分段为使用全部文件或对象进行最近似。对于像块卷或非常大的文件的大顺序实体,分段是从特定偏移量开始且长度为Dj的连续或相连字节的段。
恢复引擎122随后继续同时地或并行地从相应的备份副本下载段Dj。更具体地说,恢复引擎122可以从第一备份副本下载第一段,从第二备份副本下载第二段等等。仅举例来说,恢复引擎122随后可以通过组合所有段来在本地重建构完整副本,然后将备份的完整副本提供到数据保护系统、应用程序等。
在图1中,假设云102和104具有与从备份下载数据相关的类似或实质上相同的特性,恢复引擎122可以从备份110下载备份的第一半并且从备份112下载备份的第二半。如果云102具有较高的吞吐量,那么可以从备份110下载备份的较大部分。
恢复引擎122可以考虑到云102和104的因素并且相应地指派要下载的段,使得最小化下载时间。本发明的实施方式因此至少部分基于多个位点的有效下载吞吐量来执行下载分析并且分配将从各个位点下载的段。
在另一个示例中,可以对存储在不同云中的数据或备份副本进行去重。仅举例来说,可以通过将数据划分为块并且针对每个块创建散列值或其他签名来对数据进行去重。这允许基于签名或散列值来确定分配哪些块从哪些备份副本下载。例如,恢复引擎122可以从备份110下载散列值的第一范围并且从备份112下载散列值的第二范围。可以根据识别特定备份的散列值的清单或其他元数据来确定与备份相关联的散列值。
在分布式系统的背景中,可以查询云102和104以确定它们存储哪些块或数据。例如,集中式元数据服务器可以识别与特定备份有关的散列值或签名。可以查询每个云或位点(该信息也可以在元数据服务器处呈现)以确定被复原的备份的各个块位于何处。恢复引擎122随后可以从各个位点或云基于其有效吞吐量下载各个块。这允许本发明的实施方式基于散列表而非地址和偏移量(也可能会使用)来从多个副本下载。即便散列值不是连续的,也可以对散列值排序。这允许恢复引擎122从特定备份副本下载特定范围。
图2示出了用于执行数据保护操作的方法的示例,诸如从多个备份副本恢复数据的恢复操作。方法200可以包括用备份副本的位置来配置202恢复引擎。可以以各种方式来提供位置。所述位置可以包括URL(统一资源定位符)、地址、标识符(例如,散列值)等。恢复引擎可以向元数据服务器查询备份副本的位置。
提供给恢复引擎或由恢复引擎得到的位置信息足以让恢复引擎(或更大体来说,数据保护系统)访问每个位置处的备份副本。在一些示例中,位置可能是已经可用的或已知的。可以在必要时更新恢复引擎可用的位置。
接下来,恢复引擎可以对存储备份的副本的每个位置执行204速度测试。在一个示例中,可以对具有被恢复的备份的副本的每个位置执行速度测试。可以定期地执行确定下载吞吐量的该过程,使得在恢复操作时速度或下载吞吐量是可以容易得到的。
恢复引擎的配置以及吞吐量或速度确定可以被视为本发明的实施方式的初步或预备方面,因为它们在必要时可以预先执行。假设足够新的速度确定是可用的,那么恢复操作可以在数据保护系统接收到206恢复请求时开始。确定需要执行恢复操作是接收到恢复请求的示例。当接收到请求时,可以选择或识别要恢复的备份(或其部分)。可以自动地执行该识别(例如,最新的有效备份),或手动地进行识别。
恢复操作接下来确定208最佳的恢复计划。最佳的恢复计划是基于速度测试的结果。所述结果可以是最新的结果,或者可以是许多速度测试的平均值,所述平均值可能会考虑到网络可变性。速度测试可能会考虑到距离以及其他网络因素。
确定最佳恢复计划还可以包括确定从哪个位置或从哪个备份副本下载哪些数据(例如,多少数据)。要从每个备份副本(或用于恢复的备份副本)下载的量通常是基于备份的大小以及各个位置的吞吐量测量。在一个示例中,从N个备份副本下载备份副本。所述备份副本实质上被分割为N个段,并且从N个位置中的每一者检索不同的段。从备份副本下载的段可以具有不同大小。可以并行地下载段。与恢复操作从同一个副本下载整个备份的情形相比,这减少了停机时间。
因此,从特定位置下载的段可以以不同方式表达。对于基于对象和文件的存储,每个段可以包括某一数量的对象(基于大小)。换句话说,如果恢复引擎从第一副本下载1GB,那么从该副本下载的对象的大小为约1GB。在这种情况中,对象或文件没有被分割。因此,实际的下载量可能少于或多于1GB。
在另一个示例中,如果数据与块卷相关联或为非常大的文件,那么要下载的量可以被指定为对应块大小的倍数。如果从第一副本下载的数据是1GB并且块大小是4MB,那么从第一副本下载250个块。可以从第二副本下载下一组块。另外,可以基于地址和/或偏移量来下载数据。
因此,实际上从每个副本下载的数据量可以与所指派的量不同。另外,恢复引擎可以从所述位置下载不同的数据量。
在确定了最佳恢复计划之后,由恢复引擎从所述位置下载210备份。在一个示例中,如果N个位置通过类似带宽连接至或可用于数据保护系统或恢复引擎,那么恢复时间和停机时间可减少到N分之一。
一旦从所述位置或备份位点下载了备份的段或部分,便将所述段或部分组合或重建构为本地副本(例如,写入到卷)。重建构的副本随后可以向生产系统呈现212或复原到生产系统,从而复原到例如目标系统。参看图1,本地副本可以存储在恢复目标126上。这允许生产数据从多个备份副本复原为目标数据。
明确地说,本发明的至少一些实施方式的一个有利方面是可以通过从多个位置下载以及使用相同备份的多个副本来减少停机时间。
以下是对用于本发明的各种实施方式的示例操作环境的方面的讨论。该讨论不意欲以任何方式限制本发明的范围或实施方式的适用性。
大体上,本发明的实施方式可以与一些系统、软件和组件结合来实现,所述系统、软件和组件单独地和/或共同地实现和/或致使实现数据保护操作,所述数据保护操作可以包括但不限于数据读取/写入/删除操作、数据去重操作、数据备份操作、数据复原操作、数据克隆操作、数据归档操作、恢复操作、下载操作、灾难恢复操作、从多个副本恢复的操作等。更一般来说,本发明的范围包括所公开的概念可以在其中使用的任何操作环境。
本发明的至少一些实施方式提供用于在现有备份平台中实现所公开的功能,所述备份平台的示例包括VM的恢复点或PPDM。
可能是或可能不是公开的示例云计算环境包括可以为一个或多个客户端提供数据保护功能的存储环境。云计算环境的另一个示例是可以代表一个或多个客户端执行处理、数据保护和其他服务的云计算环境。本发明的实施方式可以与之结合使用的一些示例云计算环境包括但不限于Microsoft Azure、Amazon AWS、Dell EMC云存储服务及Google云。然而,更一般来说,本发明的范围不限于采用云计算环境的任何特定类型或实现方式。
除了云环境之外,操作环境还可以包括能够收集、修改和创建数据的一个或多个客户端。因而,特定客户端可以采用对数据执行此类操作的一个或多个应用程序中的每一者的一个或多个实例或以其他方式与所述一个或多个实例相关联。此类客户端可以包括物理机或虚拟机(VM)。
明确地说,操作环境中的装置可以采取软件、物理机或VM或这些软件、物理机或VM的任何组合的形式,但是对于任何实施方式,并不要求特定的装置实现方式或配置。类似地,数据保护系统组件诸如数据库、存储服务器、存储卷(LUN)、存储磁盘、复制服务、备份服务器、复原服务器、备份客户端和复原客户端例如可以同样采取软件、物理机或虚拟机(VM)的形式,但是对于任何实施方式,并不要求特定的组件实现方式。在采用VM的情况下,可以采用超级监管程序或其他虚拟机监视器(VMM)来创建和控制VM。术语VM包括但不限于一个或多个计算系统元件(诸如计算系统硬件)的任何虚拟化、仿真或其他表示。VM可以是基于一个或多个计算机架构,并且提供物理计算机的功能。VM实现方式可以包括硬件和/或软件或至少涉及硬件和/或软件的使用。VM的镜像可以采取例如.VMX文件和一个或多个.VMDK文件(VM硬盘)的形式。
如本文所使用,术语“数据”的范围意欲为广义的。因此,举例来说而非限制,该术语包括诸如可以由数据流分段过程产生的数据段、大数据块、数据块、原子数据、电子邮件、任何类型的对象、任何类型的文件(包括媒体文件、文字处理文件、电子表格文件和数据库文件)以及通讯录、目录、子目录、卷以及前述各者中的一者或多者的任何群组。
本发明的示例实施方式适用于能够存储和处理呈模拟、数字或其他形式的各种类型的对象的任何系统。虽然诸如档案、文件、段、块或对象等术语可以作为举例使用,但是本公开的原理不限于表示和存储数据或其他信息的任何特定形式。而是,此类原理同样适用于能够表示信息的任何对象。
如本文所使用,术语“备份”的范围意欲是广义的。因而,本发明的实施方式可以与之结合使用的示例备份包括但不限于完整备份、部分备份、克隆、快照、日志备份、PiT备份以及增量或差量备份。
现在简要地参看图3,附图和/或本文别处公开或暗含的实体中的任何一者或多者可以采取物理计算装置的形式、或包括物理计算装置、或在物理计算装置上实现、或由物理计算装置托管,所述物理计算装置的一个示例在300处示出。同样,在前述元件中的任一者包括虚拟机(VM)或由虚拟机组成的情况下,该VM可以构成图3中公开的物理组件的任何组合的虚拟化。
在图3的示例中,物理计算装置300包括存储器302、一个或多个硬件处理器306、非暂时性存储介质308、UI装置310以及数据存储装置312,其中所述存储器可以包括以下各者中的一者、一些或全部:随机存取存储器(RAM)、非易失性存储器(NVM)304(诸如NVRAM)、只读存储器(ROM)、和持久存储器。物理计算装置300的存储器组件302中的一者或多者可以采取固态装置(SSD)存储装置的形式。同样,可以提供一个或多个应用程序314,所述一个或多个应用程序包括可由一个或多个硬件处理器306执行以执行本文公开的任何操作或其部分的指令。
此类可执行指令可以采取各种形式,包括例如可执行以执行本文公开的任何方法或其部分和/或可由/可在存储位点(无论是本地部署在企业处或者是云计算位点)、客户端、数据中心、数据保护位点(包括云存储位点)或备份服务器处执行以执行本文公开的任何功能的指令。同样,此类指令可以是可执行的以执行本文公开的任何其他操作和方法以及其任何部分。
以下是本发明的一些其他示例实施方式。这些实施方式仅举例呈现并且不意欲以任何方式限制本发明的范围。
实施方式1.一种方法,所述方法包括:接收执行恢复操作的请求;确定用于从备份的多个副本恢复所述备份的计划;根据所述计划从所述多个副本中的每一者并行地下载所述备份的一部分,其中从所述多个副本中的每一者下载不同的部分;由从所述多个副本下载的所述部分重建构所述备份;以及例如在生产系统处恢复所述重建构的备份。
实施方式2.如实施方式1所述的方法,所述方法还包括连接至存储所述备份的所述多个副本中的一者的每个位置以及对每个位置执行速度测试以确定每个位置的吞吐量。
实施方式3.如实施方式1和/或2所述的方法,所述方法还包括确定存储每个位置的速度测试结果的历史。
实施方式4.如实施方式1、2和/或3所述的方法,其中所述计划是基于每个位置的所述吞吐量或基于与所述历史相关联的平均值。
实施方式5.如实施方式1、2、3和/或4所述的方法,所述方法还包括识别所述备份的所述多个副本的所述位置。
实施方式6.如实施方式1、2、3、4和/或5所述的方法,所述方法还包括从所述多个副本中的至少一些副本下载不同的数据量。
实施方式7.如实施方式1、2、3、4、5和/或6所述的方法,其中所述多个副本是相同的。
实施方式8.如实施方式1、2、3、4、5、6和/或7所述的方法,其中所述多个副本是作为对象或文件存储,从而制定所述计划使得所述部分包括完整的对象或文件。
实施方式9.如实施方式1、2、3、4、5、6、7和/或8所述的方法,其中所述部分中的至少一些部分小于或大于所指派的量。
实施方式10.如实施方式1、2、3、4、5、6、7、8和/或9所述的方法,其中所述备份的所述部分是基于所述备份的大小以及所述吞吐量与所有吞吐量的总和的比。
实施方式11.一种用于执行本文中公开的任何操作、方法或过程或任何这些操作、方法或过程的任何部分的方法。
实施方式12.一种非暂时性存储介质,所述非暂时性存储介质中存储有指令,所述指令能够由一个或多个硬件处理器执行以执行实施方式1至11中的任何一者或多者的操作。
如下文更详细地讨论,本文中公开的实施方式可以包括使用包括各种计算机硬件或软件模组的专用或通用计算机。计算机可以包括处理器以及携载指令的计算机存储介质,所述指令在由所述处理器执行和/或导致被所述处理器执行时执行本文中公开的任何一种或多种方法或所公开的任何方法的任何部分。
如上文所指示,在本发明的范围内的实施方式还包括计算机存储介质,所述计算机存储介质是用于携载计算机可执行指令或数据结构或者在上面存储有计算机可执行指令或数据结构的物理介质。此类计算机存储介质可以是可以被通用或专用计算机存取的任何可用的物理介质。
举例来说,且未限制,此类计算机存储介质可以包括硬件存储装置,诸如固态磁盘/装置(SSD)、RAM、ROM、EEPROM、CD-ROM、快闪存储器、相变存储器(“PCM”)、或其他光盘存储装置、磁盘存储装置或其他磁存储装置、或任何其他硬件存储装置,以上各者可以用于存储呈计算机可执行指令或数据结构的形式的程序码,所述计算机可执行指令或数据结构可以由通用或专用计算机系统存取并执行以实现本发明的所公开的功能。以上各者的组合也应包括在计算机存储介质的范围内。此类介质也是非暂时性存储介质的示例,并且非暂时性存储介质还包括基于云的存储系统和结构,但是本发明的范围不限于非暂时性存储介质的这些示例。
计算机可执行指令包括例如在被执行时导致通用计算机、专用计算机或专用处理装置执行某一功能或一组功能的指令和数据。因而,本发明的一些实施方式可以例如从网站、网状拓扑或其他源下载到一个或多个系统或装置。同样,本发明的范围包括任何硬件系统或装置,所述硬件系统或装置包括应用程序的实例,所述应用程序包括所公开的可执行指令。
虽然用结构特征和/或方法行为特定的语言描述了主题,但是应理解,在所附权利要求中定义的主题不一定限制于上文描述的特定特征或行为。而是,本文公开的特定特征和行为是作为实现权利要求的示例形式来公开。
如本文所使用,术语“模组”或“组件”可以指代在计算系统上执行的软件对象或常式。本文描述的不同组件、模组、引擎和服务可以实现为在计算系统上例如作为单独线程执行的对象或进程。虽然本文描述的系统和方法可以用软件实现,但是用硬件或软件与硬件的组合实现也是可能的并且是设想到的。在本公开中,“计算实体”可以是如本文先前所定义的任何计算系统,或在计算系统上运行的任何模组或模组组合。
在不偏离本发明的精神或实质特性的情况下,本发明可以体现为其他特定形式。所描述的实施方式在所有方面都仅被视为说明性而非限制性的。因此,本发明的范围由所附权利要求而非前文的描述指示。属于权利要求的含义和等效物范围内的所有变化将包含在其范围内。

Claims (11)

1.一种方法,所述方法包括:
接收执行恢复操作的请求;
确定用于从备份的多个副本恢复所述备份的计划;
根据所述计划从所述多个副本中的每一者并行地下载所述备份的一部分,其中从所述多个副本中的每一者下载不同的部分;
由从所述多个副本下载的所述部分重建构所述备份;以及
恢复所述重建构的备份。
2.如权利要求1所述的方法,所述方法还包括连接至存储所述备份的所述多个副本中的一者的每个位置以及对每个位置执行速度测试以确定每个位置的吞吐量。
3.如权利要求2所述的方法,所述方法还包括确定存储每个位置的速度测试结果的历史。
4.如权利要求3所述的方法,其中所述计划是基于每个位置的所述吞吐量或基于与所述历史相关联的平均值。
5.如权利要求1所述的方法,所述方法还包括识别所述备份的所述多个副本的位置。
6.如权利要求1所述的方法,所述方法还包括从所述多个副本中的至少一些副本下载不同的数据量。
7.如权利要求6所述的方法,其中所述多个副本是相同的。
8.如权利要求1所述的方法,其中所述多个副本是作为对象或文件存储,从而制定所述计划使得所述部分包括完整的对象或文件。
9.如权利要求8所述的方法,其中所述部分中的至少一些部分小于或大于所指派的量。
10.如权利要求2所述的方法,其中所述备份的所述部分是基于所述备份的大小以及所述吞吐量与所有吞吐量的总和的比。
11.一种非暂时性存储介质,所述非暂时性存储介质中存储有指令,所述指令能够由一个或多个硬件处理器执行以执行如权利要求1-10中任一项所述的方法。
CN202110988197.4A 2020-09-17 2021-08-26 从多个云副本进行智能恢复 Pending CN114201338A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/023,801 US11435930B2 (en) 2020-09-17 2020-09-17 Intelligent recovery from multiple clouds copies
US17/023,801 2020-09-17

Publications (1)

Publication Number Publication Date
CN114201338A true CN114201338A (zh) 2022-03-18

Family

ID=80442275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110988197.4A Pending CN114201338A (zh) 2020-09-17 2021-08-26 从多个云副本进行智能恢复

Country Status (3)

Country Link
US (1) US11435930B2 (zh)
EP (1) EP3974987B1 (zh)
CN (1) CN114201338A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11853100B2 (en) * 2021-04-12 2023-12-26 EMC IP Holding Company LLC Automated delivery of cloud native application updates using one or more user-connection gateways

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6505216B1 (en) * 1999-10-01 2003-01-07 Emc Corporation Methods and apparatus for backing-up and restoring files using multiple trails
US20040078641A1 (en) * 2002-09-23 2004-04-22 Hewlett-Packard Company Operating system-independent file restore from disk image
US7043504B1 (en) * 2000-04-10 2006-05-09 International Business Machines Corporation System and method for parallel primary and secondary backup reading in recovery of multiple shared database data sets
CN1794190A (zh) * 2004-12-22 2006-06-28 国际商业机器公司 使用数个存储介质来存储和恢复数据文件的方法
US20140067763A1 (en) * 2012-09-05 2014-03-06 Symantec Corporation Techniques for recovering a virtual machine
CN109857592A (zh) * 2019-01-04 2019-06-07 平安科技(深圳)有限公司 数据恢复控制方法、服务器及存储介质
CN111343215A (zh) * 2018-12-18 2020-06-26 中国电信股份有限公司 内容获取方法和系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7085784B2 (en) * 2002-01-10 2006-08-01 International Business Machines Corporation System and method for eliminating duplicate copies of activity history logs in bridging two or more backend database systems
CA2422176C (en) * 2003-03-14 2009-07-21 Ibm Canada Limited - Ibm Canada Limitee Method and apparatus for interrupting updates to a database to provide read-only access
US8140791B1 (en) * 2009-02-24 2012-03-20 Symantec Corporation Techniques for backing up distributed data
US9075773B1 (en) * 2014-05-07 2015-07-07 Igneous Systems, Inc. Prioritized repair of data storage failures
US10097522B2 (en) * 2015-05-21 2018-10-09 Nili Philipp Encrypted query-based access to data
US10691557B1 (en) * 2016-06-24 2020-06-23 EMC IP Holding Company LLC Backup file recovery from multiple data sources
US10740193B2 (en) * 2017-02-27 2020-08-11 Commvault Systems, Inc. Hypervisor-independent reference copies of virtual machine payload data based on block-level pseudo-mount
US10180801B2 (en) * 2017-05-16 2019-01-15 Veritas Technologies Llc Systems and methods for load balancing backup data
US10936442B2 (en) * 2018-07-06 2021-03-02 EMC IP Holding Company LLC Simultaneous file level recovery from multiple backups using a proxy virtual machine
EP3614627B1 (en) * 2018-08-20 2021-09-15 EXFO Inc. Telecommunications network and services qoe assessment
US11269745B2 (en) * 2019-10-29 2022-03-08 International Business Machines Corporation Two-node high availability storage system
CN113448770B (zh) * 2020-03-27 2024-09-17 伊姆西Ip控股有限责任公司 用于恢复数据的方法、电子设备和计算机程序产品

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6505216B1 (en) * 1999-10-01 2003-01-07 Emc Corporation Methods and apparatus for backing-up and restoring files using multiple trails
US7043504B1 (en) * 2000-04-10 2006-05-09 International Business Machines Corporation System and method for parallel primary and secondary backup reading in recovery of multiple shared database data sets
US20040078641A1 (en) * 2002-09-23 2004-04-22 Hewlett-Packard Company Operating system-independent file restore from disk image
CN1794190A (zh) * 2004-12-22 2006-06-28 国际商业机器公司 使用数个存储介质来存储和恢复数据文件的方法
US20060150013A1 (en) * 2004-12-22 2006-07-06 Oliver Augenstein System and method for storing and restoring a data file using several storage media
US20140067763A1 (en) * 2012-09-05 2014-03-06 Symantec Corporation Techniques for recovering a virtual machine
CN111343215A (zh) * 2018-12-18 2020-06-26 中国电信股份有限公司 内容获取方法和系统
CN109857592A (zh) * 2019-01-04 2019-06-07 平安科技(深圳)有限公司 数据恢复控制方法、服务器及存储介质

Also Published As

Publication number Publication date
US20220083251A1 (en) 2022-03-17
EP3974987B1 (en) 2023-06-28
US11435930B2 (en) 2022-09-06
EP3974987A1 (en) 2022-03-30

Similar Documents

Publication Publication Date Title
US11733907B2 (en) Optimize recovery time objective and costs of cloud based recovery
US12013763B2 (en) Continuous data protection using a write filter
US20220214947A1 (en) Efficient recovery of backups for deleted checkpoints
US11580015B2 (en) Garbage collection for a deduplicated cloud tier using functions
EP3974987B1 (en) Intelligent recovery from multiple cloud copies
US20210117095A1 (en) Storage array data protection using virtual machine data protection
US11704203B2 (en) Replication for cyber recovery for multiple tier data
EP4053703A1 (en) Method or apparatus to reconstruct lost data and metadata
US20220391288A1 (en) Continuous data protection in cloud using streams
US11709800B2 (en) Optimized client-side deduplication
US11599559B2 (en) Cloud image replication of client devices
CN113728313A (zh) 智能碎片整理vm内部的文件系统以在云中快速再复原并对云高效重复数据删除
US20220391328A1 (en) Continuous data protection in cloud using streams
US20220391287A1 (en) Continuous data protection in cloud using streams
US12093136B2 (en) Cold tiering microservice for deduplicated data
US11675667B2 (en) Smart automation of reliable differential backups of always on availability group databases to optimize the restore time
US11899537B2 (en) Near continuous data protection without using snapshots
US11822432B2 (en) Near continuous data protection without using snapshots
US11797236B2 (en) Near continuous data protection without using snapshots
US11435927B2 (en) Protected saveset volume movement via metadata bootstrap

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination