CN113986450A - 一种虚拟机备份方法及装置 - Google Patents

一种虚拟机备份方法及装置 Download PDF

Info

Publication number
CN113986450A
CN113986450A CN202111140682.2A CN202111140682A CN113986450A CN 113986450 A CN113986450 A CN 113986450A CN 202111140682 A CN202111140682 A CN 202111140682A CN 113986450 A CN113986450 A CN 113986450A
Authority
CN
China
Prior art keywords
backup
target
virtual machine
task
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111140682.2A
Other languages
English (en)
Inventor
廖孝军
朱广帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Big Data Technologies Co Ltd
Original Assignee
New H3C Big Data Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Big Data Technologies Co Ltd filed Critical New H3C Big Data Technologies Co Ltd
Priority to CN202111140682.2A priority Critical patent/CN113986450A/zh
Publication of CN113986450A publication Critical patent/CN113986450A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data

Abstract

本申请涉及虚拟化技术领域,特别涉及一种虚拟机备份方法及装置。该方法应用于备份集群的主备份节点,该备份集群被划分为多个地址池,一个地址池包括多个备份节点,任一地址池的备份节点分别与对应的运行有虚拟机的宿主机建立通信链路,该备份集群被划分为至少一个存储池;该方法包括:接收备份任务请求,该备份任务请求包括目标宿主机信息,各目标宿主机中需备份的目标虚拟机信息;针对每一目标虚拟机,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据,其中,该目标虚拟机的数据包括该目标虚拟机的磁盘文件和配置文件;将获取到的该目标虚拟机的磁盘文件和配置文件备份至该备份集群的指定存储池中。

Description

一种虚拟机备份方法及装置
技术领域
本申请涉及虚拟化技术领域,特别涉及一种虚拟机备份方法及装置。
背景技术
虚拟化平台部署各类业务虚拟机,达到资源集中配置管理目的。分布式备份一体化存储提供虚拟机备份服务,虚拟机数据在备份存储中以对象进行组织,分散到各个主机上。多个生产端虚拟机备份到备份存储,备份端保留虚拟机完整的副本,当原虚拟化平台遭受灾难或虚拟机数据被破坏时,可使用虚拟机备份数据进行恢复。因此,为了保证用户数据安全性,分布式备份一体化存储需要具有全面保护、快速恢复、远程容灾、良好管理性等特点。
现有的虚拟化平台备份技术实现中,其中一种备份方法为:将备份软件安装到备份端一台或多台备份服务器上,备份服务器使用本地存储或挂载第三方存储保存数据,通过对生产端需要备份的虚拟机做快照,实现虚拟机数据文件的备份,如果虚拟机发生损坏,则可以从备份端进行数据恢复。现有实现支持对虚拟机进行全量备份和增量备份。
然而,备份服务器采用本地存储或挂载第三方存储进行虚拟机数据文件的备份时,当备份服务器发生故障时,与该备份服务器相关的虚拟机备份或恢复任务无法进行,且单个备份服务器的性能瓶颈,并发过度占用备份服务器的CPU资源和网络资源,复制性能无法满足快速备份和恢复要求,甚至可能导致备份或恢复数据失败。
发明内容
本申请提供了一种虚拟机备份方法及装置,用以解决现有技术中存在的由于备份服务器故障/虚拟机性能瓶颈而导致虚拟机数据不能备份/恢复的问题。
第一方面,本申请提供了一种虚拟机备份方法,应用于备份集群的主备份节点,所述备份集群被划分为多个地址池,一个地址池包括多个备份节点,任一地址池包括的备份节点分别与对应的运行有虚拟机的宿主机建立通信链路,所述备份集群包括的各备份节点组成分布式存储,所述备份集群被划分为至少一个存储池;所述方法包括:
接收备份任务请求,其中,所述备份任务请求包括目标宿主机信息,各目标宿主机中需备份的目标虚拟机信息;
针对每一目标虚拟机,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据,其中,该目标虚拟机的数据包括该目标虚拟机的磁盘文件和配置文件;
将获取到的该目标虚拟机的磁盘文件和配置文件备份至所述备份集群的指定存储池中。
可选地,所述备份集群中的主备份节点维护有各目标宿主机与对应的地址池包括的备份节点之间的通信链路信息;基于该备份任务从该目标宿主机上获取该目标虚拟机的数据之前,所述方法还包括:
判断该目标宿主机与对应的地址池包括的备份节点之间的通信链路是否正常,其中,若该目标宿主机与对应的地址池中包括的至少一个备份节点之间的通信链路正常,则判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常;
若判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常,则执行基于该备份任务从该目标宿主机上获取该目标虚拟机的数据的步骤。
可选地,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据的步骤包括:
基于该目标虚拟机的磁盘文件和配置文件的数量,分别创建对应数量的备份任务;
基于所述备份集群包括的各备份节点的当前备份任务执行情况,确定用于执行所述对应数量的备份任务的目标备份节点;
将各备份任务分别下发至对应的目标备份节点,以使得该目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件。
可选地,将各备份任务分别下发至对应的目标备份节点,以使得目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件的步骤包括:
创建目标虚拟机对应的卷组,其中,该卷组包括多个卷对,一个备份任务对应一个卷对;
将各备份任务对应的卷对发送至目标备份节点,以使得目标备份节点指示目标宿主机创建该卷对对应的磁盘文件/配置文件对应的目标卷;
基于主备份节点下发的备份执行指令,将目标宿主机中该目标卷对应的磁盘文件/配置文件备份至该卷对中。
可选地,所述方法还包括:
接收恢复任务请求,其中,该恢复任务请求包括待恢复的虚拟机信息,用于恢复该虚拟机的宿主机信息;
针对每一待恢复的虚拟机创建对应的卷组,其中,一个卷组包括多个卷对,一个文件恢复任务对应一个卷对;
将各卷对分别下发至对应的备份节点,以使得各备份节点指示用于恢复该虚拟机的宿主机创建对应的目标文件;各备份节点分别将本地存储的磁盘文件/配置文件恢复至所述目标文件中,以使得该宿主机基于该目标文件创建并运行该虚拟机。
第二方面,本申请提供了一种虚拟机备份装置,应用于备份集群的主备份节点,所述备份集群被划分为多个地址池,一个地址池包括多个备份节点,任一地址池包括的备份节点分别与对应的运行有虚拟机的宿主机建立通信链路,所述备份集群包括的各备份节点组成分布式存储,所述备份集群被划分为至少一个存储池;所述装置包括:
接收单元,用于接收备份任务请求,其中,所述备份任务请求包括目标宿主机信息,各目标宿主机中需备份的目标虚拟机信息;
创建单元,用于针对每一目标虚拟机,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据,其中,该目标虚拟机的数据包括该目标虚拟机的磁盘文件和配置文件;
备份单元,用于将获取到的该目标虚拟机的磁盘文件和配置文件备份至所述备份集群的指定存储池中。
可选地,所述装置还包括:
判断单元,用于判断该目标宿主机与对应的地址池包括的备份节点之间的通信链路是否正常,其中,若该目标宿主机与对应的地址池中包括的至少一个备份节点之间的通信链路正常,则判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常;
若判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常,则执行基于该备份任务从该目标宿主机上获取该目标虚拟机的数据的步骤。
可选地,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据时,所述创建单元具体用于:
基于该目标虚拟机的磁盘文件和配置文件的数量,分别创建对应数量的备份任务;
基于所述备份集群包括的各备份节点的当前备份任务执行情况,确定用于执行所述对应数量的备份任务的目标备份节点;
将各备份任务分别下发至对应的目标备份节点,以使得该目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件。
可选地,将各备份任务分别下发至对应的目标备份节点,以使得目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件时,所述创建单元具体用于:
创建目标虚拟机对应的卷组,其中,该卷组包括多个卷对,一个备份任务对应一个卷对;
将各备份任务对应的卷对发送至目标备份节点,以使得目标备份节点指示目标宿主机创建该卷对对应的磁盘文件/配置文件对应的目标卷;
基于主备份节点下发的备份执行指令,将目标宿主机中该目标卷对应的磁盘文件/配置文件备份至该卷对中。
可选地,所述接收单元还用于:
接收恢复任务请求,其中,该恢复任务请求包括待恢复的虚拟机信息,用于恢复该虚拟机的宿主机信息;
针对每一待恢复的虚拟机创建对应的卷组,其中,一个卷组包括多个卷对,一个文件恢复任务对应一个卷对;
将各卷对分别下发至对应的备份节点,以使得各备份节点指示用于恢复该虚拟机的宿主机创建对应的目标文件;各备份节点分别将本地存储的磁盘文件/配置文件恢复至所述目标文件中,以使得该宿主机基于该目标文件创建并运行该虚拟机。
第三方面,本申请实施例提供一种虚拟化备份装置,该虚拟化备份装置包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如上述第一方面中任一项所述的方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如上述第一方面中任一项所述方法的步骤。
综上可知,本申请实施例提供的虚拟机备份方法,应用于备份集群的主备份节点,所述备份集群被划分为多个地址池,一个地址池包括多个备份节点,任一地址池包括的备份节点分别与对应的运行有虚拟机的宿主机建立通信链路,所述备份集群包括的各备份节点组成分布式存储,所述备份集群被划分为至少一个存储池;所述方法包括:接收备份任务请求,其中,所述备份任务请求包括目标宿主机信息,各目标宿主机中需备份的目标虚拟机信息;针对每一目标虚拟机,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据,其中,该目标虚拟机的数据包括该目标虚拟机的磁盘文件和配置文件;将获取到的该目标虚拟机的磁盘文件和配置文件备份至所述备份集群的指定存储池中。
采用本申请实施例提供的虚拟机备份方法,一个宿主机与备份集群中多个备份节点建立通信链路,虚拟机数据备份任务被划分为多个子任务,由多个执行节点执行一个虚拟机的备份任务,并采用分布式并发备份存储,极大提升虚拟机备份性能,RPO得到极大降低;任一复制任务执行节点故障,自动切换到其他执行节点,提高了备份和恢复的可靠性。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本申请实施例的这些附图获得其他的附图。
图1为本申请实施例提供的一种虚拟机备份方法的详细流程图;
图2为本申请实施例提供的一种虚拟化备份系统的系统结构图;
图3为本申请实施例提供的一种虚拟化备份系统的结构示意图;
图4为本申请实施例提供的一种虚拟机备份装置的结构示意图;
图5为本申请实施例提供的另一种虚拟机备份装置的结构示意图。
具体实施方式
在本申请实施例使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
示例性的,参阅图1所示,为本申请实施例提供的一种虚拟机备份方法的详细流程图,该方法应用于备份集群的主备份节点,所述备份集群被划分为多个地址池,一个地址池包括多个备份节点,任一地址池包括的备份节点分别与对应的运行有虚拟机的宿主机建立通信链路,所述备份集群包括的各备份节点组成分布式存储,所述备份集群被划分为至少一个存储池;该方法包括以下步骤:
步骤100:接收备份任务请求,其中,所述备份任务请求包括目标宿主机信息,各目标宿主机中需备份的目标虚拟机信息。
示例性的,参阅图2所示,为本申请实施例提供的虚拟化备份系统的系统结构图,该虚拟化备份系统包括虚拟化平台(运行业务虚拟机的生产端,如宿主机)和用于备份虚拟机数据的备份集群(分布式存储集群),其中,备份集群包括多个备份节点(如,node 1,node2,……,node n),备份集群被划分为多个地址池(如,地址池10包括的node 1,node 2和node 3;地址池11包括的node 4,node 5和node 6),实际应用中,生产端的一个宿主机可以与一个或多个地址池包括的各备份节点分别建立通信链路,如,生产端1的宿主机与地址池10包括的node 1,node 2和node 3分别建立通信链路,生产端2的宿主机与地址池11包括的node 4,node 5和node 63分别建立通信链路。本申请实施例中,各宿主机与备份集群之间采用多通信链路连接,这样,保障了宿主机与备份集群的通信健壮性,当多条通信链路中任一通信链路正常时,宿主机与备份集群的通信正常。
实际应用中,可以在生产端宿主机上安装代理,并配置归属于一个地址池的多个备份节点的网络地址,基于该网络地址分别建立到该多个备份节点的通信链路。备份集群中各备份节点可以维护其对应的地址池的多个备份节点之间的通信链路的状态。
具体地,可以采用以下方式维护通信链路状态,生产端的一个宿主机到备份集群的通信链路抽象为远端设备,多个备份节点通过地址池(地址池)进行管理,可选地,远端设备可表示为fsid:ip,其中,fsid表示生产端宿主机归属的集群的标识,ip表示宿主机的IP地址;当然,宿主机上也可以维护与地址池的多个备份节点之间的映射关系,表示为fsid:ip,其中,fsid为备份集群的标识,ip标识对应地址池包括的各备份节点的IP地址。
可选地,备份集群的主备份节点维护远端设备状态,当一个地址池中所有备份节点到宿主机的通信链路故障后,设备状态故障,备份/恢复任务不可运行;
可选地,备份集群中所有备份节点对与对应宿主机之间建立的通信链路进行检测并上报主备份节点,由主备份节点维护远端设备状态,通信链路一种检测实现为:链路定时发送心跳消息,并将检测上报备份集群备份主节点。
那么,本申请实施例中,在执行步骤100时,主备份节点接收到备份任务请求后,基于该备份任务请求确定此次备份任务针对的生成端(生成集群信息),待备份的虚拟机信息(该生产端的哪些虚拟机需要备份)。也就是说,用户触发的备份任务请求至少包括虚拟化平台(如,生产端1的宿主机x)信息,虚拟机列表(如,宿主机x里的哪些虚拟机需要备份),进一步地,还可以包括存储池信息(虚拟机数据备份至指定的存储池中)和备份方式(全量备份/增量备份)等。
步骤110:针对每一目标虚拟机,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据,其中,该目标虚拟机的数据包括该目标虚拟机的磁盘文件和配置文件。
那么,本申请实施例中,由于所述备份集群中的主备份节点维护有各目标宿主机与对应的地址池包括的备份节点之间的通信链路信息,那么,在基于该备份任务从该目标宿主机上获取该目标虚拟机的数据之前,所述方法还包括:
判断该目标宿主机与对应的地址池包括的备份节点之间的通信链路是否正常,其中,若该目标宿主机与对应的地址池中包括的至少一个备份节点之间的通信链路正常,则判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常;若判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常,则执行基于该备份任务从该目标宿主机上获取该目标虚拟机的数据的步骤。
本申请实施例中,在创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据时,一种较佳地实现方式为:
基于该目标虚拟机的磁盘文件和配置文件的数量,分别创建对应数量的备份任务;基于所述备份集群包括的各备份节点的当前备份任务执行情况,确定用于执行所述对应数量的备份任务的目标备份节点;将各备份任务分别下发至对应的目标备份节点,以使得该目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件。
更进一步的,本申请实施例中,在将各备份任务分别下发至对应的目标备份节点,以使得目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件时,一种较佳地实现方式为:
创建目标虚拟机对应的卷组,其中,该卷组包括多个卷对,一个备份任务对应一个卷对;将各备份任务对应的卷对发送至目标备份节点,以使得目标备份节点指示目标宿主机创建该卷对对应的磁盘文件/配置文件对应的目标卷;基于主备份节点下发的备份执行指令,将目标宿主机中该目标卷对应的磁盘文件/配置文件备份至该卷对中。
实际应用中,主备份节点接收备份任务请求,该请求包括虚拟化平台信息、虚拟机列表、备份池和备份方式,虚拟机列表包含该虚拟化平台下一个或多个虚拟机;主备份节点将备份任务分解到虚拟机,通过平台接口获取虚拟机所在平台集群ID、宿主机管理网络IP,根据fsid:ip查找链路表,检查备份机集群与该节点通信的远端设备是否正常,若设备故障则不启动备份。
若启动备份,则为执行备份任务的虚拟机备份创建时间点,预置时间点状态为创建中,并记录DB;主备份节点根据虚拟机标识调用虚拟化平台Rest接口创建虚拟机同步快照;主备份节点创建快照成功后,获取虚拟机同步快照信息,包括:各虚拟磁盘详情、虚拟机配置信息。
以上所述主备份节点由备份集群选举产生,可选地,一种备份集群实现为基于zookeeper进行Master选举、配置数据同步。
可选地,以上所述虚拟机同步快照名称由备份任务ID、时间点、当前备份index组合而成,index单调递增,以区分不同备份务下的相同虚拟机备份快照。
可选地,获取虚拟机配置文件数据可以对象的形式存储在备份存储池中,对象名称作为时间点的一个属性记录到数据库中。
上述通过Rest接口访问虚拟化平台时,需提供平台IP、端口、用户名和密码输入参数。备份端支持对各虚拟化平台信息进行管理,平台信息发生改变后,支持在备份端修改相应的平台信息。
进一步的,针对每一待备份的虚拟机创建一个卷组,通过卷组管理虚拟机多磁盘备份,备份端备份池为每个虚拟磁盘创建目标卷,创建Pair,关联链路并加入组。
获取虚拟机备份卷组,卷组管理多个Pair备份启动、停止、修改和事件上报,记录最新备份index、历史备份index列表,Pair信息。若获取卷组失败,则创建卷组;
备份启动后,卷组收到备份请求,根据传入的虚拟机磁盘ID、远端设备ID,获取卷组中对应的Pair;
可选地,若Pair获取失败,则在备份池中创建目标卷,然后创建一个Pair并加入卷组。Pair包括源文件和目标卷详情、远端设备信息、当前同步信息、已完成同步index列表等,Pair用于控制虚拟磁盘数据备份;
目标卷与一个虚拟磁盘文件对应,且大小一致,可选地,目标卷一种命名方式为group_id+vm_device_name+timestamp,其中group_id为卷组ID,vm_device_name为虚拟磁盘名称,timestamp为当前时间戳;
获取卷组一致性快照,其过程为:首先获取上次备份成功的index,然后根据index查找时间表,可选地,若没有找到一致性快照,则更改本次备份方式为全量备份。
本申请实施例中,可以将一个虚拟机的备份任务基于该虚拟机的磁盘文件数量划分为多个子备份任务,将一个备份任务分解为多个子备份任务,由备份集群中多个备份节点(执行节点)来执行备份任务。
例如,启动Pair备份,通过备份集群获取Pair同步任务的执行节点,然后将复制任务分配给该执行节点执行。可选地,具体的执行节点选择方法包括:
根据Pair所属卷组确定选择远端设备下地址池的备份节点列表,在该列表中进行选择;获取在线的备份节点,在在线备份节点中选择;选择一个当前任务最少的备份节点;该Pair任务与卷组其他Pair任务打散分布在不同的备份节点。
步骤120:将获取到的该目标虚拟机的磁盘文件和配置文件备份至所述备份集群的指定存储池中。
具体的,备份集群可以基于业务需求划分为至少一个存储池(备份池),这样,在执行一个虚拟机备份任务时,可以将该虚拟机数据备份至任一指定的存储池中。
本申请实施例中,卷组根据Pair执行结果确定虚拟机各个虚拟磁盘数据是否备份完成,若完成,获取备份虚拟机配置文件并创建时间点。
主备份节点卷组接收到所有Pair同步完成事件后,根据当前备份index、当前时间、卷组ID生成一致性快照,依次对各个目标卷创建快照;
更新虚拟机本次备份时间点信息,包括一致性快照、时间点状态、同步的数据量信息、虚拟机配置文件信息等;
可选地,若部分Pair同步失败,则备份任务虚拟机本次备份失败,对已创建的时间点进行清理,并删除虚拟机本次同步快照。
即一个虚拟机的所有卷对(磁盘文件/配置文件)同步成功后,才能确定该虚拟机数据备份成功,否则,该虚拟机数据备份失败。
本申请实施例中,当需要对一个虚拟机数据进行恢复时,接收恢复任务请求,其中,该恢复任务请求包括待恢复的虚拟机信息,用于恢复该虚拟机的宿主机信息;针对每一待恢复的虚拟机创建对应的卷组,其中,一个卷组包括多个卷对,一个文件恢复任务对应一个卷对;将各卷对分别下发至对应的备份节点,以使得各备份节点指示用于恢复该虚拟机的宿主机创建对应的目标文件;各备份节点分别将本地存储的磁盘文件/配置文件恢复至所述目标文件中,以使得该宿主机基于该目标文件创建并运行该虚拟机。
也就是说,虚拟机数据恢复可以包括以下步骤:
步骤1,根据待恢复的单个虚拟机标识和时间点信息,确定待恢复的数据,即一致性快照信息、虚拟机配置信息。
例如,主备份节点接收恢复任务请求,该请求包括目标虚拟化平台信息、备份虚拟机信息、备份时间点信息、恢复虚拟机信息;
主备份节点将恢复任务分解到虚拟机,确定远端设备状态,若远端设备状态异常,则恢复失败;
主备份节点根据虚拟机时间点确定同步快照信息,根据时间点记录的配置信息获取详细虚拟机配置。
步骤2,为每一个待回复的虚拟机创建一个卷组,通过卷组管理虚拟机多磁盘恢复,生产端创建恢复目标文件,创建Pair,关联链路并加入组。
恢复启动后,卷组收到恢复请求,在生产端存储池中创建目标文件,然后创建一个Pair并加入卷组。
步骤3,启动Pair恢复,通过备份集群确定虚拟磁盘复制任务运行的执行节点,由该执行节点执行数据恢复,恢复完成后通知卷组。
执行节点确定后,执行节点接收主备份节点发创建复制任务,异步完成数据数据复制;复制任务完成后,发送同步任务完成事件,并交由卷组进行处理。
步骤4,卷组根据Pair执行结果确定备份数据是否恢复完成,若完成,恢复虚拟机配置文件并在生产端创建目标虚拟机。
主备份节点卷组接收到所有Pair同步完成事件后,则虚拟机数据同步完成;
恢复虚拟机配置文件,通过虚拟化平台Rest接口创建目标虚拟机。
示例性的,参阅图3所示,为本申请实施例提供的一种虚拟化备份系统的结构示意图,该装置包括:
备份控制模块,用于接收备份任务请求,控制各虚拟机的备份,执行快照相关操作、虚拟机配置管理、备份时间点管理;
恢复控制模块,用于接收备份任务请求,控制启动备份时间点恢复到虚拟机;
备份集群管理模块,用于备份集群选主、复制执行节点选择,并对复制任务进行管理;
卷组管理模块,用于控制虚拟机虚拟磁盘备份,通过Pair进行控制,所有Pair都同步成功,则为虚拟机创建时间点;
卷对模块,用于控制卷对数据复制,根据当前选择的备份方式进行卷数据拷贝,并根据执行结果进行复制时间上报;
链路管理模块,用于对虚拟平台一个宿主机与备份端地址池通信链路进行管理,为卷组提供可靠的复制通信链路,对远端通信设备运行状态进行管理,远端设备断开时,上报Pair远端设备断开事件。
示例性的,参阅图4所示,为本申请实施例提供的一种虚拟化备份装置的结构示意图,应用于备份集群的主备份节点,所述备份集群被划分为多个地址池,一个地址池包括多个备份节点,任一地址池包括的备份节点分别与对应的运行有虚拟机的宿主机建立通信链路,所述备份集群包括的各备份节点组成分布式存储,所述备份集群被划分为至少一个存储池;所述装置包括:
接收单元40,用于接收备份任务请求,其中,所述备份任务请求包括目标宿主机信息,各目标宿主机中需备份的目标虚拟机信息;
创建单元41,用于针对每一目标虚拟机,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据,其中,该目标虚拟机的数据包括该目标虚拟机的磁盘文件和配置文件;
备份单元42,用于将获取到的该目标虚拟机的磁盘文件和配置文件备份至所述备份集群的指定存储池中。
可选地,所述装置还包括:
判断单元,用于判断该目标宿主机与对应的地址池包括的备份节点之间的通信链路是否正常,其中,若该目标宿主机与对应的地址池中包括的至少一个备份节点之间的通信链路正常,则判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常;
若判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常,则执行基于该备份任务从该目标宿主机上获取该目标虚拟机的数据的步骤。
可选地,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据时,所述创建单元41具体用于:
基于该目标虚拟机的磁盘文件和配置文件的数量,分别创建对应数量的备份任务;
基于所述备份集群包括的各备份节点的当前备份任务执行情况,确定用于执行所述对应数量的备份任务的目标备份节点;
将各备份任务分别下发至对应的目标备份节点,以使得该目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件。
可选地,将各备份任务分别下发至对应的目标备份节点,以使得目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件时,所述创建单元41具体用于:
创建目标虚拟机对应的卷组,其中,该卷组包括多个卷对,一个备份任务对应一个卷对;
将各备份任务对应的卷对发送至目标备份节点,以使得目标备份节点指示目标宿主机创建该卷对对应的磁盘文件/配置文件对应的目标卷;
基于主备份节点下发的备份执行指令,将目标宿主机中该目标卷对应的磁盘文件/配置文件备份至该卷对中。
可选地,所述接收单元40还用于:
接收恢复任务请求,其中,该恢复任务请求包括待恢复的虚拟机信息,用于恢复该虚拟机的宿主机信息;
针对每一待恢复的虚拟机创建对应的卷组,其中,一个卷组包括多个卷对,一个文件恢复任务对应一个卷对;
将各卷对分别下发至对应的备份节点,以使得各备份节点指示用于恢复该虚拟机的宿主机创建对应的目标文件;各备份节点分别将本地存储的磁盘文件/配置文件恢复至所述目标文件中,以使得该宿主机基于该目标文件创建并运行该虚拟机。
以上这些单元可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个单元通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些单元可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
进一步地,本申请实施例提供的虚拟化备份装置,从硬件层面而言,所述虚拟化备份装置的硬件架构示意图可以参见图5所示,所述虚拟化备份装置可以包括:存储器50和处理器51,
存储器50用于存储程序指令;处理器51调用存储器50中存储的程序指令,按照获得的程序指令执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种主备份节点,包括用于执行上述方法实施例的至少一个处理元件(或芯片)。
可选地,本申请还提供一种程序产品,例如计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使该计算机执行上述方法实施例。
这里,机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(RadomAccess Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种虚拟机备份方法,其特征在于,应用于备份集群的主备份节点,所述备份集群包括的各备份节点被划分为多个地址池,一个地址池包括多个备份节点,任一地址池包括的备份节点分别与对应的运行有虚拟机的宿主机建立通信链路,所述备份集群包括的各备份节点组成分布式存储,所述备份集群被划分为至少一个存储池;所述方法包括:
接收备份任务请求,其中,所述备份任务请求包括目标宿主机信息,各目标宿主机中需备份的目标虚拟机信息;
针对每一目标虚拟机,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据,其中,该目标虚拟机的数据包括该目标虚拟机的磁盘文件和配置文件;
将获取到的该目标虚拟机的磁盘文件和配置文件备份至所述备份集群的指定存储池中。
2.如权利要求1所述的方法,其特征在于,所述备份集群中的主备份节点维护有各目标宿主机与对应的地址池包括的备份节点之间的通信链路信息;基于该备份任务从该目标宿主机上获取该目标虚拟机的数据之前,所述方法还包括:
判断该目标宿主机与对应的地址池包括的备份节点之间的通信链路是否正常,其中,若该目标宿主机与对应的地址池中包括的至少一个备份节点之间的通信链路正常,则判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常;
若判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常,则执行基于该备份任务从该目标宿主机上获取该目标虚拟机的数据的步骤。
3.如权利要求1或2所述的方法,其特征在于,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据的步骤包括:
基于该目标虚拟机的磁盘文件和配置文件的数量,分别创建对应数量的备份任务;
基于所述备份集群包括的各备份节点的当前备份任务执行情况,确定用于执行所述对应数量的备份任务的目标备份节点;
将各备份任务分别下发至对应的目标备份节点,以使得该目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件。
4.如权利要求3所述的方法,其特征在于,将各备份任务分别下发至对应的目标备份节点,以使得目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件的步骤包括:
创建目标虚拟机对应的卷组,其中,该卷组包括多个卷对,一个备份任务对应一个卷对;
将各备份任务对应的卷对发送至目标备份节点,以使得目标备份节点指示目标宿主机创建该卷对对应的磁盘文件/配置文件对应的目标卷;
基于主备份节点下发的备份执行指令,将目标宿主机中该目标卷对应的磁盘文件/配置文件备份至该卷对中。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
接收恢复任务请求,其中,该恢复任务请求包括待恢复的虚拟机信息,用于恢复该虚拟机的宿主机信息;
针对每一待恢复的虚拟机创建对应的卷组,其中,一个卷组包括多个卷对,一个文件恢复任务对应一个卷对;
将各卷对分别下发至对应的备份节点,以使得各备份节点指示用于恢复该虚拟机的宿主机创建对应的目标文件;各备份节点分别将本地存储的磁盘文件/配置文件恢复至所述目标文件中,以使得该宿主机基于该目标文件创建并运行该虚拟机。
6.一种虚拟机备份装置,其特征在于,应用于备份集群的主备份节点,所述备份集群被划分为多个地址池,一个地址池包括多个备份节点,任一地址池包括的备份节点分别与对应的运行有虚拟机的宿主机建立通信链路,所述备份集群包括的各备份节点组成分布式存储,所述备份集群被划分为至少一个存储池;所述装置包括:
接收备份任务请求,其中,所述备份任务请求包括目标宿主机信息,各目标宿主机中需备份的目标虚拟机信息;
针对每一目标虚拟机,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据,其中,该目标虚拟机的数据包括该目标虚拟机的磁盘文件和配置文件;
将获取到的该目标虚拟机的磁盘文件和配置文件备份至所述备份集群的指定存储池中。
7.如权利要求6所述的装置,其特征在于,所述备份集群中的主备份节点维护有各目标宿主机与对应的地址池包括的备份节点之间的通信链路信息;基于该备份任务从该目标宿主机上获取该目标虚拟机的数据之前,所述装置还包括:
判断该目标宿主机与对应的地址池包括的备份节点之间的通信链路是否正常,其中,若该目标宿主机与对应的地址池中包括的至少一个备份节点之间的通信链路正常,则判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常;
若判定该目标宿主机与对应的地址池包括的备份节点之间的通信链路正常,则执行基于该备份任务从该目标宿主机上获取该目标虚拟机的数据的步骤。
8.如权利要求6或7所述的装置,其特征在于,创建该目标虚拟机对应的备份任务,并基于该备份任务从该目标宿主机上获取该目标虚拟机的数据的步骤包括:
基于该目标虚拟机的磁盘文件和配置文件的数量,分别创建对应数量的备份任务;
基于所述备份集群包括的各备份节点的当前备份任务执行情况,确定用于执行所述对应数量的备份任务的目标备份节点;
将各备份任务分别下发至对应的目标备份节点,以使得该目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件。
9.如权利要求8所述的装置,其特征在于,将各备份任务分别下发至对应的目标备份节点,以使得目标备份节点基于接收到的备份任务从目标宿主机获取对应的磁盘文件/配置文件的步骤包括:
创建目标虚拟机对应的卷组,其中,该卷组包括多个卷对,一个备份任务对应一个卷对;
将各备份任务对应的卷对发送至目标备份节点,以使得目标备份节点指示目标宿主机创建该卷对对应的磁盘文件/配置文件对应的目标卷;
基于主备份节点下发的备份执行指令,将目标宿主机中该目标卷对应的磁盘文件/配置文件备份至该卷对中。
10.如权利要求9所述的装置,其特征在于,所述装置还包括:
接收恢复任务请求,其中,该恢复任务请求包括待恢复的虚拟机信息,用于恢复该虚拟机的宿主机信息;
针对每一待恢复的虚拟机创建对应的卷组,其中,一个卷组包括多个卷对,一个文件恢复任务对应一个卷对;
将各卷对分别下发至对应的备份节点,以使得各备份节点指示用于恢复该虚拟机的宿主机创建对应的目标文件;各备份节点分别将本地存储的磁盘文件/配置文件恢复至所述目标文件中,以使得该宿主机基于该目标文件创建并运行该虚拟机。
CN202111140682.2A 2021-09-28 2021-09-28 一种虚拟机备份方法及装置 Pending CN113986450A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111140682.2A CN113986450A (zh) 2021-09-28 2021-09-28 一种虚拟机备份方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111140682.2A CN113986450A (zh) 2021-09-28 2021-09-28 一种虚拟机备份方法及装置

Publications (1)

Publication Number Publication Date
CN113986450A true CN113986450A (zh) 2022-01-28

Family

ID=79736987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111140682.2A Pending CN113986450A (zh) 2021-09-28 2021-09-28 一种虚拟机备份方法及装置

Country Status (1)

Country Link
CN (1) CN113986450A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115562911A (zh) * 2022-12-07 2023-01-03 中科方德软件有限公司 虚拟机数据备份方法及装置、系统、电子设备、存储介质
CN116112497A (zh) * 2022-12-29 2023-05-12 天翼云科技有限公司 一种云主机集群的节点调度方法、装置、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115562911A (zh) * 2022-12-07 2023-01-03 中科方德软件有限公司 虚拟机数据备份方法及装置、系统、电子设备、存储介质
CN116112497A (zh) * 2022-12-29 2023-05-12 天翼云科技有限公司 一种云主机集群的节点调度方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
US11030052B2 (en) Data protection using checkpoint restart for cluster shared resources
US9098439B2 (en) Providing a fault tolerant system in a loosely-coupled cluster environment using application checkpoints and logs
WO2021136422A1 (zh) 状态管理方法、主备应用服务器的切换方法及电子设备
US9501544B1 (en) Federated backup of cluster shared volumes
CN106062717A (zh) 一种分布式存储复制系统和方法
CN111078667B (zh) 一种数据迁移的方法以及相关装置
US10725980B2 (en) Highly available cluster agent for backup and restore operations
WO2014205847A1 (zh) 一种分区平衡子任务下发方法、装置与系统
US9201740B2 (en) Computer system, cluster management method, and management computer
US20120278422A1 (en) Live object pattern for use with a distributed cache
WO2019020081A1 (zh) 分布式系统及其故障恢复方法、装置、产品和存储介质
CN113986450A (zh) 一种虚拟机备份方法及装置
CN110825562B (zh) 数据备份方法、装置、系统和存储介质
CN110858168B (zh) 集群节点故障处理方法、装置及集群节点
CN111226200B (zh) 为分布式应用创建一致性快照的方法、装置和分布式系统
CN116389233A (zh) 容器云管理平台主备切换系统、方法、装置和计算机设备
CN115470041A (zh) 一种数据灾备管理方法及装置
CN112540875B (zh) 一种基于xtrabackup的mysql数据库备份、恢复校验可用性的方法
CN114356650A (zh) 数据备份方法、装置、设备、系统及存储介质
CN113438111A (zh) 基于Raft分布式恢复RabbitMQ网络分区的方法及应用
CN113946471A (zh) 基于对象存储的分布式文件级备份方法及系统
CN109947593B (zh) 数据容灾方法、系统、策略仲裁装置和存储介质
CN111444040B (zh) 一种元数据备份方法及装置
CN111400098A (zh) 一种副本管理方法、装置、电子设备及存储介质
US11354197B2 (en) Recovery of a software-defined data center

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination