CN106603279A - 一种容灾方法和容灾系统 - Google Patents

一种容灾方法和容灾系统 Download PDF

Info

Publication number
CN106603279A
CN106603279A CN201611109317.4A CN201611109317A CN106603279A CN 106603279 A CN106603279 A CN 106603279A CN 201611109317 A CN201611109317 A CN 201611109317A CN 106603279 A CN106603279 A CN 106603279A
Authority
CN
China
Prior art keywords
virtual machine
snapshot
disk
virtual
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611109317.4A
Other languages
English (en)
Inventor
李珺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201611109317.4A priority Critical patent/CN106603279A/zh
Publication of CN106603279A publication Critical patent/CN106603279A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements

Abstract

本发明实施例提供了容灾方法和容灾系统,以使得在灾备站点为生产站点的虚拟机创建一致性快照。具体的,容灾管理设备根据用户的需求或者系统配置确定需要提供一致性快照的虚拟机,确定虚拟机的标识,向虚拟化管理设备发送一致性快照请求,虚拟化管理设备向虚拟机所在的主机中的IOCF转发该一致性快照请求,该IOCF将虚拟机一致性相关IO数据下盘,并对IO数据做快照标识。基于前述的容灾过程,当IO数据传递到灾备站点的灾备虚拟机所在的主机的IOWF时,该IOWF在写入IO数据的过程中,识别IO数据的快照标识,并在该快照标识对应的一致性快照的结束点创建磁盘快照,进而在灾备站点建立虚拟机所有磁盘的一致性快照。

Description

一种容灾方法和容灾系统
技术领域
本发明涉及通信领域,特别涉及一种容灾方法和灾备系统。
背景技术
容灾技术是指在相隔较远的异地,建立两套或多套功能类似的系统,当生产站点发生地震、火灾等灾难事件,或发生断电等重大故障,导致生产站点的业务系统无法正常运行时,通过将业务系统从生产站点切换到异地的灾备站点,保持持续应用服务的能力。
在虚拟化环境下,在灾备站点创建与生产站点的虚拟机对应的灾备虚拟机。生产站点中的虚拟机IO操作会被拦截,拦截到的IO数据通过数据转发网关传递到灾备站点,并将所述IO数据写入到灾备虚拟机,从而保证生产站点和灾备站点的数据同步。更进一步的,当生产站点的业务系统无法正常运行时,为了能够在灾备站点顺利恢复业务系统,需要在灾备站点周期性的创建业务恢复点,业务恢复点一般采用虚拟机快照,即在生产站点针对运行业务系统的虚拟机创建虚拟机快照,然后将虚拟机快照文件内容复制到灾备站点,从而使得灾备站点获得虚拟机的一致性快照作为恢复点。
上述业务恢复点的创建方式会给生产站点带来一系列的问题:首先,生产站点针对虚拟机的磁盘创建快照后,会将快照卷提供给虚拟机使用,快照后的新增数据会存储到差分卷上,由于差分卷可能会存储到其他的节点,从而导致虚拟机访问磁盘的速度变慢,降低了虚拟机的IO性能;其次,在将生产站点的快照复制到灾备站点的过程中,灾备站点需要停止针对IO数据的复制操作,待快照复制完成后才可继续复制生产站点中虚拟机的IO数据,因此快照复制过程中容灾虚拟机的IO复制操作无法持续,处于暂停状态;最后,快照复制结束后,生产站点的快照不能一直保留,需要进行清理,清理快照又会给生产站点带来性能损耗。
发明内容
本发明实施例提供一种虚拟化场景下的容灾方法和容灾系统,该方法提供了在主机复制容灾场景下,无需在生产站点生成快照,而是直接在灾备站点生成快照的方式,避免了由于在生产站点生成快照而对生产站点虚拟机引起的性能影响,同时又能保持容灾IO复制操作不发生中断。
第一方面,提供了一种虚拟化场景下的容灾系统,包括生产站点和灾备站点,所述生产站点包括容灾管理设备、第一虚拟化管理设备以及至少一个第一主机,灾备站点包括第二虚拟化管理设备以及至少一个第二主机,所述第一主机上运行有IOCF以及至少一个第一虚拟机,所述第二主机上运行有IOWF以及至少一个第二虚拟机,所述第二虚拟机为所述第一虚拟机的灾备虚拟机,
所述容灾管理设备提供管理功能,具体的,容灾管理设备向所述第一虚拟化管理设备发送恢复点创建请求,所述恢复点创建请求携带第一虚拟机标识;所述第一虚拟化管理设备根据所述第一虚拟机标识即可确定需要提供一致性快照服务的虚拟机,从而向所述第一虚拟机对应的IOCF发送快照请求消息;所述IOCF调用所述第一虚拟机的操作系统,将所述第一虚拟机的IO数据写入各个磁盘,写入完成后,在与虚拟机每个磁盘分别对应的IO数据转发队列末尾添加快照标识,所述IO数据转发队列记录有成功写入与所述IO数据转发队列对应的磁盘的IO数据;所述IOCF向所述第二虚拟化管理设备发送报文,所述报文携带所述所述IO数据转发队列中的数据、第一虚拟机标识以及磁盘标识;所述第二虚拟化管理设备根据所述第一虚拟机标识确定所述第一虚拟机对应的灾备虚拟机所在的第二主机,并向第二主机的IOWF发送所述报文;所述IOWF接收所述报文,将所述报文携带的IO数据写入到第二虚拟机的磁盘,当检测到所述报文携带快照标识时,为所述报文携带的磁盘标识对应的磁盘创建快照;所述第二虚拟化管理设备确定当所述第一虚拟机的所有磁盘的快照已创建完成后,将所述第一虚拟机的所有磁盘的快照组合成虚拟机的一致性快照。
由于生产站点不需要产生快照,降低了生产站点的磁盘的性能损耗,同时,容灾站点中的一致性快照是在IO复制流程中创建的,一致性快照的创建并不会导致IO复制流程的中断。
在一种可能的实施方式中,在所述IOWF为所述报文携带的磁盘标识对应的磁盘创建快照之后,所述IOWF向所述第二虚拟化管理设备上报快照信息,所述快照信息包括虚拟机标识、磁盘标识以及快照的时间戳信息。虚拟化管理设备汇总IOWF上报的快照信息,根据创建的磁盘快照的时间戳信息确定所述第一虚拟机的所有磁盘的快照是否已创建完成。
将所述报文携带的IO数据写入到所述第二虚拟机的磁盘后,所述IOWF向IOCF返回写入成功响应消息,所述写入成功响应消息携带所述第一虚拟机标识和磁盘标识,所述IOCF收到该写入成功响应消息后,清除所述第一虚拟机标识和磁盘标识对应的IO数据转发队列。通过本步骤,可以刷新生产站点的IO数据转发队列,清楚旧的数据。
在一种可能的设计中,所述IOCF从所述IO数据转发队列中按顺序提取数据,并分别通过所述报文发送,一个报文包含所述IO数据转发队列中的一次IO数据,最后一个报文携带所述IO转发队列末尾的快照标识。
所述第一主机上运行有多个IOCF,第一虚拟机的每个磁盘对应一个IOCF。
云管理设备在发起一致性快照之前,还需要执行配置过程:所述容灾管理设备根据配置信息,确定所述第一虚拟机的一致性快照的执行周期,在灾备站点选择所述第二虚拟机作为所述第一虚拟机的灾备虚拟机,记录所述第一虚拟机的标识与所述第二主机的标识之间的对应关系,将所述对应关系发送到所述第二虚拟化管理设备。
第二方面,与前述第一方面的系统相对应,本发明实施例还提供了一种容灾方法。
第三方面,提供了一种硬件服务器,该计算服务器包括处理器和存储器,该存储器用于存储计算机程序,该处理器用于执行该存储器中存储的计算机程序,执行上述第一方面、第一方面的任一可能的实现方式中各部件的功能。
第四方面,提供了一种计算机可读介质,用于存储计算机程序,该计算机程序包括用于上述第一方面、第一方面的任一可能的实现方式中各部件功能的指令。
附图说明
图1是本发明实施例提供的灾备系统的网络架构示意图;
图2是本发明实施例提供的一致性快照的生成方法流程示意图;
图3是本发明实施例提供的硬件服务器结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了方便理解本发明实施例,首先结合图1描述本发明实施例可应用的灾备系统的架构图。灾备系统包括生产站点以及灾备站点,生产站点和灾备站点中各有若干主机、虚拟化管理设备,以及数据转发网关(Data Transfer Gateway,DTG)。容灾系统还包括容灾管理设备,所述容灾管理设备可以位于生产站点或者灾备站点。其中主机上运行有若干虚拟机(Virtual Machine,VM),生产站点的主机上还运行有IO复制功能(IO Copy Function,IOCF),灾备站点的主机上还运行有IO写入功能(IO Writer Function,IOWF)。
在一种可能的实施方式中,生产站点和灾备站点也可以各自具有独立的容灾管理设备。
其中:
容灾管理设备:负责管理容灾业务,同时对用户提供容灾功能,如:站点、保护组、保护策略、恢复计划等等;
虚拟化管理设备:提供以虚拟机为单位的容灾能力,实现虚拟机的数据容灾,如:启动容灾、停止容灾、查询容灾状态、一致性快照等;
数据转发网关:聚合虚拟机的IO数据,并对IO数据进行压缩、加密后发送到灾备站点。
IO复制功能:实时捕获虚拟机的IO数据,并采用同步或异步的方式将IO数据发送至数据转发网关;
IO写入功能:接收由生产站点发送过来的IO数据,在灾备虚拟机关闭情况下打开磁盘文件,将IO数据写入到与生产站点虚拟机对应的灾备虚拟机的磁盘中。
需要说明的是,上述容灾管理设备、虚拟化管理设备、DTG可以为独立的物理服务器,也可以以软件模块的形式位于物理服务器中。本发明实施例对上述容灾管理设备、虚拟化管理设备、DTG的实现形式并不进行限定。
具体地,结合图1所示的灾备系统的结构示意图,生产站点的虚拟机的容灾过程如下:系统管理员根据业务要求,在生产站点的容灾管理设备上配置对该生产站点的某个或某些虚拟机进行容灾服务;生产站点的容灾管理设备请求本端的虚拟化管理设备对指定VM的输入输出(IO,Input and Output)进行拦截;生产站点的虚拟化管理设备请求运行指定的需要容灾的VM的IO复制功能(IO Copy Function,IOCF),拦截指定VM的IO数据,并将拦截的IO数据发送给本端的数据转发网关;生产站点的容灾管理设备请求DTG将接收到的数据发送到灾备站点的DTG。
生产站点的容灾管理设备将生成的容灾请求发送给灾备站点的容灾管理设备,请求其完成容灾配置。灾备站点的容灾管理设备请求本端的虚拟化管理设备创建容灾虚拟机,并获取该容灾虚拟机的标识,该容灾虚拟机处于未运行状态。灾备站点的容灾管理设备请求本端的DTG将接收的对端VM(即第一站点侧上需要容灾的VM)的数据发送给指定本端的IO写入功能(IO Writer Function,IOWF),由IOWF将数据写入本端的VM(即容灾虚拟机)存储。
进一步的,在上述容灾过程的基础上,本发明实施例提供了在灾备站点创建一致性快照的功能。具体的,容灾管理设备根据用户的需求或者系统配置确定需要提供一致性快照的虚拟机,确定虚拟机的标识,向虚拟化管理设备发送一致性快照请求,虚拟化管理设备向虚拟机所在的主机中的IOCF转发该一致性快照请求,该IOCF将虚拟机一致性相关IO数据下盘,并对IO数据做快照标识。基于前述的容灾过程,当IO数据传递到灾备站点的灾备虚拟机所在的主机的IOWF时,该IOWF在写入IO数据的过程中,识别IO数据的快照标识,并在该快照标识对应的一致性快照的结束点创建磁盘快照,进而在灾备站点建立虚拟机所有磁盘的一致性快照。
在一种可能的设计中,用户可以通过容灾管理设备提供的图形用户界面配置周期性创建一致性快照的时间,容灾管理设备根据用户的配置,通过虚拟化管理设备请求IOCF周期性的发起一致性快照。
为更清楚的给出一致性快照功能的实现方案,结合图2,为本发明实施例提供的灾备站点生成一致性快照的过程。所述生产站点包括容灾管理设备、第一虚拟化管理设备以及至少一个第一主机,灾备站点包括第二虚拟化管理设备以及至少一个第二主机,所述第一主机上运行有IOCF以及至少一个第一虚拟机,所述第二主机上运行有IOWF以及至少一个第二虚拟机,所述第二虚拟机为所述第一虚拟机的灾备虚拟机。在灾备站点生成第一虚拟机的一致性快照的方法包括:
步骤201:容灾管理设备向第一虚拟化管理设备发送恢复点创建请求,用于为第一虚拟机创建一致性快照,所述恢复点创建请求携带第一虚拟机标识;
用户或管理员可以通过容灾管理设备对外提供的图像用户界面,登录到容灾系统,配置需要提供一致性快照的虚拟机以及一致性快照的执行周期等等。容灾管理设备根据用户设定的执行周期,触发虚拟化管理设备为虚拟机创建一致性快照。
需要说明的是,容灾系统根据用户的需求在灾备站点选择与待容灾的虚拟机对应的灾备虚拟机,具体选择的方法可以采用现有技术中定义的方式,本发明实施例对此并不进行限定。
还需要说明的是,容灾管理设备将生产站点虚拟机与灾备虚拟机所在的主机的标识之间的对应关系发送到灾备站点的第二虚拟化管理设备,灾备站点的第二虚拟化管理设备记录生产站点虚拟机与灾备虚拟机所在的主机的标识之间的对应关系。
步骤202:第一虚拟化管理设备接收恢复点创建请求,根据所述虚拟机标识为所述虚拟机触发一致性快照服务。具体的,第一虚拟化管理设备根据第一虚拟机标识确定第一虚拟机的IOCF,向确定的IOCF发送快照请求消息,所述快照请求消息用于通知所述IOCF执行一致性快照。
在一种可能的设计中,第一虚拟机的每个磁盘对应一个IOCF,IOCF运行在主机的VMM中。第一虚拟机可能存在多个磁盘,则第一虚拟机有与磁盘数量相同的IOCF。第一虚拟化管理设备会向第一虚拟机的每个磁盘对应的IOCF发送所述快照请求消息。其中,第一虚拟化管理设备记录有虚拟机磁盘与IOCF的对应关系。
在另一种可能的设计中,也可以由一个IOCF为虚拟机的多个磁盘提供一致性快照的服务。此时,由IOCF针对不同的磁盘触发第一虚拟机分别执行一致性快照服务。
步骤203:IOCF接收所述快照请求消息,触发第一虚拟机执行一致性快照服务,将磁盘的所有IO数据下盘,下盘完成后,第一虚拟机通知IOCF下盘结束。
具体的,当第一虚拟机操作系统为Window系统时,IOCF触发第一虚拟机的操作系统调用VSS服务。在一种可能的实施方式中,第一虚拟机操作系统(GuestOS)中包含快照代理模块,IOCF通过所述快照代理模块触发所述第一虚拟机操作系统调用VSS服务,将磁盘的所有IO数据下盘。IO数据下盘完成后,VSS服务器通过事件机制通知快照代理模块。快照代理模块向IOCF发送通知消息,通知IOCF磁盘的IO数据下盘完成。
需要说明的是,第一虚拟机操作系统调用VSS服务的具体流程可以采用现有Windows系统定义的方式,通知代理本发明实施例对此并不进行限定。在一种可能的实施方式中,VSS服务可以调用第三方应用提供的脚本,将第三方应用需要写入磁盘的IO数据下盘,下盘结束后,VSS通过事件机制通知快照代理模块。
步骤204:IOCF接收来自第一虚拟机的通知消息,确定IO数据下盘成功,将IO数据复制到IO数据转发队列,并在IO数据转发队列末尾添加快照标识。
需要说明的是,IO数据下盘过程中,所有的IO都会被IOCF复制并转发。IOCF会将成功下盘的IO数据放入IO数据转发队列,每个磁盘可以对应一个IO数据转发队列。
在IOCF触发第一虚拟机执行一致性快照服务的过程中,针对该第一虚拟机的所有新的IO均会被冻结,直到一致性快照服务结束。
当第一虚拟机存在多个磁盘时,第一虚拟机每个磁盘对应的IOCF均会执行步骤203和步骤204,将磁盘的IO数据下盘,下盘完成后,在IO数据转发队列末尾添加快照标识。
进一步的,所述快照标识可以包括时间戳信息。
当第一虚拟机的某个磁盘没有IO数据需要写入的时候,该磁盘对应的IOCF在该磁盘对应的IO数据转发队列中加入快照标识,此时,该磁盘对应的IO数据转发队列不包含IO数据。
在一致性快照创建的过程中,针对同一虚拟机的不同磁盘的IO数据转发队列的末尾添加的快照标识相同,同一组标识表示虚拟机一个完整的一致性快照。
步骤205:IOCF将IO数据转发队列中的数据携带在报文中发送到生产站点的第一数据转发网关DTG,通过灾备站点的第二数据转发网关,将IO数据转发到灾备虚拟机所在的第二主机的IOWF,所述报文包括虚拟机标识、磁盘标识以及IO数据转发队列中的IO数据。
在一种可能的设计中,IOCF将IO数据转发队列中的一个IO数据携带在一个报文中,发给对端的IOWF。
由于IO数据转发队列末尾为快照标识,此时,IOCF会将快照标识放入报文,携带快照标识的报文为快照报文。当IOWF收到快照报文时,即会针对快照报文携带的虚拟机磁盘标识对应的磁盘创建快照。
步骤206:IOWF接收IOCF发送的报文,从报文中读取IO数据,并按照IO数据转发队列中的顺序将IO数据写入灾备虚拟机的磁盘,当IOWF确定报文中携带快照标识时,对所述磁盘创建磁盘快照。
进一步的,快照标识携带时间戳信息,具备相同时间戳信息的不同磁盘的报文,对应于虚拟机的同一个快照。
在具体的执行场景中,IOWF接收到报文后,根据虚拟机标识确定对应的灾备虚拟机,根据磁盘标识将报文携带的IO数据写入到灾备虚拟机对应的磁盘中;当IOWF确定收到的报文携带快照标识时,即根据快照报文中的虚拟机标识和磁盘标识,生成对应磁盘的快照。
IOWF将IO数据写入灾备虚拟机的磁盘中后,向IOCF返回写入成功响应消息。IOCF收到写入成功响应消息后,清除IO数据转发队列。
具体的,所述写入成功响应消息携带第一虚拟机标识和磁盘标识,IOCF收到该写入成功响应消息后,清除第一虚拟机标识和磁盘标识对应的IO数据转发队列。
步骤207:灾备站点的IOWF向灾备站点的第二虚拟化管理设备上报快照信息,所述快照信息包括虚拟机标识、磁盘标识以及快照的时间戳信息。
步骤208:灾备站点的第二虚拟化管理设备接收上述快照信息,确定第一虚拟机所有的磁盘均已创建具备相同时间戳信息的磁盘快照,则为第一虚拟机创建一致性快照。IOWF对第一虚拟机所有磁盘的具备相同时间戳信息的磁盘快照进行组合,生成虚拟机的一致性快照,生成的一致性快照包含时间戳信息,用于表示一致性快照对应的恢复时间点。
例如,假设虚拟机有3个磁盘,只有当3个磁盘的快照的时间戳信息都相同时,才表示虚拟机所有磁盘的快照都生成了。
步骤209:当生产站点的第一虚拟机故障时,灾备站点的第二虚拟化管理设备可以根据容灾管理设备的指示,使用前述生成的一致性快照,在灾备站点启动所述生产站点的第一虚拟机的灾备虚拟机。
在生产站点的第一虚拟机正常运行过程中,灾备系统会根据步骤201的配置,在灾备站点为生产站点的第一虚拟机不断生成一致性快照。为了删除冗余数据,灾备站点还可以根据用户的配置在灾备站点保留一定数量的一致性快照,删除陈旧的一致性快照。当生产站点第一虚拟机发生故障需要恢复时,灾备系统可以在灾备站点选择最新的一致性快照进行创建灾备虚拟机,还可以选择某一个特定时间点的一致性快照进行恢复。
在本发明实施例中,由于生产站点不需要产生快照,降低了生产站点的磁盘的性能损耗,同时,容灾站点中的一致性快照是在IO复制流程中创建的,一致性快照的创建并不会导致IO复制流程的中断。
更进一步的,在生产站点也可以生成第一虚拟机的一致性快照,此时,第一虚拟机的恢复可以不依赖于灾备站点。具体的,在步骤204中,IOCF在发送报文前,识别IO数据转发队列中的快照标识,生成IO数据转发队列对应的磁盘的快照。当第一虚拟机所有磁盘的快照均生成后,由第一虚拟化管理设备在生产站点生成第一虚拟机的一致性快照。需要说明的是,当生产站点也生成第一虚拟机的一致性快照时,生产站点的第一虚拟化管理设备可以使用本站点的第一虚拟机的一致性快照恢复第一虚拟机。此时,由于一致性快照时在IO数据转发的过程中生成的,不会导致IO数据转发过程的中断。
应理解,图1所示的主机能够实现图2方法实施例中涉及主机中各部件的各个过程。主机中的各个模块的功能,分别为了实现图2中的方法实施例中的相应流程。具体可参见上述方法实施例中的描述,为避免重复,此处适当省略详述描述。
图3示出了根据本发明实施例的一种硬件服务器的示意性框图。图1中对应的容灾管理设备、虚拟化管理设备、DTG以及主机均可以使用图3对应的硬件服务器的结构。具体地,如图3所示,该硬件服务器300包括:处理器310和收发器320,处理器310和收发器320相连,可选地,该硬件服务器300还包括存储器330,存储器330与处理器310相连,进一步可选地,该硬件服务器300还可以包括总线系统340。其中,处理器310、存储器330和收发器320可以通过总线系统340相连,该存储器330可以用于存储指令,该处理器310用于执行该存储器330存储的指令,以控制收发器320收发信息或信号。处理器310执行存储器330中的指令,以实现图1所述的系统中各部件的功能以及图2所示的方法流程中的各个流程,本发明实施例不再赘述。
应理解,在本发明实施例中,该处理器310可以是中央处理单元(CentralProcessing Unit,简称为“简称为“),该处理器310还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器330可以包括只读存储器和随机存取存储器,并向处理器310提供指令和数据。存储器330的一部分还可以包括非易失性随机存取存储器。例如,存储器330还可以存储设备类型的信息。
该总线系统340除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统340。
在实现过程中,上述方法的各步骤可以通过处理器310中的硬件的集成逻辑电路或者软件形式的指令完成。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器330,处理器310读取存储器330中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
总之,以上所述仅为本发明技术方案的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种容灾系统,其特征在于,包括生产站点和灾备站点,所述生产站点包括容灾管理设备、第一虚拟化管理设备以及至少一个第一主机,灾备站点包括第二虚拟化管理设备以及至少一个第二主机,所述第一主机上运行有IOCF以及至少一个第一虚拟机,所述第二主机上运行有IOWF以及至少一个第二虚拟机,所述第二虚拟机为所述第一虚拟机的灾备虚拟机,
所述容灾管理设备,用于向所述第一虚拟化管理设备发送恢复点创建请求,所述恢复点创建请求携带第一虚拟机标识;
所述第一虚拟化管理设备,用于接收所述恢复点创建请求,根据所述第一虚拟机标识向所述第一虚拟机对应的IOCF发送快照请求消息;
所述IOCF,用于调用所述第一虚拟机的操作系统,将所述第一虚拟机的IO数据写入各个磁盘,写入完成后,在与虚拟机每个磁盘分别对应的IO数据转发队列末尾添加快照标识,所述IO数据转发队列记录有成功写入与所述IO数据转发队列对应的磁盘的IO数据;
所述IOCF,还用于向所述第二虚拟化管理设备发送报文,所述报文携带所述所述IO数据转发队列中的数据、第一虚拟机标识以及磁盘标识;
所述第二虚拟化管理设备,用于根据所述第一虚拟机标识确定所述第一虚拟机对应的灾备虚拟机所在的第二主机,并向第二主机的IOWF发送所述报文;
所述IOWF,用于接收所述报文,将所述报文携带的IO数据写入到第二虚拟机的磁盘,当检测到所述报文携带快照标识时,为所述报文携带的磁盘标识对应的磁盘创建快照;
所述第二虚拟化管理设备,用于确定当所述第一虚拟机的所有磁盘的快照已创建完成后,将所述第一虚拟机的所有磁盘的快照组合成虚拟机的一致性快照。
2.如权利要求1所述的系统,其特征在于,
所述IOWF,还用于向所述第二虚拟化管理设备上报快照信息,所述快照信息包括虚拟机标识、磁盘标识以及快照的时间戳信息。
3.如权利要求2所述的系统,其特征在于,
所述第二虚拟化管理设备,具体用于根据创建的磁盘快照的时间戳信息确定所述第一虚拟机的所有磁盘的快照是否已创建完成。
4.如权利要求1-3任一所述的系统,其特征在于,
所述IOWF,还用于在所述报文携带的IO数据写入到所述第二虚拟机的磁盘后,向IOCF返回写入成功响应消息,所述写入成功响应消息携带所述第一虚拟机标识和磁盘标识;
所述IOCF,还用于收到该写入成功响应消息后,清除所述第一虚拟机标识和磁盘标识对应的IO数据转发队列。
5.如权利要求1-4任一所述的系统,其特征在于,
所述IOCF,具体用于从所述IO数据转发队列中按顺序提取数据,并分别通过所述报文发送,一个报文包含所述IO数据转发队列中的一次IO数据,最后一个报文携带所述IO转发队列末尾的快照标识。
6.如权利要求1-5任一所述的系统,其特征在于,所述第一主机上运行有多个IOCF,第一虚拟机的每个磁盘对应一个IOCF。
7.如权利要求1-6任一所述的系统,其特征在于,
所述容灾管理设备,还用于根据配置信息,确定所述第一虚拟机的一致性快照的执行周期,在灾备站点选择所述第二虚拟机作为所述第一虚拟机的灾备虚拟机,记录所述第一虚拟机的标识与所述第二主机的标识之间的对应关系,将所述对应关系发送到所述第二虚拟化管理设备。
8.一种容灾方法,其特征在于,包括:
容灾管理设备向生产站点的第一虚拟化管理设备发送恢复点创建请求,所述恢复点创建请求携带第一虚拟机标识;
所述第一虚拟化管理设备接收所述恢复点创建请求,根据所述第一虚拟机标识向所述第一虚拟机对应的IOCF发送快照请求消息;
所述IOCF调用第一虚拟机的操作系统,将所述第一虚拟机的IO数据写入各个磁盘,写入完成后,在与虚拟机每个磁盘分别对应的IO数据转发队列末尾添加快照标识,所述IO数据转发队列记录有成功写入与所述IO数据转发队列对应的磁盘的IO数据;
所述IOCF向灾备站点的第二虚拟化管理设备发送报文,所述报文携带所述所述IO数据转发队列中的数据、第一虚拟机标识以及磁盘标识;
所述第二虚拟化管理设备根据所述第一虚拟机标识确定所述第一虚拟机对应的灾备虚拟机所在的第二主机,并向第二主机的IOWF发送所述报文,所述灾备虚拟机为第二虚拟机;
所述IOWF接收所述报文,将所述报文携带的IO数据写入到所述第二虚拟机的磁盘,当检测到所述报文携带快照标识时,为所述报文携带的磁盘标识对应的磁盘创建快照;
所述第二虚拟化管理设备确定当所述第一虚拟机的所有磁盘的快照已创建完成后,将所述第一虚拟机的所有磁盘的快照组合成虚拟机的一致性快照。
9.如权利要求8所述的方法,其特征在于,在所述IOWF为所述报文携带的磁盘标识对应的磁盘创建快照之后,所述方法还包括:
所述IOWF向所述第二虚拟化管理设备上报快照信息,所述快照信息包括虚拟机标识、磁盘标识以及快照的时间戳信息。
10.如权利要求9所述的方法,其特征在于,所述方法还包括:
所述第二虚拟化管理设备接收所述快照信息,根据创建的磁盘快照的时间戳信息确定所述第一虚拟机的所有磁盘的快照是否已创建完成。
11.如权利要求8-10所述的方法,其特征在于,将所述报文携带的IO数据写入到所述第二虚拟机的磁盘后,所述方法还包括:
所述IOWF向IOCF返回写入成功响应消息,所述写入成功响应消息携带所述第一虚拟机标识和磁盘标识;
所述IOCF收到该写入成功响应消息后,清除所述第一虚拟机标识和磁盘标识对应的IO数据转发队列。
12.如权利要求8-11所述的方法,其特征在于,所述IOCF向灾备站点的第二虚拟化管理设备发送报文具体包括:
所述IOCF从所述IO数据转发队列中按顺序提取数据,并分别通过所述报文发送,一个报文包含所述IO数据转发队列中的一次IO数据,最后一个报文携带所述IO转发队列末尾的快照标识。
13.如权利要求8-12任一所述的方法,其特征在于,所述第一主机上运行有多个IOCF,第一虚拟机的每个磁盘对应一个IOCF。
14.如权利要求8-13任一所述的方法,其特征在于,所述方法还包括:
所述容灾管理设备根据配置信息,确定所述第一虚拟机的一致性快照的执行周期,在灾备站点选择所述第二虚拟机作为所述第一虚拟机的灾备虚拟机,记录所述第一虚拟机的标识与所述第二主机的标识之间的对应关系,将所述对应关系发送到所述第二虚拟化管理设备。
CN201611109317.4A 2016-12-06 2016-12-06 一种容灾方法和容灾系统 Pending CN106603279A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611109317.4A CN106603279A (zh) 2016-12-06 2016-12-06 一种容灾方法和容灾系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611109317.4A CN106603279A (zh) 2016-12-06 2016-12-06 一种容灾方法和容灾系统

Publications (1)

Publication Number Publication Date
CN106603279A true CN106603279A (zh) 2017-04-26

Family

ID=58595886

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611109317.4A Pending CN106603279A (zh) 2016-12-06 2016-12-06 一种容灾方法和容灾系统

Country Status (1)

Country Link
CN (1) CN106603279A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108259613A (zh) * 2018-01-24 2018-07-06 平安科技(深圳)有限公司 容灾数据的在线同步装置、方法及计算机可读存储介质
CN109783272A (zh) * 2017-11-10 2019-05-21 阿里巴巴集团控股有限公司 磁盘快照处理方法、装置和设备
CN109828950A (zh) * 2019-01-29 2019-05-31 深圳前海达闼云端智能科技有限公司 一种数据保护方法、管理系统、服务器及可读存储介质
CN110058962A (zh) * 2018-01-18 2019-07-26 伊姆西Ip控股有限责任公司 确定虚拟机快照的一致性级别的方法、设备和计算机程序产品
CN110083515A (zh) * 2019-04-24 2019-08-02 苏州元核云技术有限公司 分布式存储系统中慢盘的快速判断方法、装置及存储介质
CN111414276A (zh) * 2019-01-08 2020-07-14 中国移动通信有限公司研究院 Vnf的数据容灾方法及装置、vnf节点及存储介质
CN112965783A (zh) * 2021-02-24 2021-06-15 上海英方软件股份有限公司 一种使用存储快照备份虚拟机的系统及方法
CN114095342A (zh) * 2021-10-21 2022-02-25 新华三大数据技术有限公司 备份的实现方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440160A (zh) * 2013-08-15 2013-12-11 华为技术有限公司 虚拟机恢复方法和虚拟机迁移方法以及装置与系统
CN103678045A (zh) * 2013-12-31 2014-03-26 曙光云计算技术有限公司 虚拟机的数据备份方法
CN103946807A (zh) * 2013-11-20 2014-07-23 华为技术有限公司 一种生成快照的方法、系统和装置
US20140244952A1 (en) * 2013-02-27 2014-08-28 Netapp, Inc. System and method for a scalable crash-consistent snapshot operation
CN104063262A (zh) * 2014-06-16 2014-09-24 南京信息工程大学 一种基于虚拟机的异地容灾系统及其容灾方法
US20160125058A1 (en) * 2014-11-04 2016-05-05 Rubrik, Inc. Network optimized deduplication of virtual machine snapshots
CN105786642A (zh) * 2014-12-22 2016-07-20 华为技术有限公司 生产站点、灾备站点及基于快照的远程容灾方法
US9471441B1 (en) * 2013-08-23 2016-10-18 Acronis International Gmbh Systems and methods for backup of virtual machines

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140244952A1 (en) * 2013-02-27 2014-08-28 Netapp, Inc. System and method for a scalable crash-consistent snapshot operation
CN103440160A (zh) * 2013-08-15 2013-12-11 华为技术有限公司 虚拟机恢复方法和虚拟机迁移方法以及装置与系统
US9471441B1 (en) * 2013-08-23 2016-10-18 Acronis International Gmbh Systems and methods for backup of virtual machines
CN103946807A (zh) * 2013-11-20 2014-07-23 华为技术有限公司 一种生成快照的方法、系统和装置
CN103678045A (zh) * 2013-12-31 2014-03-26 曙光云计算技术有限公司 虚拟机的数据备份方法
CN104063262A (zh) * 2014-06-16 2014-09-24 南京信息工程大学 一种基于虚拟机的异地容灾系统及其容灾方法
US20160125058A1 (en) * 2014-11-04 2016-05-05 Rubrik, Inc. Network optimized deduplication of virtual machine snapshots
CN105786642A (zh) * 2014-12-22 2016-07-20 华为技术有限公司 生产站点、灾备站点及基于快照的远程容灾方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783272A (zh) * 2017-11-10 2019-05-21 阿里巴巴集团控股有限公司 磁盘快照处理方法、装置和设备
CN109783272B (zh) * 2017-11-10 2023-01-24 阿里巴巴集团控股有限公司 磁盘快照处理方法、装置和设备
CN110058962A (zh) * 2018-01-18 2019-07-26 伊姆西Ip控股有限责任公司 确定虚拟机快照的一致性级别的方法、设备和计算机程序产品
CN108259613A (zh) * 2018-01-24 2018-07-06 平安科技(深圳)有限公司 容灾数据的在线同步装置、方法及计算机可读存储介质
CN108259613B (zh) * 2018-01-24 2019-12-24 平安科技(深圳)有限公司 容灾数据的在线同步装置、方法及计算机可读存储介质
CN111414276A (zh) * 2019-01-08 2020-07-14 中国移动通信有限公司研究院 Vnf的数据容灾方法及装置、vnf节点及存储介质
CN111414276B (zh) * 2019-01-08 2023-05-05 中国移动通信有限公司研究院 Vnf的数据容灾方法及装置、vnf节点及存储介质
CN109828950A (zh) * 2019-01-29 2019-05-31 深圳前海达闼云端智能科技有限公司 一种数据保护方法、管理系统、服务器及可读存储介质
CN110083515A (zh) * 2019-04-24 2019-08-02 苏州元核云技术有限公司 分布式存储系统中慢盘的快速判断方法、装置及存储介质
CN112965783A (zh) * 2021-02-24 2021-06-15 上海英方软件股份有限公司 一种使用存储快照备份虚拟机的系统及方法
CN114095342A (zh) * 2021-10-21 2022-02-25 新华三大数据技术有限公司 备份的实现方法及装置
CN114095342B (zh) * 2021-10-21 2023-12-26 新华三大数据技术有限公司 备份的实现方法及装置

Similar Documents

Publication Publication Date Title
CN106603279A (zh) 一种容灾方法和容灾系统
USRE47852E1 (en) Snapshot and replication of a multi-stream application on multiple hosts at near-sync frequency
CN107402722B (zh) 一种数据迁移方法及存储设备
JP6827501B2 (ja) ホットバックアップシステム、ホットバックアップ方法、及びコンピュータ機器
CN106776130B (zh) 一种日志恢复方法、存储装置和存储节点
CN110807064B (zh) Rac分布式数据库集群系统中的数据恢复装置
CN106919473B (zh) 一种数据灾备系统及业务处理方法
CN103995868B (zh) 面向分布式系统的全局事务管理器及事务处理方法
CN106357787A (zh) 一种存储容灾控制系统
WO2020224237A1 (zh) 区块链共识的方法、装置、设备及存储介质
MX2007000075A (es) Metodo de mejorar el funcionamiento de servidor de replica y un sistema de servidor de replica.
CN109947596A (zh) Pcie设备故障系统宕机处理方法、装置及相关组件
CN107329708A (zh) 一种分布式存储系统实现缓存数据的方法及系统
CN110825562B (zh) 数据备份方法、装置、系统和存储介质
CN110456984A (zh) 一种对Ceph存储的块设备进行连续数据保护的方法
WO2015085529A1 (zh) 数据复制方法、数据复制装置和存储设备
CN109117310A (zh) 实现数据备份的容灾系统、方法及装置
US20230004465A1 (en) Distributed database system and data disaster backup drilling method
EP4300314A2 (en) Data backup method, apparatus and system
CN113051428B (zh) 一种摄像机前端存储备份的方法及装置
WO2018001262A1 (zh) 虚拟机容灾方法、装置及系统
CN102325171B (zh) 一种监控系统中数据的存储方法及其系统
CN104170307A (zh) 失效切换方法、装置和系统
WO2023050665A1 (zh) 一种存储卷跨节点克隆的方法、装置、设备及可读介质
CN106776107B (zh) 一种奇偶校验纠错方法及网络设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170426

RJ01 Rejection of invention patent application after publication