CN105812191A - 一种容灾切换方法及装置 - Google Patents

一种容灾切换方法及装置 Download PDF

Info

Publication number
CN105812191A
CN105812191A CN201610280089.0A CN201610280089A CN105812191A CN 105812191 A CN105812191 A CN 105812191A CN 201610280089 A CN201610280089 A CN 201610280089A CN 105812191 A CN105812191 A CN 105812191A
Authority
CN
China
Prior art keywords
website
protection
srm
threshold value
cvk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610280089.0A
Other languages
English (en)
Inventor
魏帅
伊莉娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN201610280089.0A priority Critical patent/CN105812191A/zh
Publication of CN105812191A publication Critical patent/CN105812191A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种容灾切换方法及装置,所述方法包括:检测保护站点的管理网络或/和存储网络是否可达;当保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行站点容灾管理器SRM自动切换。应用本发明实施例可以实现自动容灾切换,提高故障恢复的效率,降低故障发生对现有业务的影响。

Description

一种容灾切换方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种容灾切换方法及装置。
背景技术
随着数据中心业务日益增加,用户需求不断提高,数据中心的规模和功能日趋复杂,管理难度也越来越高。在这一背景下,对数据中心资源进行虚拟化,成为目前数据中心整合的重要趋势。
虚拟化技术通过对物理资源和提供的服务进行抽象化,让资源使用者和系统管理者不关心对象的物理特征和服务边界的细节,从而降低资源使用和管理的复杂度,提高使用效率。因而,对数据中心的虚拟化能够提高数据中心的资源利用率(如CPU利用率、存储容量等),降低系统的能耗,并减少系统的设计、运行、管理、维护成本,从而实现整合的目标。
容灾系统是指在相隔较远的异地,建立两套或多套功能相同的系统,系统之间可以相互进行健康状态监视和功能切换,当一处系统因意外(如火灾、洪水、地震、人为蓄意破坏等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。
容灾系统需要具备较为完善的数据保护与灾难恢复功能,保证保护站点不能正常工作时数据的完整性及业务的连续性,并在最短时间内由恢复站点接替,恢复业务系统的正常运行,将损失降到最小。
然而实践发现,现有虚拟化平台的容灾方案中,所有故障恢复操作全部需要由管理员来手动进行切换和维护,当管理员没有及时做出故障切换的响应时,对现有业务的影响很大。
发明内容
本发明提供一种容灾切换方法及装置,以解决现有虚拟化平台容灾方案中所有故障恢复操作全部需要由管理员来手动进行切换和维护的问题。
根据本发明实施例的第一方面,提供一种容灾切换方法,包括:
检测保护站点的管理网络或/和存储网络是否可达;
当保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行站点容灾管理器SRM自动切换。
根据本发明实施例的第二方面,提供一种容灾切换装置,包括:
检测单元,用于检测保护站点的管理网络或/和存储网络是否可达;
处理单元,用于当保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行站点容灾管理器SRM自动切换。
应用本发明实施例,通过检测保护站点的管理网络或/和存储网络是否可达,并在保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行SRM自动切换,与现有容灾切换方案中所有故障恢复操作均需要由管理员来手动进行和维护的实现方案相比,实现了自动容灾切换,提高了故障恢复的效率,降低了故障发生对现有业务的影响。
附图说明
图1是本发明实施例提供的一种容灾切换方法的流程示意图;
图2是本发明实施例提供的另一种容灾切换方法的流程示意图;
图3是本发明实施例提供的一种容灾切换装置的结构示意图;
图4是本发明实施例提供的另一种容灾切换装置的结构示意图;
图5是本发明实施例提供的另一种容灾切换装置的结构示意图;
图6是本发明实施例提供的一种容灾切换系统的架构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。
请参见图1,为本发明实施例提供的一种容灾切换方法的流程示意图,如图1所示,该方法可以包括以下步骤:
需要说明的是,步骤101~步骤102的执行主体可以为支持容灾备份的虚拟化数据中心组网的恢复站点,为便于描述,以下以步骤101~步骤102的执行主体为恢复站点为例进行说明。
步骤101、检测保护站点的管理网络或/和存储网络是否可达。
本发明实施例中,为了实现保护站点和恢复站点之间的自动切换,可以预先在恢复站点上配置监控策略,该监控策略可以包括需要监控的参数、参数对应的阈值等。
可选地,监控策略中包括的需要监控的参数可以包括保护站点的管理网络不可达次数或/和保护站点的存储网络不可达次数等;参数对应的阈值可以包括管理网络检测阈值或/和存储网络检测阈值等。
作为一种可选的实施方式,在本发明实施例中,检测保护站点的管理网络或/和存储网络是否可达,可以包括:
当监控策略中存在管理网络检测阈值时,定时或周期性检测保护站点的管理网络是否可达;
当监控策略中存在存储网络检测阈值时,定时或周期性检测保护站点的存储网络是否可达。
在该实施方式中,恢复站点获取到预先配置的监控策略后,可以判断该监控策略中是否存在管理网络检测阈值或/和存储网络检测阈值。
若监控策略中存在管理网络检测阈值,则恢复站点可以定时或周期性地(监控策略中可以包括检测的时间点或周期,下同)检测保护站点的管理网络是否可达,并统计保护站点的管理网络的不可达次数。
例如,恢复站点的CVM(CloudVirtualizationManager,虚拟化管理器)可以定时或周期性地向保护站点的CVM发送REST(RepresentationalStateTransfer,表述性状态传递)请求,并根据保护站点的CVM的响应确定对端网络是否可达。如,当保护站点的CVM返回正确的响应消息时,恢复站点可以认为对端管理网络可达;当保护站点的CVM返回错误的响应消息,或超时的响应消息,或未返回响应消息,则认为对端管理网络不可达。
若监控策略中存在存储网络检测阈值,则恢复站点可以定时或周期性地检测保护站点的存储网络是否可达,并统计保护站点的存储网络的不可达次数。其中,恢复站点检测保护站点的管理网络是否可达的周期与检测保护站点的存储网络是否可达的周期可以相同,也可以不同,本发明实施例对此不做限定。
例如,恢复站点可以通过接收保护站点的存储网络的告警(可以预先设置保护站点的存储网络发生故障时对恢复站点进行告警)或定期(或周期性)检测保护站点存储网络的存储控制器的连通状态的方式,确定保护站点的存储网络是否可达,并统计不可达次数。
步骤102、当保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行SRM自动切换。
本发明实施例中,恢复站点上配置的监控策略中还可以包括触发SRM(SiteRecoveryManager,站点容灾管理器)自动切换的条件,该触发SRM自动切换的条件可以为单个生效(即任一参数达到对应的阈值则触发切换)或关联生效(需要两个或多个预设参数达到阈值才触发切换)等。
相应地,在本发明实施例中,恢复站点可以在检测到保护站点的管理网络不可达次数达到管理网络检测阈值,或检测到保护站点的存储网络不可达次数达到存储网络检测阈值时,进行SRM自动切换(单个生效);或者,恢复站点可以在检测到保护站点的管理网络不可达次数达到管理网络检测阈值,且保护站点的存储网络不可达次数时,进行SRM自动切换(联动生效)。
本发明实施例中,当恢复站点检测到保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,恢复站点可以暂停保护站点的虚拟机业务以及保护站点的存储设备,然后提升恢复站点的存储设备(即将恢复站点的存储设备由从设备提升为主设备),并将恢复站点的存储设备挂载到恢复站点的CVK上,进而根据保护站点的虚拟机配置,以及恢复站点的CVK负载、网络资源以及存储资源,在恢复站点选择最优CVK进行增加虚拟机,并在虚拟机上启动对应的业务。
可选地,在本发明实施例中,当恢复站点确定需要进行SRM自动切换时,恢复站点还可以根据用户配置的容灾恢复策略(该容灾恢复策略可以包括在监控策略中,也可以单独配置,本发明实施例对此不做限定),为恢复站点中的指定恢复集群,增加关联动作,选择当前保护站点的策略;其中,该策略可以包括但不限于DRX(DynamicResourceeXtension,动态资源扩展)策略、高可用性策略、资源调度策略以及资源均衡策略中的一个或多个。
作为一种可选的实施方式,上述步骤102中,进行SRM自动切换可以包括:
调用指定恢复集群接口下发高可用性、资源调度以及资源均衡策略命令中的一个或多个。
在该实施方式中,由于高可用性策略、资源调度策略以及资源均衡策略可以直接应用于恢复集群,因此,当选择的策略为高可用性策略、资源调度策略以及资源均衡策略中的一个或多个时,恢复站点可以调用指定恢复集群接口下发高可用性、资源调度以及资源均衡策略命令中的一个或多个,直接在恢复站点的指定恢复集群上应用相应策略。
作为另一种可选的实施方式,上述步骤102中,进行SRM自动切换可以包括:
若保护站点存在DRX策略,则指定恢复站点中DRX生效的CVK集合,并以克隆方式,在恢复站点中对应的CVK上启动保护站点中的虚拟机业务;或者,根据预先上传的DRX模板在恢复站点中对应的CVK上启动虚拟机业务。
在该实施方式中,由于需要在保护站点中已存在DRX策略的前提下,恢复站点中才能自动应用DRX策略,因此,当恢复站点中存在DRX策略时,恢复站点可以先在恢复站点中指定DRX生效的集群(即CVK集合),并通过克隆方式或模板部署方式在该集群的CVK上启动相应的虚拟机业务。
其中,对于克隆方式,恢复站点可以克隆方式,直接在恢复站点中对应的CVK上启动保护站点中的虚拟机业务;对于模板部署方式,则需要预先在恢复站点中上传和保护站点DRX策略相同的DRX模板,从而,恢复站点可以根据预先上传的DRX模板在恢复站点中对应的CVK上启动虚拟机业务。
进一步地,作为一种可选的实施方式,在本发明实施例中,进行SRM自动切换之前,还可以包括以下步骤:
11)、根据预先配置的告警列表进行告警处理;
12)、若未接收到告警反馈,则确定执行上述SRM自动切换的步骤。
在该实施方式中,可以预先在恢复站点上配置告警列表(该告警列表可以包括在监控策略中,也可以单独配置,本发明实施例对此不做限定),该告警列表用于在恢复站点确定保护站点的状态满足SRM自动切换的触发条件时,进行相应的告警操作。其中,该告警列表可以包括但不限于告警通知的管理员列表及告警方式。
相应地,当恢复站点检测到保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,恢复站点在进行SRM自动切换之前,可以先根据预先配置告警列表进行告警处理,如根据告警列表中包括的告警方式向告警通知的管理员列表中包括的告警对象发送告警通知,以使对应的管理员在接收到告警通知后进行相应的反馈。
恢复站点进行告警处理之后,可以检测是否接收到告警反馈;若未接收到,则恢复站点进行SRM自动切换,其中,SRM自动切换的具体实现可以参见上述实施例中的相关描述。
在该实施方式中,若恢复站点进行告警处理之后接收到告警反馈,则恢复站点可以根据接收到的告警反馈进行相应地处理,其具体实现在此不再赘述。
可见,在图1所示的方法流程中,通过检测保护站点的管理网络或/和存储网络是否可达,并在保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行SRM自动切换,与现有容灾切换方案中所有故障恢复操作均需要由管理员来手动进行和维护的实现方案相比,实现了自动容灾切换,提高了故障恢复的效率,降低了故障发生对现有业务的影响;此外,在本发明实施例提供的技术方案中,还可以实现保护站点的自动化策略,如DRX策略,在容灾切换后,自动在恢复站点上继续生效,而不需要由用户手动来配置,进一步提高了故障恢复效率。
进一步地,在本发明实施例中,为了进一步地提高容灾系统的可靠性,避免发生故障时,无法及时进行自动切换,还可以预先在保护站点上配置相应的监控策略,以使保护站点可以根据该监控策略对自身状态进行监控,并在监控到自身状态满足自动切换触发条件时,进行SRM自动切换的相应操作。
请一并参阅图2,图2为本发明实施例提供的另一种容灾切换方法的流程示意图,如图2所示,该方法可以包括以下步骤:
需要说明的是,步骤201~步骤202的执行主体可以为支持容灾备份的虚拟化数据中心组网的保护站点,为便于描述,以下以步骤201~步骤202的执行主体为保护站点为例进行说明。
步骤201、检测保护组中的故障的存储资源的数量或/和故障的CVK的数量。
本发明实施例中,为了实现保护站点和恢复站点之间的自动切换,可以预先在恢复站点上配置监控策略,该监控策略可以包括需要监控的参数、参数对应的阈值等。
可选地,监控策略中包括的需要监控的参数可以包括保护组中故障的存储资源数量或/和保护组中故障的CVK(CloudVirtualizationKernel,虚拟化内核平台)数量等;参数对应的阈值可以包括存储资源检测阈值或/和CVK检测阈值等。
作为一种可选的实施方式,在本发明实施例中,检测保护组中的故障的存储资源的数量或/和故障的CVK的数量,可以包括:
当监控策略中存在存储资源检测阈值时,定时或周期性检测保护组中故障的存储资源数量;
当监控策略中存在CVK检测阈值时,定时或周期性检测所述保护组中故障的CVK数量。
在该实施方式中,保护站点获取到预先配置的监控策略后,可以判断该监控策略中是否存在存储资源检测阈值或/和CVK检测阈值。
若监控策略中存在存储资源检测阈值,则保护站点可以定时或周期性地(监控策略中可以包括检测的时间点或周期,下同)检测保护组中故障的存储资源数量,并记录所检测到的保护组中故障的存储资源数量。
例如,保护站点可以定时检测主机上的存储状态,使用超时机制,若连续三个预设时间段内(可以根据具体场景设定,如20s、30s等)未有结果,则认为存储资源故障。
若监控策略中存在CVK检测阈值,则保护站点可以定时或周期性地检测保护组中故障的CVK数量,并记录检测到的故障的CVK数量。其中,保护站点检测保护组中故障的存储资源数量的周期与检测保护组中故障的CVK数量的周期可以相同,也可以不同,本发明实施例对此不做限定。
例如,可以设置保护站点的保护组中的CVK定时向CVM(CloudVirtualizationManager,虚拟化管理器)发送心跳报文,例如,CVK与CVM之间建立TCP(TransmissionControlProtocol,传输控制协议)连接,并使用定时器保持与CVM的心跳连接,若连接失败,则触发心跳告警或更高不确定等级告警;若某CVK对应的告警超过三个,则认为该CVK故障。
步骤202、当保护组中故障的存储资源数量达到存储资源检测阈值或/和保护组中故障的CVK数量达到CVK检测阈值时,向恢复站点发送SRM自动切换触发指令,以使恢复站点进行SRM自动切换。
本发明实施例中,保护站点上配置的监控策略中还可以包括触发SRM自动切换的条件,该触发SRM自动切换的条件可以为单个生效(即任一参数达到对应的阈值则触发切换)或关联生效(需要两个或多个预设参数达到阈值才触发切换)等。
相应地,在本发明实施例中,保护站点可以在检测到保护组中故障的存储资源数量达到存储资源检测阈值,或检测到保护组中故障的CVK数量达到CVK检测阈值时,向恢复站点发送SRM自动切换触发指令(单个生效);或者,保护站点可以在检测到保护组中故障的存储资源数量达到存储资源检测阈值,且保护组中故障的CVK数量达到CVK检测阈值时,向恢复站点发送SRM自动切换触发指令(联动生效)。
其中,恢复站点接收到SRM自动切换触发指令之后,进行SRM自动切换的具体实现可以参见图1所示方法流程中的相关描述,本发明实施例在此不再赘述。
作为一种可选的实施方式,在本发明实施例中,向恢复站点发送SRM自动切换触发指令之前,还可以包括以下步骤:
21)、根据预先配置的告警列表进行告警处理;
22)、若未接收到告警反馈,则确定执行上述向恢复站点发送SRM自动切换触发指令的步骤。
在该实施方式中,可以预先在保护站点上配置告警列表(该告警列表可以包括在监控策略中,也可以单独配置,本发明实施例对此不做限定),该告警列表用于在保护站点确定当前状态满足SRM自动切换的触发条件时,进行相应的告警操作。其中,该告警列表可以包括但不限于告警通知的管理员列表及告警方式。
相应地,当保护站点检测到保护组中故障的存储资源数量达到存储资源检测阈值或/和保护组中故障的CVK数量达到CVK检测阈值时,保护站点在向恢复站点发送SRM自动切换触发指令之前,可以先根据预先配置告警列表进行告警处理,如根据告警列表中包括的告警方式向告警通知的管理员列表中包括的告警对象发送告警通知,以使对应的管理员在接收到告警通知后进行相应的反馈。
保护站点进行告警处理之后,可以检测是否接收到告警反馈;若接收到,则保护站点可以直接根据接收到的告警反馈进行相应处理;若未接收到,则保护站点向恢复站点发送SRM自动切换触发指令。
在该实施方式中,若保护站点进行告警处理之后接收到告警反馈,则保护站点可以根据接收到的告警反馈进行相应地处理,其具体实现在此不再赘述。
可见,在图2所示的方法流程中,通过在保护站点上配置监控策略,由保护站点根据该监控策略对保护组进行监控,并在保护组中故障的存储资源数量达到存储资源检测阈值或/和保护组中故障的CVK数量达到CVK检测阈值时,向恢复站点发送SRM自动切换触发指令,以使恢复站点进行SRM自动切换,与现有容灾切换方案中所有故障恢复操作均需要由管理员来手动进行和维护的实现方案相比,实现了自动容灾切换,提高了故障恢复的效率,降低了故障发生对现有业务的影响。
值得说明的是,在本发明实施例中,图1所示的容灾切换方案和图2所示的容灾切换方案可以单独使用,即仅通过在恢复站点上配置上述监控策略实现SRM自动切换,或仅通过在保护站点上配置上述监控策略实现SRM自动切换;或者,图1所示的容灾切换方案和图2所示的容灾切换方案可以结合使用,即分别在恢复站点和保护站点上配置上述相应监控策略,并在恢复站点或/和保护站点确定满足SRM自动切换条件时,进行SRM自动切换。
通过以上描述可以看出,在本发明实施例提供的技术方案中,通过检测保护站点的管理网络或/和存储网络是否可达,并在保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行SRM自动切换,与现有容灾切换方案中所有故障恢复操作均需要由管理员来手动进行和维护的实现方案相比,实现了自动容灾切换,提高了故障恢复的效率,降低了故障发生对现有业务的影响。
请参见图3,为本发明实施例提供一种容灾切换装置的结构示意图,其中,该装置可以应用于上述方法实施例中的恢复站点,如图3所示,该装置可以包括:
检测单元310,用于检测保护站点的管理网络或/和存储网络是否可达;
处理单元320,用于当保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行站点容灾管理器SRM自动切换。
请一并参阅图4,为本发明实施例提供的另一种容灾切换装置的结构示意图,在图3所示实施例的基础上,图4所示的装置还可以包括:
告警单元330,用于当保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行告警处理;
相应地,所述处理单元320,可以具体用于若所述告警单元330未接收到告警反馈,则进行SRM自动切换。
请一并参阅图5,为本发明实施例提供的另一种容灾切换装置的结构示意图,在图3所示实施例的基础上,图5所示的装置还可以包括:
接收单元340,用于接收保护站点发送的SRM自动切换触发指令;其中,所述SRM自动切换触发指令是所述保护站点检测到保护组中故障的存储资源数量达到存储资源检测阈值或/和保护组中故障的虚拟化内核平台CVK数量达到CVK检测阈值时发送的;
相应地,所述处理单元320,还可以用于当所述接收单元340接收到所述保护站点发送的SRM自动切换触发指令时,进行SRM自动切换。
在可选实施例中,所述处理单元320,可以具体用于调用指定恢复集群接口下发高可用性、资源调度以及资源均衡策略命令中的一个或多个。
在可选实施例中,所述处理单元320,可以具体用于若保护站点存在动态资源扩展DRX策略,则指定恢复站点中DRX生效的CVK集合,并以克隆方式,在恢复站点中对应的CVK上启动保护站点中的虚拟机业务;或者,根据预先上传的DRX模板在恢复站点中对应的CVK上启动虚拟机业务。
请参见图6,为本发明实施例提供一种容灾切换系统的架构示意图,如图6所示,该系统可以包括:保护站点610和恢复站点620;其中:
恢复站点620,用于检测保护站点的管理网络或/和存储网络是否可达;
所述恢复站点620,还用于当保护站点610的管理网络不可达次数达到管理网络检测阈值或/和保护站点610的存储网络不可达次数达到存储网络检测阈值时,进行站点容灾管理器SRM自动切换。
在可选实施例中,所述保护站点610,可以用于检测保护组中的故障的存储资源的数量或/和故障的CVK的数量;
所述保护站点610,还可以用于当检测到保护组中故障的存储资源数量达到存储资源检测阈值或/和保护组中故障的虚拟化内核平台CVK数量达到CVK检测阈值时,向所述恢复站点620发送SRM自动切换触发指令;
所述恢复站点620,还可以用于当接收到所述保护站点610发送的SRM自动切换触发指令时,进行SRM自动切换。
在可选实施例中,所述保护站点610,还用于当检测到保护组中故障的存储资源数量达到存储资源检测阈值或/和保护组中故障的虚拟化内核平台CVK数量达到CVK检测阈值时,根据预先配置的告警列表进行告警处理;
所述保护站点610,可以具体用于若未接收到告警反馈,向所述恢复站点620发送SRM自动切换触发指令。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
由上述实施例可见,通过检测保护站点的管理网络或/和存储网络是否可达,并在保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行SRM自动切换,与现有容灾切换方案中所有故障恢复操作均需要由管理员来手动进行和维护的实现方案相比,实现了自动容灾切换,提高了故障恢复的效率,降低了故障发生对现有业务的影响。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种容灾切换方法,其特征在于,包括:
检测保护站点的管理网络或/和存储网络是否可达;
当保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行站点容灾管理器SRM自动切换。
2.根据权利要求1所述的方法,其特征在于,所述进行SRM自动切换之前,还包括:
根据预先配置的告警列表进行告警处理;
若未接收到告警反馈,则确定执行所述进行SRM自动切换的步骤。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当接收到所述保护站点发送的SRM自动切换触发指令时,进行SRM自动切换;其中,所述SRM自动切换触发指令是所述保护站点检测到保护组中故障的存储资源数量达到存储资源检测阈值或/和保护组中故障的虚拟化内核平台CVK数量达到CVK检测阈值时发送的。
4.根据权利要求1所述的方法,其特征在于,所述进行SRM自动切换包括:
调用指定恢复集群接口下发高可用性、资源调度以及资源均衡策略命令中的一个或多个。
5.根据权利要求1所述的方法,其特征在于,所述进行SRM自动切换包括:
若保护站点存在动态资源扩展DRX策略,则指定恢复站点中DRX生效的CVK集合,并以克隆方式,在恢复站点中对应的CVK上启动保护站点中的虚拟机业务;或者,根据预先上传的DRX模板在恢复站点中对应的CVK上启动虚拟机业务。
6.一种容灾切换装置,其特征在于,包括:
检测单元,用于检测保护站点的管理网络或/和存储网络是否可达;
处理单元,用于当保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行站点容灾管理器SRM自动切换。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
告警单元,用于当保护站点的管理网络不可达次数达到管理网络检测阈值或/和保护站点的存储网络不可达次数达到存储网络检测阈值时,进行告警处理;
所述处理单元,具体用于若所述告警单元未接收到告警反馈,则进行SRM自动切换。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
接收单元,用于接收保护站点发送的SRM自动切换触发指令;其中,所述SRM自动切换触发指令是所述保护站点检测到保护组中故障的存储资源数量达到存储资源检测阈值或/和保护组中故障的虚拟化内核平台CVK数量达到CVK检测阈值时发送的;
所述处理单元,还用于当所述接收单元接收到所述保护站点发送的SRM自动切换触发指令时,进行SRM自动切换。
9.根据权利要求6所述的装置,其特征在于,
所述处理单元,具体用于调用指定恢复集群接口下发高可用性、资源调度以及资源均衡策略命令中的一个或多个。
10.根据权利要求6所述的装置,其特征在于,
所述处理单元,具体用于若保护站点存在动态资源扩展DRX策略,则指定恢复站点中DRX生效的CVK集合,并以克隆方式,在恢复站点中对应的CVK上启动保护站点中的虚拟机业务;或者,根据预先上传的DRX模板在恢复站点中对应的CVK上启动虚拟机业务。
CN201610280089.0A 2016-04-28 2016-04-28 一种容灾切换方法及装置 Pending CN105812191A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610280089.0A CN105812191A (zh) 2016-04-28 2016-04-28 一种容灾切换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610280089.0A CN105812191A (zh) 2016-04-28 2016-04-28 一种容灾切换方法及装置

Publications (1)

Publication Number Publication Date
CN105812191A true CN105812191A (zh) 2016-07-27

Family

ID=56459016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610280089.0A Pending CN105812191A (zh) 2016-04-28 2016-04-28 一种容灾切换方法及装置

Country Status (1)

Country Link
CN (1) CN105812191A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168830A (zh) * 2017-05-18 2017-09-15 郑州云海信息技术有限公司 一种基于虚拟化平台的容灾系统、方法
CN109698769A (zh) * 2019-02-18 2019-04-30 深信服科技股份有限公司 应用容灾装置及方法、终端设备、可读存储介质
CN110113192A (zh) * 2019-04-23 2019-08-09 深信服科技股份有限公司 虚拟桌面的选路方法、选路设备、系统、存储介质及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075689A1 (zh) * 2008-12-31 2010-07-08 华为技术有限公司 网络容灾方法、终端和呼叫会话控制功能实体
CN102571904A (zh) * 2011-10-11 2012-07-11 浪潮电子信息产业股份有限公司 一种模块化设计的nas集群系统构建方法
CN103812675A (zh) * 2012-11-08 2014-05-21 中兴通讯股份有限公司 一种实现业务交付平台异地容灾切换的方法和系统
CN104468163A (zh) * 2013-09-18 2015-03-25 腾讯科技(北京)有限公司 容灾网络组网的方法、装置及容灾网络

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075689A1 (zh) * 2008-12-31 2010-07-08 华为技术有限公司 网络容灾方法、终端和呼叫会话控制功能实体
CN102571904A (zh) * 2011-10-11 2012-07-11 浪潮电子信息产业股份有限公司 一种模块化设计的nas集群系统构建方法
CN103812675A (zh) * 2012-11-08 2014-05-21 中兴通讯股份有限公司 一种实现业务交付平台异地容灾切换的方法和系统
CN104468163A (zh) * 2013-09-18 2015-03-25 腾讯科技(北京)有限公司 容灾网络组网的方法、装置及容灾网络

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168830A (zh) * 2017-05-18 2017-09-15 郑州云海信息技术有限公司 一种基于虚拟化平台的容灾系统、方法
CN109698769A (zh) * 2019-02-18 2019-04-30 深信服科技股份有限公司 应用容灾装置及方法、终端设备、可读存储介质
CN109698769B (zh) * 2019-02-18 2022-03-22 深信服科技股份有限公司 应用容灾装置及方法、终端设备、可读存储介质
CN110113192A (zh) * 2019-04-23 2019-08-09 深信服科技股份有限公司 虚拟桌面的选路方法、选路设备、系统、存储介质及装置
CN110113192B (zh) * 2019-04-23 2023-02-03 深信服科技股份有限公司 虚拟桌面的选路方法、选路设备、系统、存储介质及装置

Similar Documents

Publication Publication Date Title
CN101150430B (zh) 一种通过心跳机制实现网络接口板倒换的方法
CN106330475B (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
EP2882136B1 (en) Method and system for implementing remote disaster recovery switching of service delivery platform
EP2798782B1 (en) Technique for handling a status change in an interconnect node
CN108430116A (zh) 断网重连方法、介质、装置和计算设备
CN101404568A (zh) 双网卡热备冗余方法
CN106533736B (zh) 一种网络设备重启方法和装置
CN103490914A (zh) 一种网络应用设备多机热备的切换系统及方法
EP2637102B1 (en) Cluster system with network node failover
CN101237315A (zh) 一种用于双控高可用系统的同步检测和故障隔离方法
CN105812191A (zh) 一种容灾切换方法及装置
CN104901834A (zh) 一种网络服务器自动切换的方法及系统
CN109600264A (zh) CloudStack云平台
CN105577444A (zh) 一种无线控制器管理方法及无线控制器
CN108933818A (zh) 通信方法及装置
CN107528705B (zh) 故障处理方法及装置
CN103001787A (zh) 用于数据处理中心容灾备份的系统及方法
CN101114935A (zh) 系统升级的方法、升级系统及监控实体
JP6421516B2 (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
CN214045653U (zh) 一种光信号汇聚处理设备中主控备份设备
CN101557307B (zh) 调度自动化系统应用状态管理方法
CN107872822B (zh) 一种业务的承载方法及承载装置
EP2922331B1 (en) Method and system for performing dual-homing automatic switching decision according to the number of registered gateways
CN115801642B (zh) 基于状态控制的rdma通讯管理模块、方法、设备及介质
CN112804721A (zh) 双频路由器自动切换链路方法及双频路由器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Applicant after: Xinhua three Technology Co., Ltd.

Address before: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Applicant before: Huasan Communication Technology Co., Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160727