CN111176888B - 云存储的容灾方法、装置及系统 - Google Patents

云存储的容灾方法、装置及系统 Download PDF

Info

Publication number
CN111176888B
CN111176888B CN201811348869.XA CN201811348869A CN111176888B CN 111176888 B CN111176888 B CN 111176888B CN 201811348869 A CN201811348869 A CN 201811348869A CN 111176888 B CN111176888 B CN 111176888B
Authority
CN
China
Prior art keywords
storage
storage cluster
cluster
cloud
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811348869.XA
Other languages
English (en)
Other versions
CN111176888A (zh
Inventor
朱世峰
丁强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Uniview Technologies Co Ltd
Original Assignee
Zhejiang Uniview Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Uniview Technologies Co Ltd filed Critical Zhejiang Uniview Technologies Co Ltd
Priority to CN201811348869.XA priority Critical patent/CN111176888B/zh
Publication of CN111176888A publication Critical patent/CN111176888A/zh
Application granted granted Critical
Publication of CN111176888B publication Critical patent/CN111176888B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1466Management of the backup or restore process to make the backup process non-disruptive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space

Abstract

本发明涉及视频监控技术领域,提供一种云存储的容灾方法、装置及系统,所述方法包括:当检测到第一存储集群故障时,根据容灾备份策略判断第二存储集群是否可用,其中,第一存储集群与第二存储集群均属于第一云存储系统;当第二存储集群可用时,将第二存储集群作为当前可用存储集群。与现有技术相比,本发明在第一存储集群故障时,根据容灾备份策略由与第一存储集群同属于一个云存储系统中的第二存储集群接管存储业务,解决了第一存储集群故障带来的存储业务中断的问题,从而极大地提升了存储业务的稳定性。

Description

云存储的容灾方法、装置及系统
技术领域
本发明涉及视频监控技术领域,具体而言,涉及一种云存储的容灾方法、装置及系统。
背景技术
视频监控不仅仅可以对危险事件进行监控和预判,在事发后还可以调取录像进行取证破案,在此类场景下,视频监控的存储稳定性至关重要。
现有技术采取集群容灾的方式提升存储稳定性,即同一个存储集群中部分存储节点宕机时,由冗余存储节点接管存储业务,保证视频监控存储的连续性,达到提升视频监控的存储稳定性的目的,但是,当冗余存储节点也故障时,视频监控的存储业务就会被中断,此时,无法保证视频监控的存储稳定性。
发明内容
本发明实施例的目的在于提供一种云存储的容灾方法、装置及系统,当第一存储集群中冗余存储节点故障导致第一存储集群故障时,根据容灾备份策略由与第一存储集群同属于一个云存储系统中的第二存储集群接管第一存储集群的存储业务,解决了同一个存储集群中冗余存储节点故障导致的存储业务的中断的问题,从而极大地提升了存储业务的稳定性。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种云存储的容灾方法,所述方法包括:当检测到第一存储集群故障时,根据容灾备份策略判断第二存储集群是否可用,其中,第一存储集群与述第二存储集群均属于第一云存储系统;容灾备份策略包含第一备份存储集群对应关系,第一备份存储集群对应关系表征第一存储集群在第一云存储系统内的备份存储集群为第二存储集群;当第二存储集群可用时,将第二存储集群作为当前可用存储集群。
第二方面,本发明实施例还提供了一种云存储的容灾装置,所述装置包括判断模块和配置模块。其中,判断模块用于当检测到第一存储集群故障时,根据容灾备份策略判断第二存储集群是否可用,其中,第一存储集群与第二存储集群均属于第一云存储系统;容灾备份策略包含第一备份存储集群对应关系,第一备份存储集群对应关系表征第一存储集群在第一云存储系统内的备份存储集群为第二存储集群;配置模块用于当第二存储集群可用时,将第二存储集群作为当前可用存储集群。
第三方面,本发明实施例还提供了一种云存储的容灾系统,所述系统包括:第一云存储系统和第二云存储系统,其中,第一云存储系统包括第一存储集群、第二存储集群及云存储的容灾装置,第二云存储系统包括第三存储集群及管理服务器;云存储的容灾装置,用于当检测到第一存储集群故障时,根据容灾备份策略判断第二存储集群是否可用,其中,容灾备份策略包含第一备份存储集群对应关系,第一备份存储集群对应关系表征第一存储集群在第一云存储系统内的备份存储集群为第二存储集群;用于当第二存储集群可用时,将第二存储集群作为当前可用存储集群。
相对现有技术,本发明实施例提供的一种云存储的容灾方法、装置及系统,首先,第一云存储系统的存储管理节点预先设置第一存储集群的容灾备份策略,该容灾备份策略包含第一备份存储集群对应关系,其中,第一备份存储集群对应关系表征第一存储集群在第一云存储系统内的备份存储集群为第二存储集群;然后,当第一云存储系统的存储管理节点检测第一存储集群中的冗余节点发生故障导致第一存储集群故障时,根据容灾备份策略判断第二存储集群是否可用,当该第二存储集群可用时,将该第二存储集群作为当前可用存储集群以接管第一存储集群的存储业务。与现有技术相比,本发明实施例在第一存储集群中的冗余节点发生故障导致第一存储集群故障时,根据容灾备份策略由与第一存储集群同属于一个云存储系统中的第二存储集群接管第一存储集群的存储业务,解决了第一存储集群中冗余存储节点发生故障导致第一存储集群故障,带来的存储业务中断的问题,从而极大地提升了存储业务的稳定性。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了现有技术应用的场景示例图。
图2示出了本发明实施例提供的应用场景的方框示例图。
图3示出了本发明实施例提供的第一云存储系统中的管理服务器100的方框示意图。
图4示出了本发明实施例提供的一种云存储的容灾方法流程图。
图5示出了本发明实施例提供的另一种云存储的容灾方法流程图。
图6示出了本发明实施例提供的另一种云存储的容灾方法流程图。
图7示出了本发明实施例提供的另一种云存储的容灾方法流程图。
图8示出了本发明实施例提供的另一种云存储的容灾方法流程图。
图9示出了本发明实施例提供的另一种云存储的容灾方法流程图。
图10示出了本发明实施例提供的视频检索的示例流程图。
图11示出了本发明实施例提供的云存储的容灾装置的方框示意图。
图标:100-第一云存储系统的管理服务器;101-存储器;102-通信接口;103-处理器;104-总线;200-云存储的容灾装置;201-判断模块;202-配置模块;203-收发模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1示出了现有技术应用的场景示例图,图1中,网络摄像机通过视频管理平台与云存储系统的管理服务器通信,将网络摄像机的视频流存储至云存储系统。云存储系统还包括3个存储集群:存储集群1、存储集群2及存储集群3,其中,存储集群1包括3个存储节点:存储节点1-1、存储节点1-2及存储节点1-3,存储集群2包括3个存储节点:存储节点2-1、存储节点2-2及存储节点2-3,存储集群3包括2个存储节点:存储节点3-1及存储节点3-2,管理服务器负责统一管理云存储系统中存储集群1、存储集群2及存储集群3的所有存储节点,云存储系统的所有存储节点均负责存储来自网络摄像机的视频流,当网络摄像机通过开放型网络视频接口论坛协议(Open Network Video Interface Forum,ONVIF)接入云存储系统时,在存储视频流之前,还需要云存储系统的管理服务器首先确定出对网络摄像机的视频流进行收流的存储节点,然后再由收流的存储节点通过云存储系统的管理服务器,获取当前用于存储网络摄像机的视频流的存储节点。用户首先会通过视频管理平台对网络摄像机进行配置,指定存储网络摄像机的视频流的存储集群,网络摄像机接入云存储系统后,云存储系统的管理服务器就依据网络摄像机的配置,从指定的存储集群中确定出对网络摄像机的视频流进行收流的存储节点,然后再由收流的存储节点通过云存储系统的管理服务器,获取当前用于存储网络摄像机的视频流的存储节点。例如,图1中,网络摄像机配置存储集群1为存储视频流的存储集群,管理服务器从存储集群1的3个存储节点中选出存储节点1-1作为对视频流进行收流的存储节点,存储节点1-1通过管理服务器获取存储集群1的存储节点1-2用于存储视频流的存储节点。为了提高存储集群的可靠性,避免因存储集群节点中的存储节点发生故障导致整个存储集群故障,引发存储业务中断,现有技术方案为每个存储集群还配置一个或者多个冗余存储节点,当存储集群中的存储节点发生故障时,由对应的冗余存储节点接管故障存储节点的存储业务,但是,当冗余节点也发生故障时,仍然会导致存储集群故障,引发存储业务的中断,无法保证存储业务的稳定性。
为了解决上述现有技术的技术问题,本发明实施例提供一种云存储的容灾方法、装置及系统,其核心改进在于为存储集群预先配置两个备用存储集群,当存储集群中的冗余节点发生故障导致存储集群故障时,按照容灾备份策略由备用存储集群接管故障存储集群的存储业务。
请参照图2,图2示出了本发明实施例提供的应用场景的方框示例图。图2中,网络摄像机通过视频管理平台与云存储系统1的管理服务器1-4通信,云存储系统1的管理服务器1-4与云存储系统2的管理服务器2-2通信,本发明实施例的云存储系统1以具有3个存储集群为架构作为示例说明:存储集群1-1、存储集群1-2及存储集群1-3。
其中,存储集群1-1包括3个存储节点:存储节点1-1-1、存储节点1-1-2及存储节点1-1-3。
存储集群1-2包括3个存储节点:存储节点1-2-1、存储节点1-2-2及存储节点1-2-3。
存储集群1-3包括2个存储节点:存储节点1-3-1及存储节点1-3-2。
并且该应用场景还包括一云存储系统2,本发明实施例提供的云存储系统2以1个存储集群,即存储集群2-1作为示例。
其中,存储集群2-1包括3个存储节点:存储节点2-1-1、存储节点2-1-2及存储节点2-1-3。
在该应用场景中,将云存储系统1中的存储集群1-1配置为存储网络摄像机的视频流的存储集群,即云存储系统1为第一云存储系统、存储集群1-1为第一存储集群,容灾备份策略将存储集群1-2配置为存储集群1-1在云存储系统1内的备份存储集群,即存储集群1-2为第二存储集群、将存储集群2-1配置为存储集群1-1在云存储系统2内的备份存储集群,即存储集群2-1为第三存储集群。
需要说明的是,上述图2所示的系统架构,仅作为示例对本发明实施例提供的云存储的容灾方法进行说明,其并不对实现本发明技术方案的系统架构进行限定。本领域技术人员可以基于具体场景需求设置相应的系统架构,但是可以在不付出创造性劳动的条件下,在该系统架构下实现本发明实施例提供的云存储的容灾方法及对应效果。
进而,基于上述应用场景,本发明实施例提供云存储的容灾方法,其方法的执行主体为云存储系统1中的管理服务器1-4,当管理服务器1-4检测到存储集群1-1发生故障时,判断存储集群1-2是否可用,当存储集群1-2可用时,将存储集群1-2作为当前可用存储集群,以使网络摄像机的视频流存储至存储集群1-2,当存储集群1-2不可用时,判断存储集群2-1是否可用,当存储集群2-1可用时,将存储集群2-1作为当前可用存储集群,以使网络摄像机的视频流存储至存储集群2-1,由此保证网络摄像机的视频流的存储业务的连续性,提升存储业务的稳定性。
请参照图3,图3示出了本发明实施例提供的第一云存储系统的管理服务器100的方框示意图。第一云存储系统的管理服务器100可以是图2中的管理服务器1-4。第一云存储系统的管理服务器100可以是,但不限于,主机、虚拟机、实体服务器、实体服务器上的虚拟机等能提供与所述服务器或者虚拟机有相同功能的实体或者虚拟的服务端。第一云存储系统的管理服务器100的操作系统可以是,但不限于,Windows系统、Linux系统等。所述第一云存储系统的管理服务器100包括存储器101、通信接口102、处理器103和总线104,所述存储器101、通信接口102和处理器103通过总线104连接。
处理器103用于执行存储器101中存储的可执行模块,例如计算机程序。
具体的,该处理器103可以是一个处理器或多个处理器的组合,此处不予限定。
其中,存储器101可能包含高速随机存取存储器(RAM:Random AccessMemory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口102(可以是有线或者无线)实现该第一云存储系统的管理服务器100与第二云存储系统中的管理服务器、以及外部存储设备之间的通信连接。
总线104可以是ISA总线、PCI总线或EISA总线等。图3中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器101用于存储与本发明实施例相关的程序代码或数据信息,以便上述处理器103在执行云存储的容灾方法进行读写等操作,实现对应的技术效果。
基于上述应用场景,下面给出一种云存储的容灾方法可能的实现方式,具体的,请参照图4,图4示出了本发明实施例提供的一种云存储的容灾方法流程图,该流程可以被图2中云存储系统1的管理服务器1-4执行,该方法流程包括以下步骤:
步骤101,当检测到第一存储集群故障时,根据容灾备份策略判断第二存储集群是否可用,其中,第一存储集群与第二存储集群均属于第一云存储系统;容灾备份策略包含第一备份存储集群对应关系,第一备份存储集群对应关系表征第一存储集群在第一云存储系统内的备份存储集群为第二存储集群。
在本发明实施例中,参见图2,存储集群1-1可以是用户通过视频管理平台为网络摄像机预先配置的、用于存储网络摄像机的视频流的存储集群,第一备份存储集群对应关系表征存储集群1-1在云存储系统1内的备份存储集群为存储集群1-2,作为一种实施方式,第一备份存储集群对应关系可以通过为存储集群1-1配置第一备用空间实现,该第一备用空间设置在1-2存储集群上,同时记录该第一备用空间与存储集群1-2的对应关系,且该第一备用空间的类型为zone级,即该第一备用空间与存储集群1-1同属于云存储系统1。
需要说明的是,存储集群1-1故障可以是存储集群1-1故障中的冗余存储节点发生故障导致的。存储集群1-2是否可用是指存储集群1-2当前是否可以提供存储服务,当存储集群1-2当前可以提供存储服务时,则存储集群1-2可用,否则,存储集群1-2不可用。
步骤102,当第二存储集群可用时,将第二存储集群作为当前可用存储集群。
在本发明实施例中,当前可用存储集群可以是当前用于存储网络摄像机的视频流的存储集群,在存储集群1-1发生故障之前,存储集群1-1为当前可用存储集群,当存储集群1-1发生故障后,存储集群1-2可用时,当前可用存储集群从存储集群1-1转换成存储集群1-2。
本发明实施例提供的云存储的容灾方法,云存储系统1的管理服务器1-4检测到存储集群1-1故障时,根据容灾备份策略判断存储集群1-2是否可用,具体的是根据容灾备份策略包含第一备份存储集群对应关系,确定出存储集群1-1在云存储系统1内的备份存储集群,即存储集群1-2,进而判断存储集群1-2是否可用,当存储集群1-2可用时,将存储集群1-2作为当前可用存储集群,本发明实施例在存储集群1-1发生故障时,根据容灾备份策略,确定出存储集群1-2,当存储集群1-2可用时,由存储集群1-2接管存储集群1-1的存储业务,提升了存储业务的稳定性。
进一步地,当存储集群1-2不能对外提供存储服务时,此时存储集群1-2是不可用的,存储集群1-2不可用可以是存储集群1-2处于初始化阶段,尚未准备好提供存储服务,也可以是由存储集群1-2故障、存储集群1-2掉电、或者存储集群1-2网络异常等其他事件引发存储集群1-2不可用,此处对于存储集群1-2不可用的原因不进行限定。
当存储集群1-1故障且存储集群1-2不可用时,为了提升此种情况下存储业务的稳定性,本发明实施例给出一种可能的实现方式,在图4的基础上,图5示出了本发明实施例提供的另一种云存储的容灾方法流程图,该方法流程包括以下步骤:
步骤104,当第二存储集群不可用时,根据容灾备份策略判断第三存储集群是否可用,其中,第三存储集群属于第二云存储系统;容灾备份策略还包含第二备份存储集群对应关系,第二备份存储集群对应关系表征第一存储集群在第二云存储系统内的备份存储集群为第三存储集群。
在本发明实施例中,继续参照图2,存储集群2-1可以是容灾备份策略预先设置的存储集群1-1在云存储系统2内的备份存储集群。第二备份存储集群对应关系表征存储集群1-1在云存储系统2内的备份存储集群,作为一种实施方式,第二备份存储集群对应关系可以通过为存储集群1-1配置第二备用空间实现,该第二备用空间设置在存储集群2-1上,同时记录该第二备用空间与存储集群2-1的对应关系,且该第二备用空间的类型为region级,即该第二备用空间与存储集群1-1不同属于云存储系统1,第二备用空间属于云存储系统2。
步骤105,当第三存储集群可用时,将第三存储集群作为当前可用存储集群。
在本发明实施例中,当存储集群1-1故障、且存储集群1-2不可用时,可以将存储业务切换到存储集群2-1,提升此种情况下存储业务的稳定性。
进一步地,在确定当前可用存储集群后,本发明实施例给出一种可能的访问可用存储集群的实现方式,可以实现将网络摄像机的视频流存储至当前可用存储集群,以达到当前可用存储集群接管存储集群1-1的存储业务的目的。在图5的基础上,图6为本发明实施例提供的另一种云存储的容灾方法流程图,请参照图6,在步骤102之后,该方法流程包括以下步骤:
步骤103,将第一主存储节点作为当前可用存储集群的当前主存储节点。
在本发明实施例中,参见图2,第一主存储节点是管理服务器1-4根据轮巡策略预先从存储节点1-2-1、存储节点1-2-2及存储节点1-2-3中选出的,是存储集群1-2提供存储服务的入口,向存储集群1-2存储视频流时,首先要向存储集群1-2的第一主存储节点发送存储请求,由第一主存储节点在存储节点1-2-1、存储节点1-2-2及存储节点1-2-3中确定用于存储视频流的存储节点,然后再将待存储视频流发送该存储节点存储待存储视频流。当当前可用存储集群为存储集群1-2时,当前可用存储集群的当前主存储节点为存储集群1-2的第一主存储节点。
在步骤105之后,该方法流程包括以下步骤:
步骤106,将第二主存储节点作为当前可用存储集群的当前主存储节点。
在本发明实施例中,第二主存储节点为存储集群2-1提供存储服务的入口,可以是存储节点2-1-1、存储节点2-1-2及存储节点2-1-3中的任意一个存储节点,向存储集群2-1存储视频流时,首先要向存储集群2-1的第二主存储节点发送存储请求,由第二主存储节点在存储节点2-1-1、存储节点2-1-2及存储节点2-1-3中确定用于存储视频流存储节点,然后再将待存储视频流发送该存储节点存储待存储视频流。当当前可用存储集群为存储集群2-1时,当前可用存储集群的当前主存储节点为存储集群2-1的第二主存储节点。
进一步地,本发明实施例给出了配置当前可用存储集群的当前主存储节点的一种可能实施方式,在图6的基础上,图7为本发明实施例提供的另一种云存储的容灾方法流程图。
步骤103,具体包括:
子步骤1031,获取第一主存储节点的标识信息。
本发明实例中,第一主存储节点的标识信息可以是第一主存储节点的IP地址、端口、备用空间信息等,继续参见图2,通过第一主存储节点的标识信息可以向存储集群1-2发送存储请求,以获取存储集群1-2中可以存储视频流的存储节点。
子步骤1032,根据第一主存储节点的标识信息,配置第一主存储节点为当前可用存储集群的当前主存储节点。
步骤106,具体包括:
子步骤1061,向第二云存储系统的管理服务器发送节点标识获取消息,以使第二云存储系统的管理服务器依据节点标识获取消息获取第二主存储节点的标识信息。
本发明实例中,管理服务器1-4向管理服务器2-2发送第一获取消息,管理服务器2-2依据第一获取消息,从存储集群2-1获取第二主存储节点的标识信息、并返回至管理服务器1-4,第二主存储节点的标识信息可以是第二主存储节点的IP地址、端口等,通过第二主存储节点的标识信息可以向存储集群2-1发送存储请求,以获取存储集群2-1中可以存储视频流的存储节点。
子步骤1062,接收第二云存储系统的管理服务器返回的节点标识响应消息,其中,节点标识响应消息包含第二主存储节点的标识信息。
子步骤1063,依据第二主存储节点的标识信息,将第二主存储节点作为当前可用存储集群的当前主存储节点。
进一步地,当存储集群1-1故障恢复时,将存储集群1-1作为当前可用存储集群。在图1的基础上,图8为本发明实施例提供的另一种云存储的容灾方法流程图,请参照图8,该方法流程还包括以下步骤:
步骤107,当接收到第一存储集群发送的故障恢复消息时,将第一存储集群作为当前可用存储集群。
在本发明实施例中,参见图2,在存储集群1-1故障时,如果网络摄像机通过私有协议接入云存储系统1,网络摄像机会收到存储视频失败的消息,网络摄像机向管理服务器1-4请求当前可用存储集群的主存储节点,管理服务器1-4请求接收此请求后,基于该请求检测存储集群1-1是否故障,若存储集群1-1未故障,则返回存储集群1-1的主存储节点,若存储集群1-1存储故障,则判断存储集群1-2是否可用,若存储集群1-2可用,则将存储集群1-2的第一主存储节点返回至网络摄像机,同时返回备用类型标识,网络摄像机收到备用类型标识后,可以得知,当前收到的第一主存储节点为备用存储集群的主存储节点,则不保存第一主存储节点,因此,后续每次切换保存视频的文件时都会向管理服务器1-4请求当前可用存储集群,如果切换时,收到存储集群1-1的恢复消息,则将存储集群1-1的主存储节点作为当前可用存储集群的当前主存储节点返回至网络摄像机,并且返回非备用类型标识,网络摄像机收到非备用类型标识后,可以得知,当前收到的存储集群1-1的主存储节点非备用存储集群的主存储节点,则保存该存储集群1-1的主存储节点,可以直接获取保存的该存储集群1-1的主存储节点,并向该存储集群1-1的主存储节点获取待存储视频文件的存储节点,除非存储集群1-1发生故障,当存储集群1-2不可用时,向管理服务器2-2获取存储集群2-1是否可用,当存储集群2-1可用时,则返回存储集群2-1的第二主存储节点至网络摄像机,同时返回备用类型标识,后续处理同存储集群1-2可用时类似,此处不再赘述。
在本发明实施例中,在存储集群1-1故障时,如果网络摄像机通过ONVIF协议接入云存储系统1,收流的存储节点会收到存储视频失败的消息,收流的存储节点向管理服务器1-4请求当前可用存储集群的当前主存储节点,管理服务器1-4获取当前可用存储集群的当前主存储节点与网络摄像机通过私有协议接入云存储系统1的情况下的处理类似,此处不再赘述,当管理服务器1-4收到存储集群1-1的恢复消息时,如果当前可用存储集群为存储集群1-2,则首先停止收流的存储节点的收流,在存储集群1-1中重新选择新的收流的存储节点,新的收流的存储节点再向管理服务器1-4请求存储集群1-1的主存储节点以存储视频,如果当前可用存储集群为存储集群2-1,则管理服务器1-4首先向管理服务器2-2发送停止收流的消息,以使管理服务器2-2停止收流的存储节点的收流,并向管理服务器1-4返回收流完成的消息,管理服务器1-4收到收流完成的消息后,在存储集群1-1中重新选择新的收流的存储节点,新的收流的存储节点再向管理服务器1-4请求存储集群1-1的主存储节点以存储视频。
需要说明的是,每次切换保存视频的文件时都会向管理服务器1-4请求当前可用存储集群,这只是及时使恢复后的存储集群1-1重新接管存储业务的一种具体实现方式,但是并不是唯一的实现方式,例如,及时使恢复后的存储集群1-1重新接管存储业务还可以采用如下方式:管理服务器1-4周期性地检测存储集群1-1是否恢复,一旦检测到存储集群1-1恢复,及时通知当前可用存储集群停止当前的存储业务,以使存储业务尽快地恢复至存储集群1-1。
进一步地,当用户需要检索网络摄像机存储的视频流时,向管理服务器1-4发送视频检索请求,由管理服务器1-4再向存储集群1-1、存储集群1-2及存储集群2-1发送视频检索请求,以获取与视频检索请求对应的视频。在图2的基础上,图9为本发明实施例提供的另一种云存储的容灾方法流程图,请参照图9,该方法流程还包括以下步骤:
步骤108,接收视频检索请求。
在本发明实施例中,参见图2,用户通过视频管理平台发起针对网络摄像机的检索请求操作,视频管理平台基于该检索请求操作生成检索请求,并将该检索请求发送至管理服务器1-4。
步骤109,根据容灾备份策略,向第一存储集群、第二存储集群及第三存储集群发送视频检索请求,以获取与视频检索请求对应的视频。
在本发明实施例中,当存储集群1-1、存储集群1-2及存储集群2-1均可用时,此时,存储集群1-1为当前可用存储集群,管理服务器1-4向当前可用存储集群的当前主存储节点发送视频检索请求,当前主存储节点负责获取当前可用存储集群中所有存储节点存储的与视频检索请求对应的视频并返回至管理服务器1-4,同时,根据容灾备份策略,管理服务器1-4可以获取存储集群1-1在云存储系统1内的备份存储集群即存储集群1-2,同时还可以获取存储集群1-1在云存储系统2内的备份存储集群即存储集群2-1,管理服务器1-4存储有存储集群1-2的第一主存储节点的标识信息及存储集群2-1的第二主存储节点的标识信息,依据该第一主存储节点的标识信息向第一主存储节点发送视频检索请求,第一主存储节点负责获取存储集群1-2中各存储节点上存储的与视频检索请求对应的视频,依据该第二主存储节点的标识信息向管理服务器2-2发送视频检索请求,管理服务器2-2依据第二存储节点的标识信息向第二主存储节点发送视频检索请求,第二主存储节点负责获取存储集群2-1中各存储节点上存储的与视频检索请求对应的视频并返回至管理服务器2-2,再最终返回至管理服务器1-4,管理服务器1-4获取到存储集群1-1、存储集群1-2及存储集群2-1存储的与视频检索请求对应的视频后,可以根据预设规则对获取到的视频进行组织和排列,并返回至视频管理平台,以展示给用户,其中,预设规则可以是视频存储的时间的先后顺序。
具体的,下面给出一种检索视频可能的实现方式,图10示出了检索的流程示例图,图10中,云存储系统1为第一云存储系统,云存储系统2为第二云存储系统,管理服务器1-4为第一云存储系统的管理服务器100,管理服务器2-2为第二云存储系统的管理服务器,存储集群1-1为第一存储集群,即当前可用存储集群,存储节点1-1-1为当前可用存储集群的当前主存储节点,存储集群1-2为第二存储集群,存储节点1-2-1为第一主存储节点,存储集群2-1为第三存储集群,存储节点2-1-1为第二主存储节点,检索步骤包括:
S1:管理服务器1-4接收视频检索请求。
S2:管理服务器1-4向存储节点1-1-1、存储节点1-2-1及管理服务器2-2发送视频检索请求,以使管理服务器2-2向存储节点2-1-1发送视频检索请求。
S3:存储节点1-1-1、存储节点1-2-1及存储节点2-1-1分别获取对应存储集群的存储节点上存储的视频。
S4:存储节点1-1-1、存储节点1-2-1返回视频至管理服务器1-4,以及管理服务器2-2返回视频至管理服务器1-4。
S5:管理服务器1-4将收到的视频按照时间进行组织后返回至视频管理平台。
需要说明的是,管理服务器1-4收到视频检索请求时,存储集群1-1、存储集群1-2及存储集群2-1中任意一个或者两个存储集群都可能处于故障或者不可用状态,此时,虽然管理服务器1-4向存储集群1-1、存储集群1-2及存储集群2-1发送视频检索请求,但是只有处于可用状态的存储集群才会返回与视频检索请求对应的视频,管理服务器1-4对收到的与视频检索请求对应的视频按照时间进行组织后返回至视频管理平台。
请参照图11,图11示出了本发明实施例提供的云存储的容灾装置200的方框示意图,云存储的容灾装置200包括判断模块201和配置模块202,判断模块201和配置模块202可以通过上述实施例中处理器103执行来实现。
判断模块201,用于当检测到第一存储集群故障时,根据容灾备份策略判断第二存储集群是否可用,其中,第一存储集群与第二存储集群均属于第一云存储系统;容灾备份策略包含第一备份存储集群对应关系,第一备份存储集群对应关系表征第一存储集群在第一云存储系统内的备份存储集群为第二存储集群。
配置模块202,用于当第二存储集群可用时,将第二存储集群作为当前可用存储集群。
本发明实施例提供的云存储的容灾装置200,通过检测到第一存储集群故障时,判断模块201根据容灾备份策略判断第二存储集群是否可用,具体的是根据容灾备份策略包含第一备份存储集群对应关系,确定出第一存储集群在第一云存储系统内的备份存储集群,即第二存储集群,进而判断第二存储集群是否可用,当第二存储集群可用时,配置模块202将第二存储集群作为当前可用存储集群,本发明实施例在第一存储集群发生故障时,根据容灾备份策略,确定出第二存储集群,当第二存储集群可用时,由第二存储集群接管第一存储集群的存储业务,提升了存储业务的稳定性。
可选地,判断模块201还用于执行步骤104,配置模块202还用于执行步骤103、105、106、107,以实现对应的技术效果。
可选地,为了实现上述实施例中方法流程的步骤和对应技术效果,参见图11,云存储的容灾装置200还可以包括收发模块203。
进而,该收发模块203可以配合配置模块202执行步骤103,例如,在上文图7对应实施例中,该收发模块203执行步骤1031以获取第一主存储节点的标识信息;相应地,配置模块202执行步骤1032,以实现将第一主存储节点配置为当前可用存储集群的当前主存储节点的功能。
类似地,继续参见图7,该收发模块203配合配置模块202执行步骤106,该收发模块203执行步骤1061和步骤1062,相应地,配置模块202执行步骤1063,以实现将第二主存储节点配置为当前可用存储集群的当前主存储节点的功能。
可选地,该收发模块203还可以执行图9中的步骤108和步骤109,以获取与视频检索请求对应的视频。
其中,在步骤109中,该收发模块203在接收到视频检索请求对应的视频后,会将完整的视频数据发送给视频管理平台,以便后续用户通过视频管理平台调取该视频数据。
可选地,为了实现步骤101,该收发模块203还可以用于接收负责收流的存储节点发送的获取当前可用存储集群的主存储节点的消息,以配合判断模块201实现步骤101的功能,例如,结合图2,收发模块203接收负责收流的存储节点1-1-1发送的获取当前可用存储集群的主存储节点的消息,基于该消息检测第一存储集群是否故障等步骤101的功能。
可见,判断模块201、配置模块202以及收发模块203可以配合实现上实施例中各个方法流程的步骤,以实现相应的技术效果。
基于上述图2所示的本发明实施例提供的应用场景的方框示例图中的云存储的容灾系统架构,本发明实施例还提供一种云存储的容灾系统,该云存储的容灾系统包括云存储系统1和云存储系统2,其中,云存储系统1包括存储集群1-1、存储集群1-2及云存储的容灾装置200,云存储的容灾装置200可以用于执行上述图4中步骤101和102,实现当存储集群1-1故障时,存储集群1-2可以接管存储集群1-1的存储业务,解决了存储集群1-1故障带来的存储业务中断的问题,从而极大地提升了存储业务的稳定性。
可选地,请参照图1,现有技术仅能够在一个云存储系统内进行容灾处理,其并不能够跨云存储系统进行容灾,因为基于图2中的云存储的容灾系统架构,本发明实施例还提供一种可能的实现方式,目的在于:实现跨云存储系统的容灾处理,以提高系统稳定性。
为了实现多个云存储系统间的交互,云存储的容灾装置200用于当所述存储集群1-2不可用时,根据容灾备份策略判断存储集群2-1是否可用,当存储集群2-1可用时,将存储集群2-1作为当前可用存储集群,作为一种使当前可用存储集群接管存储集群1-2的存储业务的具体实施方式,云存储的容灾装置200可以执行步骤1061-1063,以使管理服务器2-2返回存储集群2-1的主存储节点,通过存储集群2-1的主存储节点确定存储视频的存储节点,达到接管存储集群1-2的存储业务的效果。
需要说明的是,本发明实施例中所示的系统架构仅以两个云存储系统为例进行说明,基于场景需求,该系统架构也可以包含更多的云存储系统,此时,容灾备份策略可以包含多个备份存储集群对应关系,当其中任意一个云存储系统中的存储集群不可用时,根据容灾备份策略、通过与其余云存储系统中的管理服务器进行交互,确定出可用存储集群,以接管不可用存储集群上的存储业务,任意两个云存储系统中的交互方法与上述描述的方法类似,本领域技术人员可以在不付出创造性劳动的条件下、实现包含多个云存储系统的系统架构对应的云存储的容灾方法及对应效果。
综上所述,本发明提供的一种云存储的容灾方法、装置及系统,所述方法包括:当检测到第一存储集群故障时,根据容灾备份策略判断第二存储集群是否可用,其中,第一存储集群与述第二存储集群均属于第一云存储系统;容灾备份策略包含第一备份存储集群对应关系,第一备份存储集群对应关系表征第一存储集群在第一云存储系统内的备份存储集群为第二存储集群;当第二存储集群可用时,将第二存储集群作为当前可用存储集群。与现有技术相比,本发明实施例在第一存储集群中的冗余节点发生故障导致第一存储集群故障时,根据容灾备份策略由与第一存储集群同属于一个云存储系统中的第二存储集群接管第一存储集群的存储业务,解决了第一存储集群中冗余存储节点发生故障导致第一存储集群故障,带来的存储业务中断的问题,从而极大地提升了存储业务的稳定性。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

Claims (7)

1.一种云存储的容灾方法,其特征在于,包括:
当检测到第一存储集群故障时,根据容灾备份策略判断第二存储集群是否可用,其中,所述第一存储集群与所述第二存储集群均属于第一云存储系统;所述容灾备份策略包含第一备份存储集群对应关系,所述第一备份存储集群对应关系表征所述第一存储集群在所述第一云存储系统内的备份存储集群为所述第二存储集群;
当所述第二存储集群可用时,将所述第二存储集群作为当前可用存储集群;
当所述第二存储集群不可用时,根据所述容灾备份策略判断第三存储集群是否可用,其中,所述第三存储集群属于第二云存储系统;所述容灾备份策略还包含第二备份存储集群对应关系,所述第二备份存储集群对应关系表征所述第一存储集群在所述第二云存储系统内的备份存储集群为所述第三存储集群,所述第一云存储系统还包括管理服务器,所述第二云存储系统还包括管理服务器且所述第二云存储系统的管理服务器与所述第一云存储系统的管理服务器不同;
当所述第三存储集群可用时,将所述第三存储集群作为所述当前可用存储集群,所述第三存储集群包括第二主存储节点;
所述将所述第三存储集群作为所述当前可用存储集群的步骤之后,所述方法还包括:
第一云存储系统的管理服务器向所述第二云存储系统的管理服务器发送节点标识获取消息,以使所述第二云存储系统的管理服务器依据所述节点标识获取消息获取所述第二主存储节点的标识信息;
第一云存储系统的管理服务器接收所述第二云存储系统的管理服务器返回的节点标识响应消息,其中,所述节点标识响应消息包含所述第二主存储节点的标识信息;
第一云存储系统的管理服务器依据所述第二主存储节点的标识信息,将所述第二主存储节点作为所述当前可用存储集群的当前主存储节点。
2.如权利要求1所述的云存储的容灾方法,其特征在于,所述第二存储集群包括第一主存储节点,所述将所述第二存储集群作为当前可用存储集群的步骤之后,所述方法还包括:
将所述第一主存储节点作为所述当前可用存储集群的当前主存储节点。
3.如权利要求2所述的云存储的容灾方法,其特征在于,所述将所述第一主存储节点作为所述当前可用存储集群的当前主存储节点的步骤,包括:
获取所述第一主存储节点的标识信息;
根据所述第一主存储节点的标识信息,将所述第一主存储节点作为所述当前可用存储集群的当前主存储节点。
4.如权利要求1所述的云存储的容灾方法,其特征在于,所述方法还包括:
当接收到所述第一存储集群发送的故障恢复消息时,将所述第一存储集群作为所述当前可用存储集群。
5.如权利要求1所述的云存储的容灾方法,其特征在于:
接收视频检索请求;
根据所述容灾备份策略,向所述第一存储集群、所述第二存储集群及所述第三存储集群发送所述视频检索请求,以获取与所述视频检索请求对应的视频。
6.一种云存储的容灾装置,其特征在于,包括:
判断模块,用于当检测到第一存储集群故障时,根据容灾备份策略判断第二存储集群是否可用,其中,所述第一存储集群与所述第二存储集群均属于第一云存储系统;所述容灾备份策略包含第一备份存储集群对应关系,所述第一备份存储集群对应关系表征所述第一存储集群在所述第一云存储系统内的备份存储集群为所述第二存储集群;
配置模块,用于当所述第二存储集群可用时,将所述第二存储集群作为当前可用存储集群;
所述判断模块还用于当所述第二存储集群不可用时,根据所述容灾备份策略判断第三存储集群是否可用,其中,所述第三存储集群属于第二云存储系统;所述容灾备份策略还包含第二备份存储集群对应关系,所述第二备份存储集群对应关系表征所述第一存储集群在所述第二云存储系统内的备份存储集群为所述第三存储集群,所述第一云存储系统还包括管理服务器,所述第二云存储系统还包括管理服务器且所述第二云存储系统的管理服务器与所述第一云存储系统的管理服务器不同;
所述配置模块还用于当所述第三存储集群可用时,将所述第三存储集群作为所述当前可用存储集群,所述第三存储集群包括第二主存储节点;
所述配置模块还用于:所述第一云存储系统的管理服务器向所述第二云存储系统的管理服务器发送节点标识获取消息,以使所述第二云存储系统的管理服务器依据所述节点标识获取消息获取所述第二主存储节点的标识信息;所述第一云存储系统的管理服务器接收所述第二云存储系统的管理服务器返回的节点标识响应消息,其中,所述节点标识响应消息包含所述第二主存储节点的标识信息;所述第一云存储系统的管理服务器依据所述第二主存储节点的标识信息,将所述第二主存储节点作为所述当前可用存储集群的当前主存储节点。
7.一种云存储的容灾系统,其特征在于,包括:第一云存储系统和第二云存储系统,其中,所述第一云存储系统包括第一存储集群、第二存储集群及云存储的容灾装置,所述第二云存储系统包括第三存储集群;
所述云存储的容灾装置,用于当检测到所述第一存储集群故障时,根据容灾备份策略判断所述第二存储集群是否可用,其中,所述容灾备份策略包含第一备份存储集群对应关系,所述第一备份存储集群对应关系表征所述第一存储集群在所述第一云存储系统内的备份存储集群为所述第二存储集群;用于当所述第二存储集群可用时,将所述第二存储集群作为当前可用存储集群,所述第一云存储系统还包括管理服务器,所述第二云存储系统还包括管理服务器且所述第二云存储系统的管理服务器与所述第一云存储系统的管理服务器不同;
所述云存储的容灾装置,还用于当所述第二存储集群不可用时,根据所述容灾备份策略判断第三存储集群是否可用,其中,所述第三存储集群属于第二云存储系统;所述容灾备份策略还包含第二备份存储集群对应关系,所述第二备份存储集群对应关系表征所述第一存储集群在所述第二云存储系统内的备份存储集群为所述第三存储集群;当所述第三存储集群可用时,将所述第三存储集群作为所述当前可用存储集群,所述第三存储集群包括第二主存储节点;
所述云存储的容灾装置,还用于:所述第一云存储系统的管理服务器向所述第二云存储系统的管理服务器发送节点标识获取消息,以使所述第二云存储系统的管理服务器依据所述节点标识获取消息获取所述第二主存储节点的标识信息;
所述第一云存储系统的管理服务器接收所述第二云存储系统的管理服务器返回的节点标识响应消息,其中,所述节点标识响应消息包含所述第二主存储节点的标识信息;
所述第一云存储系统的管理服务器依据所述第二主存储节点的标识信息,将所述第二主存储节点作为所述当前可用存储集群的当前主存储节点。
CN201811348869.XA 2018-11-13 2018-11-13 云存储的容灾方法、装置及系统 Active CN111176888B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811348869.XA CN111176888B (zh) 2018-11-13 2018-11-13 云存储的容灾方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811348869.XA CN111176888B (zh) 2018-11-13 2018-11-13 云存储的容灾方法、装置及系统

Publications (2)

Publication Number Publication Date
CN111176888A CN111176888A (zh) 2020-05-19
CN111176888B true CN111176888B (zh) 2023-09-15

Family

ID=70655336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811348869.XA Active CN111176888B (zh) 2018-11-13 2018-11-13 云存储的容灾方法、装置及系统

Country Status (1)

Country Link
CN (1) CN111176888B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112286723A (zh) * 2020-09-30 2021-01-29 北京大米科技有限公司 机房容灾控制方法、终端及存储介质
CN112527567A (zh) * 2020-12-24 2021-03-19 北京百度网讯科技有限公司 系统容灾方法、装置、设备以及存储介质
CN113254274A (zh) * 2021-04-21 2021-08-13 北京大米科技有限公司 消息处理方法、装置、存储介质以及服务器
CN114584458B (zh) * 2022-03-03 2023-06-06 平安科技(深圳)有限公司 一种基于etcd的集群容灾管理方法、系统、设备及存储介质
CN114785797A (zh) * 2022-04-26 2022-07-22 南京甄视智能科技有限公司 一种录像存储容灾系统及方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103354503A (zh) * 2013-05-23 2013-10-16 浙江闪龙科技有限公司 一种可自动检测及替换故障节点的云存储系统及其方法
US9087012B1 (en) * 2014-06-04 2015-07-21 Pure Storage, Inc. Disaster recovery at high reliability in a storage cluster
US9311330B1 (en) * 2012-09-28 2016-04-12 Emc Corporation Method and system for performing full backup in a failover cluster
CN106357787A (zh) * 2016-09-30 2017-01-25 郑州云海信息技术有限公司 一种存储容灾控制系统
CN106502835A (zh) * 2016-10-26 2017-03-15 中国银联股份有限公司 一种容灾备份方法及装置
CN108023746A (zh) * 2016-11-02 2018-05-11 杭州海康威视数字技术股份有限公司 一种视频数据处理方法、装置及系统
CN108351823A (zh) * 2015-10-22 2018-07-31 Netapp股份有限公司 实现自动切换
CN108351824A (zh) * 2015-10-30 2018-07-31 Netapp股份有限公司 用于在计算节点之间执行切换操作的方法、设备和介质
US10089187B1 (en) * 2016-03-29 2018-10-02 EMC IP Holding Company LLC Scalable cloud backup

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150033454A (ko) * 2013-09-24 2015-04-01 주식회사 엘지씨엔에스 빅데이터 처리 장치 관리 방법 및 이를 수행하는 관리 시스템
US10540245B2 (en) * 2016-11-22 2020-01-21 International Business Machines Corporation One-step disaster recovery configuration on software-defined storage systems

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311330B1 (en) * 2012-09-28 2016-04-12 Emc Corporation Method and system for performing full backup in a failover cluster
CN103354503A (zh) * 2013-05-23 2013-10-16 浙江闪龙科技有限公司 一种可自动检测及替换故障节点的云存储系统及其方法
US9087012B1 (en) * 2014-06-04 2015-07-21 Pure Storage, Inc. Disaster recovery at high reliability in a storage cluster
CN108351823A (zh) * 2015-10-22 2018-07-31 Netapp股份有限公司 实现自动切换
CN108351824A (zh) * 2015-10-30 2018-07-31 Netapp股份有限公司 用于在计算节点之间执行切换操作的方法、设备和介质
US10089187B1 (en) * 2016-03-29 2018-10-02 EMC IP Holding Company LLC Scalable cloud backup
CN106357787A (zh) * 2016-09-30 2017-01-25 郑州云海信息技术有限公司 一种存储容灾控制系统
CN106502835A (zh) * 2016-10-26 2017-03-15 中国银联股份有限公司 一种容灾备份方法及装置
CN108023746A (zh) * 2016-11-02 2018-05-11 杭州海康威视数字技术股份有限公司 一种视频数据处理方法、装置及系统

Also Published As

Publication number Publication date
CN111176888A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
CN111176888B (zh) 云存储的容灾方法、装置及系统
US10489254B2 (en) Storage cluster failure detection
EP3518110B1 (en) Designation of a standby node
CN108923992B (zh) 一种nas集群高可用方法、系统及电子设备和存储介质
US20160036924A1 (en) Providing Higher Workload Resiliency in Clustered Systems Based on Health Heuristics
CN106330475B (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
CN108153622B (zh) 一种故障处理的方法、装置和设备
CN110830283B (zh) 故障检测方法、装置、设备和系统
US7356531B1 (en) Network file system record lock recovery in a highly available environment
CN106911728A (zh) 分布式系统中主节点的选取方法和装置
CN107508694B (zh) 一种集群内的节点管理方法及节点设备
CN102394914A (zh) 集群脑裂处理方法和装置
CN109496401B (zh) 一种业务接管方法、存储设备和业务接管装置
CN105511987A (zh) 一种强一致性且高可用的分布式任务管理系统
CN108462756B (zh) 一种数据写入方法和装置
CN108600284B (zh) 一种基于Ceph的虚拟机高可用实现方法及系统
CN108512753B (zh) 一种集群文件系统中消息传输的方法及装置
CN110858168B (zh) 集群节点故障处理方法、装置及集群节点
CN113330426B (zh) 一种备份数据的方法、装置和系统
CN105490847B (zh) 一种私有云存储系统中节点故障实时检测及处理方法
CN112887367B (zh) 实现分布式集群高可用的方法、系统及计算机可读介质
CN103810038A (zh) 一种ha集群中虚拟机存储文件迁移方法及其装置
CN108133034B (zh) 共享存储访问方法及相关装置
CN113986450A (zh) 一种虚拟机备份方法及装置
US20170116096A1 (en) Preserving coredump data during switchover operation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant