CN105812420A - 一种集群系统 - Google Patents

一种集群系统 Download PDF

Info

Publication number
CN105812420A
CN105812420A CN201410848200.2A CN201410848200A CN105812420A CN 105812420 A CN105812420 A CN 105812420A CN 201410848200 A CN201410848200 A CN 201410848200A CN 105812420 A CN105812420 A CN 105812420A
Authority
CN
China
Prior art keywords
dcs
working machine
machine
host apparatus
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410848200.2A
Other languages
English (en)
Inventor
谭琳
吴立
张兴明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN201410848200.2A priority Critical patent/CN105812420A/zh
Publication of CN105812420A publication Critical patent/CN105812420A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明实施例公开了一种集群系统,涉及安防领域,用以提高集群系统的稳定性。在本发明实施例中,主用系统,由N个主用设备组成,用于通过外部访问地址接收来自所述集群系统外部的访问请求;其中N≥1;备用系统,由M个备用设备组成,且至少包括一个处于DCS工作机状态的DCS工作机,其中,所述DCS工作机用于:在检测到主用设备故障时,从所述备用系统中选取可用的备用设备作为代理设备;根据预先获取的所述故障主用设备的配置信息和外部访问地址,对选取出的代理设备进行配置,以使所述代理设备替代所述故障主用设备通过所述外部访问地址接收来自所述集群系统外部的访问请求;其中M≥1;从而提高了集群系统的稳定性。

Description

一种集群系统
技术领域
本发明涉及安防领域,尤其涉及一种集群系统。
背景技术
集群系统是一种由互相连接的计算机组成的并行或分布式系统,可以作为单独、统一的计算资源加以管理。通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益,其任务调度则是集群系统中的核心技术。
现有技术中,在由一群(N台)同构设备组成的设备集群中,每一台设备都无差别地承担着集群1/N的负载,共同维持着整个集群的功能与负载的稳定。
然而,在这样一个集群系统中,一旦出现一台或多台设备故障,整个集群的负载能力就会下降,进而影响其稳定性和可用性。
发明内容
本发明实施例提供一种集群系统,用以提升集群系统的稳定性。
本发明实施例提供一种集群系统,该集群系统包括:
主用系统,由N个主用设备组成,用于通过外部访问地址接收来自所述集群系统外部的访问请求;其中N≥1;
备用系统,由M个备用设备组成,且至少包括一个处于调度系统DCS工作机状态的DCS工作机,其中,所述DCS工作机用于:在检测到主用设备故障时,从所述备用系统中选取可用的备用设备作为代理设备;根据预先获取的所述故障主用设备的配置信息和外部访问地址,对选取出的代理设备进行配置,以使所述代理设备替代所述故障主用设备通过所述外部访问地址接收来自所述集群系统外部的访问请求;其中M≥1。
从上述技术方案可以看出,集群系统中的备用系统在主用设备故障时,可以从备用系统中的M个备用设备中选取能够替代故障主用设备工作的备用设备,该备用设备利用与故障主用设备的外部访问地址相同的地址替代故障主用设备工作,用户在通过该外部访问地址发送访问请求时,由替代故障主用设备的备用设备进行响应,在主用设备发生故障时,提高了集群系统的稳定性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种集群创建的流程示意图;
图2为本发明实施例提供的一种集群系统初始化的流程示意图;
图3为本发明实施例提供的一种故障检测与主备切换的流程示意图;
图4为本发明实施例提供的一种故障恢复与备主切换的流程示意图;
图5为本发明实施例提供的一种外部查询和配置的流程示意图;
图6为本发明实施例提供的一种DCS备份机迁移的流程示意图;
图7为本发明实施例提供的一种集群系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例可以应用于由多台设备组成的集群系统中,尤其适用于由N台主用设备和M台备用设备组成的N+M集群系统中。当集群系统中的主用设备和/或备用设备发生故障时,集群系统会调度对应的同构设备及时接替故障设备工作,提高整个集群系统在应对外部访问请求时的稳定性。
本发明是实力通过描述N+M冗余集群在运行过程中几个典型流程对整个系统的设计进行说明。为描述方便起见,这里统一将集群内的M台备用设备命名为:M1,M2,M3,……Mm,N台主用设备命名为:N1,N2,N3,……Nn。其中,由M台M台备用设备(也可称为备用机)组成备用系统,由N台主用设备(也可称为主用机)组成主用系统,在备用系统中还可以包括一台DCS工作机(以下简称M1)、一台DCS备份机(以下简称M2)以及若干空闲备用设备(可以简称为空闲机);需要说明的是,本发明实施例可以将由M1和M2组成的系统称为DCS系统。其中,DCS(DispatchingConsoleSystem,调度系统):DCS系统能够对主用系统和备用系统进行及时正确地调度。
作为一种优选的实施方式,本发明实施例提供了一种集群的创建过程,图1示出了本发明实施例提供的一种集群创建的流程示意图,如图1所示,该流程可以包括:
步骤11:获取配置列表,若未获取到,则执行步骤18,若获取到,则执行步骤12。
步骤12:判断获取到的配置列表中是否只有一台备用机,若是,则执行步骤16;否则,执行步骤13。
步骤13:向所有设备询问能否成为DCS工作机(M1)。
步骤14:判断是否各设备均无应答,若是,则执行步骤18;否则,执行步骤15。
步骤15:判断各设备是否均不反对成为DCS工作机,若否,则执行步骤18;否则,执行步骤16。
步骤16:启动一DCS工作机。
步骤17:10秒后启动一DCS备份机,并完成集群的创建。
步骤18:清除内存中保存的DCS工作机信息。
作为一种优选的实施方式,本发明实施例提供了一种集群系统初始化过程,图2示出了本发明实施例提供了一种集群系统初始化的流程示意图,如图2所示,集群的初始化工作包括如下内容:
步骤21:DCS工作机(M1)获取DCS配置信息。
具体的,DCS工作机(M1)获取所有主用设备和备用设备的IP地址信息并获取集群内所有可用虚拟IP地址信息。
步骤22:DCS工作机(M1)设置每台主用设备的虚拟IP地址。
步骤23:DCS工作机(M1)订阅每台主用设备的配置信息
步骤24:DCS工作机(M1)订阅每台主用设备的保活信息。
步骤25:DCS工作机(M1)启动每台主用设备。
在集群初始化过程中,还可以包括如下内容:
DCS工作机(M1)上配置DCS信息。
DCS工作机(M1)把DCS信息同步到所有M(备用机)上,每台M(备用机)明确各自的优先级(包括DCS优先级和主备优先级)。
每台M明确自己的状态:M1为“DCS工作”,M2为“DCS备份”,其余为空闲。
M1与M2开始建立DCS主备关系。
M1把DCS代理策略分发给所有主用机和备用机(DCS代理转发的安全级)。
M1启用所有主用设备。
M1向M2同步主用设备的配置信息。
这样,当集群中的各设备执行上述操作之后,集群初始化完成。仍如图2所示,如果在初始化过程中,发现主用设备故障,那么因为此时还未获得该设备的配置信息,无法为故障主用设备启动相应的备用设备。因此,若主用设备初始化失败,将导致对应的虚拟设备不可用(即该虚拟IP不可访问)。
对于初始化失败的主用设备,可以由M1以一定的时间间隔重复尝试将其初始化,直至成功。
进一步的,如果集群中只存在一台M(备用机),即M=1时,无需部署DCS备份机,该初始化流程如下:
在M1上配置DCS信息。
M1明确自己的状态为“DCS工作”。
M1把DCS代理策略分发给所有的主用机和自己(DCS代理转发的安全级)。
M1启用所有主用设备。
这样,当集群中的各设备执行上述操作之后,集群初始化完成。
作为一种优选的实施方式,本发明实施例提供了一种故障检测与主备切换的过程,图3示出了本发明实施例提供了一种故障检测与主备切换的流程示意图,如图3所示,故障检测与主备切换包括的主要内容如下:
步骤31:DCS系统检测到主用设备的保活模块一定时间内没有发送保活消息,或者发送了一个故障报告。
步骤32:DCS(M1)取消了主用设备的虚拟IP。
步骤33:DCS(M1)关闭主用设备。
步骤34:DCS(M1)把该主用设备的最新配置信息配置到选中的一台备用设备上。
步骤35:DCS(M1)向该备用设备订阅配置信息。
步骤36:DCS(M1)向该备用设备订阅保活信息。
步骤37:DCS(M1)启动该备用设备。
步骤38:DCS(M1)设置该备用设备的虚拟IP。
在本发明实施例中,主用设备的故障大致可分为三种类型:主用设备和DCS系统之间的网络发生了故障,主用设备本身系统级故障(掉电,关机等),主用设备上相关业务逻辑模块故障。当发生上述三种或其他故障时,为了尽量不选中正担任DCS任务(如DCS工作机或DCS备份机)的备用机,优先选取状态为“空闲”的备用机,如果没有,则选取状态为“DCS备份”的可用备用机,如果还没有,则选取状态为“DCS工作“的可用备用机。
优选的,本发明实施例提供一种备用机的选取算法:
在本算法描述中,Mx表示编号为x的一台备用机,Status(Mx)表示Mx的状态。
作为一种优选的实施方式,本发明实施例提供了一种故障恢复与备主切换的过程,图4示出了本发明实施例提供了一种故障恢复与备主切换的流程示意图,如图4所示,故障恢复与备主切换包括的主要内容如下:
步骤41:主用设备恢复,其保活模块继续向DCS发送保活消息,DCS检测到该设备发送的保活消息。
步骤42:DCS(M1)取消对应的备用设备的虚拟IP。
步骤43:DCS(M1)关闭备用设备。
步骤44:DCS(M1)使用最新的配置设置主用设备的配置信息。
步骤45:DCS(M1)订阅主用设备的配置信息。
步骤46:DCS(M1)启动主用设备。
步骤47:DCS(M1)设置主用设备的虚拟IP。
步骤48:DCS(M1)要求备用设备将数据回传给主用设备。
在执行步骤48之后,备用设备开始向主用设备回传数据。
作为一种优选的实施方式,本发明实施例提供了一种外部查询和配置的过程,图5示出了本发明实施例提供了一种外部查询和配置的流程示意图,如图5所示,当外部通过任意一个虚拟IP对该集群系统进行查询或配置访问时,外部查询和配置包括的主要内容如下:
步骤51:该虚拟IP对应的虚拟设备(可以为主用设备也可以为备用设备)收到访问请求,检查是否允许访问。
步骤52:允许访问则虚拟设备把请求转发给工作设备。
步骤53:虚拟设备收到工作设备的回复。
步骤54:虚拟设备把回复转发给外部用户。
作为一种优选的实施方式,本发明实施例提供了一种DCS备份机选取流程,该流程包括的主要内容如下:
在集群系统完成初始化后,M2即成为DCS备份机,此后,当出现下面两种情况中的任一种时,需要重新选取DCS备份机:
M2替代主用机进行工作,一段时间后,有一台备用机Mx恢复到空闲状态,则DCS备份机迁移到Mx。
DCS工作机通过保活机制发现DCS备份机故障,则重新选取DCS备份机。
第一种情况下,直接迁移即可,第二种情况下,需要一种DCS备份机的选取算法,算法描述如下:
设当前状态下,Mx=DCS工作机,My=DCS备份机。Status(Mz)表示Mz的状态。
当Status(My)==故障时,Mx上运行如下算法:
作为一种优选的实施方式,本发明实施例提供了一种DCS备份机迁移流程,图6示出了本发明实施例提供了一种DCS备份机迁移的流程示意图,如图6所示,DCS备份机迁移包括的主要内容如下:
当选定了新的DCS备份机后,需要进行新旧DCS备份机间的迁移,迁移的主要流程如下(为描述简便起见,以Mb1表示旧DCS备份机,Mb2表示新DCS备份机,Mw表示DCS工作机):
步骤61:Mw通过保活通道向Mb1发送BYE命令(Mb1无故障的情况下)。
步骤62:Mb1将自己的状态中的“DCS备份”状态位清除(Mb1无故障的情况下)。
步骤63:Mb1回应BYE命令,并断开保活通道(Mb1无故障的情况下)。
步骤64:Mw清除Mb1的“DCS备份”状态位。
步骤65:Mw跟Mb2建立连接,发送所有主用机的配置信息,所有备用机的状态信息。
步骤66:Mw跟Mb2建立保活连接,发送HELLO命令。
步骤67:Mb2将自己的状态中的“DCS备份”状态位置位。
步骤68:Mb2回应HELLO命令,保活通道建立成功。
步骤69:Mw置Mb2的“DCS备份”状态位。
作为一种优选的实施方式,本发明实施例提供了DCS备份机的两类工作流程,其中,DCS备份机的工作主要分为两类:作为备份机的日常工作,接管DCS工作机。
第一类:作为备份机的日常工作。
具体的,DCS备份机的日常工作主要包括如下:
1、定期向DCS工作机发送保活命令,并接收保活回应,确认DCS工作机正常。
2、接受DCS工作机发送的主用机配置信息,备用机状态信息,并更新本地数据。
第一类:接管DCS工作机。
具体的,为描述简便起见,本节称DCS工作机为Mw,DCS备份机为Mb,当Mb通过保活通道发现Mw故障时,便接管Mw成为工作机,流程如下:
Mb置Mw状态为“故障”。
Mb向所有备用机发送“状态获取”请求,获取备用机最新状态信息,更新本地数据。
Mb向所有主用机,以及状态为“替代主用机工作”的备用机发送保活信息订阅请求,和配置信息订阅请求。
Mb将自己的“DCS工作”状态位置位。
Mb按照上述实施例所描述的算法选取新的DCS备份机。
Mb按照上述实施例所描述的流程(无Mb1的情况),进行DCS备份机迁移。
作为一种优选的实施方式,本发明实施例提供了一种主用机恢复的检测流程。当一台主用机从故障中恢复,重新变成可用时,可能DCS工作机已经迁移到另一台M(备用机)上了,而此时,刚从故障中恢复过来的主用机并不知道新的DCS在哪里。为了保证能及时检测到恢复的主用机,要求DCS工作机对故障主用机进行定期探测。探测到恢复的主用机,则将其状态从“故障”改为“空闲”,然后根据系统的要求,进行人工,或自动的备主切换。
作为一种优选的实施方式,本发明实施例提供了一种备用机恢复的检测流程。当一台故障的备用机(以下简称Mr)从故障中恢复时,此时的集群内部状态是未知的,可处于各种状态。Mr首先读取自己的配置信息,如果发现集群中M=1,则立即执行上述实施例所描述的接管DCS工作机流程,使自己变成DCS工作机。然后进入正常工作流程。如果发现集群中M>1,则向集群中所有其它M(备用机)报告自己的状态为“空闲”,如果发现其它M(备用机)均已故障,则立即执行上述实施例所描述的接管DCS工作机流程,使自己变成DCS工作机,然后进入正常工作流程。如果集群中还有M(备用机)存活,则存活的M(备用机)向Mr回应自己的状态(这些状态中必有“DCS工作”)。即:从故障中恢复的备用机需立即跟其它备用机进行一个状态信息的同步。
作为一种优选的实施方式,本发明实施例提供了一种从无DCS备份机状态中恢复的流程。按照上述实施例所描述的选取算法,集群中无DCS备份机,则表示除DCS工作机外,所有M(备用机)均已故障。当某一台M(备用机)从故障中恢复时,跟DCS工作机完成状态信息同步后,DCS工作机立即选取该M(备用机)成为DCS备份机。
作为一种优选的实施方式,本发明实施例提供了一种从无DCS工作机状态中恢复的流程。集群中无DCS工作机,则表示所有M(备用机)均已故障,则按照上述实施例的描述,第一台恢复的M(备用机)会自动成为DCS工作机。
作为一种优选的实施方式,本发明实施例提供了一种DCS功能迁移的流程。在两种情况下,要进行DCS工作机的功能迁移:
第一种情况:DCS备份机在发现DCS工作机已故障的情况下,接管DCS工作机。
第二种情况:DCS工作机在替代主用机进行工作时,有其它M(备用机)状态转为“空闲”。
在DCS工作机正替代某台已故障的主用机进行工作时,整个系统中肯定已无空闲的M(备用机)。一段时间后,某台M(备用机)状态变为空闲,则DCS工作机将自身的DCS功能迁往该M(备用机),流程如下(为描述方便起见,称DCS工作机为Mw,空闲备用机为Mi):
Mw向Mi发送TO_DCS命令,要求Mi成为DCS工作机。
Mi向所有备用机发送“状态获取”请求,获取备用机最新状态信息,更新本地数据(获取到的Mw的状态位中的“DCS工作”状态需清除)。
Mi向所有主用机,以及状态为“替代主用机工作”的备用机发送保活信息订阅请求,和配置信息订阅请求。
Mi置自己的“DCS工作”状态位,回应Mw已进入DCS工作状态
Mw清除自己的“DCS工作”状态位。
Mw跟它的备份机断开连接(参考3.5.2中Mw跟Mb1之间的流程)。
Mw回应Mi已完全退出“DCS工作”状态。
Mi按3.5.1所描述的算法选取新的DCS备份机。
Mi按3.5.2所描述的流程(无Mb1的情况),进行DCS备份机迁移。
从上述技术方案可以看出,集群系统中的备用系统在主用设备故障时,可以从备用系统中的M个备用设备中选取能够替代故障主用设备工作的备用设备,该备用设备利用与故障主用设备的外部访问地址相同的地址替代故障主用设备工作,用户在通过该外部访问地址发送访问请求时,由替代故障主用设备的备用设备进行响应,在主用设备发生故障时,提高了集群系统的稳定性。
基于相同的技术构思,本发明实施例提供一种集群系统,图7示出了本发明实施例提供的一种集群系统的结构示意图,如图7所示,该集群系统可以包括:
主用系统71,由N个主用设备组成,用于通过所述外部访问地址接收来自所述集群系统外部的访问请求;其中N≥1;
备用系统72,由M个备用设备组成,且至少包括一个处于调度系统DCS工作机状态的DCS工作机,其中,所述DCS工作机用于:在检测到主用设备故障时,从所述备用系统72中选取可用的备用设备作为代理设备;根据预先获取的所述故障主用设备的配置信息和外部访问地址,对选取出的代理设备进行配置,以使所述代理设备替代所述故障主用设备通过所述外部访问地址接收来自所述集群系统外部的访问请求;其中M≥1。
可选的,所述备用系统72仅由一个处于DCS工作机状态的DCS工作机组成,或
所述备用系统72由一个处于DCS工作机状态的DCS工作机、一个处于DCS备份机状态的DCS备份机组成,或
所述备用系统72由一个处于DCS工作机状态的DCS工作机、一个处于DCS备份机状态的DCS备份机以及若干处于空闲状态的空闲机组成;
当所述备用系统72仅由一个所述DCS工作机组成,该备用系统在检测到主用设备故障时,选取自身作为所述代理设备;
当所述备用系统72由一个DCS工作机、一个DCS备份机组成,该备用系统在检测到主用设备故障时,优先选取所述DCS备份机作为所述代理设备;
当所述备用系统72由一个DCS工作机、一个DCS备份机、以及若干空闲机组成,该备用系统在检测到主用设备故障时,优先选取一个空闲机作为所述代理设备。
可选的,所述DCS工作机还用于:检测所述备用系统72中除自身之外的其它各备用设备的工作状态,并获取各设备的配置信息和/或外部访问地址;在检测到主用设备故障时,从工作状态正常的各备用设备选取所述代理设备。
可选的,所述DCS工作机还用于:在检测到系统中DCS备份机故障或不存在DCS备份机时,将工作状态正常的任一空闲机转换为DCS备份机。
可选的,所述DCS备份机具体用于:检测DCS工作机的工作状态,并对存储于所述DCS工作机的配置信息和外部访问地址进行备份;在检测到所述DCS工作机故障时,将自身转换为DCS工作机,并利用已备份的配置信息和外部访问地址,替代故障的DCS工作机工作。
可选的,所述DCS工作机还用于:在检测到主用设备故障恢复后,根据替代该主用设备工作的代理设备的配置信息和外部访问地址,配置该主用设备,并在该主用设备恢复正常工作后,向所述代理设备发送回传指令,以指示所述代理设备将在替代该主用设备工作期间所存储的数据传输给该主用设备。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器,使得通过该计算机或其他可编程数据处理设备的处理器执行的指令可实现流程图中的一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种集群系统,其特征在于,该集群系统包括:
主用系统,由N个主用设备组成,用于通过外部访问地址接收来自所述集群系统外部的访问请求;其中N≥1;
备用系统,由M个备用设备组成,且至少包括一个处于调度系统DCS工作机状态的DCS工作机,其中,所述DCS工作机用于:在检测到主用设备故障时,从所述备用系统中选取可用的备用设备作为代理设备;根据预先获取的所述故障主用设备的配置信息和外部访问地址,对选取出的代理设备进行配置,以使所述代理设备替代所述故障主用设备通过所述外部访问地址接收来自所述集群系统外部的访问请求;其中M≥1。
2.如权利要求1所述的集群系统,其特征在于,所述备用系统仅由一个处于DCS工作机状态的DCS工作机组成,或
所述备用系统由一个处于DCS工作机状态的DCS工作机和一个处于DCS备份机状态的DCS备份机组成,或
所述备用系统由一个处于DCS工作机状态的DCS工作机、一个处于DCS备份机状态的DCS备份机以及若干处于空闲状态的空闲机组成;
当所述备用系统仅由一个所述DCS工作机组成,该备用系统在检测到主用设备故障时,选取自身作为所述代理设备;
当所述备用系统由一个DCS工作机和一个DCS备份机组成,该备用系统在检测到主用设备故障时,优先选取所述DCS备份机作为所述代理设备;
当所述备用系统由一个DCS工作机、一个DCS备份机、以及若干空闲机组成,该备用系统在检测到主用设备故障时,优先选取一个空闲机作为所述代理设备。
3.如权利要求2所述的集群系统,其特征在于,所述DCS工作机还用于:
检测所述备用系统中除自身之外的其它各备用设备的工作状态,并获取各设备的配置信息和/或外部访问地址;
在检测到主用设备故障时,从工作状态正常的各备用设备选取所述代理设备。
4.如权利要求3所述的集群系统,其特征在于,所述DCS工作机还用于:在检测到系统中DCS备份机故障或不存在DCS备份机时,将工作状态正常的任一空闲机转换为DCS备份机。
5.如权利要求4所述的集群系统,其特征在于,所述DCS备份机具体用于:
检测DCS工作机的工作状态,并对存储于所述DCS工作机的配置信息和外部访问地址进行备份;
在检测到所述DCS工作机故障时,将自身转换为DCS工作机,并利用已备份的配置信息和外部访问地址,替代故障的DCS工作机工作。
6.如权利要求1-5任一所述的集群系统,其特征在于,所述DCS工作机还用于:
在检测到主用设备故障恢复后,根据替代该主用设备工作的代理设备的配置信息和外部访问地址,配置该主用设备,并在该主用设备恢复正常工作后,向所述代理设备发送回传指令,以指示所述代理设备将在替代该主用设备工作期间所存储的数据传输给该主用设备。
CN201410848200.2A 2014-12-29 2014-12-29 一种集群系统 Pending CN105812420A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410848200.2A CN105812420A (zh) 2014-12-29 2014-12-29 一种集群系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410848200.2A CN105812420A (zh) 2014-12-29 2014-12-29 一种集群系统

Publications (1)

Publication Number Publication Date
CN105812420A true CN105812420A (zh) 2016-07-27

Family

ID=56421554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410848200.2A Pending CN105812420A (zh) 2014-12-29 2014-12-29 一种集群系统

Country Status (1)

Country Link
CN (1) CN105812420A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733808A (zh) * 2018-05-21 2018-11-02 试金石信用服务有限公司 大数据软件系统切换方法、系统、终端设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179432A (zh) * 2007-12-13 2008-05-14 浪潮电子信息产业股份有限公司 一种多机环境中实现系统高可用的方法
CN101873223A (zh) * 2010-05-27 2010-10-27 天讯瑞达通信技术有限公司 基于ip切换的n+m服务备份机制
CN103002065A (zh) * 2012-12-14 2013-03-27 大唐移动通信设备有限公司 一种主用设备与备用设备共用ip地址的方法和装置
CN103441863A (zh) * 2013-08-08 2013-12-11 中国民航大学 一种空管自动化系统中的双服务器热备系统及控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179432A (zh) * 2007-12-13 2008-05-14 浪潮电子信息产业股份有限公司 一种多机环境中实现系统高可用的方法
CN101873223A (zh) * 2010-05-27 2010-10-27 天讯瑞达通信技术有限公司 基于ip切换的n+m服务备份机制
CN103002065A (zh) * 2012-12-14 2013-03-27 大唐移动通信设备有限公司 一种主用设备与备用设备共用ip地址的方法和装置
CN103441863A (zh) * 2013-08-08 2013-12-11 中国民航大学 一种空管自动化系统中的双服务器热备系统及控制方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733808A (zh) * 2018-05-21 2018-11-02 试金石信用服务有限公司 大数据软件系统切换方法、系统、终端设备及存储介质
CN108733808B (zh) * 2018-05-21 2022-09-20 试金石信用服务有限公司 大数据软件系统切换方法、系统、终端设备及存储介质

Similar Documents

Publication Publication Date Title
CN109815049B (zh) 节点宕机恢复方法、装置、电子设备及存储介质
CN106331098B (zh) 一种服务器集群系统
US10601657B2 (en) Instance node management method and management device
CN109669762B (zh) 云计算资源管理方法、装置、设备及计算机可读存储介质
CN105933407B (zh) 一种实现Redis集群高可用的方法及系统
US9112887B2 (en) Mirroring solution in cloud storage environment
CN103152419B (zh) 一种云计算平台的高可用集群管理方法
EP3142011B1 (en) Anomaly recovery method for virtual machine in distributed environment
EP3210367B1 (en) System and method for disaster recovery of cloud applications
CN108270726B (zh) 应用实例部署方法及装置
CN104408071A (zh) 一种基于集群管理器的分布式数据库高可用方法及系统
CN108199962B (zh) 地址迁移方法、装置、网络设备及可读存储介质
CN102394914A (zh) 集群脑裂处理方法和装置
CN105554130A (zh) 基于分布式存储系统的NameNode切换方法和切换装置
CN104036043A (zh) 一种mysql高可用的方法及管理节点
CN105812169A (zh) 一种主备机切换方法及装置
CN105959145B (zh) 一种适用高可用性集群的并行管理服务器的方法及系统
CN114328033A (zh) 保持高可用设备组业务配置一致性的方法及装置
CN117370316A (zh) 数据库的高可用管理方法和装置、电子设备及存储介质
CN117240694A (zh) 一种基于keepalived的双机热备主备切换方法、装置及系统
CN105812420A (zh) 一种集群系统
CN115878361A (zh) 数据库集群的节点管理方法、装置及电子设备
CN112491633B (zh) 一种多节点集群的故障恢复方法、系统及相关组件
CN105939203A (zh) 表项同步方法以及装置
CN112612652A (zh) 分布式存储系统异常节点重启方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160727

RJ01 Rejection of invention patent application after publication