CN102006190A - 一种高可用集群备份系统及其备份方法 - Google Patents

一种高可用集群备份系统及其备份方法 Download PDF

Info

Publication number
CN102006190A
CN102006190A CN 201010560550 CN201010560550A CN102006190A CN 102006190 A CN102006190 A CN 102006190A CN 201010560550 CN201010560550 CN 201010560550 CN 201010560550 A CN201010560550 A CN 201010560550A CN 102006190 A CN102006190 A CN 102006190A
Authority
CN
China
Prior art keywords
equipment
auxiliary equipment
master control
supervising device
control set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010560550
Other languages
English (en)
Other versions
CN102006190B (zh
Inventor
肖健明
李海东
唐金荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN2010105605500A priority Critical patent/CN102006190B/zh
Publication of CN102006190A publication Critical patent/CN102006190A/zh
Application granted granted Critical
Publication of CN102006190B publication Critical patent/CN102006190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种高可用集群备份系统及其备份方法,克服现有高可用集群备份技术不能对故障模块进行定位的不足。其中该系统包括互为备份的两台设备,每一设备均包括主控装置、监控装置及附属装置群,任一设备中的监控装置均用于监控所属设备中主控装置及附属装置群中各附属装置的工作状态,获得运行状态数据并封装成监控帧数据发送给另一设备,还用于在另一设备中的监控装置监控到所属主控装置及附属装置群中各附属装置出现工作故障时,对另一设备中的监控装置发送的监控帧数据进行解析和辨别,获得解析结果及工作故障的严重程度,并根据解析结果及工作故障的严重程度采取控制措施。本发明通过硬件设备来实现HA,不占用设备主控装置的带宽。

Description

一种高可用集群备份系统及其备份方法
技术领域
本发明涉及控制技术,尤其涉及一种高可用(High Availability,HA)集群备份系统及其备份方法。
背景技术
随着数字技术的发展,当今有各个领域都需要保证设备运行的高可靠性,特别是银行、电信、导航等民生领域,以及金融、交通甚至军事领域等等都是如此。而现在云计算、云存储技术的兴起,对设备的高可靠性需求更是提到了前所未有的高度。
所有的设备都有使用寿命,而且各种设备的使用寿命又都不尽相同,另外,设备运行过程中,也可能出现各种故障。这样,各种设备组合在一起的大型系统,就无法准确知道设备在何时会出现故障,进而难以高效预防对用户可能造成的损失。
软件双机HA系统能够提高可靠性保证,其是在系统的主CPU中运行HA后台管理进程,该进程能对本机的许多主要模块进行侦测,如CPU、数据库、操作系统以及网络等。当本机发现所侦测的这些模块出现故障了,将停止向备份机发送HA信号。备份机将在此时接管主机的全部工作,以保证对外界的服务正常运行。
但是,现有的软件双机HA集群备份技术,不能对故障模块进行定位,也不能根据故障严重程度进行区别性处理。同时软件HA将占用主机的资源,这将影响主机的主要性能。
在以往的HA技术中,备份设备往往不参与工作,只是监视主设备的工作状态,只有在主设备出现故障时,备份设备才接管主设备的工作。这将带来硬件资源的浪费,因为备份设备也在一起的老化,并且在大部分时间中未能发挥其应有的效益。
发明内容
本发明所要解决的技术问题是需要提供一种双机集群备份技术,克服现有高可用集群备份技术不能对故障模块进行定位的不足。
为了解决上述技术问题,本发明提供了一种双机集群备份系统,包括互为备份的第一设备和第二设备,每一设备均包括主控装置、监控装置及附属装置群,其中:
任一设备中的监控装置,均用于监控所属设备中主控装置及附属装置群中各附属装置的工作状态,获得运行状态数据并封装成监控帧数据发送给另一设备,还用于在所述另一设备中的监控装置监控到所属主控装置及附属装置群中各附属装置出现工作故障时,对所述另一设备中的监控装置发送的监控帧数据进行解析和辨别,获得解析结果及所述工作故障的严重程度,并根据所述解析结果及所述工作故障的严重程度采取控制措施。
优选地,所述任一设备中的监控装置,均包含有故障识别部件;所述故障识别部件预先存储有所述另一设备的主控装置及附属装置群中的各附属装置的故障类型,用于根据所述故障类型对所述工作故障进行所述辨别,获得所述工作故障的严重程度。
优选地,所述监控帧数据包括主控装置软硬件运行状态及附属装置群中各附属装置的运行状态。
优选地,所述监控帧数据进一步包括前导符、帧校验位以及停止位。
为了解决上述技术问题,本发明还提供了一种双机集群备份系统的备份方法,所述双机集群备份系统包括互为备份的第一设备和第二设备,每一设备均包括主控装置、监控装置及附属装置群;
在所述方法中:
任一设备中的监控装置均监控所属设备中主控装置及附属装置群中各附属装置的工作状态,获得运行状态数据并封装成监控帧数据发送给另一设备;
在所述另一设备中的监控装置监控到所属主控装置及附属装置群中各附属装置出现工作故障时,所述任一设备中的监控装置对所述另一设备中的监控装置发送的监控帧数据进行解析和辨别,获得解析结果及所述工作故障的严重程度,并根据所述解析结果及所述工作故障的严重程度采取控制措施。
优选地,所述任一设备中的监控装置预先存储有所述另一设备的主控装置及附属装置群中的各附属装置的故障类型,根据所述故障类型对所述工作故障进行所述辨别,获得所述工作故障的严重程度。
优选地,所述监控帧数据包括主控装置软硬件运行状态及附属装置群中各附属装置的运行状态。
优选地,所述监控帧数据进一步包括前导符、帧校验位以及停止位。
本发明技术方案相对于以往关于提高设备可靠性的HA技术的不同之处在于,本发明通过硬件设备(如控制芯片等)来实现HA,其优点在于不会占用设备主控装置的带宽。进一步地,两台设备互为备份,在同时完成工作的基础上,还同时监视本设备及另一设备的运行状态,并针对性地采取相应的措施,提高了资源利用率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明实施例所述的双机集群备份系统的组成示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。
首先,如果不冲突,本发明实施例以及实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一、一种双机集群(HA)备份系统
本实施例包括第一设备和第二设备,两设备互为备份,每一设备均包括主控装置、监控装置及附属装置群。任一设备中的监控装置,用于监控所属设备中主控装置及附属装置群中各附属装置的工作状态,获得运行状态数据并封装成监控帧数据发送给另一设备,还用于在另一设备中的监控装置监控到所属主控装置及附属装置群中各附属装置出现工作故障时,对另一设备中的监控装置发送的监控帧数据进行解析和辨别,获得解析结果及工作故障的严重程度,并根据解析结果及工作故障的严重程度采取控制措施。
如图1所示,本实施例主要包括第一设备100和第二设备200,其中第一设备100包括有第一主控装置110、第一监控装置120、第一附属装置群130;第二设备200包括有第二主控装置210、第二监控装置220、第二附属装置群230。第一设备100的组成与结构,均与第二设备200相同,包括两个设备各自所包括的主控装置、监控装置,附属装置群所包含的各种附属装置等等,也都是一模一样的。附属装置群(第一附属装置群130和第二附属装置群230)中的附属装置比如包括电源、风扇、温度传感器等等。
第一监控装置120,用于监控第一主控装置110及第一附属装置群130中各附属装置的工作状态,获得第一运行状态数据,将第一运行状态数据封装成第一监控帧数据后发送给第二监控装置220;
第二监控装置220,用于接收第一监控装置120发送的第一监控帧数据,在第一监控装置120监控到第一主控装置110及第一附属装置群130中各附属装置出现工作故障时,对第一监控帧数据进行解析和辨别,获得第一解析结果及第一工作故障的严重程度,并根据第一解析结果及第一工作故障的严重程度采取相应的控制措施。
需要说明的是,第一设备100和第二设备200二者互为备份,因此前述的第一监控装置220,同样可以用于监控第而主控装置210及第二附属装置群230中各附属装置的工作状态,获得第二运行状态数据,将第二运行状态数据封装成第二监控帧数据后发送给第一监控装置120;前述的第一监控装置120同样可以用于接收第二监控装置220发送的第二监控帧数据,在第二监控装置220监控到第二主控装置210及第二附属装置群230中各附属装置出现工作故障时,对第二监控帧数据进行解析和辨别,获得第二解析结果及第二工作故障的严重程度,并根据第二解析结果及第二工作故障的严重程度采取相应的控制措施。
以下论述中,称第一设备100和第二设备200的其中之一为主机设备时,另一则相应地为其备份设备。另外,需要说明的是,前述以及后述的“第一”、“第二”仅是为了描述的方便,以相互区分具有相同功能和/或含义的两者,除此之外并无其他含义。
在正常情况下,互为备份的两台设备(第一设备100和第二设备200)协同工作,这种处理方法可以提升在正常情况下的系统处理速度。而在某台设备出现故障的时候,没有出现故障的设备就会出现故障的那台设备所处理的任务进行完全的接管。
设备中的监控装置对设备中的主控装置及附属装置群的运行状态进行监控(第一监控装置120对第一设备100中的第一主控装置110及第一附属装置群130中的附属装置的运行状态进行监控,以及第二监控装置220对第二设备200中的第二主控装置210及第二附属装置群230的附属装置的运行状态进行监控),获得运行状态数据(第一监控装置120获得第一运行状态数据,第二监控装置220获得第二运行状态数据)。监控装置把监控获得的运行状态数据封装成监控帧数据(将第一运行状态数据封装成第一监控帧数据,将第二运行状态数据封装成第二监控帧数据),周期性地发送给备份设备的监控装置。监控帧数据中的每一位都有其特定的含义,它们代表着监控对象的运行状况。监控装置还能对主控装置、附属装置群中的各种附属装置进行简单的管理(例如开启和停止等)。
在实际应用中,上述的监控装置可以是低成本的CPU(如8051单片机等),在这个CPU当中可以运行一个简单的程序,该程序可以对本设备的各部分运行状态进行监控,并把各部分监控状态封装成数据帧发送给另一设备的监控装置,该程序还具有对本设备监控状态数据帧以及接收到的另一设备的监控装置发送过来的监控状态数据帧进行解析的功能,还可以对解析后的结果采取相应的进一步措施。
监控装置包含有故障识别部件,该故障识别部件预先存储有另一设备中监控装置的监控对象(即另一设备的主控装置及附属装置群中的各附属装置)的故障类型,用于根据该故障类型能对监控对象所出现的工作故障进行辨别,获得工作故障的严重程度,然后依据所获得的工作故障的严重程度采取相应的控制措施。
例如:当第一设备100中的第一监控装置120监控到第一主控装置110运行出现故障(如运行不正常)时,就将含有第一主控装置120出现故障的监控帧数据发送给第二设备200的第二监控装置220,并由该第二监控装置220采取进一步措施,而该第一监控装置120则关闭所监控的第一主控装置110及第一附属装置群130中的各附属装置。
第二设备200的第二监控装置220对第一设备100所发送过来的监控帧数据进行解析,获得第一解析结果,并根据第一解析结果采取不同的措施。例如:
第一解析结果表示第一设备100的第一主控装置110出现了故障,那么第二设备200的第二监控装置220即通知自身所监控的第二主控装置210全部接管第一设备100的第一主控装置110处理的全部数据处理任务,同时发送第一设备出现故障的第一告警消息,发送的第一告警消息包括该第一解析结果,以及对故障的初步判断。另外,还可以同时点亮第一设备100的故障报警灯。
在实际应用中,上述的故障识别部件可以是独立的功能实体,也可以是监控装置集成有此功能,比如用程序来对数据帧进行解析来实现。相比较而言,程序解析的方法在一定程度上可能会相对简单,因为监控装置本身可以有一个CPU。
以上是以第一设备出现故障为例进行说明的,实际上,第一设备100与第二设备200互为备份设备,它们的性能以及工作方式等都完全相同,各自的运行状态的信息会互相发送。设备在运行时每隔一段时间都会向对方转达自己的工作状态,如果在某时间段后没有收到对方设备发送来的信息,则也可以认为对方设备已经出现故障,这种情况下,本方设备可以主动接管对方设备所处理的所有数据处理任务,并为对方设备进行故障报警。
假定两台设备一开始都正常运行。在运行当中,各自的监控装置分别相互独立地对本设备的主控装置及附属装置群进行监控,同时也接收对方设备监控帧数据并进行解析,这样,就可以知道本设备和对方设备的运行状态,并对运行采取恰当的管理措施。
第一监控装置120还可以对监控第一主控装置110及第一附属装置群130中的附属装置的运行状态所产生的第一运行状态数据进行处理。具体地,对第一运行状态数据解析,判断第一主控装置110及第一附属装置群130中的附属装置的运行是否出错。如果运行正常,则把第一运行状态数据发送给第二设备200的第二监控装置220;如果出错,则对错误的危害程度进行评估,如果评估出错误危害性较小,则向管理人员发送出错信息,同时把出错信息发送给第二设备200的第二监控装置220;如果评估出错位危害性较大,则向第二设备200的第二监控装置220发送严重出错信息,同时关闭第一主控装置110及第一附属装置群130中的各附属装置,最终关闭该第一监控装置本身。
相应地,第二监控装置220同样可以对监控第二主控装置210及第二附属装置群230中的附属装置的运行状态所产生的第二运行状态数据进行同样性质的处理。
前述的监控帧数据,本实施例中包括如下组成部分:
1、4比特(bit)前导符;
2、1bit做起始位,附属装置群中的每个附属装置的运行状态各占1bit,主控装置的运行状态占2bit,然后再有1bit做奇偶校验,1bit做停止位。
本实施例中的监控帧数据可以如下形式:
 0   1   2   3   4   5   6   7   8   9   10   11   12
bit0-bit3,为每帧数据的前导符(假定前导符为1011,即每帧数据都以1011开始);
bit4,为数据域起始位,可设定为0;
bit5,为主控装置软件运行状态,1表示正常,0表示异常;
bit6,为主控装置硬件运行状态,1表示正常,0表示异常;
bit7,为附属装置群中的第一附属装置的运行状态,1表示正常,0表示异常;
bit8,附属装置群中的第二附属装置的运行状态,1表示正常,0表示异常;
bit9,附属装置群中的第三附属装置的运行状态,1表示正常,0表示异常;
bit10,用于表示该数据帧是表示那一台设备的运行状态,1表示第二备份设备,0表示第一备份设备;
Bit11,为帧校验位;
Bit12,为停止位,设为0。
对监控帧数据各位定义可以根据实际硬件的数量以及及软件解析方法自行定义,对每一组成部分所占用的bit数也可以根据实际情况进行调整。
实施例二、一种双机集群备份系统的备份方法
如图1所示实施例所示,本实施例中双机集群备份系统包括互为备份的第一设备和第二设备,每一设备均包括主控装置、监控装置及附属装置群;在该方法中:
任一设备中的监控装置均监控所属设备中主控装置及附属装置群中各附属装置的工作状态,获得运行状态数据并封装成监控帧数据发送给另一设备;
在另一设备中的监控装置监控到所属主控装置及附属装置群中各附属装置出现工作故障时,任一设备中的监控装置对另一设备中的监控装置发送的监控帧数据进行解析和辨别,获得解析结果及工作故障的严重程度,并根据解析结果及工作故障的严重程度采取控制措施。
优选地,任一设备中的监控装置预先存储有另一设备的主控装置及附属装置群中的各附属装置的故障类型,根据故障类型对工作故障进行辨别,获得工作故障的严重程度。
如前所述,本实施例中的监控帧数据包括主控装置软硬件运行状态及附属装置群中各附属装置的运行状态,还可以进一步包括前导符、帧校验位以及停止位。
需要说明的是,本发明中的设备,可以是装置、子系统、板卡或者其他类似的功能体等等,比如为了提高可靠性时的两块完全相同的板卡,即可视为两个互为备份的第一设备和第二设备。
本发明所提出的硬件HA技术与现有的软件HA技术的主要区别包含:
1)本发明提供的硬件HA技术拥有物体实体上独立的HA硬件模块,而软件HA技术没有(它只是在系统中拥有一个软件HA模块);
2)本发明提出的硬件HA模块,其不仅具有通常的HA功能,同时还能根据侦测到的信息对本机进行管理,而现有的软件HA技术无法根据侦测到的信息对本机进行管理;
3)本发明提供的硬件HA技术所能侦测的模块比现有的软件HA技术所能侦测到的更多,其不仅能侦测软件HA技术所能侦测的模块,还能侦测如散热装置等之类的模块;因此本发明技术方案除了能更好地提供可靠性保证以外,还能在一定程度上起到保护设备的作用,使设备在出现故障的时候不至于进一步地受到损坏;
4)本发明提出的硬件HA技术在HA信号方面也进行了改进;现有的软件HA技术中的HA信号,一般只是通知备份机本机的工作是否正常;而本发明提供的HA信号除了能通知备份机主机是否正常以外,同时还能通知备份机在出问题时的故障信息;备份机还能通过该故障信息判断主机故障的严重程度,并根据严重程度作出相应的反应;
5)本发明提出的硬件HA技术有其自己的运行机制,不用增加主机主CPU的开销,而现有的软件HA技术将增加主机主CPU的开销,相比而言,节约了CPU利用效率。
本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (8)

1.一种双机集群备份系统,其特征在于,包括互为备份的第一设备和第二设备,每一设备均包括主控装置、监控装置及附属装置群,其中:
任一设备中的监控装置,均用于监控所属设备中主控装置及附属装置群中各附属装置的工作状态,获得运行状态数据并封装成监控帧数据发送给另一设备,还用于在所述另一设备中的监控装置监控到所属主控装置及附属装置群中各附属装置出现工作故障时,对所述另一设备中的监控装置发送的监控帧数据进行解析和辨别,获得解析结果及所述工作故障的严重程度,并根据所述解析结果及所述工作故障的严重程度采取控制措施。
2.根据权利要求1所述的系统,其特征在于:
所述任一设备中的监控装置,均包含有故障识别部件;所述故障识别部件预先存储有所述另一设备的主控装置及附属装置群中的各附属装置的故障类型,用于根据所述故障类型对所述工作故障进行所述辨别,获得所述工作故障的严重程度。
3.根据权利要求1所述的系统,其特征在于:
所述监控帧数据包括主控装置软硬件运行状态及附属装置群中各附属装置的运行状态。
4.根据权利要求3所述的系统,其特征在于:
所述监控帧数据进一步包括前导符、帧校验位以及停止位。
5.一种双机集群备份系统的备份方法,其特征在于,所述双机集群备份系统包括互为备份的第一设备和第二设备,每一设备均包括主控装置、监控装置及附属装置群;
在所述方法中:
任一设备中的监控装置均监控所属设备中主控装置及附属装置群中各附属装置的工作状态,获得运行状态数据并封装成监控帧数据发送给另一设备;
在所述另一设备中的监控装置监控到所属主控装置及附属装置群中各附属装置出现工作故障时,所述任一设备中的监控装置对所述另一设备中的监控装置发送的监控帧数据进行解析和辨别,获得解析结果及所述工作故障的严重程度,并根据所述解析结果及所述工作故障的严重程度采取控制措施。
6.根据权利要求5所述的方法,其特征在于:
所述任一设备中的监控装置预先存储有所述另一设备的主控装置及附属装置群中的各附属装置的故障类型,根据所述故障类型对所述工作故障进行所述辨别,获得所述工作故障的严重程度。
7.根据权利要求5所述的方法,其特征在于:
所述监控帧数据包括主控装置软硬件运行状态及附属装置群中各附属装置的运行状态。
8.根据权利要求7所述的方法,其特征在于:
所述监控帧数据进一步包括前导符、帧校验位以及停止位。
CN2010105605500A 2010-11-23 2010-11-23 一种高可用集群备份系统及其备份方法 Active CN102006190B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105605500A CN102006190B (zh) 2010-11-23 2010-11-23 一种高可用集群备份系统及其备份方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105605500A CN102006190B (zh) 2010-11-23 2010-11-23 一种高可用集群备份系统及其备份方法

Publications (2)

Publication Number Publication Date
CN102006190A true CN102006190A (zh) 2011-04-06
CN102006190B CN102006190B (zh) 2012-10-31

Family

ID=43813282

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105605500A Active CN102006190B (zh) 2010-11-23 2010-11-23 一种高可用集群备份系统及其备份方法

Country Status (1)

Country Link
CN (1) CN102006190B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102185710A (zh) * 2011-04-26 2011-09-14 中兴通讯股份有限公司 一种单板日志的管理方法及日志管理系统
CN103259829A (zh) * 2012-03-05 2013-08-21 合肥华云通信技术有限公司 一种提高云计算调度系统备份效率的方法
CN104679710A (zh) * 2013-11-28 2015-06-03 中国科学院沈阳自动化研究所 一种面向半导体生产线搬运系统软件故障快速恢复方法
WO2018010603A1 (zh) * 2016-07-13 2018-01-18 杭州海康威视数字技术股份有限公司 基于视频云存储系统的存储模式升级方法、装置和系统
CN113359409A (zh) * 2021-07-14 2021-09-07 江苏天芯微半导体设备有限公司 一种多腔体cvd设备分布式控制系统及其方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004019588A1 (en) * 2002-08-26 2004-03-04 Koninklijke Philips Electronics N.V. Internet device providing quality and link information
CN1592231A (zh) * 2003-08-28 2005-03-09 蚬壳星盈科技(深圳)有限公司 高扩展性互联网超级服务器的维护单元结构及方法
CN1668015A (zh) * 2004-12-20 2005-09-14 华中科技大学 基于协同入侵检测的大规模网络安全防御系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004019588A1 (en) * 2002-08-26 2004-03-04 Koninklijke Philips Electronics N.V. Internet device providing quality and link information
CN1592231A (zh) * 2003-08-28 2005-03-09 蚬壳星盈科技(深圳)有限公司 高扩展性互联网超级服务器的维护单元结构及方法
CN1668015A (zh) * 2004-12-20 2005-09-14 华中科技大学 基于协同入侵检测的大规模网络安全防御系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102185710A (zh) * 2011-04-26 2011-09-14 中兴通讯股份有限公司 一种单板日志的管理方法及日志管理系统
CN103259829A (zh) * 2012-03-05 2013-08-21 合肥华云通信技术有限公司 一种提高云计算调度系统备份效率的方法
CN104679710A (zh) * 2013-11-28 2015-06-03 中国科学院沈阳自动化研究所 一种面向半导体生产线搬运系统软件故障快速恢复方法
WO2018010603A1 (zh) * 2016-07-13 2018-01-18 杭州海康威视数字技术股份有限公司 基于视频云存储系统的存储模式升级方法、装置和系统
CN113359409A (zh) * 2021-07-14 2021-09-07 江苏天芯微半导体设备有限公司 一种多腔体cvd设备分布式控制系统及其方法

Also Published As

Publication number Publication date
CN102006190B (zh) 2012-10-31

Similar Documents

Publication Publication Date Title
CN103607297B (zh) 一种计算机集群系统的故障处理方法
CN108270726B (zh) 应用实例部署方法及装置
CN102006190B (zh) 一种高可用集群备份系统及其备份方法
CN110488701A (zh) 基于国产化处理器的网络和FlexRay总线的高可用热备份方法
CN105095001A (zh) 分布式环境下虚拟机异常恢复方法
CN105243004A (zh) 一种故障资源检测方法及装置
CN103246242B (zh) 工厂监视控制装置以及工厂监视控制方法
CN110609699B (zh) 维护存储系统的组件的方法、电子设备和计算机可读介质
CN110427283A (zh) 一种双余度的燃油管理计算机系统
CN109271270A (zh) 存储系统中底层硬件的故障排除方法、系统及相关装置
US20120239988A1 (en) Computing unit, method of managing computing unit, and computing unit management program
CN107005440B (zh) 一种链路故障定位的方法、装置及系统
JP2018136882A (ja) 情報処理装置、情報処理システム及び情報処理装置制御方法
CN111104266A (zh) 访问资源的分配方法、装置、存储介质和电子设备
CN109219105B (zh) 路由切换方法以及路由切换系统
CN106534262A (zh) 一种网络信息系统故障的切换方法
Brandt et al. New systems, new behaviors, new patterns: Monitoring insights from system standup
CN104346233A (zh) 一种用于计算机系统的故障恢复方法及装置
KR20230064270A (ko) 직류 송배전망용 고속 제어 플랫폼 장치, 방법 및 시스템
CN112650168A (zh) 分布式控制系统及其动态调度资源的方法
JPH1188471A (ja) 試験方法及び試験装置
KR101505491B1 (ko) Pod 기반의 모듈형 데이터 센터 및 그의 모니터링 방법
Wahanani Performance Analysis Of Failover Cluster For System Recovery
JP7334554B2 (ja) 機器管理システム及び機器管理方法
JP7532882B2 (ja) 障害判定装置、障害判定方法、及び、障害判定プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201111

Address after: 215100 No. 1 Guanpu Road, Guoxiang Street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province

Patentee after: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd.

Address before: 100085 Beijing, Haidian District on the road to information on the ground floor, building 2-1, No. 1, C

Patentee before: Inspur (Beijing) Electronic Information Industry Co.,Ltd.