CN102045187A - 一种利用检查点实现高可用性系统的方法和设备 - Google Patents

一种利用检查点实现高可用性系统的方法和设备 Download PDF

Info

Publication number
CN102045187A
CN102045187A CN2009102356749A CN200910235674A CN102045187A CN 102045187 A CN102045187 A CN 102045187A CN 2009102356749 A CN2009102356749 A CN 2009102356749A CN 200910235674 A CN200910235674 A CN 200910235674A CN 102045187 A CN102045187 A CN 102045187A
Authority
CN
China
Prior art keywords
master
main
module
backup
checkpoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009102356749A
Other languages
English (en)
Other versions
CN102045187B (zh
Inventor
魏巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN 200910235674 priority Critical patent/CN102045187B/zh
Publication of CN102045187A publication Critical patent/CN102045187A/zh
Application granted granted Critical
Publication of CN102045187B publication Critical patent/CN102045187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本发明公开了一种利用检查点实现高可用性系统的方法和设备,其中,该方法包括以下步骤:A,检查点模块模拟用于高可用性HA系统的主用器件的备份器件,建立和所述主用器件之间的HA连接,并通过建立的HA连接获取所述主用器件的状态同步信息;B,所述检查点模块获知所述主用器件出现故障时,利用所述状态同步信息接替该主用器件处理业务,并在获知出现故障的主用器件重启时,使该重启后的主用器件重新处理业务,自身降为该重启后的主用器件的备份。采用本发明,将HA机制和检查点机制联系起来,避免现有技术由于HA机制和检查点机制完全独立所带来的缺陷。

Description

一种利用检查点实现高可用性系统的方法和设备
技术领域
本发明涉及网络管理技术,特别涉及一种利用检查点(Checkpoint)实现高可用性(HA:High availability)系统的方法和设备。
背景技术
检查点,部分情况下又称为snapshot,是提高集群系统容错能力,满足低端设备高可用性要求的一项重要机制,其主要思想是:低端设备中的器件在预设的条件达到时,将当前正在执行程序的状态存储在一个稳定的存储器内,其中,预设的条件可为系统运行状态的变换、管理员的命令或者预设的时间等情况,以便在故障后系统可以从该状态恢复程序的执行。如图1所示,用于处理业务的器件1在运行过程中将状态I存储在文件1、状态II存储在文件2以及状态III存储在文件3中,当器件1出现故障基于文件1重新启动时,该器件1就能够恢复到文件1存储的状态I;相应地,当基于文件2或3启动时,就能够恢复到状态II和III。
通常,检查点机制适用于一些低端性能的设备;而对于一些高端性能的设备,为了提高高端设备的高可靠性,通常会采用HA机制。其中,HA机制的主要思想是:在系统中为处理业务的器件(在HA机制中记为主用器件)提供冗余备份(记为备份器件),比如备用单板,备用子卡等,部分情况下还可能是备份进程(为便于描述,通称为备份器件);以便主用器件发生了故障或者异常时,该备份器件可以快速的切换为主用器件,并接管出现故障的主用器件处理的相应服务。
综上可以看出,现有的HA机制和检查点机制为两种完全不同、且相互独立的机制,如果现有一设备既需要支持HA机制,又需要支持检查点机制,即该设备既存在低端性能又存在高端性能,就需要该设备的软件显示两套不同的实现代码,其中一套代码用于支持HA机制,另一套代码用于支持检查点机制,这样显然会带来工作量的增加;另外,由于HA机制和检查点机制完全不同,这也会导致软件难以维护,并增加软件编译的复杂度。
发明内容
本发明提供了一种利用检查点实现高可用性系统的方法和设备,以便将HA机制和检查点机制联系起来,避免现有技术由于HA机制和检查点机制完全独立所带来的缺陷。
一种利用检查点实现高可用性系统的方法,该方法包括以下步骤:
A,检查点模块模拟用于HA系统的主用器件的备份器件,建立和所述主用器件之间的HA连接,并通过建立的HA连接获取所述主用器件的状态同步信息;
B,所述检查点模块获知所述主用器件出现故障时,利用所述状态同步信息接替该主用器件处理业务,并在获知出现故障的主用器件重启时,使该重启后的主用器件重新处理业务,自身降为该重启后的主用器件的备份。
一种利用检查点实现高可用性系统的设备,包括:通信单元和处理单元;其中,
所述通信单元模拟用于高可用性HA系统的主用器件的备份器件,建立和所述主用器件之间的HA连接,并通过建立的HA连接获取所述主用器件的状态同步信息;
所述处理单元用于获知所述主用器件出现故障时,利用所述状态同步信息接替该主用器件处理业务,并在获知出现故障的主用器件重启时,使该重启后的主用器件重新处理业务,自身降为该重启后的主用器件的备份。
由以上技术方案可以看出,本发明通过增加用于担任主用器件的备份的检查点模块,使检查点模块获取主用器件的状态同步信息,并在获知到主用器件出现故障时,利用获取的状态同步信息接替该主用器件处理业务,并在获知出现故障的主用器件重启时,使该重启后的主用器件重新处理业务,自身降为该重启后的主用器件的备份。可以看出,这种方式类似于现有HA机制中为主用器件提供备份器件,主用器件发生了故障或者异常时,备份器件快速切换为主用器件,并接管出现故障的主用器件处理的相应服务的方式,如此,当现有的设备既存在支持检查点机制的低端性能又存在支持HA机制的高端性能时,也可以仅维护一套实现代码,如此,简化应用软件的设计,避免现有技术由于HA机制和检查点机制完全独立所带来的缺陷。
附图说明
图1为现有的检查点机制的实现流程图;
图2为本发明实施例提供的基本流程图;
图3为本发明实施例提供的第一详细流程图;
图4为本发明实施例提供的第二详细流程图
图4a为本发明实施例提供的HA连接第一示意图;
图4b为本发明实施例提供的HA连接第二示意图;
图5为本发明实施例提供的设备结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
本发明实施例中,提出了一种利用检查点实现HA系统的方法,采用本发明,可使检查点机制和HA机制联动起来,避免了现有技术由于HA机制和检查点机制完全独立所带来的缺陷,实现了仅维护一套类似HA机制的实现代码,简化应用软件的设计。
本发明实施例提出的利用检查点实现高可用性系统的方法中,需要增加一个以上的检查点模块,每一检查点模块所执行的操作如图2所示,主要包括以下步骤:
步骤201,检查点模块模拟用于HA系统的主用器件的备份器件,建立和所述主用器件之间的HA连接,并通过建立的HA连接获取所述主用器件的状态同步信息。
这里,检查点模块可以同时模拟一个以上主用器件的备份器件,本发明实施例并不具体限定。
步骤202,检查点模块获知主用器件出现故障时,利用获取的状态同步信息接替该主用器件处理业务,在获知出现故障的主用器件重启时,使该重启后的主用器件重新处理业务,自身降为该重启后的主用器件的备份。
这里,检查点模块获知主用器件出现故障时,自身从备用身份切换为主用身份,利用获取的状态同步信息接管出现故障的主用器件所处理的业务。当获知到出现故障的主用器件又重启时,使该重启后的主用器件重新恢复主用身份来处理业务,自身降为该重启后的主用器件的备份。
如此,实现了本发明实施例提供的基本流程。为使本发明实施例更加清楚,下面对本发明实施例提供的流程进行详细描述。
第一实施例:
参见图3,图3为本发明实施例提供的第一详细流程图。如图3所示,该流程可包括以下步骤:
步骤301,检查点模块模拟主用器件的备份器件,与主用器件建立HA连接。
通常,由于低端性能设备中一些器件并没有备份器件,但是都能执行对应的业务处理操作,以便实现对应的业务处理功能,本实施例为便于检查点机制与HA机制统一,可将低端性能设备中执行业务处理操作的器件记为主用器件。由于检查点模块作为主用器件的备份,则根据HA机制中备份器件的定义,可以知道,本步骤301中检查点模块用于监听主用器件,随时准备在主用器件出现故障时接管主用器件处理的业务。
这里,检查点模块和主用器件建立HA连接的过程可与现有HA机制中备份器件和主用器件建立HA连接的流程类似,这里不再详述。
需要说明的是,由于每一主用器件都能执行对应的业务处理操作,因此,优选地,可利用业务处理操作区分各个主用器件。本发明实施例中,可根据实际情况配置检查点模块担任哪几个主用器件的备份。通常,检查点模块可同时担任一个以上主用器件的备份,这里不具体限定。为便于描述,本实施例以检查点模块只担任一个主用器件的备份为例,本领域技术人员很容易根据该例得出担任多个主用器件的备份的流程,这里不再赘述。
步骤302,当HA连接建立完成后,主用器件将自身当前存储的状态同步信息同步给伪装成自身的备份器件的检查点模块。
如此,执行到本步骤302时,伪装成主用器件的检查点模块即可获得主用器件同步过来的状态同步信息。这里,步骤302中的状态同步信息具体为主用器件当前运行状态对应的数据,比如,主用器件当前的运行状态为存在表项1和表项2,则当前运行状态对应的数据为表项1和表项2中的数据。
步骤303,后续主用器件执行相关操作获得的实时同步数据通过所述HA连接同步给所述检查点模块。
如此,执行到本步骤303时,伪装成主用器件的检查点模块即可获得主用器件同步过来的实时同步数据。这里,实时同步数据具体为主用器件执行相关操作对应的数据,具体可包含删除数据、修改数据和添加数据中的至少一个。
可以看出,通过上述步骤301至步骤303实现了检查点模块通过建立的HA连接获取主用器件的状态同步信息的操作。
步骤304,伪装成主用器件的备份器件的检查点模块在获知该主用器件发生故障后,升级为主用器件,利用获取的状态同步信息接替出现故障的主用器件处理业务。
这里,检查点模块可按照现有的HA机制中备份器件感知主用器件出现故障的方法获知主用器件是否出现故障,之后,升级为主用器件。
执行到本步骤304时,如果主用器件出现故障,则主用器件和检查点模块之间存在的HA连接也就没有用处了,因此,本步骤304中,检查点模块可进一步取消自身和出现故障的主用器件之间的HA连接。
可以看出,本步骤304中,主用器件发生故障后,检查点模块可根据获取的状态同步信息继续执行出现故障的主用器件所处理的业务,优选地,本实施例中为减少检查点模块的负荷,可根据实际情况重启出现故障的主用器件。
步骤305,检查点模块在出现故障的主用器件重启后,重新和重启后的主用器件建立HA连接,并将处理的业务对应的数据通过重新建立的HA连接同步到重启后的该主用器件。
这里,由于每一主用器件都能执行对应的业务处理操作,因此,当出现故障的主用器件重启后,该重启后的主用器件会在系统中通过广播来确定谁当前正执行自身对应的业务处理操作,所述广播内容包含该主用器件对应的业务处理操作的标识信息,当检查点模块接收到广播后,如果自身正好执行操作标识信息对应的操作,则确定原来出现故障的主用器件已经重启了,于是和该重启后的主用器件重新建立HA连接,并进行数据同步。
步骤306,检查点模块完成数据同步后,主动触发重启后的主用器件恢复主用身份重新处理业务,自身降为该重启后的主用器件的备份。
这里,步骤306中检查点模块主动触发重启后的主用器件恢复主用身份重新处理业务,自身降为该重启后的主用器件的备份具体可为:检查点模块发送适用于HA机制中的主备倒换请求给重启后的主用器件,重启后的主用器件接收所述主备倒换请求后,恢复主用身份重新处理业务,并返回响应给检查点模块,当检查点模块接收到响应后,自身降为该重启后的主用器件的备份。
执行到本步骤306时,检查点模块又重新成为主用器件的备份。如此,系统恢复稳定状态,并按照上述类似步骤303至步骤306的操作继续执行,直至结束流程。
至此,实现了本发明实施例提供的完整流程。
可以看出,本实施例中提供的流程类似于现有HA机制中为主用器件提供备份器件,主用器件发生了故障或者异常时,备份器件快速切换为主用器件,并接管出现故障的主用器件处理的相应服务的流程,因此,当现有的设备既存在支持检查点机制的低端性能又存在支持HA机制的高端性能时,可维护一套实现代码,如此,简化应用软件的设计,避免现有技术由于HA机制和检查点机制完全独立所带来的缺陷。
需要说明的是,通常,主用器件是在预设的存储条件到达时存储状态同步信息(具体为主用器件在存储条件到达时的运行状态对应的数据),其中,预设的存储条件为系统运行状态的变换、管理员的命令或者预设的时间等情况,如果存储条件达不到,不管当前执行多少操作,主用器件都不会存储状态同步信息,但是根据上面步骤303的描述可以知道,主用器件却会将执行相关操作获得的实时同步数据都会通过当前存在的与检查点模块之间的HA连接同步给该检查点模块,如此,就会出现检查点模块接收的数据信息和主用器件存储的状态同步信息不一致的情况。比如,如果主用器件在时间段1内执行的数据处理操作为增加表项1、删除表项1、增加表项2、删除表项2、增加表项3和删除表项3,则主用器件就会将这6项数据处理操作对应的实时同步数据通过当前存在的与检查点模块之间的HA连接发送给检查点模块,如此,检查点模块即可得到这6项数据处理操作对应的实时同步数据,而若在时间段1结束时如果主用器件存储的条件未达到,则主用器件不会存储时间段1中的任何数据信息,这样,就出现了检查点模块接收的数据信息和主用器件存储的信息不一致的情况,进而也可以看出,检查点模块接收的这6项操作对应的数据相比于主用器件存储的状态同步信息是无效的。为了避免出现这种情况,本发明提出了另一种实施例,具体参见图4。
第二实施例:
参见图4,图4为本发明实施例提供的第二详细流程图。如图4所示,该流程可包括以下步骤:
步骤401,检查点模块模拟主用器件的第一备份器件,建立和所述主用器件的第一HA连接。
步骤402,当第一HA连接建立完成后,主用器件将自身当前存储的状态同步信息通过该第一HA连接同步给伪装成第一备份器件的检查点模块。
这里,步骤401至步骤402的具体操作分别与步骤301至步骤302类似,这里不再详述。
步骤403,后续检查点模块判断是否满足进一步同步所述主用器件状态同步信息的条件,如果否,执行步骤404;否则,转至步骤405。
这里,进一步同步所述主用器件状态同步信息的条件包括:预设时间间隔比如1分钟或者其他时间,或者预设的主用器件执行相关操作比如删除数据、修改数据、添加数据中的至少一个的次数等,本发明实施例并不具体限定。其中,由于主用器件后续执行相关操作时获得的实时同步数据都会同步给检查点模块,因此,如果同步主用器件状态同步信息的条件为预设的主用器件执行相关操作的个数,则步骤403具体为根据接收的主用器件发送的执行相关操作时获得的实时同步数据来判断当前是否满足进一步同步所述主用器件状态同步信息的条件。
需要说明的是,本步骤403是在主用器件运行正常时所执行的,如果执行到本步骤403,检查点模块获知主用器件出现故障,则即使当前满足进一步同步所述主用器件状态同步信息的条件,也不执行下述步骤404至步骤407;而是执行下述步骤408至步骤410,等出现故障的主用器件重启并恢复主用身份后,检查点模块再返回执行步骤403。
步骤404,后续所述主用器件执行相关操作获得的实时同步数据通过第一HA连接同步给检查点模块。之后,如果没有获知出主用器件出现故障,则返回执行步骤403;否则,执行下述步骤408,图4以没有获知出主用器件出现故障为例。
这里,步骤404具体可与图2所示的步骤303类似。
步骤405,检查点模块模拟所述主用器件的第二备份器件,建立与所述主用器件之间的第二HA连接。
执行到本步骤405时,可以看出,检查点模块与主用器件之间当前存在两条HA连接,进而可以看出主用器件当前模拟了主用器件的两个备份器件,具体可参见图4a所示的示意图。
步骤406,当第二HA连接建立完成后,主用器件通过该第二HA连接将自身当前存储的状态同步信息同步给伪装成第二备份器件的检查点模块。之后,执行步骤407。
需要说明的是,执行到本步骤406时,主用器件依然在执行相关操作时获得的实时同步数据通过第一HA连接同步给伪装成第一备份器件的检查点模块。可以看出,执行到本步骤406时,尽管检查点模块当前伪装成主用器件的两个备份器件,但是,该两个备份器件是相互独立、且互不影响的。
步骤407,当获知通过第二HA连接完成信息同步以后,所述检查点模块放弃伪装的所述主用器件第一备份器件的身份。之后,如果检查点模块没有获知出主用器件出现故障,将第二HA连接更新为第一HA连接,返回执行步骤403;否则,执行下述步骤408。图4以获知出主用器件出现故障为例。
这里,检查点模块获知信息同步的操作具体实现时可有多种形式,比如:由于主用器件和检查点模块已在步骤405中建立了第二HA连接,因此,检查点模块可通过该第二HA连接发送咨询请求,主用器件通过该第二HA连接接收到咨询请求时,响应该咨询请求,如此,检查点模块即可获知信息是否完成同步;或者主用器件在通过该第二HA连接完成信息同步后,可将已完成同步的通知发送给检查点模块,如此,检查点模块即可获知主用器件完成信息同步,本发明在此不作具体限定。
本步骤407中,检查点模块之所以放弃伪装的主用器件第一备份器件的身份,主要是因为检查点模块作为第二备份器件,已完全与主用器件达到信息同步,因此,为节省资源,可放弃伪装的主用器件第一备份器件的身份。可以看出,执行到本步骤407时,检查点模块和主用器件之间又恢复到仅存在一个HA连接的状态,以及主用器件当前仅存在1个处于工作状态的备份器件,具体可参见图4b所示的示意图。
可以看出,通过上述步骤401至步骤407实现了检查点模块通过建立的HA连接获取主用器件的状态同步信息的操作。
需要说明的是,上述步骤401至步骤407都是在主用器件运行正常时检查点模块与主用器件的通信流程,若主用器件出现故障,则执行步骤408至步骤410。
这里,步骤408至步骤410分别与图3所示的步骤304至步骤306类似,这里不再赘述。
至此,实现了本发明实施例提供的第二详细流程。
以上对本发明提供的方法进行了详细描述,下面对本发明提供的设备进行详述。
参见图5,图5为本发明实施例提供的利用检查点实现高可用性系统的设备结构图,如图5所示,该设备包括:通信单元501和处理单元502;
其中,通信单元501模拟用于HA系统的主用器件的备份器件,建立和所述主用器件之间的HA连接,并通过建立的HA连接获取所述主用器件的状态同步信息;
处理单元502用于获知所述主用器件出现故障时,利用所述状态同步信息接替该主用器件处理业务,并在获知出现故障的主用器件重启时,使该重启后的主用器件重新处理业务,自身降为该重启后的主用器件的备份。
优选地,本实施例中,通信单元501的结构具体实现时可有多种实现形式,为便于理解,下面列举两个实施例进行描述。
第一种结构形式:
比如,如图5所示,通信单元501可包括:第一建立模块5011和数据处理存储模块5012。
其中,第一建立模块5011,用于模拟所述主用器件的备份器件,与该主用器件建立HA连接;
第一数据处理模块5012,用于接收并存储主用器件通过所述HA连接同步的自身当前存储的状态同步信息,和后续执行相关操作获得的实时同步数据。
通过上面描述的通信单元501的第一种结构形式,能够实现通信单元501与主用器件进行数据同步。
优选地,本实施例还提供了通信单元501的另一种结构方式。
如图5所示,通信单元501可包括:第二建立模块5013和第二数据处理模块5014。
其中,第二建立模块5013用于模拟所述主用器件的第一备份器件,建立和所述主用器件的第一HA连接;以及接收到第二数据处理模块5014发送的建立通知后,模拟所述主用器件的第二备份器件,建立与所述主用器件之间的第二HA连接;
第二数据处理模块5014用于在第一HA连接建立完成后,接收并存储主用器件通过该第一HA连接同步的自身当前存储的状态同步信息,后续判断是否满足进一步同步所述主用器件状态同步信息的条件,如果是,发送建立通知给第二建立模块5013;并在所述第二HA连接建立完成后,接收并存储主用器件通过该第二HA连接同步的自身当前存储的状态同步信息,在通过第二HA连接完成信息同步以后,触发第二建立模块5013放弃伪装的所述主用器件第一备份器件的身份。这里,进一步同步所述主用器件状态同步信息的条件具体可为预设时间间隔或者预设的主用器件执行相关操作的次数。
可以看出,通过上面描述的通信单元的第二种结构形式,可以实现第二建立模块5013建立的与主用器件之间的HA连接,这大大提高了本实施例提供的利用检查点实现高可用性系统的设备的运行效率。
优选地,如图5所示,处理单元502可包括:业务处理模块5021、同步模块5022和身份处理模块5023。
其中,业务处理模块5021,用于获知所述主用器件出现故障时,利用当前存储的状态同步信息接替该主用器件处理业务;
同步模块5022,用于在获知出现故障的主用器件重启时,与该重启后的主用器件重新建立HA连接,将业务处理模块5021处理的业务对应的数据通过重新建立的HA连接同步到重启后的主用器件;
身份处理模块5022,用于在同步模块5022完成数据同步后,主动触发重启后的主用器件恢复主用身份重新处理业务,自身降为该重启后的主用器件的备份。
由以上技术方案可以看出,本发明通过增加用于担任主用器件的备份的检查点模块,使检查点模块获取主用器件的状态同步信息,并在获知到主用器件出现故障时,利用获取的状态同步信息接替该主用器件处理业务,并在获知出现故障的主用器件重启时,使该重启后的主用器件重新处理业务,自身降为该重启后的主用器件的备份。可以看出,这种方式类似于现有HA机制中为主用器件提供备份器件,主用器件发生了故障或者异常时,备份器件快速切换为主用器件,并接管出现故障的主用器件处理的相应服务的方式,如此,当现有的设备既存在支持检查点机制的低端性能又存在支持HA机制的高端性能时,也可以仅维护一套实现代码,如此,简化应用软件的设计,避免现有技术由于HA机制和检查点机制完全独立所带来的缺陷。
进一步地,由于本发明实施例提供的利用检查点实现高可用性系统的方法类似于HA机制,如此,在各个用于处理业务的主用器件中只设置类似HA接口或者HA接口即可,而不需要现有技术中由于HA机制和检查点机制不同而需要分别在执行低端性能处理的器件中设置检查点接口,而在执行高端性能处理的器件中设置HA接口所带来的维护困难的缺陷。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种利用检查点实现高可用性系统的方法,其特征在于,该方法包括以下步骤:
A,检查点模块模拟用于高可用性HA系统的主用器件的备份器件,建立和所述主用器件之间的HA连接,并通过建立的HA连接获取所述主用器件的状态同步信息;
B,所述检查点模块获知所述主用器件出现故障时,利用所述状态同步信息接替该主用器件处理业务,并在获知出现故障的主用器件重启时,使该重启后的主用器件重新处理业务,自身降为该重启后的主用器件的备份。
2.根据权利要求1所述的方法,其特征在于,步骤A具体包括:
所述检查点模块模拟所述主用器件的备份器件,与该主用器件建立HA连接,当该HA连接建立完成后,所述主用器件将自身当前存储的状态同步信息同步给伪装成该主用器件的备份器件的检查点模块;后续所述主用器件执行相关操作获得的实时同步数据通过所述HA连接同步给所述检查点模块。
3.根据权利要求1所述的方法,其特征在于,步骤A具体包括:
所述检查点模块模拟所述主用器件的第一备份器件,建立和所述主用器件的第一HA连接,该第一HA连接建立完成后,所述主用器件将自身当前存储的状态同步信息通过该第一HA连接同步给伪装成第一备份器件的检查点模块;后续所述检查点模块判断是否满足进一步同步所述主用器件状态同步信息的条件,如果是,所述检查点模块模拟所述主用器件的第二备份器件,建立与所述主用器件之间的第二HA连接,该第二HA连接建立完成后,所述主用器件通过该第二HA连接将自身当前存储的状态同步信息同步给伪装成第二备份器件的检查点模块;当通过第二HA连接完成信息同步以后,所述检查点模块放弃伪装的所述主用器件第一备份器件的身份。
4.根据权利要求3所述的方法,其特征在于,所述进一步同步所述主用器件状态同步信息的条件包括:预设时间间隔或者预设的主用器件执行相关操作的次数。
5.根据权利要求1所述的方法,其特征在于,所述步骤B中使该重启后的主用器件重新处理业务,自身降为该重启后的主用器件的备份包括:
B1,与该重启后的主用器件重新建立HA连接,将处理的业务对应的数据通过重新建立的HA连接同步到重启后的该主用器件;
B2,完成数据同步后,主动触发重启后的主用器件恢复主用身份重新处理业务,自身降为该重启后的主用器件的备份。
6.根据权利要求5所述的方法,其特征在于,所述步骤B2中触发重启后的主用器件恢复主用身份包括:
发送主备倒换请求给所述重启后的主用器件,所述重启后的主用器件接收所述主备倒换请求后,恢复主用身份;
所述重启后的主用器件恢复主用身份后,进一步执行发送与所述主备倒换请求对应的响应的操作;所述步骤B2中降为该重启后的主用器件的备份包括:
接收到重启后的主用器件发送的与所述主备倒换请求对应的响应时,降为该重启后的主用器件的备份。
7.一种利用检查点实现高可用性系统的设备,其特征在于,该设备包括:通信单元和处理单元;其中,
所述通信单元模拟用于高可用性HA系统的主用器件的备份器件,建立和所述主用器件之间的HA连接,并通过建立的HA连接获取所述主用器件的状态同步信息;
所述处理单元用于获知所述主用器件出现故障时,利用所述状态同步信息接替该主用器件处理业务,并在获知出现故障的主用器件重启时,使该重启后的主用器件重新处理业务,自身降为该重启后的主用器件的备份。
8.根据权利要求7所述的设备,其特征在于,所述通信单元包括:
第一建立模块,用于模拟所述主用器件的备份器件,与该主用器件建立HA连接;
第一数据处理模块,用于接收并存储主用器件通过所述HA连接同步的自身当前存储的状态同步信息,和后续执行相关操作获得的实时同步数据。
9.根据权利要求7所述的设备,其特征在于,所述通信单元还包括:
第二建立模块,用于模拟所述主用器件的第一备份器件,建立和所述主用器件的第一HA连接;以及接收到第二数据处理模块发送的建立通知后,模拟所述主用器件的第二备份器件,建立与所述主用器件之间的第二HA连接;
第二数据处理模块,用于在第一HA连接建立完成后,接收并存储主用器件通过该第一HA连接同步的自身当前存储的状态同步信息,后续判断是否满足进一步同步所述主用器件状态同步信息的条件,如果是,发送建立通知给所述第二建立模块;并在所述第二HA连接建立完成后,接收并存储主用器件通过该第二HA连接同步的自身当前存储的状态同步信息,在通过第二HA连接完成信息同步以后,触发所述第二建立模块放弃伪装的所述主用器件第一备份器件的身份。
10.根据权利要求8或9所述的设备,其特征在于,所述处理单元包括:
业务处理模块,用于获知所述主用器件出现故障时,利用当前存储的状态同步信息接替该主用器件处理业务;
同步模块,用于在获知出现故障的主用器件重启时,与该重启后的主用器件重新建立HA连接,将所述业务处理模块处理的业务对应的数据通过重新建立的HA连接同步到重启后的主用器件;
身份处理模块,用于在所述同步模块完成数据同步后,主动触发重启后的主用器件恢复主用身份重新处理业务,自身降为该重启后的主用器件的备份。
CN 200910235674 2009-10-10 2009-10-10 一种利用检查点实现高可用性系统的方法和设备 Active CN102045187B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200910235674 CN102045187B (zh) 2009-10-10 2009-10-10 一种利用检查点实现高可用性系统的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200910235674 CN102045187B (zh) 2009-10-10 2009-10-10 一种利用检查点实现高可用性系统的方法和设备

Publications (2)

Publication Number Publication Date
CN102045187A true CN102045187A (zh) 2011-05-04
CN102045187B CN102045187B (zh) 2013-03-20

Family

ID=43911004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200910235674 Active CN102045187B (zh) 2009-10-10 2009-10-10 一种利用检查点实现高可用性系统的方法和设备

Country Status (1)

Country Link
CN (1) CN102045187B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102769626A (zh) * 2012-07-26 2012-11-07 北京神州绿盟信息安全科技股份有限公司 一种会话信息同步方法、装置以及系统
CN103873959A (zh) * 2012-12-13 2014-06-18 联想(北京)有限公司 一种控制方法和电子设备
CN104636182A (zh) * 2013-11-06 2015-05-20 国际商业机器公司 一种操作数据处理系统的方法、数据处理系统和处理器
CN108965259A (zh) * 2018-06-21 2018-12-07 佛山科学技术学院 一种区块链恶意节点发现与隔离方法及装置
CN109284624A (zh) * 2018-09-03 2019-01-29 佛山科学技术学院 一种基于区块链存储的数据安全隔离方法及装置
CN110086581A (zh) * 2019-05-30 2019-08-02 深圳市中航比特通讯技术有限公司 一种网络融合场景下一主多备数据同步的方法和装置
CN115499296A (zh) * 2022-07-29 2022-12-20 天翼云科技有限公司 一种云桌面热备管理方法、装置及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271332B (zh) * 2008-05-09 2011-08-24 北京方天长久科技有限公司 紧凑型一体化冗余控制器及其控制方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102769626A (zh) * 2012-07-26 2012-11-07 北京神州绿盟信息安全科技股份有限公司 一种会话信息同步方法、装置以及系统
CN102769626B (zh) * 2012-07-26 2015-11-18 北京神州绿盟信息安全科技股份有限公司 一种会话信息同步方法、装置以及系统
CN103873959A (zh) * 2012-12-13 2014-06-18 联想(北京)有限公司 一种控制方法和电子设备
CN103873959B (zh) * 2012-12-13 2019-02-05 联想(北京)有限公司 一种控制方法和电子设备
CN104636182A (zh) * 2013-11-06 2015-05-20 国际商业机器公司 一种操作数据处理系统的方法、数据处理系统和处理器
CN104636182B (zh) * 2013-11-06 2017-12-22 国际商业机器公司 一种操作数据处理系统的方法、数据处理系统和处理器
CN108965259A (zh) * 2018-06-21 2018-12-07 佛山科学技术学院 一种区块链恶意节点发现与隔离方法及装置
CN109284624A (zh) * 2018-09-03 2019-01-29 佛山科学技术学院 一种基于区块链存储的数据安全隔离方法及装置
CN109284624B (zh) * 2018-09-03 2022-09-27 上海信领数字科技有限公司 一种基于区块链存储的数据安全隔离方法及装置
CN110086581A (zh) * 2019-05-30 2019-08-02 深圳市中航比特通讯技术有限公司 一种网络融合场景下一主多备数据同步的方法和装置
CN115499296A (zh) * 2022-07-29 2022-12-20 天翼云科技有限公司 一种云桌面热备管理方法、装置及系统
CN115499296B (zh) * 2022-07-29 2024-03-12 天翼云科技有限公司 一种云桌面热备管理方法、装置及系统

Also Published As

Publication number Publication date
CN102045187B (zh) 2013-03-20

Similar Documents

Publication Publication Date Title
CN106713487B (zh) 数据的同步方法和装置
CN102045187B (zh) 一种利用检查点实现高可用性系统的方法和设备
CN103744809B (zh) 基于vrrp的车辆信息管理系统双机热备方法
CN100397803C (zh) N+1备份的数据实时同步方法
CN106850260A (zh) 一种虚拟化资源管理平台的部署方法和装置
CN102394914A (zh) 集群脑裂处理方法和装置
CN101237315A (zh) 一种用于双控高可用系统的同步检测和故障隔离方法
CN105955836A (zh) 一种冷热备份自动演练多功能系统
CN102681917A (zh) 一种操作系统及其修复方法
CN102937955A (zh) 一种基于MySQL双存储引擎的内存数据库实现方法
CN105589756B (zh) 批处理集群系统以及方法
CN107124305A (zh) 节点设备运行方法及节点设备
CN113051110A (zh) 集群切换方法、装置及设备
CN109656753A (zh) 一种应用于轨道交通综合监控系统的冗余热备系统
CN109324942B (zh) 微服务的双活处理方法、装置及系统、设备、存储介质
CN105426213A (zh) 软件更新方法和系统
CN115658390A (zh) 容器容灾方法、系统、装置、设备及计算机可读存储介质
CN1275476C (zh) 移动通讯系统中使用共享内存的群集系统及其实现方法
CN101686261A (zh) 一种基于rac的冗余服务器系统
JP2006338145A (ja) 多重化データベースシステム及びその同期化方法、仲介装置、仲介プログラム
EP4060514A1 (en) Distributed database system and data disaster backup drilling method
CN114020279A (zh) 应用软件分布式部署方法、系统、终端及存储介质
CN116185697B (zh) 容器集群管理方法、装置、系统、电子设备及存储介质
CN110716828B (zh) 一种数据库实时备份方法
CN102487332A (zh) 故障处理方法、装置和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Patentee after: Xinhua three Technology Co., Ltd.

Address before: 310053 Hangzhou hi tech Industrial Development Zone, Zhejiang province science and Technology Industrial Park, No. 310 and No. six road, HUAWEI, Hangzhou production base

Patentee before: Huasan Communication Technology Co., Ltd.

CP03 Change of name, title or address