CN101155061B - 一种主备控制方法 - Google Patents

一种主备控制方法 Download PDF

Info

Publication number
CN101155061B
CN101155061B CN200610141012A CN200610141012A CN101155061B CN 101155061 B CN101155061 B CN 101155061B CN 200610141012 A CN200610141012 A CN 200610141012A CN 200610141012 A CN200610141012 A CN 200610141012A CN 101155061 B CN101155061 B CN 101155061B
Authority
CN
China
Prior art keywords
machine
standby
host
state
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200610141012A
Other languages
English (en)
Other versions
CN101155061A (zh
Inventor
张伟良
邓辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN200610141012A priority Critical patent/CN101155061B/zh
Publication of CN101155061A publication Critical patent/CN101155061A/zh
Application granted granted Critical
Publication of CN101155061B publication Critical patent/CN101155061B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明提供一种主备控制方法,包括如下步骤:(a)主机与备机的数据和状态进行同步;(b)网管向主机发起主备倒换命令,主机向备机发起主备倒换提示;(c)备机收到主备倒换提示后,备机检查是否可以执行主备倒换,即备机是否正确获取数据和状态,如果是,备机向主机发送同意主备倒换的应答消息,备机倒换为主机,否则,备机向主机发送拒绝主备倒换的应答消息,主备倒换取消。本发明提供的主备控制方法,以备机为主导,简化了主备控制方法,确保了主备之间保持数据与状态一致,主备倒换后系统能够正常工作。

Description

一种主备控制方法
技术领域
本发明属于通信技术领域,特别涉及一种主备控制方法。
背景技术
在嵌入式通信设备中,为了提高系统的可靠性与安全性,往往提供主控板的主备工作方式,在主备工作方式的系统中,正常情况下,一个主控板处于正常的工作状态(称为主机),而另一个主控板则处于备用状态(称为备机),在满足一定条件的情况下,原来处于备用状态的主控板将转为主用状态(这个过程称为主备倒换),从而保证系统正常稳定运行。在发生主备倒换之前,备机尽量保持与主机一致的数据和状态,因此主备机之间需同步数据,数据可以分为两类,一类与配置有关,称为静态数据,一类与业务运行有关,称为动态数据。
系统发生主备倒换有多种原因,如人机命令倒换、超级终端倒换、硬件按钮倒换,以及主用主控板掉电、软件或者硬件异常等,大致可以分为两类:一类是为了完成特定的功能(如版本升级等)主用主控板主动要求主备倒换,另一类是主用主控板发生软硬件故障而引起的主备倒换。
嵌入式通信系统采用主备工作方式,有助于提高系统的稳定性。但是在实际应用中,主备控制方法实现较复杂,主备功能往往较易发生故障,而且与主备功能相关的故障较难定位和解决,例如主机将数据同步给备机,但备机由于启动较慢,不能正确地接收数据;又如发生主备倒换时,备机并没有正确地同步主机的数据与状态,导致倒换后系统无法正常工作甚至业务中断等等。
发明内容
本发明要解决的技术问题是提供一种确保备机正确获取主机的数据与状态、确保发生主备倒换后系统能够正常工作的主备控制方法。
为解决上述问题,本发明提供一种主备控制方法,包括如下步骤:
(a)主机与备机的数据和状态进行同步;其中,
(3a)备机启动阶段主动向主机请求同步原始数据和状态;
(3b)备机获得主机原始数据和状态后,定时向主机请求同步增量数据与状态,并记录每次增量同步的执行结果;
(b)网管向主机发起主备倒换命令,主机向备机发起主备倒换提示;
(c)备机收到主备倒换提示后,备机检查是否执行主备倒换,即备机是否正确获取数据和状态,包括备机是否正确获取原始数据和状态,且最近一次请求同步增量数据和状态执行结果是否正确,如果是,备机向主机发送同意主备倒换的应答消息,备机倒换为主机,否则,备机向主机发送拒绝主备倒换的应答消息,主备倒换取消。
所述备机倒换为主机后检查本地是否正确获取数据和状态,如果是,则继续作为主机工作;否则重启,从本地装载数据。
所述步骤(c)中主机如果在规定时间内未收到备机的应答消息,则认为备机异常,取消主备倒换。
所述步骤(3a)进一步包含如下步骤:
(a1)备机启动后,进行系统初始化;
(a2)备机向主机发送请求,请求主机向备机同步原始数据和状态;
(a3)备机启动定时器T1;
(a4)如果在T1溢出之前,备机接收到主机同步的原始数据和状态,则更新备机的数据和状态并记录备机已获得原始数据和状态,否则,转入步骤(a2)。
所述步骤(3b)中进一步包含如下步骤:
(b1)备机启动完成,备机获得主机的原始数据和状态;
(b2)设置定时器T2;
(b3)T2溢出,备机向主机请求同步增量数据与状态,完成增量数据与状态的同步;
(b4)记录本次请求的执行结果,如果备机正确获取主机的增量数据与状态,则记录本次请求的执行结果正确,转到步骤(b2);否则记录本次请求的执行结果错误,转到步骤(b2)。
所述备机正确获取原始数据和状态是指,如果该备机的最初始状态是主机,则该备机正确获取原始数据和状态是指最初始的主机从本地装载数据并产生状态,如果该备机的最初始状态是备机,则该备机正确获取原始数据和状态是指最初始的备机从最初始的主机同步过原始数据和状态。
本发明提供的主备控制方法,以备机为主导,简化了主备控制方法,确保了主备之间保持数据与状态一致,主备倒换后系统能够正常工作。
附图说明
图1是本发明实施例备机启动阶段主动向主机请求同步原始数据和状态流程图;
图2是本发明实施例备机启动完成后定时向主机请求同步增量数据与状态流程图;
图3是本发明实施例主备倒换主机征求备机意见的流程图;
图4是本发明实施例备机倒换为主机后的检查工作流程图。
具体实施方式
本发明提出的以备机为主导的主备控制方法主要包含下述各步骤。
1、备机启动阶段主动向主机请求同步原始数据和状态。在原始数据同步阶段,以主机为主导的同步机制中,主机需判断备机是否正常,如果备机正常才将数据和状态同步给备机,为了提高同步的可靠性,还需提供重发机制和确认机制,主机实现复杂,主备机配合也较复杂。而以备机为主导的同步机制中,该阶段的数据同步可以用图1来描述,具体过程可以描述为:
101:备机启动后,系统初始化;
102:备机向主机发送请求,请求主机向备机同步原始数据和状态,
103:备机启动定时器T1,定时器T1的时长根据具体系统确定,一般应大于主机收集数据时间和数据在主备机之间传输时间的总和;
104:如果在T1溢出之前,备机接收到主机同步的原始数据和状态,则转入步骤105;否则,转入步骤102;
105:更新备机的数据和状态,关闭T1,并记录标记,表示已同步原始数据和状态。
与以主机为主导的同步机制不同,在以备机为主导的同步机制中,主机无需判断备机的状态,备机也无需判断主机的状态,备机启动初始化完成后即向主机发起请求同步数据,为了提高可靠性仅需重发机制,而无需确认机制,主备配合较简单。
2、备机启动完成后定时向主机请求同步增量数据与状态。系统正常工作后,业务开始运行,此时会产生大量的动态数据,如用户、线路的状态等,这些动态数据都需同步到备机,在业务量大的情况下将导致主备机非常繁忙。以备机为主导的定时同步方法根据动态数据随时变化更新的特点,采用定时同步,避免动态数据每发生一次变化就同步一次,减少同步的数据量,而且每次同步的结果可以作为备机是否同意主备倒换的依据,如图2所述,具体过程可以描述为:
201:备机启动完成或者主机转为备机完成,其中备机启动完成包括已经从主机同步原始数据和状态;
202:设置定时器T2,定时器T2的时长根据具体系统确定,对同步实时性要求较高的系统,T2时长可以短一些,对同步实时性要求较低的系统,T2时长可以长一些;
203:T2溢出,备机向主机请求同步增量数据与状态,完成增量数据与状态的同步过程;
204:记录本次请求的执行结果,如果备机正确获取主机的增量数据与状态,则记录本次请求的执行结果正确,转到步骤202;否则记录本次请求的执行结果错误,转到步骤202。
以备机为主导的定时同步机制,可以减少主机的策略工作,主机只要根据备机的请求发送数据和状态即可。另外在系统的正常运行中,改变配置的频率较小,因改变配置而引起的静态数据同步对系统造成的负担也较小。
3、主备倒换主机征求备机的意见。在主机主动发起的主备倒换过程中,如果主机不征求备机的意见而强行倒换,则有可能备机未准备好甚至备机根本无法倒换成为主机,系统将无法正常工作。主机征求备机主备倒换的过程可以用图3来描述,具体过程可以描述为:
301:网管向主机发起主备倒换命令;
302:主机向备机发起主备倒换提示;
303:备机收到主备倒换提示后,检查是否可以执行主备倒换,可以主备倒换的条件为:正确获取原始数据和状态,并且最近一次请求同步增量数据和状态执行结果正确。备机正确获取原始数据和状态的含义是,如果该备机的最初始状态是主机并经过奇数次主备倒换后转为备机,则该备机正确获取原始数据和状态是指最初始的主机从本地装载数据并产生状态,如果该备机的最初始状态是备机并经过偶数次主备倒换仍然为备机,则该备机正确获取原始数据和状态是指最初始的备机从最初始的主机同步过原始数据和状态。如果满足主备倒换条件,执行步骤304;否则执行步骤305;
304:备机向主机发送同意主备倒换的消息,主机执行主备倒换,结束。
305:备机向主机发送拒绝主备倒换的消息,主机放弃主备倒换,结束。
在以备机为主导的主备机制中,主机主动发起的主备倒换,主机需征求备机的意见,备机如果未准备好将拒绝主备倒换,而主机可以设置超时,如果在规定时间内未收到备机的应答,则认为备机异常,取消主备倒换。
4、备机倒换为主机后的检查工作。在主机发生异常的情况下,备机将无条件倒换为主机,这种情况下,新主机可能因数据或者状态不正确而无法正常工作。因此只要备机倒换为主机后就做检查工作,以保证系统能正常工作,用图4描述,具体过程为:
401:主机发生异常、拔出、复位或者主动倒换;
402:备机倒换为主机;
403:倒换后的新主机检查本地是否正确获取原始数据和状态以及最近一次请求同步增量数据和状态执行结果是否正确,倒换后的新主机正确获取原始数据和状态的含义是,如果该新主机的最初始状态是主机,则该新主机正确获取原始数据和状态是指最初始的主机从本地装载数据并产生状态,如果该新主机的最初始状态是备机,则该新主机正确获取原始数据和状态是指最初始的备机从最初始的主机同步过原始数据和状态。如果倒换后的新主机正确获取原始数据和状态并且最近一次请求同步增量数据和状态执行结果正确,转入步骤404;否则转入步骤405;
404:倒换后的新主机继续作为主机工作,结束。
405:倒换后的新主机重启;
406:倒换后的新主机从本地装载数据,结束。
关于406中从本地装载数据,倒换后的新主机检测到异常后重启,试图从本地装载数据并恢复相关业务,初始状态为备机的新主机不排除有数据存盘文件,有多种可能性,如通过网管将数据存盘文件下载到备机,通过主备文件传输将数据存盘文件传输到备机等,当然不排除初始状态为备机的新主机没有数据存盘文件,新主机从本地装载数据失败后可以创建默认数据,这里涉及的描述比较复杂,因此直接描述为从本地装载数据。
备机倒换为主机后做检查工作,可以尽量继承原来主机的数据和状态工作,而在发生异常的情况下可以从本地状态数据重新工作,从而尽量缩短业务中断的时间。本实施例无论是否正常倒换都做检查,即执行了步骤3之后还执行步骤4中的检查,但在另一实施例中,备机可以记录下倒换的原因,在主机向备机发起的主动倒换完成后,不再进行上述检查。

Claims (6)

1.一种主备控制方法,其特征在于包含以下步骤:
(a)主机与备机的数据和状态进行同步;其中,
(3a)备机启动阶段主动向主机请求同步原始数据和状态;
(3b)备机获得主机原始数据和状态后,定时向主机请求同步增量数据与状态,并记录每次增量同步的执行结果;
(b)网管向主机发起主备倒换命令,主机向备机发起主备倒换提示;
(c)备机收到主备倒换提示后,备机检查是否执行主备倒换,即备机是否正确获取数据和状态,包括备机是否正确获取原始数据和状态,且最近一次请求同步增量数据和状态执行结果是否正确,如果是,备机向主机发送同意主备倒换的应答消息,备机倒换为主机,否则,备机向主机发送拒绝主备倒换的应答消息,主备倒换取消。
2.如权利要求1所述的方法,其特征在于:所述备机倒换为主机后检查本地是否正确获取数据和状态,如果是,则继续作为主机工作;否则重启,从本地装载数据。
3.如权利要求1所述的方法,其特征在于:所述步骤(c)中主机如果在规定时间内未收到备机的应答消息,则认为备机异常,取消主备倒换。
4.如权利要求1所述的方法,其特征在于:所述步骤(3a)进一步包含如下步骤:
(a1)备机启动后,进行系统初始化;
(a2)备机向主机发送请求,请求主机向备机同步原始数据和状态;
(a3)备机启动定时器T1;
(a4)如果在T1溢出之前,备机接收到主机同步的原始数据和状态,则更新备机的数据和状态并记录备机已获得原始数据和状态,否则,转入步骤(a2)。
5.如权利要求1所述的方法,其特征在于:所述步骤(3b)中进一步包含如下步骤:
(b1)备机启动完成,备机获得主机的原始数据和状态;
(b2)设置定时器T2;
(b3)T2溢出,备机向主机请求同步增量数据与状态,完成增量数据与状态的同步;
(b4)记录本次请求的执行结果,如果备机正确获取主机的增量数据与状态,则记录本次请求的执行结果正确,转到步骤(b2);否则记录本次请求的执行结果错误,转到步骤(b2)。
6.如权利要求1所述的方法,其特征在于:所述备机正确获取原始数据和状态是指,如果该备机的最初始状态是主机,则该备机正确获取原始数据和状态是指最初始的主机从本地装载数据并产生状态,如果该备机的最初始状态是备机,则该备机正确获取原始数据和状态是指最初始的备机从最初始的主机同步过原始数据和状态。
CN200610141012A 2006-09-28 2006-09-28 一种主备控制方法 Expired - Fee Related CN101155061B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200610141012A CN101155061B (zh) 2006-09-28 2006-09-28 一种主备控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200610141012A CN101155061B (zh) 2006-09-28 2006-09-28 一种主备控制方法

Publications (2)

Publication Number Publication Date
CN101155061A CN101155061A (zh) 2008-04-02
CN101155061B true CN101155061B (zh) 2010-05-12

Family

ID=39256520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200610141012A Expired - Fee Related CN101155061B (zh) 2006-09-28 2006-09-28 一种主备控制方法

Country Status (1)

Country Link
CN (1) CN101155061B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102882718B (zh) * 2012-09-25 2015-07-29 烽火通信科技股份有限公司 通信设备中带有防御性的主备倒换方法
CN104836677B (zh) * 2014-02-11 2018-10-12 华为技术有限公司 一种双机备份的方法和服务器
CN109062184B (zh) * 2018-08-10 2021-05-14 中国船舶重工集团公司第七一九研究所 双机应急救援设备、故障切换方法和救援系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1321004A (zh) * 2000-04-25 2001-11-07 华为技术有限公司 交换机的主备倒换方法及其实现装置
CN1437348A (zh) * 2002-02-04 2003-08-20 深圳市中兴通讯股份有限公司 通信系统中主备板数据实时同步的方法
CN1463081A (zh) * 2002-05-30 2003-12-24 华为技术有限公司 通信设备中实现主备设备快速倒换的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1321004A (zh) * 2000-04-25 2001-11-07 华为技术有限公司 交换机的主备倒换方法及其实现装置
CN1437348A (zh) * 2002-02-04 2003-08-20 深圳市中兴通讯股份有限公司 通信系统中主备板数据实时同步的方法
CN1463081A (zh) * 2002-05-30 2003-12-24 华为技术有限公司 通信设备中实现主备设备快速倒换的方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
.高可靠性通信设备主备倒换软件的设计.电信科学 11.2003,(11),19-22.
何先波,李志蜀,唐宁九,殷锋,吴云波.面向通信领域的主备倒换与数据同步技术.计算机应用25 10.2005,25(10),2312-2314.
何先波,李志蜀,唐宁九,殷锋,吴云波.面向通信领域的主备倒换与数据同步技术.计算机应用25 10.2005,25(10),2312-2314. *
王继刚
王继刚;顾国昌;芦东昕;.高可靠性通信设备主备倒换软件的设计.电信科学 11.2003,(11),19-22. *
芦东昕
顾国昌

Also Published As

Publication number Publication date
CN101155061A (zh) 2008-04-02

Similar Documents

Publication Publication Date Title
US9311199B2 (en) Replaying jobs at a secondary location of a service
JP4467623B2 (ja) アップデート管理プログラム、管理ノード、アップデート管理方法、およびクラスタシステム
US8533525B2 (en) Data management apparatus, monitoring apparatus, replica apparatus, cluster system, control method and computer-readable medium
US20120324436A1 (en) Method of updating versioned software using a shared cache
CN112380062A (zh) 一种基于系统备份点多次快速恢复系统的方法及系统
CN101155015A (zh) 一种主机与备机间的数据和状态同步方法
CN111209265B (zh) 一种数据库切换方法和终端设备
WO2009089746A1 (fr) Procédé, dispositif et système de réalisation d'une tâche dans un environnement de grappes
JPH11184825A (ja) クラスタシステム
CN101155061B (zh) 一种主备控制方法
CN106685688A (zh) 一种集群计算机设备同步升级方法
US8174966B2 (en) Switching program, switching method and duplex system
US8880552B2 (en) Database system and database control method
CN106775636B (zh) 电池固件处理方法、装置和充电柜系统
CN109739685B (zh) 一种主从热备份数据同步方法和存储介质
WO2024113995A1 (zh) 一种bmc异构升级方法、系统、设备及可读存储介质
CN107786650B (zh) 一种存储介质和管理策略的同步方法、装置及系统
US10153945B2 (en) Information processing apparatus, control method, and storage medium storing program
JP2014016953A (ja) 無共有型データベースシステム、同期装置、データベースサーバ、その同期方法および同期プログラム
JP4289293B2 (ja) 起動制御方法、二重化プラットフォームシステム及び情報処理装置
CN112751693A (zh) 分布式存储系统的数据处理方法、装置及电子设备
US7171465B1 (en) Method for determining a server computer which carried out a process most recently, and high availability computer system
CN115604286A (zh) 节点主备状态信息同步的方法、装置、设备及存储介质
CN114968656A (zh) 一种数据回滚方法、装置、设备及介质
CN111130896A (zh) 一种nfs故障的切换方法、系统及双控存储系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100512

Termination date: 20150928

EXPY Termination of patent right or utility model