CN101110608A - 一种主备板数据检测的方法、系统和装置 - Google Patents

一种主备板数据检测的方法、系统和装置 Download PDF

Info

Publication number
CN101110608A
CN101110608A CNA2007101430810A CN200710143081A CN101110608A CN 101110608 A CN101110608 A CN 101110608A CN A2007101430810 A CNA2007101430810 A CN A2007101430810A CN 200710143081 A CN200710143081 A CN 200710143081A CN 101110608 A CN101110608 A CN 101110608A
Authority
CN
China
Prior art keywords
data
standby plate
master control
control borad
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101430810A
Other languages
English (en)
Other versions
CN101110608B (zh
Inventor
张炜
雷建忠
陈静
王彬
贾军利
肖蒲云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2007101430810A priority Critical patent/CN101110608B/zh
Publication of CN101110608A publication Critical patent/CN101110608A/zh
Application granted granted Critical
Publication of CN101110608B publication Critical patent/CN101110608B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种主备板数据检测的方法,包括以下步骤:在接收到检测的触发消息之后,向备用板发送检测请求信息;接收所述备用板当前的数据,所述备用板当前的数据是所述备用板根据所述检测请求信息收集的;根据接收的所述备用板当前的数据检测所述主控板和所述备用板的数据的一致性。通过本发明实施例,可以实时地检测该主控板和备用板的数据是否一致,从而弥补了现有技术无法实时地检测主控板和备用板的数据是否一致的缺陷,保证了系统运行的可靠性。

Description

一种主备板数据检测的方法、系统和装置
技术领域
本发明涉及网络通信技术领域,特别涉及一种主备板数据检测的方法、系统和装置。
背景技术
随着计算机技术的飞速发展,计算机网络技术得到了广泛的应用,从完成一般的数据处理到越来越多的信息交流,越来越多的企业或家庭都在通过网络获取信息和资讯。随着网络的广泛应用,企业或家庭对网络的可靠性也提出了更高的要求,HA(High Availability,高可靠性)是电信级设备的基本要求,也是电信运营商建设网络的基本出发点。
随着通信技术的发展,电信级路由器为了达到高可靠性,一般都会采用“主备板”的双主控机制。“主备板”的双主控机制是指主用主控板AMB(ActiveMain Board,主控板)和备用主控板SMB(Standby Main Board,备用板)同时工作,主控板管理路由器,处理网络信息,接受用户的配置管理,备用板则处于“听命”状态,在主控板出现问题的情况下,备用板升为主控板,接管路由器的管理,以保证通信畅通。这种机制只有在主备板的配置和部分状态信息完全一致时,才能保证在主控板出现问题发生主备倒换之后,各种业务能够正常进行。如何实时地检测主备板的数据是否一致,在系统业务不繁忙时对备用板的数据进行恢复以使主备板的数据达到一致,成为了一个亟待解决的重要问题。
HA热备份处理,就是备用板作为主控板的一个完全映像,与主控板保持完全同步,但不处理业务,不管理路由器。这就要求主控板收集备份数据,然后同步给备用板,由备用板分发这些备份数据。最终的目的就是保证主备板的备份数据完全一致,当主控板发生故障时,备用板可以在最短的时间内取代原来的主控板,实现主备倒换,保证系统业务不中断。热备份分批量备份、实时备份和数据平滑三个阶段:
批量备份:发生在主控板发现备板被插入并处于ready状态(就绪状态)时,通知各注册的业务模块,由各业务模块发送自己的备份数据。
实时备份:发生在批量备份结束后,进入实时备份阶段。主控板正常运行的大部分时间都处于实时备份状态,实时备份由各业务模块发起。
数据平滑:发生主备倒换时,接管系统的新主控板为了保证自己获得的系统状态是最新状态,要做数据平滑。
HA热备份的功能是将主控板上需要备份的数据备份到备用板,它的优点是减少了系统由于主备用数据备份的不完全而造成的主备用数据的不一致,但是缺点是在系统软件本身有问题而出现故障时,例如,内存保护出错、死机等,往往造成主控板和备用板上的配置数据不一致,这会导致在发生主备倒换时,在备用板取代主控板之后,不能正常完成原主控板的各项功能。对于这种情况,现有的热备份处理技术没有提供任何有效的措施对主备板数据的一致性进行检测和恢复。
在实现本发明的过程中,发明人发现现有技术至少存在如下缺点:在HA架构下,不能实时地检测主控板和备用板的数据是否一致,在主控板和备用板的数据不一致时,也不能对备用板的数据进行恢复以使备用板的数据与主控板的数据保持一致。
发明内容
本发明实施例提出一种主备板数据检测的方法和装置,解决现有技术中不能实时地检测主控板和备用板当前的数据是否一致的缺点。
为达到上述目的,本发明实施例一方面提出一种主备板数据检测的方法,包括以下步骤:在接收到检测的触发消息之后,向备用板发送检测请求信息;接收所述备用板当前的数据,所述备用板当前的数据是所述备用板根据所述检测请求信息收集的;根据接收的所述备用板当前的数据检测所述主控板和所述备用板的数据的一致性。
另一方面,本发明实施例还提出一种主备板数据检测的系统,包括:主控板,用于在接收到检测的触发消息之后,向所述备用板发送检测请求信息,并接收所述备用板根据所述检测请求信息收集的所述备用板当前的数据,根据接收的所述备用板当前的数据检测所述主控板和所述备用板的数据的一致性;备用板,用于根据所述主控板下发的检测请求信息收集所述备用板当前的数据并向所述主控板发送。
再一方面,本发明实施例还提出一种主控板,包括:消息接收模块,用于接收检测的触发消息;请求信息发送模块,与所述消息接收模块连接,用于在所述消息接收模块接收到检测的触发消息之后,向备用板发送检测请求信息;数据接收模块,用于接收所述备用板根据所述检测请求信息收集的所述备用板当前的数据;数据检测模块,与所述数据接收模块连接,用于根据所述数据接收模块接收的所述备用板当前的数据检测所述主控板和备用板当前的数据是否一致。
再一方面,本发明实施例还提出一种备用板,包括:请求信息接收模块,用于接收所述主控板下发的检测请求信息;数据收集模块,与所述请求信息接收模块连接,用于根据所述请求信息接收模块接收的检测请求信息收集所述备用板当前的数据;数据发送模块,与所述数据发送模块连接,用于将所述数据收集模块收集的所述备用板当前的数据发送给所述主控板。
与现有技术相比,本发明实施例具有以下优点:通过本发明实施例,在接收到检测的触发消息之后,根据主控板收集的该主控板的数据和备用板根据检测请求信息收集的该备用板的数据检测该主控板与备用板数据的一致性。这就弥补了现有技术中不能实时地检测主控板与备用板的数据是否一致的缺陷,提高了系统的稳定性和可靠性。
附图说明
图1为本发明实施例主备板数据检测的系统的结构图;
图2为本发明实施例主备板数据检测的方法的流程图;
图3为本发明主备板数据检测的方法实施例一的流程图;
图4为本发明主备板数据检测的方法实施例二的流程图;
图5为本发明主备板数据检测的方法实施例三的流程图;
图6为本发明主备板数据检测的方法实施例四的流程图。
具体实施方式
本发明实施例提供了一种主备板数据检测的方法,通过本发明实施例,对主控板和备用板数据的一致性进行检测,弥补了现有技术中在HA架构下,无法实时地对主备板数据的一致性进行检测的缺陷,提高了双主控系统的稳定性和可靠性。另外,对于主备板数据一致性的检测,可以由主控板完成,也可以由第三方设备来完成,如:由远程服务器检测该双主控系统主备板数据的一致性,但是本发明实施例均以由主控板检测该双主控系统主备板数据的一致性为例进行说明。本发明实施例中提到的数据包括配置数据和业务数据。该配置数据主要来自用户向主控板输入的命令行配置;业务数据主要来自各个业务模块,包括表征主控板和备用板的运行状态或表项的数据。
如图1所示,为本发明实施例主备板数据检测的系统的结构图,包括主控板1、备用板2和业务模块3。主控板1用于在接收到检测的触发消息之后,向备用板2发送检测请求信息,并接收备用板2根据该检测请求信息收集的该备用板2当前的数据,根据该主控板1收集的该主控板1当前的数据和该备用板2当前的数据检测主控板1和备用板2的数据是否一致。该触发消息是用户预先设置的,该触发消息可以按如下方式设置:非业务高峰期触发,保存配置数据成功后触发,接口板插入且配置数据恢复完毕后触发或备用板批量备份结束后触发等。当然该触发消息还可有多种设置方式,例如:可以将上述触发消息结合设置,如在非业务高峰期并保存配置数据成功后触发等。备用板2用于根据主控板1下发的检测请求信息收集该备用板2当前的数据并向主控板1发送。这里的数据包括配置数据和业务数据。该配置数据主要来自用户向主控板输入的命令行配置;业务数据主要来自各个业务模块,包括表征主控板和备用板的运行状态或表项的数据。在主控板1检测出该主控板1和备用板2的数据不一致之后,将检测结果上报管理员,由管理员决定后续的操作,优选地,业务模块3在接收到主控板1的通知信息之后对备用板2的数据进行恢复。
其中,主控板1包括消息接收模块11、请求信息发送模块12、数据接收模块13、数据检测模块14、数据恢复模块15和告警模块16。消息接收模块11用于接收检测的触发消息,该触发消息可以按如下方式设置:非业务高峰期触发,保存配置数据成功后触发,接口板插入且配置数据恢复完毕后触发或备用板批量备份结束后触发等。当然该触发消息还可有多种设置方式,例如:可以将上述触发消息结合设置,如在非业务高峰期并保存配置数据成功后触发等。请求信息发送模块12,与消息接收模块11连接,用于在消息接收模块11接收到检测的触发消息之后,向备用板2发送检测请求信息,该检测请求信息包括对备用板2的检测项目。数据接收模块13,用于接收备用板2根据请求信息发送模块12发送的检测请求信息收集的备用板2当前的数据。数据检测模块14,与数据接收模块13连接,用于根据数据接收模块13接收的该备用板2当前的数据和该主控板1当前的数据检测该主控板1和备用板2当前的数据是否一致。,在检测出主控板1和备用板2的数据不一致时,通知数据恢复模块15对该主控板1和备用板2的数据进行恢复并通知告警模块16发出告警信息。这里的数据包括配置数据和业务数据。该配置数据主要来自用户向主控板输入的命令行配置;业务数据主要来自各个业务模块,包括表征主控板1和备用板2的运行状态或表项的数据。数据恢复模块15,与数据检测模块14连接,用于在数据检测模块14检测出该主控板1和该备用板2的数据不一致之后,通知业务模块3对该备用板2的数据进行恢复,使该备用板2的数据与该主控板1的数据达到一致,保证在主控板1出现故障而发生主备倒换后,该备用板2可以正常执行原主控板1的各项业务。告警模块16用于在数据检测模块14检测出该主控板1和该备用板2的数据不一致时,发出告警信息,并记录发出告警信息的次数。
其中,备用板2包括请求信息接收模块21、数据收集模块22和数据发送模块23。请求信息接收模块21用于接收主控板1下发的检测请求信息,该检测请求信息包括对备用板2检测的检测项目。数据收集模块22,与请求信息接收模块21连接,用于根据请求信息接收模块21接收的检测请求信息收集该备用板2当前的数据。数据发送模块23,与数据收集模块22连接,用于将数据收集模块22收集的该备用板2当前的数据发送给主控板1。
其中,数据检测模块14包括配置数据检测子模块141,用于在接收到检测的触发消息之后,先判断是否有新的配置数据下发,如果有新的配置数据下发,则该配置数据检测子模块141中断当前的检测进程,等待一段时间,在主控板将下发的新配置数据处理完成之后,再重新启动检测进程;如果没有新的配置数据下发,则该配置数据检测子模块141向备用板2发送检测请求信息,该检测请求信息包括对备用板2检测的检测项目。在该备用板2根据该检测请求信息收集该备用板2当前的配置数据并将该备用板2当前的配置数据上报给该配置数据检测子模块141之后,该配置数据检测子模块141根据比对算法检测该主控板1和备用板2的配置数据是否一致。
其中,数据检测模块14还包括业务数据检测子模块142,用于在接收到检测的触发消息之后,先判断是否有新的业务数据下发,如果有新的业务数据下发,则该业务数据检测子模块142中断当前的检测进程,等待一段时间,在主控板将下发的新业务数据处理完成之后,再重新启动检测进程;如果没有新的业务数据下发,则该业务数据检测子模块142向备用板2发送检测请求信息,该检测请求信息包括对备用板2检测的检测项目。在该备用板2根据该检测请求信息收集该备用板2当前的业务数据并将该备用板2当前的配置数据上报给该业务数据检测子模块142之后,该业务数据检测子模块142通知各个预先向主控板1注册了自动检测功能的业务模块3按预定的顺序,如:注册的先后顺序检测该主控板1和备用板2的业务数据是否一致,并接收各业务模块3上报的该主控板1和备用板2业务数据的检测结果。
其中,数据恢复模块15包括配置数据恢复子模块151,用于在配置数据检测子模块141检测出主控板1和备用板2的配置数据不一致之后,通知该备用板2重启并通知各业务模块3以批量备份的方式对该备用板的配置数据进行恢复。优选地,在配置数据检测子模块141检测出主控板1和备用板2的配置数据不一致之后,配置数据恢复子模块151先判断该备用板2是否已达到预设的最大重启次数,如果配置数据恢复子模块151判断该备用板2还未达到预设的最大重启次数,则通知该备用板2重启并通知各业务模块3以批量备份的方式对该备用板2的配置数据进行恢复。如果配置数据恢复子模块151判断该备用板2已达到预设的最大重启次数,则不再重启该备用板2,只通知告警模块16定时发出告警信息,并记录发出告警信息的次数。
其中,数据恢复模块15还包括业务数据恢复子模块152,用于在业务数据检测子模块142检测出主控板1和备用板2的业务数据不一致之后,通知各个预先向主控板1注册了自动恢复功能的业务模块3按预定的顺序,如:注册的先后顺序对该备用板2的数据进行自动恢复,以使该备用板2和该主控板1的业务数据保持一致,并接收各业务模块3上报的该备用板2的业务数据恢复结束的消息。
如图2所示,为本发明实施例主备板数据检测的方法的流程图,具体包括:
S201,向备用板发送检测请求信息。在接收到检测的触发消息之后,向备用板发送检测请求信息,该检测请求信息包括对备用板的检测项目。该触发消息可以按如下方式设置:非业务高峰期触发,保存配置数据成功后触发,接口板插入且配置数据恢复完毕后触发或备用板批量备份结束后触发等。当然该触发消息还可有多种设置方式,例如:可以将上述触发消息结合设置,如在非业务高峰期并保存配置数据成功后触发等。系统在初始化时注册CSBR(Compare Slave Build Run,主备数据一致性检测)任务,在接收到检测的触发消息之后,CSBR任务被触发,在开始执行自动检测该主控板和备用板的数据一致性的进程之前,先判断是否有新的数据下发,如果有新的数据下发,则中断当前的自动检测进程,等待一段时间,在将新下发的数据处理完成之后,再重新启动自动检测进程;如果判断没有新的数据下发,则向该备用板发送检测请求信息。
S202,接收备用板根据检测请求信息收集的该备用板当前的数据。在接收到检测请求信息之后,该备用板根据该检测请求信息收集该备用板当前的数据,并将该备用板当前的数据上报。该数据包括配置数据和业务数据。该配置数据主要来自用户向主控板输入的命令行配置;业务数据主要来自各个业务模块,包括表征主控板和备用板的运行状态或表项的数据。
S203,检测主控板和备用板数据的一致性。在备用板根据检测请求信息收集该备用板当前的数据并将该备用板当前的数据上报之后,根据该主控板收集的该主控板当前的数据和该备用板当前的数据自动检测该主控板和备用板的数据是否一致。在自动检测配置数据时,根据预定的比对算法检测该主控板和备用板的配置数据是否一致。其中,有多种比对算法可供选择,例如,检测主控板和备用板的配置数据的条数是否一致,大多数情况下主控板和备用板的配置数据不一致均是配置数据的条数不一致;还可以将主控板和备用板当前的配置数据保存成文件,检测该主控板和备用板当前的配置数据文件的字符串是否一致,这种比对算法更精确,同时可以更直观地找出哪条配置数据不一致。在自动检测业务数据时,各业务模块先向该主控板的CSBR任务注册自动检测功能,并提供自动检测的处理方法,在接收到自动检测的触发消息之后,通知各个预先向该主控板注册了自动检测功能的业务模块按预定的顺序,如:注册的先后顺序检测该主控板和备用板的业务数据是否一致,各业务模块通过该自动检测的处理方法检测该主控板和备用板的业务数据是否一致。在检测完成之后,各业务模块将该主控板和备用板的业务数据是否一致的检测结果上报给该主控板的CSBR任务。如果检测出该主控板和备用板的数据不一致,则将检测结果上报管理员,由管理员决定后续的操作,优选地,通知业务模块对该备用板的数据进行自动恢复;如果该主控板检测出该主控板和备用板的数据一致,则返回,继续检测该主控板和备用板的数据是否一致。
另外,对于主控板和备用板的配置数据和业务数据的一致性检测还可采用手动检测的方式,由用户主观给出检测结果。例如,对于手动检测主控板和备用板的配置数据是否一致,用户可以通过执行检测命令直接给出检测结果,也可以将主控板和备用板的配置数据保存成文件,自行比较两个配置数据文件的差异。手动检测一般只作为自动检测的辅助手段,用来确认为什么不一致,在手动检测出主控板和备用板的数据不一致时,不会对备用板的数据进行自动恢复,只能采用手动恢复的方式对该备用板的数据进行恢复。
本发明实施例提供了一种主备板数据检测的方法,通过本发明实施例,主控板在注册了CSBR任务之后,可以实时地检测该主控板和备用板上的数据是否一致,从而可以在检测出该主控板和该备用板的数据不一致之后,由管理员根据检测结果决定后续操作,如:对该备用板的数据进行恢复等,提高了系统的可靠性。
下面通过具体实施例并结合附图对本发明作进一步详细说明:
如图3所示,为本发明主备板数据检测的方法实施例一的流程图,在本发明实施例中,自动检测主控板和备用板的配置数据是否一致的流程具体包括:
S301,接收自动检测的触发消息。该触发消息是用户预先设置的,该触发消息可以按如下方式设置:非业务高峰期触发,保存配置数据成功后触发,接口板插入且配置数据恢复完毕后触发或备用板批量备份结束后触发等。系统在初始化时注册CSBR任务,在接收到检测的触发消息之后,CSBR任务被触发,开始自动检测该主控板和备用板的配置数据是否一致。
S302,主控板判断是否有新的配置数据下发。在主控板向备用板发送自动检测的请求信息之前,该主控板先判断是否有新的配置数据下发给该主控板,如果没有,则该主控板向备用板发送自动检测的请求信息;如果有新的配置数据下发给该主控板,则该主控板将中断当前的自动检测进程,等待一段时间,在该主控板将下发的新配置数据处理完成之后,再重新对该主控板和备用板的配置数据的一致性进行自动检测。
S303,主控板向备用板发送自动检测的请求信息。在主控板判断没有新的配置数据下发给该主控板之后,该主控板向该备用板发送自动检测的请求信息,该自动检测的请求信息包括对该备用板检测的检测项目。在接收到该自动检测的请求信息之后,该备用板会向该主控板发送请求应答消息,上报该备用板已处于自动检测的就绪状态。
S304,主控板接收备用板的请求应答消息。在该主控板接收到该备用板的请求应答消息之后,会再次判断是否有新的配置数据下发给该主控板,如果没有,则该主控板的状态更新为自动检测的就绪状态,并等待一段时间,在此过程中,该备用板将下发到该备用板的配置数据处理完毕。如果该主控板判断有新的配置数据下发给该主控板,则该主控板将中断当前的自动检测进程,等待一段时间,在该主控板将下发的新配置数据处理完成之后,再重新对该主控板和备用板的配置数据的一致性进行自动检测。。
S305,主控板判断是否有新的配置数据下发。在该主控板等待一段时间,并且备用板将下发到该备用板的配置数据处理完毕之后,主控板再次判断是否有新的配置数据下发给该主控板,如果没有新的配置数据下发,则该主控板的状态更新为自动检测的开始状态,并向备用板发送请求收集消息。如果该主控板判断有新的配置数据下发给该主控板,则该主控板将中断当前的自动检测进程,等待一段时间,在该主控板将下发的新配置数据处理完成之后,再重新对该主控板和备用板的配置数据的一致性进行自动检测。
S306,主控板向备用板发送请求收集消息。在该主控板判断没有新的配置数据下发给该主控板,且该主控板的状态更新为自动检测的开始状态之后,该主控板向该备用板发送请求收集消息,请求该备用板收集当前的配置数据。
S307,备用板向主控板发送根据请求收集消息收集的该备用板当前的配置数据。在该备用板收到该主控板发送的请求收集消息之后,该备用板的状态更新为备用板自动检测开始状态,并开始收集该备用板当前的配置数据。在该备用板收集当前的配置数据结束之后,将该备用板当前的配置数据的收集结果上报给该主控板,同时该备用板的状态更新为备用板自动检测的结束状态。
S308,主控板判断是否有新的配置数据下发。在该主控板收到该备用板上报的该备用板当前的配置数据之后,该主控板会判断是否有新的配置数据下发给该主控板,如果没有,该主控板开始收集该主控板当前的配置数据;如果该主控板判断有新的配置数据下发给该主控板,则该主控板将中断当前的自动检测进程,等待一段时间,在该主控板将下发的新配置数据处理完成之后,再重新对该主控板和备用板配置数据的一致性进行自动检测。
S309,主控板收集该主控板的配置数据并检测该主控板和备用板的配置数据是否一致。在该主控板判断没有新的配置数据下发之后,该主控板开始收集该主控板当前的配置数据,在该主控板收集完该主控板当前的配置数据之后,会根据比对算法检测该主控板和备用板的配置数据是否一致。其中,有多种比对算法可供选择,例如,检测主控板和备用板的配置数据的条数是否一致,大多数情况下主控板和备用板的配置数据不一致均是配置数据的条数不一致;还可以将主控板和备用板当前的配置数据保存成文件,检测该主控板和备用板当前的配置数据文件的字符串是否一致,这种比对算法更精确,同时可以更直观地找出哪条配置数据不一致。在检测出该主控板和该备用板的配置数据不一致之后,该主控板将发出告警信息,并记录发出告警信息的次数,同时将该主控板和该备用板的配置数据不一致的情况记入日志。
上述主备板数据检测的方法,在接收到自动检测的触发消息之后,主控板的CSBR任务被触发,主控板向备用板发送请求收集消息,请求备用板收集该备用板当前的配置数据,在该备用板将当前的配置数据上报该主控板之后,该主控板检测该主控板和备用板的配置数据是否一致,在检测出该主控板和该备用板的配置数据不一致之后,该主控板将发出告警信息,提醒用户对该主控板和该备用板的配置数据不一致的状况进行处理,这就弥补了现有技术中HA架构下不能实时地检测主控板和备用板的配置数据是否一致的缺陷。
如图4所示,为本发明主备板数据检测的方法实施例二的流程图,在本发明实施例中,恢复备用板的配置数据的流程具体包括:
S401,主控板发出告警信息的次数达到预设的自动恢复的触发值。在主控板检测出该主控板和备用板的配置数据不一致时,该主控板会发出告警信息,并记录发出告警信息的次数。如果该主控板发出告警信息的次数达到预设的自动恢复的触发值,例如,如果预设的自动恢复的触发值为2,则在该主控板发出2次告警信息之后,若没有对该备用板的配置数据进行手动恢复,则该主控板将开始执行自动恢复该备用板上的配置数据的进程。
S402,优选地,主控板判断是否为业务高峰期。在主控板发出告警信息的次数达到预设的自动恢复的触发值之后,该主控板先判断现在是否为业务高峰期,如果现在不是业务高峰期,则该主控板会再进行一次自动检测,检测该主控板和备用板的配置数据是否一致。如果该主控板判断现在是业务高峰期,则不对该备用板的配置数据进行恢复,不重启该备用板。
S403,优选地,主控板再次检测该主控板和备用板的配置数据是否一致。在主控板判断现在不是业务高峰期之后,该主控板会再进行一次自动检测,检测该主控板和备用板的配置数据是否一致。
S404,优选地,主控板判断备用板是否达到最大重启次数。在主控板再次检测该主控板和备用板上的配置数据还不一致之后,该主控板会先判断该备用板的重启次数是否已达到最大重启次数。如果该备用板的重启次数已达到最大重启次数,则不再重启该备用板,并将该备用板的重启次数已达到最大重启次数的情况记入日志。
S405,重启备用板。在主控板判断该备用板的重启次数还未达到最大重启次数之后,将重启备用板,在该备用板的状态为就绪状态时,该主控板通知各业务模块以批量备份的方式对该备用板的配置数据进行恢复。
上述主备板数据检测的方法,在主控板检测出该主控板和备用板的配置数据不一致之后,该主控板将重启该备用板,并通知各业务模块以批量备份的方式对该备用板的配置数据进行恢复。这就保证了主控板和备用板的配置数据的一致性,弥补了现有技术在主控板和备用板的配置数据不一致时,无法对备用板的配置数据进行恢复的缺陷。
另外,在主控板检测出该主控板和备用板的配置数据不一致时,还可采用手动恢复的方式对该备用板的配置数据进行恢复。例如,手动恢复该备用板的配置数据分为以下两种情况:
(1)如果主控板上的配置数据比备用板的配置数据多,用户需要再次在该主控板上执行一遍该备用板缺少的配置命令,或者手动重启该备用板以批量备份的方式对该备用板上的配置数据进行恢复。
(2)如果备用板上的配置数据比主控板的配置数据多,则需要根据实际情况选择合适的恢复方式:
a)如果备用板比主控板多的是有效的配置命令,则在该主控板上执行该配置命令;
b)如果备用板比主控板多的是无效的配置命令,则可以有三种方法对该备用板的配置数据进行恢复:
手动重启该备用板,以批量备份的方式对该备用板的配置数据进行恢复;
不作处理,等待自动恢复该备用板的配置数据;
在该主控板上执行该配置命令,然后再执行取消命令取消该配置命令。
如图5所示,为本发明主备板数据检测的方法实施例三的流程图,在本发明实施例中,自动检测主控板和备用板的业务数据是否一致的流程具体包括:
S501,业务模块向主控板的CSBR任务注册自动检测功能。在自动检测主控板和备用板的业务数据是否一致之前,各业务模块先向该主控板的CSBR任务注册自动检测功能,并提供相应的自动检测的处理方法。
S502,接收自动检测的触发消息。该触发消息是用户预先设置的,该触发消息可以按如下方式设置:非业务高峰期触发,保存配置数据成功后触发,接口板插入且配置数据恢复完毕后触发或备用板批量备份结束后触发等。系统在初始化时注册CSBR任务,在接收到检测的触发消息之后,CSBR任务被触发,开始执行自动检测该主控板和备用板的业务数据一致性的进程。
S503,主控板向备用板发送自动检测的请求信息。在接收到自动检测的触发消息之后,该主控板向备用板发送自动检测的请求信息,该检测的请求信息包括对该备用板检测的检测项目。在发送该自动检测的请求信息之前,该主控板先判断是否有新的业务数据下发给该主控板,如果没有,则该主控板向备用板发送自动检测的请求信息;如果判断有新的业务数据下发给该主控板,则该主控板将中断当前的自动检测进程,等待一段时间,在该主控板将下发的新业务数据处理完成之后,再重新对该主控板和备用板的业务数据的一致性进行自动检测。
步骤S504,主控板通知各业务模块按预定的顺序检测该主控板和备用板的业务数据是否一致。在接收到备用板根据自动检测的请求信息收集的该备用板当前的业务数据之后,该主控板通知各个预先向该主控板注册了自动检测功能的业务模块按预定的顺序,如:注册的先后顺序检测该主控板和备用板的业务数据是否一致,各业务模块通过自动检测的处理方法检测该主控板和备用板的业务数据是否一致。通常是检测各业务模块在该主控板和备用板的运行状态和各个表项是否一致。在检测完成之后,将该主控板和备用板的业务数据的检测结果上报给该主控板的CSBR任务。如果所有的业务模块均上报业务数据检测一致的结果,则说明该主控板和备用板的业务数据一致;如果有业务模块上报业务数据检测不一致的结果,则说明该主控板和备用板的业务数据不一致。该主控板在接收到该主控板和备用板的业务数据不一致的检测结果之后,将发出告警信息,并记录发出告警信息的次数,并将该主控板和备用板的业务数据不一致的情况记入日志。
上述主备板数据检测的方法,各业务模块先向该主控板的CSBR任务注册自动检测功能,在接收到自动检测的触发消息之后,该主控板通知各注册了自动检测功能的业务模块按预定的顺序检测该主控板和备用板的业务数据是否一致。在检测出该主控板和备用板的业务数据不一致之后,将发出告警信息提醒用户对该主控板和备用板的业务数据不一致的状况进行处理,这就弥补了现有技术无法实时地检测主控板和备用板的业务数据是否一致的缺陷。
如图6所示,为本发明主备板数据检测的方法实施例四的流程图,在本发明实施例中,自动恢复备用板的业务数据的流程具体包括:
S601,业务模块向主控板的CSBR任务注册自动恢复功能。在对备用板的业务数据进行自动恢复之前,各业务模块先向主控板的CSBR任务注册自动恢复功能,并提供相应的自动恢复的处理方法。
S602,主控板发出告警信息的次数达到预设的自动恢复的触发值。在主控板检测出该主控板和备用板的业务数据不一致时,该主控板会发出告警信息,并记录发出告警信息的次数。如果该主控板发出告警信息的次数达到预设的自动恢复的触发值,例如,如果预设的自动恢复的触发值为2,则在该主控板发出2次告警信息之后,若没有对该备用板的业务数据进行恢复,则该主控板将通知各预先向该主控板注册的业务模块对该备用板上的业务数据进行自动恢复。
S603,优选地,主控板判断是否为业务高峰期。在主控板发出告警信息的次数达到预设的自动恢复的触发值之后,该主控板先判断现在是否为业务高峰期,如果该主控板判断现在是业务高峰期,则不对该备用板的业务数据进行恢复。
S604,优选地,主控板再次检测该主控板和备用板的业务数据是否一致。在主控板判断现在不是业务高峰期之后,该主控板会再进行一次自动检测,检测该主控板和备用板的业务数据是否一致。
S605,主控板通知各业务模块按预定的顺序对备用板的业务数据进行恢复。在主控板再一次检测出该主控板和备用板的业务数据不一致之后,该主控板将通知各预先向该主控板注册了自动恢复功能的业务模块按预定的顺序,如:注册的先后顺序对该备用板的业务数据进行恢复。各业务模块有各自的业务数据表项,当业务数据发生不一致时,由该业务模块提供的对业务数据自动恢复的处理方法,针对本业务进行处理,例如:如果发生备用板的业务数据丢失,可以通过备份的方式将该业务数据备份到该备用板。在业务数据的恢复完成之后,向该主控板的CSBR任务上报该备用板的业务数据恢复完成的消息。
上述主备板数据检测的方法,各业务模块先向主控板的CSBR任务注册自动恢复功能,在该主控板检测出该主控板和备用板的业务数据不一致时,该主控板通知各预先向该主控板注册了自动恢复功能的业务模块按预定的顺序对该备用板的业务数据进行恢复,使该备用板的业务数据与该主控板的业务数据保持一致。这就弥补了现有技术在主控板和备用板的业务数据不一致时,不能及时地对备用板的业务数据进行恢复的缺陷。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (23)

1.一种主备板数据检测的方法,其特征在于,包括以下步骤:
在接收到检测的触发消息之后,向备用板发送检测请求信息;
接收所述备用板当前的数据,所述备用板当前的数据是所述备用板根据所述检测请求信息收集的;
根据接收的所述备用板当前的数据检测所述主控板和所述备用板的数据的一致性。
2.如权利要求1所述主备板数据检测的方法,其特征在于,在检测所述主控板和所述备用板的数据是否一致之后,还包括以下步骤:
如果检测所述主控板与所述备用板的数据不一致,则通知业务模块对所述备用板的数据进行恢复。
3.如权利要求2所述主备板数据检测的方法,其特征在于,在所述通知业务模块对所述备用板的数据进行恢复之前,还包括以下步骤:发出告警信息,并记录发出所述告警信息的次数,如果发出所述告警信息的次数达到预设的自动恢复的触发值,则通知所述业务模块对所述备用板的数据进行恢复。
4.如权利要求1至3任意一项所述主备板数据检测的方法,其特征在于,所述数据为配置数据,
根据接收的所述备用板当前的数据检测所述主控板和所述备用板的数据的一致性具体包括:
根据比对算法检测所述主控板和所述备用板的配置数据的一致性。
5.如权利要求2所述主备板数据检测的方法,其特征在于,所述数据为配置数据,
所述通知业务模块对所述备用板的配置数据进行恢复具体包括:
通知所述备用板重启;
在所述备用板重启后通知所述业务模块以批量备份的方式对所述备用板的配置数据进行恢复。
6.如权利要求1至3任意一项所述主备板数据检测的方法,其特征在于,所述数据为业务数据,
根据接收的所述备用板当前的数据检测所述主控板和所述备用板的数据的一致性具体包括:
通知预先向所述主控板注册的业务模块按顺序检测所述主控板与所述备用板的业务数据的一致性;
所述业务模块向所述主控板上报检测结果。
7.如权利要求2所述主备板数据检测的方法,其特征在于,所述数据为业务数据,
所述通知业务模块对备用板的数据进行恢复具体包括以下步骤:
通知预先向所述主控板注册的业务模块按顺序对所述备用板的业务数据进行恢复。
8.如权利要求7所述主备板数据检测的方法,其特征在于,在所述通知预先向主控板注册的业务模块按顺序对所述备用板的业务数据进行恢复之后,还包括以下步骤:
所述业务模块在恢复结束后,向所述主控板上报所述备用板的业务数据恢复结束的消息。
9.如权利要求1所述主备板数据检测的方法,其特征在于,在向所述备用板发送检测请求信息之前,还包括以下步骤:
判断是否有新的数据下发给所述主控板;
如果有新的数据下发给所述主控板,则中断当前的检测进程,等待后,再重新检测所述主控板和所述备用板的数据的一致性;
如果判断没有新的数据下发给所述主控板,则向所述备用板发送所述检测请求信息。
10.一种主备板数据检测的系统,其特征在于,包括:
主控板,用于在接收到检测的触发消息之后,向备用板发送检测请求信息,并接收所述备用板根据所述检测请求信息收集的所述备用板当前的数据,根据接收的所述备用板当前的数据检测所述主控板和所述备用板的数据的一致性;
备用板,用于根据所述主控板下发的检测请求信息收集所述备用板当前的数据并向所述主控板发送。
11.如权利要求10所述主备板数据检测的系统,其特征在于,还包括业务模块,用于在接收到所述主控板的通知信息之后对所述备用板的数据进行恢复。
12.如权利要求10所述主备板数据检测的系统,其特征在于,所述主控板包括:
消息接收模块,用于接收检测的触发消息;
请求信息发送模块,与所述消息接收模块连接,用于在所述消息接收模块接收到检测的触发消息之后,向所述备用板发送检测请求信息;
数据接收模块,用于接收所述备用板根据所述检测请求信息收集的所述备用板当前的数据;
数据检测模块,与所述数据接收模块连接,用于根据所述数据接收模块接收的所述备用板当前的数据检测所述主控板和备用板当前的数据是否一致。
13.如权利要求12所述主备板数据检测的系统,其特征在于,所述主控板还包括数据恢复模块,与所述数据检测模块连接,用于在所述数据检测模块检测出所述主控板和所述备用板当前的数据不一致之后,通知所述业务模块对所述备用板的数据进行恢复。
14.如权利要求12或13所述主备板数据检测的系统,其特征在于,所述主控板还包括告警模块,用于在所述数据检测模块检测出所述主控板和所述备用板的数据不一致之后,发出告警信息,并记录发出所述告警信息的次数。
15.如权利要求10所述主备板数据检测的系统,其特征在于,所述备用板包括:
请求信息接收模块,用于接收所述主控板下发的检测请求信息;
数据收集模块,与所述请求信息接收模块连接,用于根据所述请求信息接收模块接收的检测请求信息收集所述备用板当前的数据;
数据发送模块,与所述数据收集模块连接,用于将所述数据收集模块收集的所述备用板当前的数据发送给所述主控板。
16.一种主控板,其特征在于,包括:
消息接收模块,用于接收检测的触发消息;
请求信息发送模块,与所述消息接收模块连接,用于在所述消息接收模块接收到检测的触发消息之后,向备用板发送检测请求信息;
数据接收模块,用于接收所述备用板根据所述检测请求信息收集的所述备用板当前的数据;
数据检测模块,与所述数据接收模块连接,用于根据所述数据接收模块接收的所述备用板当前的数据检测所述主控板和备用板当前的数据是否一致。
17.如权利要求16所述主控板,其特征在于,包括数据恢复模块,与所述数据检测模块连接,用于在所述数据检测模块检测出所述主控板和所述备用板当前的数据不一致之后,通知业务模块对所述备用板的数据进行恢复。
18.如权利要求16或17所述主控板,其特征在于,包括告警模块,用于在所述数据检测模块检测出所述主控板和所述备用板的数据不一致之后,发出告警信息,并记录发出所述告警信息的次数。
19.如权利要求16所述主控板,其特征在于,所述数据检测模块包括配置数据检测子模块,用于根据比对算法检测所述主控板和备用板的配置数据是否一致。
20.如权利要求19所述主控板,其特征在于,所述数据恢复模块包括配置数据恢复子模块,用于在所述配置数据检测子模块检测出所述主控板和备用板的配置数据不一致之后,通知所述备用板重启并通知所述业务模块在所述备用板重启后以批量备份的方式对所述备用板的配置数据进行恢复。
21.如权利要求16所述主控板,其特征在于,所述数据检测模块包括业务数据检测子模块,用于通知预先向所述主控板注册的业务模块按顺序检测所述主控板与所述备用板的业务数据是否一致,并接收所述业务模块上报的所述业务数据的检测结果。
22.如权利要求21所述主控板,其特征在于,所述数据恢复模块包括业务数据恢复子模块,用于在所述业务数据检测子模块检测出所述主控板与所述备用板的业务数据不一致之后,通知预先向所述主控板注册的业务模块按顺序对所述备用板的业务数据进行恢复,并接收所述业务模块上报的所述业务数据恢复结束的消息。
23.一种备用板,其特征在于,包括:
请求信息接收模块,用于接收主控板下发的检测请求信息;
数据收集模块,与所述请求信息接收模块连接,用于根据所述请求信息接收模块接收的检测请求信息收集所述备用板当前的数据;
数据发送模块,与所述数据发送模块连接,用于将所述数据收集模块收集的所述备用板当前的数据发送给所述主控板。
CN2007101430810A 2007-08-23 2007-08-23 一种主备板数据检测的方法、系统和装置 Expired - Fee Related CN101110608B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101430810A CN101110608B (zh) 2007-08-23 2007-08-23 一种主备板数据检测的方法、系统和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101430810A CN101110608B (zh) 2007-08-23 2007-08-23 一种主备板数据检测的方法、系统和装置

Publications (2)

Publication Number Publication Date
CN101110608A true CN101110608A (zh) 2008-01-23
CN101110608B CN101110608B (zh) 2011-02-09

Family

ID=39042528

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101430810A Expired - Fee Related CN101110608B (zh) 2007-08-23 2007-08-23 一种主备板数据检测的方法、系统和装置

Country Status (1)

Country Link
CN (1) CN101110608B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049258A (zh) * 2015-08-14 2015-11-11 深圳市傲冠软件股份有限公司 网络容灾系统的数据传输方法
CN105391629A (zh) * 2014-09-05 2016-03-09 杭州迪普科技有限公司 一种资源备份的方法及装置
CN106649822A (zh) * 2016-12-29 2017-05-10 深圳市捷顺科技实业股份有限公司 一种数据处理方法及装置
WO2017101646A1 (zh) * 2015-12-18 2017-06-22 中兴通讯股份有限公司 一种基站单板的硬件故障检测方法及装置
CN107713992A (zh) * 2013-03-15 2018-02-23 雅培糖尿病护理公司 数据处理系统
CN115150317A (zh) * 2022-06-22 2022-10-04 杭州迪普科技股份有限公司 路由表项下发方法、装置、电子设备及计算机可读介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1190018C (zh) * 2002-05-13 2005-02-16 华为技术有限公司 主控板数据热备份的方法
CN1199366C (zh) * 2002-08-28 2005-04-27 华为技术有限公司 一种实现主控板热备份的方法
CN1332522C (zh) * 2003-12-25 2007-08-15 电子科技大学 具有安全保护功能的密码芯片的制备方法
CN1756108A (zh) * 2004-09-29 2006-04-05 华为技术有限公司 主备系统数据同步方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107713992A (zh) * 2013-03-15 2018-02-23 雅培糖尿病护理公司 数据处理系统
CN107713992B (zh) * 2013-03-15 2021-10-26 雅培糖尿病护理公司 数据处理系统
CN105391629A (zh) * 2014-09-05 2016-03-09 杭州迪普科技有限公司 一种资源备份的方法及装置
CN105391629B (zh) * 2014-09-05 2019-01-22 杭州迪普科技股份有限公司 一种资源备份的方法及装置
CN105049258A (zh) * 2015-08-14 2015-11-11 深圳市傲冠软件股份有限公司 网络容灾系统的数据传输方法
CN105049258B (zh) * 2015-08-14 2019-02-26 深圳市傲冠软件股份有限公司 网络容灾系统的数据传输方法
WO2017101646A1 (zh) * 2015-12-18 2017-06-22 中兴通讯股份有限公司 一种基站单板的硬件故障检测方法及装置
CN106649822A (zh) * 2016-12-29 2017-05-10 深圳市捷顺科技实业股份有限公司 一种数据处理方法及装置
CN115150317A (zh) * 2022-06-22 2022-10-04 杭州迪普科技股份有限公司 路由表项下发方法、装置、电子设备及计算机可读介质
CN115150317B (zh) * 2022-06-22 2023-09-12 杭州迪普科技股份有限公司 路由表项下发方法、装置、电子设备及计算机可读介质

Also Published As

Publication number Publication date
CN101110608B (zh) 2011-02-09

Similar Documents

Publication Publication Date Title
CN101110608B (zh) 一种主备板数据检测的方法、系统和装置
EP2600565B1 (en) Disaster tolerance service system and disaster tolerance method
CN101706795A (zh) 主备服务器上数据库数据同步方法
CN109474465A (zh) 一种基于服务器集群的可动态流转的高可用性的实现方法和系统
KR20040047209A (ko) 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템
CN110377456A (zh) 一种虚拟化平台容灾的管理方法及装置
CN101237315A (zh) 一种用于双控高可用系统的同步检测和故障隔离方法
WO2012171349A1 (zh) 一种分布式自增计数的实现方法、装置及系统
CN110109772B (zh) 一种cpu的重启方法、通信设备及可读存储介质
EP4060514A1 (en) Distributed database system and data disaster backup drilling method
CN111026585B (zh) 一种录播系统中的存储服务器热备切换方法
US20150195167A1 (en) Availability device, storage area network system with availability device and methods for operation thereof
EP3896571B1 (en) Data backup method, apparatus and system
WO2018010603A1 (zh) 基于视频云存储系统的存储模式升级方法、装置和系统
JPH09186686A (ja) 網管理システム
US5583986A (en) Apparatus for and method of duplex operation and management for signalling message exchange no. 1 system
CN100362760C (zh) 一种分布式配置数据库系统的备份方法
CN113297134B (zh) 数据处理系统及数据处理方法、装置、电子设备
CN112948177A (zh) 一种容灾备份方法、装置、电子设备及存储介质
JP5515286B2 (ja) 分散トランザクション処理システム、サーバ装置及びそれらに用いる分散トランザクションの障害復旧方法
CN108933873B (zh) 一种用户数据的同步方法及装置
CN110795291A (zh) 一种数据库处理方法及装置
CN104516790A (zh) 一种分布式环境下检查点记录和恢复的系统及方法
JP5344712B2 (ja) データ整合方法及びサービス提供装置
CN100413261C (zh) 数据恢复的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110209

Termination date: 20170823

CF01 Termination of patent right due to non-payment of annual fee