CN101605051B - 一种实现控制板上业务的主备倒换方法和装置 - Google Patents

一种实现控制板上业务的主备倒换方法和装置 Download PDF

Info

Publication number
CN101605051B
CN101605051B CN2009100887851A CN200910088785A CN101605051B CN 101605051 B CN101605051 B CN 101605051B CN 2009100887851 A CN2009100887851 A CN 2009100887851A CN 200910088785 A CN200910088785 A CN 200910088785A CN 101605051 B CN101605051 B CN 101605051B
Authority
CN
China
Prior art keywords
unit
control board
business
working traffic
standby
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009100887851A
Other languages
English (en)
Other versions
CN101605051A (zh
Inventor
乔会来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN2009100887851A priority Critical patent/CN101605051B/zh
Publication of CN101605051A publication Critical patent/CN101605051A/zh
Application granted granted Critical
Publication of CN101605051B publication Critical patent/CN101605051B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Monitoring And Testing Of Exchanges (AREA)

Abstract

本发明提供了一种实现控制板上业务的主备倒换方法和装置,其中,该方法应用于包含多个控制板的高可用性HA系统中,从各个控制板包含的HA处理单元中选择出一个作为主用HA处理单元;将待处理业务分成一个以上业务组;该方法包括:A,针对启动的每一业务,各个控制板上运行该业务的业务单元将该业务注册到对应业务组中;B,所述主用HA处理单元确定所述业务组的主用业务单元和对应的备用业务单元;C,所述主用HA处理单元在所述主用业务单元出现故障时,确定用于与出现故障的主用业务单元进行倒换的备用业务单元,使该备用业务单元与所述出现故障的主用业务单元进行主备倒换。采用本发明,降低主备倒换的影响范围,减少主备倒换的复杂度。

Description

一种实现控制板上业务的主备倒换方法和装置
技术领域
本发明涉及数据通信技术,特别涉及一种实现控制板上业务的主备倒换方法和装置。
背景技术
现有技术中,高可用性(HA:High Availability)技术是指尽量缩短因日常维护操作和突发的系统崩溃所导致的停机时间而提高系统可用性的一种技术。参见图1,图1为现有技术中HA系统的结构图。在图1中,HA系统包括m+1决控制板(具体为控制板1至控制板m+1)。每一个控制板上具有相同的软硬件能力,比如,当前待处理业务为业务1至业务5,则每一个控制板上都具有运行业务1至业务5的软硬件能力。
系统启动时,按照预设的竞争原则在m+1块控制板中选择出其中一块控制板为主控板,假如选择出控制板1为主控板;则剩下的m块控制板(即控制板2至控制板m+1)是为该主控板备份的备份板;正常情况下,主控板如图1中的控制板1处于工作状态,与外部的接口板进行通信,而备份板处于备份状态下,不与接口板通信;在主控板正常工作时,该主控板上处理HA系统待处理的所有业务,并将处理的业务信息实时备份到备份板上;当主控板运行的其中一个业务出现故障时,则重新按照上述预设的竞争机制从所有的备份板中选择其中一个备份板,启动主备倒换,即将原主控板倒换到该选择出的备份板,由该备份板作为新的主控板继续执行原主控板的业务处理操作。
可以看出,现有提供的方案是以控制板为单位进行倒换的,比如,在主控板上运行的业务2出现故障时,就需要选择出一个备份板,将该主控板倒换到该备份板上;也就是说,现有提供的方案中在主控板运行的业务中只要有一个业务出现故障时,就需要使整个主控板进行主备倒换,如此,采用现有提供的方案就会导致一些没有必要的倒换,大大扩大了主备倒换的影响范围,加大了主备倒换的复杂度。
发明内容
本发明提供了一种实现控制板上业务的主备倒换方法和装置,以便降低主备倒换的影响范围,减少主备倒换的复杂度。
一种实现控制板上业务的主备倒换方法,该方法应用于包含多个控制板的HA系统中,每一控制板包含用于管理业务的HA处理单元和一个以上用于运行业务的业务单元;从各个控制板包含的HA处理单元中选择出一个作为主用HA处理单元;将待处理业务分成一个以上业务组;每一业务组包含一个以上业务;该方法包括:
A,针对启动的每一业务,运行该业务的业务单元将该业务注册到对应业务组中;
B,所述主用HA处理单元确定所述业务组的主用业务单元和对应的备用业务单元;所述主用业务单元为在业务组处理过程中处于主用状态的业务单元,与所述备用业务单元处于不同的控制板上;所述备用业务单元为在业务组处理过程中处于备用状态的业务单元;
C,所述主用HA处理单元在所述主用业务单元出现故障时,确定用于与出现故障的主用业务单元进行倒换的备用业务单元,使该备用业务单元与所述出现故障的主用业务单元进行主备倒换。
一种实现控制板上业务的主备倒换装置,该装置应用于包含多个控制板的HA系统中,每一控制板包含一个以上用于运行业务的业务单元;该装置包括:选择单元和一个以上HA处理单元;其中,各个HA处理单元分别处于不同的控制板上,用于管理其所处的控制板上的业务单元;
所述选择单元用于从所述一个以上HA处理单元中选择出一个作为主用HA处理单元;
所述主用HA处理单元在当前启动的业务注册到对应的业务组中时,确定所述业务组的主用业务单元和对应的备用业务单元;所述主用业务单元为在业务组处理过程中处于主用状态的业务单元,与所述备用业务单元处于不同的控制板上;所述备用业务单元为在业务组处理过程中处于备用状态的业务单元;以及在所述主用业务单元出现故障时,确定用于与出现故障的主用业务单元进行倒换的备用业务单元,使该备用业务单元与所述出现故障的主用业务单元进行主备倒换。
由上可见,本发明提供的方法和装置中,当主用HA处理单元在运行业务组中业务的主用业务单元出现故障时,确定用于与出现故障的主用业务单元进行倒换的备用业务单元,使该备用业务单元与所述出现故障的主用业务单元进行主备倒换。可以看出,本发明提供的方法中,当主用业务单元在运行业务组中业务出现故障时,并非将该主用业务单元所处的整个控制板进行倒换,而是仅将该出现故障的主用业务单元进行倒换,这样,大大降低了主备倒换的影响范围,并相应减少了主备倒换的复杂度。
附图说明
图1为现有技术中HA系统的结构图;
图2为本发明实施例提供的方法流程图;
图3a为本发明实施例提供的业务组示意图;
图3b为本发明实施例提供的HA系统的业务运行示意图;
图3c为针对图3中的HA系统的业务执行负载均衡后的效果示意图
图4为本发明实施例提供的装置结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明的方法进行详细描述。
本发明实施例提供的方法应用于包含多个控制板的HA系统中,每一控制板具有相同的结构,包含:HA处理单元、监控单元和一个以上的业务单元;其中,HA处理单元用于管理与其处于同一控制板上的业务单元;监控单元用于监控与其处于同一控制板的所有业务单元是否出现故障;业务单元为运行业务的实体,一个业务单元可以运行一个以上的业务,该业务具体为HA系统待处理业务。比如,HA系统待处理业务为业务1至业务5,则可使每一控制板包括3个业务单元,分别为业务单元1至业务单元3,其中,业务单元1用于运行业务1,业务单元2用于运行业务2和业务3,业务单元3用于运行业务4和业务5。
本发明实施例提供的方法的具体流程图可参见图2所示。参见图2,图2为本发明实施例提供的详细流程图。本实施例应用于包含多个控制板的HA系统,其中,每一控制板包含上述的业务单元、HA处理单元和监控单元。这里,控制板具体实现时可为控制板或者控制节点,这里以控制板为例。如图2所示,该流程可包括以下步骤:
步骤201,按照预设的确定原则从各个控制板包含的HA处理单元中选择出一个作为HA系统的主用HA处理单元。
这里,之所以选择出主用HA处理单元主要是为了统一管理HA系统中各个控制板上的业务单元。其中,预设的确定原则具体实现时可有多种实现形式,比如控制板的槽位最低,或者控制板的槽位最高等,本发明实施例并不具体限定。若预设的确定原则为控制板的槽位最低,则从各个控制板中选择槽位最低的控制板上的HA处理单元作为系统的主用HA处理单元。优选地,在确定出主用HA处理单元后,可将其他控制板上的HA处理单元确定为与该主用HA处理单元对应的备用HA处理单元。如此,在主用HA处理单元执行业务管理时,可将管理信息实时备份到备用HA处理单元中。
步骤202,将待处理业务分成一个以上业务组。
这里,每一业务组包含一个以上业务。本步骤之所以将待处理业务分成一个以上的业务组,主要是为了使主用HA处理单元以业务组为单位管理HA系统待处理的所有业务,而不是分散的针对各个控制板上各个业务单元运行的业务进行管理。
本实施例中,一个业务组中包含一个以上业务,而业务是由业务单元运行的,如此,就有可能导致一个业务组中的业务是由不同业务单元运行的,比如,若HA系统待处理业务为业务1至业务5,HA系统中的每一控制板上都包含业务单元1至业务单元3,其中,业务单元1运行业务1,业务单元2运行业务2和业务3,业务单元3运行业务4和业务5,如此,若将业务1、业务2和业务4划分到同一个业务组中,可以看出,该业务组中的业务是由不同业务单元运行的不同的业务,通常,一个业务组中任何时刻只存在一个处于主用状态的业务单元(记为主用业务单元),如此,后续步骤在确定该业务组的主用业务单元时就无法确定该业务组的主用业务单元。
优选地,本实施例中,由于HA系统包含的各个控制板具有相同的结构,为便于后续确定业务组的主用业务单元,本步骤202可按照各个控制板上运行相同业务的业务单元所运行的一个以上业务划分到同一业务组的原则,将待处理业务分成一个以上业务组,比如,若HA系统当前待处理业务为业务1至业务5,其中,HA系统包含了控制板1至控制板3,每一控制板上包含了运行业务1的业务单元1、运行业务2和业务3的业务单元2、以及运行业务4和业务5的业务单元3;按照上述原则对待处理业务1至业务5进行分组,比如,业务1划分到业务组x,业务2和业务3划分到业务组y,业务4和业务5划分到业务组z;当然,也可将业务1划分到业务组x,业务2划分到业务组y1,业务3划分到业务组y2,业务4划分到业务组z1,业务5划分到业务组z2。也就是说,步骤202在执行业务分组操作时,将HA包含的各个控制板上运行相同业务的业务单元所运行的一个以上业务分到同一业务组中,一般不将各个控制板上运行不同业务的业务单元所运行的不同业务划分到同一业务组中。
需要说明的是,本实施例中可将划分的各个业务所属的业务组信息缓存在各个控制板上运行各个业务的业务单元中。
步骤203,当业务启动时,各个控制板上运行该业务的业务单元将自身缓存的该业务所属的业务组信息携带在注册请求中发送给主用HA处理单元。
这里,步骤203启动的业务的个数为一个以上,并且,该启动的业务可以为各个控制板上相同业务单元运行的业务;也可为各个控制板上不同业务单元运行的业务。比如当前启动的业务为业务2、业务4和业务5,若每一控制板上运行业务2的实体为业务单元2,运行业务4和业务5的实体为业务单元3,则针对启动的业务2,各个控制板上的业务单元2将自身缓存的业务2所属的业务组信息携带在注册请求中发送给主用HA处理单元;针对启动的业务4和业务5,各个控制板上的业务单元3将自身缓存的业务4和业务5所属的业务组信息携带在注册请求中发送给主用HA处理单元。
其中,步骤203中的业务组信息可为业务组的序号或者名称等。
需要说明的是,步骤203发生的时间并没有特别的限制,其可发生在HA系统初始化时,或者HA系统正常运行其他业务的过程中等。
步骤204,主用HA处理单元接收注册请求,根据该注册请求携带的启动的业务所属的业务组信息将该启动的业务注册到对应的业务组中。
如此,主用HA处理单元后续可以业务组为单位来管理各个业务。
步骤205,针对每一业务组,主用HA处理单元在自身所处的控制板存储了业务配置文件时,判断该业务配置文件中是否存在该业务组的主用配置信息,如果是,执行步骤206;否则,执行步骤208。
这里,业务配置文件可为用户预先针对当前待处理业务设置的;也可为HA系统前次运行时由用户所配置的。其中,业务组的主用配置信息具体包含了该业务组的主用业务单元所在的控制板的信息(比如该控制板的名称或者序号等)。
需要说明的是,若当前不存在业务配置文件,或者存在业务配置文件,但该业务配置文件为空文件,则也执行步骤208。
本实施例中,步骤205中的每一业务组为包含了步骤203中启动的业务的每一业务组。为便于描述,以业务组1为例。
步骤206,根据主用配置信息确定该业务组1的主用业务单元所在的控制板,判断该控制板是否启动,如果是,执行步骤207;否则,执行步骤208。
这里,为便于执行步骤206中的判断操作,可在步骤206之前进一步包括:按照预设的竞争原则在HA系统包含的各个控制板中选择其中一个控制板作为系统主控制板;其中,预设的竞争原则与上述预设的确定原则可相同,也可不相同。本实施例中,当HA系统包含的除该系统主控制板之外的其他控制板启动时,都需要向系统主控制板进行启动请求;具体为:针对除该系统主控制板之外的每一控制板,该控制板通过自身包含的HA处理单元向系统主控制板发送启动请求,启动请求携带了与该控制板对应的启动信息,其中,与控制板对应的启动信息可为该控制板的槽位信息,或者该控制板的序号等。当系统主控制板接收到启动请求后,将该启动请求中携带的启动信息缓存到内存中。如此,步骤206中的判断操作可包括:判断内存中是否缓存了业务组1的主用业务单元所在的控制板对应的启动信息,如果是,确定该控制板已启动,否则,确定该控制板没有启动。
步骤207,根据主用配置信息确定业务组的主用业务单元。之后,执行步骤209。
这里,主用业务单元为在业务处理过程中处于主用状态(具体为与其他外部设备比如接口设备进行通信)的业务单元。若业务组1的主用配置信息为业务组1的主用业务单元在控制板1上的信息,则步骤207为:将控制板1上运行业务组1中业务的业务单元确定为业务组1的主用业务单元。
需要说明的是,在本步骤207确定出业务组1的主用业务单元后,直接将其他控制板上运行业务组1中业务的业务单元确定为该主用业务单元的备份(记为对应该主用业务单元的备用业务单元)。其中,备用业务单元为在业务处理过程中处于备用状态(具体为不与其他外部设备比如接口设备进行通信)的业务单元;并且,与其对应的主用业务单元处于不同的控制板上。
步骤208,确定系统主控制板上运行业务组1中业务的业务单元为业务组1的主用业务单元。之后,执行步骤209。
由于一个业务组中任何时刻只存在一个主用业务单元,因此,在本步骤208确定出业务组1的主用业务单元后,直接将除系统主控制板之外的其他控制板上运行业务组1中业务的业务单元确定为该主用业务单元的备份(记为对应该主用业务单元的备用业务单元)。
如此,通过步骤205至步骤208实现了确定业务组的主用业务单元和备用业务单元的操作。为便于理解该确定操作,下面以图3a所示的具体实施例进行描述。如图3a所示,HA系统包含控制板1、控制板2和控制板3,每一控制板上包含HA处理单元、运行业务1的业务单元1、以及运行业务2和业务3的业务单元2。其中,业务1启动时注册到业务组X中,业务2和业务3启动时注册到业务组Y中,若按照预设的竞争原则选择出控制板3为系统主控制板;以及按照预设的确定原则确定出控制板2上的HA处理单元为主用HA处理单元。针对业务组X,若主用HA处理单元所在的控制板(控制板2)上当前存在业务配置文件,并且该业务配置文件中存在业务组X的主用配置信息,其中,该主用配置信息为业务组X的主用业务单元所在的控制板的序号(假如为控制板1),则判断内存中是否缓存了控制板1的启动信息,如果是,如图3a所示,将控制板1上运行业务组X中业务(只有业务1)的业务单元1确定为业务组X的主用业务单元,将除控制板1之外的其他控制板即控制板2和控制板3上运行业务组X中业务(只有业务1)的业务单元1确定为业务组X的备用业务单元。针对业务组Y,若当前存在的业务配置文件中不存在业务组Y的主用配置信息,或者当前不存在业务配置文件,或者,当前存在的业务配置文件中存在业务组Y的主用配置信息(业务组Y的主用业务单元所在的控制板的序号),但是判断出内存中没有缓存根据业务组Y的主用配置信息确定出的控制板(比如控制板2)对应的启动信息,由于控制板3被选择为系统主控制板,则如图3a所示,将控制板3上运行业务组Y中业务(业务2和业务3)的业务单元2确定为业务组Y的主用业务单元,将除控制板3之外的控制板即控制板1和控制板2上运行业务组Y中业务(业务2和业务3)的业务单元2确定为业务组Y的备用业务单元。
需要说明的是,由于业务组的主用业务单元和备用业务单元是由主用HA处理单元确定的,各个业务单元并不知情,因此,在各个业务单元运行时,各个业务单元需要向主用HA处理单元发送一个身份咨询信息,即确定自身的身份是担任主用业务单元的身份还是担任备用业务单元的身份。
步骤209,监控主用业务单元在业务处理过程中是否出现故障,如果是,执行步骤210;否则,返回执行步骤209。
这里,由于HA系统中每一个控制板比如控制板除了包含业务单元和HA处理单元之外,还包含监控单元,其中,该监控单元用于监控与其处于同一控制板比如控制板上的业务单元是否出现故障。本实施例中由于主用业务单元处于主用状态,其通常需要与外部设备进行通信,因此,为保证系统的稳定性,可使监控单元重点监控与其处于同一控制板上的主用业务单元是否出现故障。
优选地,监控单元监控与其处于同一控制板上的主用业务单元是否出现故障的操作具体实现时可有多种实现形式,比如:监控单元定期发送状态查询给与其在同一控制板上的主用业务单元,该主用业务单元返回状态结果;如此,监控单元根据状态结果判断该主用业务单元是否出现故障;或者,主用业务单元定时主动发送状态报告给与其在同一控制板上的监控单元,如此,监控单元根据状态报告判断该主用业务单元是否出现故障;或者监控单元主动(定期或者实时)通过操作系统功能查看业务进程的运行状态,根据该运行状态判断该主用业务单元是否出现故障等。
步骤210,监控单元发送与其处于同一控制板上的主用业务单元出现故障的通知给步骤201确定出的主用HA处理单元。
这里,若监控单元与主用HA处理单元不在同一控制板上,则监控单元可通过HA系统中控制板之间的内部通信链路发送故障通知给主用HA处理单元。
本实施例中,监控单元发送的故障通知携带了出现故障的主用业务单元的位置信息,具体为出现故障的主用业务单元所在的控制板的信息。
步骤211,主用HA处理单元确定用于与出现故障的主用业务单元进行倒换的备用业务单元,并启动主备倒换。
这里,当主用业务单元出现故障时,用户可根据实际需求指定一个业务单元作为与出现故障的主用业务单元进行倒换的备用业务单元,如此,主用HA处理单元可根据接收的来自用户的配置指令(该配置指令中携带了用户指定的业务单元的标识信息,具体为该业务单元所在的控制板的信息)确定对应的备用业务单元。
优选地,本发明实施例中,为便于主用HA处理单元主动动态确定与出现故障的主用业务单元进行倒换的备用业务单元,可在步骤207或者步骤208确定出主用业务单元和备用业务单元后,记录确定出的主用业务单元的位置信息和对应的备用业务单元的位置信息,其中,主用业务单元的位置信息包含了主用业务单元所在的控制板的信息;备用业务单元的位置信息包含了备用业务单元所在的控制板的信息。
如此,主用HA处理单元根据接收的故障通知携带的主用业务单元的位置信息在已记录的位置信息中查找与该主用业务单元对应的备用业务单元的位置信息;从查找到位置信息中任意选择一个,将该选择的位置信息对应的业务单元确定为与所述出现故障的主用业务单元进行倒换的备用业务单元。或者,
主用HA处理单元在HA系统的堆叠结构为框式堆叠时,框式堆叠中每一框包含两个控制板,根据接收的故障通知携带的主用业务单元的位置信息,在已记录的位置信息中查找与出现故障的主用业务单元处于同一框的另一控制板上对应的备用业务单元的位置信息,将查找到的位置信息对应的业务单元确定为与出现故障的主用业务单元进行倒换的备用业务单元。这里,故障通知携带的主用业务单元的位置信息具体可为该主用业务单元所在的控制板的信息(比如控制板的槽位或者序号等),通常,一个框中的两个控制板的信息有关联(比如槽位相邻或者序号相邻等),如此,主用HA处理单元在已记录的位置信息中很容易查找到与出现故障的主用业务单元处于同一框的另一控制板上对应的备用业务单元的位置信息,之后,将查找到的位置信息对应的业务单元确定为与出现故障的主用业务单元进行倒换的备用业务单元。
通过步骤209至步骤211可以看出,监控单元对应的对象分为两侧,其中一侧为被监控侧(记为A侧),即主用业务单元;另一侧为关心监控结果侧(记为B侧),即主用HA处理单元。由于主用业务单元运行一个以上的业务,针对每一个业务,在监控单元、主用业务单元和主用HA处理单元三者之间用对应的字符串进行标识,达到全局统一。并且,由于一个控制板上可能包含一个以上主用业务单元,这样,监控单元的对象可包含多个A侧和B侧。
本发明实施例中,步骤211在启动主备倒换时,主用HA处理单元还可重启原主用业务单元,这样,在原主用业务单元重新启动后,原主用业务单元担任新主用业务单元的备份角色,为便于该原主用业务单元的业务信息与新主用业务单元的业务信息同步,可将新主用业务单元的业务信息批量备份到原主用业务单元中。
需要说明的是,本发明实施例中为保证控制板的负载均衡,在业务运行过程中,若接收到来自用户的动态调整命令,则根据调整条件调整各个控制板上处于主用状态的主用业务单元和处于备份状态的备用业务单元的个数,其中,调整条件为:控制板当前内存的使用情况、控制板当前CPU的使用情况、该控制板上预先设置的主用业务单元的数目,以及业务在该控制板上处于运行状态的预设程度值(通常,程度值越高表示该业务需要在该控制板上处于运行状态,程度值越低表示该业务需要在该控制板上处于备份状态)中的至少一个。
比如,参见图3b,图3b为本发明实施例提供的HA系统的业务运行示意图。如图3b所示,控制板1、控制板2,以及控制板3上配置业务单元,其中,该业务单元的个数为6个,若当前控制板1上有4个主用业务单元,两个备用业务单元,而控制板2和控制板3上各有一个主业务单元,5个备用业务单元,为保证各个控制板负载均衡,用户可下发动态调整命令,当HA系统接收到命令后,根据调整条件调整控制板1、控制板2,以及控制板3上运行的业务,若调整条件为:运行该业务的控制板当前的内存使用情况和当前的CPU使用情况;则当控制板2,以及控制板3上的当前内存和CPU还能满足额外增加的至少一个主用业务单元,则将当前控制板1上的其中一个主用业务单元进行主备倒换,具体将该主用业务单元倒换到控制板2上运行该主用业务单元所运行的业务组中业务的业务单元,即由该业务单元担任主用业务单元;相应地,控制板1上执行倒换的主用业务单元担任备用业务单元。类似地,还可再次将当前控制板1上剩余三个主用业务单元中的其中一个倒换到控制板3上运行该主用业务单元所运行的业务组中业务的业务单元,相应地,控制板1上执行倒换的主用业务单元担任备用业务单元。如此,控制板1、控制板2、以及控制板3上各运行两个主用业务单元和四个备用业务单元,达到图3c所示的效果,这样,能够保证控制板的负载均衡。
以上是对本发明所提供的方法进行的描述,下面对本发明所提供的装置进行详细描述。
参见图4,图4为本发明实施例提供的装置结构图。该装置应用于包含多个控制板的HA系统中,每一控制板包含一个以上用于运行业务的业务单元;该装置包括:选择单元401和一个以上HA处理单元402;其中,各个HA处理单元分别处于不同的控制板上,用于管理其所处的控制板上的业务单元。
选择单元401用于从一个以上HA处理单元402中选择出一个作为主用HA处理单元;这里,假如选择出一个以上HA处理单元402中的HA处理单元4021为主用HA处理单元。
主用HA处理单元4021在当前启动的业务注册到对应的业务组中时,确定所述业务组的主用业务单元和对应的备用业务单元;所述主用业务单元为在业务组处理过程中处于主用状态的业务单元,与所述备用业务单元处于不同的控制板上;所述备用业务单元为在业务组处理过程中处于备用状态的业务单元;以及,在所述主用业务单元出现故障时,确定用于与出现故障的主用业务单元进行倒换的备用业务单元,使该备用业务单元与所述出现故障的主用业务单元进行主备倒换。
优选地,选择单元401还用于从HA系统包含的各个控制板中选择一个控制板作为系统主控制板。
如图4所示,主用HA处理单元4021包括:判断子单元4022、第一确定子单元4023和第二确定子单元4024。
其中,判断子单元4022在自身所处的控制板存储了业务配置文件时,判断该业务配置文件中是否存在所述业务组的主用配置信息;
第一确定子单元4023用于在判断子单元4022的判断结果为是时,根据所述主用配置信息确定所述业务组的主用业务单元,并确定除所述主用业务单元所处控制板之外的控制板上的用于运行所述业务组中业务的业务单元为与所述主用业务单元对应的备用业务单元;
第二确定子单元4024用于在判断子单元4022的判断结果为否时,确定所述系统主控制板上运行所述业务组中业务的业务单元为该业务组的主用业务单元,确定除主用业务单元所处控制板之外的控制板上运行所述业务组中业务的业务单元为与该主用业务单元对应的备用业务单元。
优选地,如图4所示,主用HA处理单元4021还包括:记录子单元4025和第三确定子单元4026。
记录子单元4025记录第一确定子单元4023或者第二确定子单元4024确定的主用业务单元和对应的备用业务单元的位置信息;
第三确定子单元4026包括:查找模块40261和确定模块40262;
其中,查找模块40261用于接收HA系统中各个控制板上的监控单元发送的故障通知,其中,该故障通知携带了出现故障的主用业务单元的位置信息;根据接收的故障通知携带的位置信息在记录子单元4025已记录的位置信息中查找到任意一个对应的备用业务单元的位置信息;或者,在所述HA系统的堆叠结构为框式堆叠时,框式堆叠中每一框包含两个控制板,根据接收的故障通知携带的位置信息,在记录子单元4025已记录的位置信息中查找与出现故障的主用业务单元处于同一框的另一控制板上对应的备用业务单元的位置信息;
确定模块40262将查找模块40261查找到的位置信息对应的业务单元确定为与所述出现故障的主用业务单元进行倒换的备用业务单元。
优选地,如图4所示,该装置还包括:调整单元403。
其中,调整单元403用于在接收到动态调整命令时,按照负载均衡原则并结合预设的调整条件调整各个控制板上主用业务单元和备用业务单元的数量;其中,所述调整条件为:控制板当前内存的使用情况、控制板当前CPU的使用情况、控制板上预设的主用业务单元的数目,以及业务在控制板上处于运行状态的预设程度值中的至少一个。
由以上描述可以看出,本发明提供的实现控制板上业务的主备倒换方法和装置中,当主用HA处理单元在运行业务组中业务的主用业务单元出现故障时,确定用于与出现故障的主用业务单元进行倒换的备用业务单元,使该备用业务单元与所述出现故障的主用业务单元进行主备倒换。可以看出,本发明提供的方法中,当主用业务单元在运行其对应的业务时出现故障,并非将该主用业务单元所处的整个控制板进行倒换,而是仅将该出现故障的主用业务单元进行倒换,这样,大大降低了主备倒换的影响范围,并相应减少了主备倒换的复杂度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种实现控制板上业务的主备倒换方法,其特征在于,该方法应用于包含多个控制板的高可用性HA系统中,每一控制板包含用于管理业务的HA处理单元和一个以上用于运行业务的业务单元;从各个控制板包含的HA处理单元中选择出一个作为主用HA处理单元;将待处理业务分成一个以上业务组;每一业务组包含一个以上业务;该方法包括:
A,针对启动的每一业务,各个控制板上运行该业务的业务单元将该业务注册到对应业务组中;
B,所述主用HA处理单元确定所述业务组的主用业务单元和对应的备用业务单元;所述主用业务单元为在业务组处理过程中处于主用状态的业务单元,与所述备用业务单元处于不同的控制板上;所述备用业务单元为在业务组处理过程中处于备用状态的业务单元;
C,所述主用HA处理单元在所述主用业务单元出现故障时,确定用于与出现故障的主用业务单元进行倒换的备用业务单元,使该备用业务单元与所述出现故障的主用业务单元进行主备倒换。
2.根据权利要求1所述的方法,其特征在于,预先将各个业务所属的业务组信息缓存到运行各个业务的业务单元中;
所述步骤A的注册包括:各个控制板上针对运行所述启动的业务的业务单元将缓存的该业务所属的业务组信息携带在注册请求中发送给所述主用HA处理单元;所述主用HA处理单元接收所述注册请求,根据所述注册请求携带的所述业务所属的业务组信息将所述业务注册到对应的业务组中。
3.根据权利要求1所述的方法,其特征在于,预先从HA系统包含的各个控制板中选择一个控制板作为系统主控制板;所述步骤B中的确定包括:
B1,所述主用HA处理单元在自身所处的控制板存储了业务配置文件时,判断该业务配置文件中是否存在所述业务组的主用配置信息,在是的情况下,执行步骤B2;在不存在所述业务组的主用配置信息时,或者在当前未存储所述业务配置文件时,执行步骤B3;
B2,根据所述主用配置信息确定所述业务组的主用业务单元,并确定除所述主用业务单元所处控制板之外的控制板上的用于运行所述业务组中业务的业务单元为与所述主用业务单元对应的备用业务单元;
B3,确定所述系统主控制板上运行所述业务组中业务的业务单元为该业务组的主用业务单元,确定除主用业务单元所处控制板之外的控制板上运行所述业务组中业务的业务单元为与该主用业务单元对应的备用业务单元。
4.根据权利要求3所述的方法,其特征在于,所述HA系统中每一控制板还包括用于监控与其处于同一控制板上的主用业务单元是否出现故障的监控单元;
当监控单元监控出与其处于同一控制板的主用业务单元出现故障时,发送故障通知给所述主用HA处理单元。
5.根据权利要求4所述的方法,其特征在于,所述步骤C中的确定包括:
根据来自用户的配置指令将该配置指令携带的业务单元标识信息对应的业务单元确定为与所述出现故障的主用业务单元进行倒换的备用业务单元;或者;
所述故障通知携带了出现故障的主用业务单元的位置信息;所述主用HA处理单元记录通过所述步骤B2或者步骤B3确定的主用业务单元和对应的备用业务单元的位置信息;
所述主用HA处理单元根据接收的故障通知携带的位置信息在已记录的位置信息中查找到任意一个对应的备用业务单元的位置信息,将查找到的位置信息对应的业务单元确定为与所述出现故障的主用业务单元进行倒换的备用业务单元;或者,在所述HA系统的堆叠结构为框式堆叠时,框式堆叠中每一框包含两个控制板,所述主用HA处理单元根据接收的故障通知携带的位置信息,在已记录的位置信息中查找与出现故障的主用业务单元处于同一框的另一控制板上对应的备用业务单元的位置信息,将查找到的位置信息对应的业务单元确定为与所述出现故障的主用业务单元进行倒换的备用业务单元。
6.根据权利要求1至5任一所述的方法,其特征在于,在主用业务单元的业务处理过程中,若接收到动态调整命令,则按照负载均衡原则并结合预设的调整条件调整各个控制板上主用业务单元和备用业务单元的数量;其中,所述调整条件为:控制板当前内存的使用情况、控制板当前CPU的使用情况、控制板上预设的主用业务单元的数目,以及业务在控制板上处于运行状态的预设程度值中的至少一个,其中,所述程度值越高表示业务需要在控制板上处于运行状态,程度值越低表示业务需要在控制板上处于备份状态。
7.一种实现控制板上业务的主备倒换装置,其特征在于,该装置应用于包含多个控制板的高可用性HA系统中,每一控制板包含一个以上用于运行业务的业务单元;该装置包括:选择单元和一个以上HA处理单元;其中,各个HA处理单元分别处于不同的控制板上,用于管理其所处的控制板上的业务单元;
所述选择单元用于从所述一个以上HA处理单元中选择出一个作为主用HA处理单元;
所述主用HA处理单元在当前启动的业务由各个控制板上运行该业务的业务单元注册到对应的业务组中时,确定所述业务组的主用业务单元和对应的备用业务单元;所述主用业务单元为在业务组处理过程中处于主用状态的业务单元,与所述备用业务单元处于不同的控制板上;所述备用业务单元为在业务组处理过程中处于备用状态的业务单元;以及在所述主用业务单元出现故障时,确定用于与出现故障的主用业务单元进行倒换的备用业务单元,使该备用业务单元与所述出现故障的主用业务单元进行主备倒换。
8.根据权利要求7所述的装置,其特征在于,所述选择单元还用于从HA系统包含的各个控制板中选择一个控制板作为系统主控制板;所述主用HA处理单元包括:判断子单元、第一确定子单元和第二确定子单元;其中,
所述判断子单元在自身所处的控制板存储了业务配置文件时,判断该业务配置文件中是否存在所述业务组的主用配置信息;
所述第一确定子单元用于在所述判断子单元的判断结果为是时,根据所述主用配置信息确定所述业务组的主用业务单元,并确定除所述主用业务单元所处控制板之外的控制板上的用于运行所述业务组中业务的业务单元为与所述主用业务单元对应的备用业务单元;
所述第二确定子单元用于在所述判断子单元的判断结果为否时,确定所述系统主控制板上运行所述业务组中业务的业务单元为该业务组的主用业务单元,确定除主用业务单元所处控制板之外的控制板上运行所述业务组中业务的业务单元为与该主用业务单元对应的备用业务单元。
9.根据权利要求8所述的装置,其特征在于,所述主用HA处理单元还包括:记录子单元和第三确定子单元;其中,
所述记录子单元记录所述第一确定子单元或者所述第二确定子单元确定的主用业务单元和对应的备用业务单元的位置信息;
所述第三确定子单元包括:查找模块和确定模块;其中,
所述查找模块用于接收HA系统中各个控制板上的监控单元发送的故障通知,其中,该故障通知携带了出现故障的主用业务单元的位置信息;根据接收的故障通知携带的位置信息在所述记录子单元已记录的位置信息中查找到任意一个对应的备用业务单元的位置信息;或者,在所述HA系统的堆叠结构为框式堆叠时,框式堆叠中每一框包含两个控制板,根据接收的故障通知携带的位置信息,在所述记录子单元已记录的位置信息中查找与出现故障的主用业务单元处于同一框的另一控制板上对应的备用业务单元的位置信息;
所述确定模块将所述查找模块查找到的位置信息对应的业务单元确定为与所述出现故障的主用业务单元进行倒换的备用业务单元。
10.根据权利要求7所述的装置,其特征在于,该装置还包括:调整单元;其中,
所述调整单元用于在接收到动态调整命令时,按照负载均衡原则并结合预设的调整条件调整各个控制板上主用业务单元和备用业务单元的数量;其中,所述调整条件为:控制板当前内存的使用情况、控制板当前CPU的使用情况、控制板上预设的主用业务单元的数目,以及业务在控制板上处于运行状态的预设程度值中的至少一个,其中,所述程度值越高表示业务需要在控制板上处于运行状态,程度值越低表示业务需要在控制板上处于备份状态。
CN2009100887851A 2009-07-16 2009-07-16 一种实现控制板上业务的主备倒换方法和装置 Active CN101605051B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100887851A CN101605051B (zh) 2009-07-16 2009-07-16 一种实现控制板上业务的主备倒换方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100887851A CN101605051B (zh) 2009-07-16 2009-07-16 一种实现控制板上业务的主备倒换方法和装置

Publications (2)

Publication Number Publication Date
CN101605051A CN101605051A (zh) 2009-12-16
CN101605051B true CN101605051B (zh) 2011-09-07

Family

ID=41470610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100887851A Active CN101605051B (zh) 2009-07-16 2009-07-16 一种实现控制板上业务的主备倒换方法和装置

Country Status (1)

Country Link
CN (1) CN101605051B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102143032B (zh) * 2010-02-02 2014-05-07 杭州华三通信技术有限公司 清除残留链路状态协议数据单元分片的方法及路由设备
CN101938417A (zh) * 2010-09-01 2011-01-05 中兴通讯股份有限公司 板卡主备配置的实现方法和板卡
CN102025551A (zh) * 2010-12-23 2011-04-20 中兴通讯股份有限公司 基于接入网关的主备用设备切换方法和装置
CN102780571A (zh) * 2011-05-11 2012-11-14 中兴通讯股份有限公司 主备板倒换的处理方法及系统
CN103023673A (zh) * 2011-09-21 2013-04-03 中兴通讯股份有限公司 一种控制单元的启动方法及装置
CN109120680B (zh) * 2018-07-27 2022-01-14 北京华为数字技术有限公司 一种控制系统、方法及相关设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1909550A (zh) * 2005-08-03 2007-02-07 中兴通讯股份有限公司 一种实现主备倒换及负荷分担的系统及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1909550A (zh) * 2005-08-03 2007-02-07 中兴通讯股份有限公司 一种实现主备倒换及负荷分担的系统及方法

Also Published As

Publication number Publication date
CN101605051A (zh) 2009-12-16

Similar Documents

Publication Publication Date Title
EP3620905B1 (en) Method and device for identifying osd sub-health, and data storage system
CN101605051B (zh) 一种实现控制板上业务的主备倒换方法和装置
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
US7340637B2 (en) Server duplexing method and duplexed server system
CN101110776B (zh) 数据业务的备份方法、备份装置与备份系统
EP1622307B1 (en) Communication system including a temporary save server
US20010037473A1 (en) Backup apparatus and a backup method
EP1863222B1 (en) A disaster recovery system and method of service controlling device in intelligent network
CN101150439A (zh) 一种实现主备切换的方法、系统及设备
CN101714109A (zh) 双cpu系统主板的控制方法及设备
CN102388570B (zh) 一种主备模式下的单板运行方法及系统
CN111581287A (zh) 一种数据库管理的控制方法、系统和存储介质
CN100496030C (zh) 基于高可用性系统的综合接入媒体网关设备
JP2000332653A (ja) 監視システム及び方法
CN112803998B (zh) 多总线网络跨网通信方法、装置、系统、设备和存储介质
CN102571311B (zh) 主备切换的通讯系统和通讯方法
CN110972170A (zh) 基站的配置方法及基站
CN100362484C (zh) 多机备份的方法
CN100395962C (zh) 通信系统中设备的倒换方法及其系统
KR100297555B1 (ko) 이동통신 시스템에서의 다이나믹 기능을 이용한 기지국의 채널자원 관리방법
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
CN101616025B (zh) 一种控制板上业务的主备确定方法和装置
CN100499387C (zh) 一种通信系统中单板的n+1备份的方法
CN1845468B (zh) N+1冗余备份方法、处理板和多处理板系统
CN100463373C (zh) 一种集中控制并分层实施的切换控制方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Patentee after: Xinhua three Technology Co., Ltd.

Address before: 310053 Hangzhou hi tech Industrial Development Zone, Zhejiang province science and Technology Industrial Park, No. 310 and No. six road, HUAWEI, Hangzhou production base

Patentee before: Huasan Communication Technology Co., Ltd.