CN1547329A - 一种通信系统中单板的n+1备份的方法 - Google Patents
一种通信系统中单板的n+1备份的方法 Download PDFInfo
- Publication number
- CN1547329A CN1547329A CNA2003101123706A CN200310112370A CN1547329A CN 1547329 A CN1547329 A CN 1547329A CN A2003101123706 A CNA2003101123706 A CN A2003101123706A CN 200310112370 A CN200310112370 A CN 200310112370A CN 1547329 A CN1547329 A CN 1547329A
- Authority
- CN
- China
- Prior art keywords
- communication system
- slave board
- mainboard
- board
- described communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 156
- 238000000034 method Methods 0.000 title claims abstract description 107
- 230000007704 transition Effects 0.000 claims abstract description 14
- 238000011084 recovery Methods 0.000 claims description 49
- 230000007257 malfunction Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 4
- 238000011897 real-time detection Methods 0.000 abstract 1
- 238000013461 design Methods 0.000 description 4
- 238000013024 troubleshooting Methods 0.000 description 3
- 230000002950 deficient Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
本发明的一种通信系统中单板的N+1备份的方法,所述通信系统中包括有物理结构相同的多块单板作为主板,以及另增一物理结构相同的单板作为该多块主板的备板;所述通信系统在上电后记录各单板的相关信息,所述方法包括:所述通信系统指定单板的主/备类型,并对所述各单板的工作状态进行实时检测;所述通信系统根据情形,根据已记录的该单板的相关信息判断该单板的主/单板类型,进行主板或备板的状态跃迁处理,并记录主、备记录信息,所述状态跃迁处理发生在主、备板的配置请求流程,故障倒换流程以及故障恢复流程。本发明方法提高系统的可靠性,节省系统资源,而且单板的配置方式灵活,并大大降低系统的复杂程度和产品成本。
Description
技术领域
本发明涉及通信领域,尤其是涉及通信系统中单板备份的配置方法。
背景技术
在中国知识产权局公开的申请号为00106113.5的发明专利申请中,阐述了一种用于交换机的主备倒换方法,该方法对交换机的主控板及交换网板进行了1+1的冗余备份。该方法中所述主控板的主、备两板保持实时通信,在所述主控板备板上保持一份与所述主控板主板上同样的数据而实现热备份。所述交换网板的主用、备用两板处于同步运行状态,一旦所述交换网板的主用板出现问题时则由该交换网板的备用板接替工作从而实现热备份。
在上述现有技术中,其提出了对某一类型的数量为一的单板进行1+1备份的保护方式,但对于目前的大多数系统来说,除了包括一些数量为一的单板外,往往还包括许多个,数量个数为自然数N的物理结构相同的单板,如:在码分多址系统中,基站控制台的声码器板以及基站收发信台的基带板和射频板等,这些单板在数量上都分别有多块。
对于现有技术系统中的这些多块物理结构相同的单板,如果采用上述申请号为00106113.5的发明所述的“1+1备份”方法,就需要对这些物理结构相同的每块单板都配置一块备用板,并且对应的主、备两板之间保持实时通信。若整个系统中该类型的单板数量为N,那么这时相当于采用了“N+N备份”方式,这样这种方法虽然能完成对单板故障时的保护,但是由于每块板都需要配置一块备份板,系统实际需要的单板配置数量总数为2N,所使用资源增加了一倍。如果在该系统中所包含的单板种类和数量越多,需要增加的资源也就越多,因而系统的复杂度也随之增加,成本就显著加大了。
同时,由于在现有技术的“1+1备份”时,每一对所述主、备板都是一一对应的,而且要保持其相互之间的实时通信,这样一方面所述主、备板之间的配置不灵活(因主、备板两两之间要一一对应),另一方面必然会加大该系统对数据相关信息的处理工作量,增加了系统的负荷。因此,这种“1+1备份”或“N+N备份”的方法并不适合多块物理结构相同的单板保护。
因此,现有技术显然存在缺陷,而有待于改进和发明创造。
发明内容
本发明的目的是提供一种通信系统中单板的N+1备份的方法,为了克服现有技术中的上述缺陷,实现对物理结构相同的多块单板的使用一块冗余单板进行备份保护,从而减少资源浪费和系统复杂程度,以及降低系统处理负荷,从而解决现有技术中存在的不能合理而有效的对多块物理结构相同的单板进行备份保护的问题。
本发明的技术方案如下:
一种通信系统中单板的N+1备份的方法,所述通信系统中包括有物理结构相同的多块单板,其中至少一块单板作为备板,其余单板作为主板;所述通信系统在上电后记录各单板的相关信息,所述方法还包括以下步骤:
a)所述通信系统指定单板的主/备类型,并对所述各单板的工作状态进行实时检测;
b)所述通信系统根据情形,根据已记录的该单板的相关信息判断该单板的主/单板类型,相应进行主板或备板的状态跃迁处理,并记录处理后的主、备记录信息,即:
b1)所述通信系统根据单板的配置请求信息进行配置主、备板的配置请求流程;
b2)所述通信系统在检测到所述多块单板中的一块发生故障时,进行主、备板的故障倒换流程;
b3)所述通信系统在检测到某一故障单板被恢复时,进行主、备板的故障恢复流程。
所述的方法,其中,所述步骤b)中的故障倒换流程包括:
b21)如该故障单板为主板时,判断是否存在空闲且状态正常的所述备板;
b23)如有空闲且状态正常的备板,则所述通信系统通知该备板进行倒换;
b24)如无空闲且状态正常的备板,则所述通信系统停止该故障主板的工作,通知该故障主板进入故障状态,并由该通信系统告警该主板故障。
所述的方法,其中,所述步骤b)中的故障倒换流程还包括:
b25)如所述通信系统查询该故障单板为备板,则所述通信系统通知该故障备板进入故障状态,并由该通信系统告警该备板故障。
所述的方法,其中,所述步骤b23)的倒换过程包括:
b231)所述备板收到所述通信系统的倒换通知后,向该通信系统发起配置请求;
b232)所述通信系统根据已记录的该故障主板的相关信息,依该相关信息配置所述备板;
b233)所述备板转入主板状态开始工作;
b234)所述通信系统通知所述故障主板停止工作,进入故障状态,等待故障恢复;
b235)所述通信系统更新相应的主、备记录信息。
所述的方法,其中,所述步骤b)中的配置请求流程还包括以下步骤:
b11)所述通信系统进入正常工作状态并收到某一单板的配置请求信息;
b12)所述单板为主板时,该通信系统根据其所记录的该主板的相关信息对该主板进行配置;
b13)所述单板为备板时,根据所述通信系统查询该备板的倒换记录,如该备板已倒换过,则根据所述通信系统已记录的倒换主板的相关信息来配置该备板,并相应更新主、备记录信息;如该备板未曾倒换过,则该备板进入空闲等待状态。
所述的方法,其中,所述步骤b)中的主板故障恢复流程包括:
b31)所述通信系统查询该主板的倒换记录;
b32)如在故障时已倒换,则所述通信系统查询该倒换备板的工作状态,如该倒换备板工作正常,则所述故障恢复后的主板转为备板,进入备板的空闲等待状态;如该倒换备板有故障,则由所述通信系统根据已记录的该主板的相关信息配置该故障恢复的主板重新开始工作;
b33)如在故障时没有倒换,则由所述通信系统根据其已记录的该主板的相关信息重新配置该故障恢复后的主板开始工作;
b34)所述通信系统相应更新其主、备记录信息。
所述的方法,其中,所述步骤b)中的备板故障恢复流程包括:
b35)所述通信系统检测到所述备板被故障恢复后,查询其已记录的相关信息,获得所述多个主板的工作情况;
b36)如果所述通信系统当前存在故障且没有倒换的主板,则向该故障恢复后的备板进行倒换;
b37)如果所述通信系统当前所述各主板工作状态均正常,则该被故障恢复的备板直接进入备板空闲等待状态。
所述的方法,其中,所述备板的指定由人工指定该多块单板中的一块为备板。
所述的方法,其中,所述备板的指定由所述通信系统根据所述多块单板的上电顺序指定。
所述的方法,其中,所述备板的指定由所述通信系统对该多块单板随机指定。
本发明所提供的一种通信系统中单板的N+1备份的方法,由于采用了N块单板可共用一块备份板,实现了物理结构相同的多块单板在故障时的备份保护,达到了故障时相关信息不丢失的效果,使系统的可靠性提高了88.9%。同时,与“1+1备份”或“N+N备份”方法相比,本方法能节省(1-1/N)×100%的资源,而且单板的数量越多(即N越大),节省的资源越多。另外,由于本方法只需要在系统中多增加一块结构相同的备份板,且这些共N+1块单板中的任意一块可作为备板,因此单板的配置方式灵活,并大大降低系统的复杂程度和产品成本。
附图说明
附图中,
图1是本发明方法的多块单板在N+1备份配置时的主、备状态跃迁流程示意图;
图2是本发明方法的单板在N+1备份配置时的配置请求流程图;
图3是本发明方法的单板在N+1备份配置时的故障倒换流程图;
图4是本发明方法的单板在N+1备份配置时的故障恢复流程图。
具体实施方式
下面结合附图对技术方案的实施例作进一步的详细描述:
本发明所提供的一种通信系统中单板的N+1备份的方法,在复杂度最低、资源使用最少的前提下,使得多块物理结构相同的单板中的某块单板在发生故障时,能通过一种有效的方法保证故障单板的数据不丢失,该通信系统仍能正常工作。
具体的说,如果当前系统中某一类型的单板数量为N,那么就在系统中再另外增加一块与之物理结构相同的单板,作为这N块单板的备板。当这N块单板中任一块发生了故障时,就可以通过将数据倒换到这第N+1块用作备份的单板上来保证所述通信系统的运行可靠性和用户业务的稳定性。这种方法即称为“N+1备份”设计,该方法相当于这N块物理结构相同的单板共享一块备份板来实现对数据相关信息的保护。
对于所述备板的指定,本发明方法可采用两种方式:
1.采用人为指定的方式,即:人为指定这N+1块单板中的任意一块为备板,剩余N块为主板。这种方式的优点在于:系统处理简单,直接可以从配置中得到单板的主备关系,便于维护和管理。但一旦发生了连续倒换,在系统记录中为备板的单板可能已倒换成主板进行工作,如果此时不人为对系统记录的主备板信息进行更新,就会导致实际的主备相关信息与系统记录的不一致。因此,采用人为指定的方式时,必须人为更新系统主备信息记录,不灵活。
2.采用系统自动指定的方式,例如:所述通信系统可以根据N+1块单板的上电顺序指定主、备板,也可以随机指定。这种方式的优点在于:灵活,连续倒换后,仍能通过实时的消息交互,保证实际的主备相关信息与所述通信系统的记录相关信息的一致性。但缺点是:处理复杂,会增加系统的处理,开销增大。
在实际设计中,本发明方法可根据系统的设计要求来选择单板的主、备指定方式:如果对系统开销要求较高,可采用人为指定的方法,否则可采用系统自动指定的方法。
本发明的该单板“N+1”备份方法的核心思想在于在本发明的“N+1备份”方法中,所述多个单板(包括主、备板)的相关信息必须由所述通信系统记录,记录可以通过多种方式实现,例如,使用数据库来管理,也可用标识位及数据结构来管理等等,须要正确记录该N+1块单板的相应数据及相关信息,并建立该多块单板的主、备关系表。
同时,本发明方法的所述通信系统还对各单板,包括各主板和所述备板进行实时检测其工作状态并进行记录,所述主板的工作状态如图1所示的包括主板正常工作状态(状态a),主板故障状态(状态b),主板故障恢复状态(状态c);而所述备板的工作状态包括备板空闲等待状态(状态d),备板故障状态(状态e),备板故障恢复状态(状态f)。对于物理结构相同的该N块单板,系统另增一块与之物理结构相同的单板,作为这N块板的备板,也就是该N块单板共享一块备份板,由所述通信系统实时检测各单板的工作状态,一旦这N块单板中任一块发生了故障,通过与第N+1块的备板进行倒换,来确保故障主板上的数据不丢失,同时不影响系统运行和用户服务。
在本发明的“N+1备份”方法中,所述多个单板的相关信息必须由所述通信系统记录,其可以通过多种方式实现,只要能够正确记录N+1块单板的相应数据及相关信息即可。这里,以数据库记录相关信息的方式为例进行描述。
本发明方法采用数据库管理的方式记录单板相关信息时,须建立该多块单板的主、备关系表。
对于主板,记录的相关信息可以包括:
●逻辑地址:该主板对应的地址。
●当前状态:该主板的当前状态,如正常或故障。
●上一状态:该主板的上一状态。在该主板的状态跃迁时,先将跃
迁前的状态存入“上一状态”,同时将跃迁后的状态存入“当前
状态”。
●是否倒换过:用于标识该主板是由于倒换从备板转成的主板,还
是所述通信系统上电时原来的主板。
●对应备板的地址:如果当前主板不是由倒换的备板转成的,则不
用填写;否则,将倒换之前的备板的地址存入“对应备板地址”。
●当前状态配置数据:与“当前状态”相对应的主板的配置数据。
●上一状态配置数据:与“上一状态”相对应的主板的配置数据。
●需要记录的其他相关信息。
对于备板,记录的相关信息可以包括:
●逻辑地址:该备板对应的地址。
●当前状态:该备板的当前状态,如空闲等待状态或故障。
●上一状态:该备板的上一状态。在状态跃迁时,先将跃迁前的状
态存入“上一状态”,同时将跃迁后的状态存入“当前状态”。
●是否倒换过:该备板是由于倒换后从主板转成的备板,还是所述
通信系统上电时的备板。
●对应主板的地址:如果当前备板不是由倒换的主板转成的,则不
用填写;否则,将倒换之前的主板的地址存入“对应主板地址”。
●等等需要记录的其他相关信息。
每次单板的数据或者状态等相关信息发生变化时,该数据库中的记录就进行相应的更新,如图2、图3及图4中所示的步骤211,步骤313,步骤414等所对应的操作。在实际使用时,所述通信系统根据需要,通过查询该数据库来获得某一单板的最近状态的相关信息并加以使用。
为了便于描述,将这N块单板称为主板,将另增的第N+1块单板称为备板。这里,先令N>=2。因为,当N=1时,即:对于一块单板配置一块备份板,此时就可以按照通常使用的“1+1”备份的方法来保护,设计比较简单,是所述的“N+1”备份方法的一个特例。为了说明本发明方法对多块单板备份保护的通用性,取N>=2时的设计来描述具体实现方法。
本发明方法主要包括单板主/备状态的处理,具体步骤描述如下:
第一步,所述通信系统指定单板的主/备类型后,即其中一块单板为备板,其他为主板,根据当前运行情况,进行主板和备板的状态跃迁处理。
第二步,如图1所示的,所述主板的状态跃迁处理可具体划分为:
1.所述主板上电后,进入正常运行状态,即图1中的状态a,所述通信
系统记录当前该主板的地址、状态及数据等相关信息。
2.如果该多块主板中的一块发生了故障,则该对应主板进入故障状态,
即图1中的状态b,所述通信系统记录该主板故障时的状态及数据等
相关信息。
3.一旦该主板故障被恢复,该主板进入故障恢复状态,即图1中的状态
c,所述通信系统需要记录该主板故障恢复时的状态及数据等相关信
息。
4.所述通信系统根据所记录的相关信息,如果所述主板在故障时,没有
发生倒换或者检测到与之对应的倒换备板当前工作不正常,即也处于
故障状态,这时,该经过故障恢复的主板需要重新变为主板开始工作,
进入所述主板的正常状态,即图1中的状态a,所述通信系统需要更
新该主板的状态和数据等相关信息。
5.所述通信系统根据记录的相关信息,如果该主板在故障时,发生了倒
换且检测到与之对应的所述倒换备板当前工作正常,这时,该故障恢
复的所述主板应变为备板,进入备板空闲等待状态,即图1中的状态
d,所述通信系统根据该当前情况更新该由主板转变后的备板的状态
和数据等相关信息。
第三步,如图1所示的,所述备板的状态跃迁处理可具体划分为:
1.所述备板上电后,进入备板空闲等待状态,即图1中的状态d,所述
通信系统记录当前该备板的地址、状态及数据等相关信息。
2.如果所述备板发生了故障,该备板进入故障状态,即图1中的状态e,
所述通信系统记录该备板故障时的状态及数据等相关信息。
3.一旦对该备板进行故障恢复,该备板进入故障恢复状态,即图1中的
状态f,所述通信系统需要记录该备板故障恢复时的状态及数据等相
关信息。
4.所述通信系统根据所记录的相关信息,如果当前存在发生了故障且还
没有进行倒换的主板,则需要该备板与之进行倒换,该备板变成主板
开始工作,即:进入主板正常状态,即图1中的状态a,所述通信系
统需要更新该由备板转换成的主板的状态和数据等相关信息。
5.所述通信系统根据所记录的相关信息,如果当前不存在发生了故障且
未进行倒换的主板,则需要该故障恢复的备板重新进入备板空闲等待
状态,即图1中状态d,所述通信系统根据当前情况更新该备板的状
态和数据等相关信息。
6.所述备板进入备板空闲等待状态,即图1中的状态d后(非上电后的
备板空闲等待状态),一旦所述通信系统检测到当前有某块主板发生
了故障,就需要该备板与之进行倒换,该备板变成主板开始工作,即:
进入主板正常状态,即图1中的状态a,所述通信系统需要更新该由
备板转换为主板的状态和数据等相关信息。
所述主板或单板的状态跃迁处理通过以下结合附图的详细描述,将使其实用性和创造性更为突出。
首先,如图2所示的,为本发明方法的多块单板在N+1备份配置时的配置请求流程,具体包括下列步骤:
步骤201:程序开始;
步骤202:所述通信系统进入正常工作状态;
步骤203:所述系统收到某一单板的配置请求消息;
步骤204:所述通信系统根据其所记录的相关信息,获得该单板的类型;
步骤205:对该单板类型进行判断,是主板还是备板;
步骤206:如果该单板是主板,则进入主板配置流程,所述通信系统根据记录的相关信息获得该主板的配置数据,对其进行配置。
承接所述步骤205,如果该单板是备板,则进入备板配置流程。该备板配置流程又包括下列步骤:
步骤207:所述通信系统查询该备板的倒换记录;
步骤208:判断是否发生过倒换;
步骤209:如果发生过倒换,所述通信系统获得与之倒换的主板的配置相关信息;
步骤210:所述通信系统用得到的该主板数据来配置该备板;
步骤211:所述通信系统更新相应主、备记录相关信息;
步骤212:如果没有发生倒换,则所述通信系统直接通知该备板进入备板空闲等待状态;
步骤213:承接所述步骤206、步骤211或步骤212,本流程结束。
如图3所示的,为本发明方法的多块单板在N+1备份配置时的故障倒换流程,具体包括下列步骤:
步骤301:所述通信系统开始工作;
步骤302:所述单板进入正常工作状态;
步骤303:所述通信系统进行实时检测所有多块单板的状态;
步骤304:所述通信系统如果检测到有某块单板发生了故障,则查询该单板的相应相关信息;
步骤305:所述通信系统检测判断该单板类型是主板还是备板;
如果当前发生故障的单板是主板,则进入主板的故障处理流程,该主板的故障处理流程又包括下列步骤:
步骤306:所述通信系统查询当前备板的工作状态;
步骤307:所述通信系统判断是否存在空闲且状态正常的备板;
步骤308:如果存在满足条件的备板,所述通信系统就通知该备板向所述故障主板进行倒换;
步骤309:所述备板收到通知后,向所述通信系统发起配置请求,所述备板配置过程还包括以下步骤:
步骤310:所述通信系统根据其所记录的该主板相关信息,获得该故障主板的配置数据,并按照该数据配置待倒换的备板;
步骤311:所述备板配置成功后,即转入主板状态并开始工作;
步骤312:所述通信系统通知所述故障主板停止工作,进入故障状态,等待故障恢复,如更换或修复等;
步骤313:所述通信系统更新其相应的主、备记录相关信息。
步骤314:承接所述步骤307,如果不存在可用的备板,此时所述通信系统无法进行倒换,则该通信系统告警;
步骤315:该通信系统通知故障主板停止工作,进入故障状态,等候故障恢复。
步骤316:承接所述步骤305,如果所述通信系统检测到当前发生故障的是所述备板,则进入备板的故障处理流程:直接进行系统告警,并通知该故障备板进入故障状态,等待故障恢复。此时,所述通信系统无法进行倒换,如果出现某块主板故障需要倒换时,对所述故障主板将执行所述步骤314和步骤315,对该故障主板进行告警,也等待故障恢复。
步骤317:承接所述步骤313,步骤315和步骤316,本流程结束。
如图4所示的,为本发明方法的多块单板在N+1备份配置时的故障恢复流程,具体可以包括下列步骤:
步骤401:所述通信系统开始工作;
步骤402:所述通信系统在正常工作时,实时检测各故障单板的工作状态;
步骤403:一旦所述通信系统检测到有某块故障单板发生了故障恢复,所述通信系统通过查询其所记录的相关信息,获得该单板类型;
步骤404:所述通信系统判断该故障单板是主板还是备板;
如果当前故障单板是主板的故障恢复,则进入主板的故障恢复处理流程,该主板故障恢复流程又包括下列步骤:
步骤405:所述通信系统根据其所记录的主、备记录相关信息,获得该故障主板的倒换记录;
步骤406:对该故障主板是否已倒换过进行判断;
步骤407:如果在其故障时,所述通信系统已对该主板进行了倒换,该通信系统查询其相应的主、备记录相关信息,得到与之对应的倒换备板的工作状态;
步骤408:对该倒换备板的工作状态是否正常进行判断;
步骤409:如果该倒换备板工作状态正常,则该被故障恢复后的主板即转为备板,进入备板的空闲等待状态;同时,所述通信系统更新相应主、备记录相关信息。
如果该倒换备板工作状态异常,则需要该故障恢复的主板重新开始工作,其操作步骤为:
步骤410:该故障恢复后的主板重新向所述通信系统发起配置请求;
步骤411:所述通信系统根据其已有的主、备记录相关信息,按照其发生故障之前的数据重新对该主板进行配置;
步骤412:对该主板配置成功后,该故障恢复的主板重新进入主板工作状态;
步骤413:所述通信系统通知与之相应的倒换备板停止工作,进入故障状态,等待对倒换备板的故障恢复。
承接所述步骤406,如果在该主板故障时,所述通信系统没有对该故障主板进行倒换,即如所述步骤314和步骤315的情况,该故障主板没有可倒换备板时,则也需要该故障恢复的主板重新开始工作,具体步骤如下:
步骤415:该故障恢复后的主板重新向所述通信系统发起配置请求;
步骤416:所述通信系统根据其所记录的相关信息,按照该主板故障之前的数据重新对其进行配置;
步骤417:对该主板配置成功后,该故障恢复后的主板重新进入主板工作状态。
步骤414:承接所述步骤409、步骤413以及步骤417,所述通信系统更新其相应的主、备记录相关信息。
承接所述步骤404,如果当前是备板故障恢复,则进入备板的故障恢复处理流程,所述备板的故障恢复处理流程又包括下列步骤:
步骤418:所述通信系统根据其所记录的相关信息,获得当前各主板的工作状态;
步骤419:对各主板进行检测,是否存在故障且没有倒换的主板;
步骤420:如果所述通信系统当前存在故障且没有进行倒换的主板,则此时需要对该故障主板首先进行倒换,因此时该备板已被故障恢复成正常状态了。该主板故障倒换的流程如图3所示的所述步骤306-313的过程,在此不再赘述。
步骤421:如果所述通信系统当前各主板工作状态均正常,则无需与该备板进行倒换,则该经故障恢复后的备板直接进入空闲等待状态,在所述通信系统需要时(即某块主板出现故障时),进行倒换。
步骤422:承接所述步骤420、步骤421以及步骤414,该流程结束。
综上,在本发明的通信系统中单板的N+1备份的方法中,利用记录主备板的倒换关系等数据相关信息,以及所述通信系统对多块单板的工作状态进行实时检测,并相应触发倒换或故障恢复等流程,可以在该多块单板中增加一块单板作为备板,实现“N+1备份”的配置方法,在系统资源中大大减少需要使用的单板数量,而同样可以实现系统的高稳定性。
需要指出的是,依本发明方法的技术构思,所述备板并不限于一块,可以是一块以上备板,但备板数目远少于主板的数目,由本发明方法的所述通信系统加以管理,虽占用资源略有提升,但系统稳定性将更显著提高。
应当理解的是,对本领域普通技术人员来说,可以根据本发明的技术构思做出各种更多可能的等同改变或替换,而所有这些改变或替换都应属于本发明所附权利要求的保护范围。
Claims (10)
1、一种通信系统中单板的N+1备份的方法,所述通信系统中包括有物理结构相同的多块单板,其中至少一块单板作为备板,其余单板作为主板;所述通信系统在上电后记录各单板的相关信息,所述方法还包括以下步骤:
a)所述通信系统指定单板的主/备类型,并对所述各单板的工作状态进行实时检测;
b)所述通信系统根据情形,根据已记录的该单板的相关信息判断该单板的主/单板类型,相应进行主板或备板的状态跃迁处理,并记录处理后的主、备记录信息,即:
b1)所述通信系统根据单板的配置请求信息进行配置主、备板的配置请求流程;
b2)所述通信系统在检测到所述多块单板中的一块发生故障时,进行主、备板的故障倒换流程;
b3)所述通信系统在检测到某一故障单板被恢复时,进行主、备板的故障恢复流程。
2、根据权利要求1所述的方法,其特征在于,所述步骤b)中的故障倒换流程包括:
b21)如该故障单板为主板时,判断是否存在空闲且状态正常的所述备板;
b23)如有空闲且状态正常的备板,则所述通信系统通知该备板进行倒换;
b24)如无空闲且状态正常的备板,则所述通信系统停止该故障主板的工作,通知该故障主板进入故障状态,并由该通信系统告警该主板故障。
3、根据权利要求2所述的方法,其特征在于,所述步骤b)中的故障倒换流程还包括:
b25)如所述通信系统查询该故障单板为备板,则所述通信系统通知该故障备板进入故障状态,并由该通信系统告警该备板故障。
4、根据权利要求2所述的方法,其特征在于,所述步骤b23)的倒换过程包括:
b231)所述备板收到所述通信系统的倒换通知后,向该通信系统发起配置请求;
b232)所述通信系统根据已记录的该故障主板的相关信息,依该相关信息配置所述备板;
b233)所述备板转入主板状态开始工作;
b234)所述通信系统通知所述故障主板停止工作,进入故障状态,等待故障恢复;
b235)所述通信系统更新相应的主、备记录信息。
5、根据权利要求1所述的方法,其特征在于,所述步骤b)中的配置请求流程还包括以下步骤:
b11)所述通信系统进入正常工作状态并收到某一单板的配置请求信息;
b12)所述单板为主板时,该通信系统根据其所记录的该主板的相关信息对该主板进行配置;
b13)所述单板为备板时,根据所述通信系统查询该备板的倒换记录,如该备板已倒换过,则根据所述通信系统已记录的倒换主板的相关信息来配置该备板,并相应更新主、备记录信息;如该备板未曾倒换过,则该备板进入空闲等待状态。
6、根据权利要求1所述的方法,其特征在于,所述步骤b)中的主板故障恢复流程包括:
b31)所述通信系统查询该主板的倒换记录;
b32)如在故障时已倒换,则所述通信系统查询该倒换备板的工作状态,如该倒换备板工作正常,则所述故障恢复后的主板转为备板,进入备板的空闲等待状态;如该倒换备板有故障,则由所述通信系统根据已记录的该主板的相关信息配置该故障恢复的主板重新开始工作;
b33)如在故障时没有倒换,则由所述通信系统根据其已记录的该主板的相关信息重新配置该故障恢复后的主板开始工作;
b34)所述通信系统相应更新其主、备记录信息。
7、根据权利要求6所述的方法,其特征在于,所述步骤b)中的备板故障恢复流程包括:
b35)所述通信系统检测到所述备板被故障恢复后,查询其已记录的相关信息,获得所述多个主板的工作情况;
b36)如果所述通信系统当前存在故障且没有倒换的主板,则向该故障恢复后的备板进行倒换;
b37)如果所述通信系统当前所述各主板工作状态均正常,则该被故障恢复的备板直接进入备板空闲等待状态。
8、根据权利要求1~7任一权项所述的方法,其特征在于,所述备板的指定由人工指定该多块单板中的一块为备板。
9、根据权利要求1~7任一权项所述的方法,其特征在于,所述备板的指定由所述通信系统根据所述多块单板的上电顺序指定。
10、根据权利要求1~7任一权项所述的方法,其特征在于,所述备板的指定由所述通信系统对该多块单板随机指定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2003101123706A CN100499387C (zh) | 2003-11-28 | 2003-11-28 | 一种通信系统中单板的n+1备份的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2003101123706A CN100499387C (zh) | 2003-11-28 | 2003-11-28 | 一种通信系统中单板的n+1备份的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1547329A true CN1547329A (zh) | 2004-11-17 |
CN100499387C CN100499387C (zh) | 2009-06-10 |
Family
ID=34336494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003101123706A Expired - Fee Related CN100499387C (zh) | 2003-11-28 | 2003-11-28 | 一种通信系统中单板的n+1备份的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100499387C (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100362811C (zh) * | 2005-08-12 | 2008-01-16 | 上海华为技术有限公司 | 一种获取配置信息的方法 |
WO2008119263A1 (fr) * | 2007-03-30 | 2008-10-09 | Huawei Technologies Co., Ltd. | Procédé de calcul d'indice de fiabilité de carte unique, dispositif et système associés |
WO2011015068A1 (zh) * | 2009-08-03 | 2011-02-10 | 中兴通讯股份有限公司 | 一种故障检测的方法和系统 |
CN106603303A (zh) * | 2016-12-30 | 2017-04-26 | 杭州迪普科技股份有限公司 | 云聚合板卡的切换方法和装置 |
CN111405216A (zh) * | 2019-10-25 | 2020-07-10 | 杭州海康威视系统技术有限公司 | 配置方法、装置及设备、存储介质 |
CN112804077A (zh) * | 2020-06-05 | 2021-05-14 | 中兴通讯股份有限公司 | 数据保护方法、控制器、控制面设备和存储介质 |
-
2003
- 2003-11-28 CN CNB2003101123706A patent/CN100499387C/zh not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100362811C (zh) * | 2005-08-12 | 2008-01-16 | 上海华为技术有限公司 | 一种获取配置信息的方法 |
WO2008119263A1 (fr) * | 2007-03-30 | 2008-10-09 | Huawei Technologies Co., Ltd. | Procédé de calcul d'indice de fiabilité de carte unique, dispositif et système associés |
WO2011015068A1 (zh) * | 2009-08-03 | 2011-02-10 | 中兴通讯股份有限公司 | 一种故障检测的方法和系统 |
CN106603303A (zh) * | 2016-12-30 | 2017-04-26 | 杭州迪普科技股份有限公司 | 云聚合板卡的切换方法和装置 |
CN111405216A (zh) * | 2019-10-25 | 2020-07-10 | 杭州海康威视系统技术有限公司 | 配置方法、装置及设备、存储介质 |
CN111405216B (zh) * | 2019-10-25 | 2022-06-28 | 杭州海康威视系统技术有限公司 | 配置方法、装置及设备、存储介质 |
CN112804077A (zh) * | 2020-06-05 | 2021-05-14 | 中兴通讯股份有限公司 | 数据保护方法、控制器、控制面设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN100499387C (zh) | 2009-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1137439C (zh) | 容错计算机系统 | |
CN1308851C (zh) | 数据处理系统中执行远程复制的方法和存储数据的方法 | |
CN1098490C (zh) | 具有检查点恢复功能的i/o控制设备 | |
CN101060391A (zh) | 主备服务器切换方法及系统及主用服务器、备用服务器 | |
CN1282552C (zh) | 电源管理装置、文件服务器、打印机及系统、计算机软件 | |
CN1834932A (zh) | 存储控制装置和方法 | |
CN1288556C (zh) | 运算处理系统和控制方法,任务管理系统和方法 | |
CN1906583A (zh) | 信息处理设备、中断处理控制方法、以及计算机程序 | |
CN1285036C (zh) | 数据处理系统和远程复制方法 | |
CN1227589C (zh) | 用于保存返回状态的数据处理设备和方法 | |
CN1648867A (zh) | 数据处理系统 | |
CN101078999A (zh) | 一种实现数据备份和恢复的方法及系统 | |
CN1801756A (zh) | 迁移程序、信息处理装置、计算机系统和存储有迁移程序的计算机可读记录介质 | |
CN1760836A (zh) | 信息处理系统、信息处理方法和程序 | |
CN101035388A (zh) | 无断电电源装置、无断电电源系统以及关闭方法 | |
CN1855900A (zh) | 网关系统 | |
CN1160638C (zh) | 多计算机系统及其控制方法 | |
CN1955940A (zh) | Raid系统、raid控制器及其重建/拷回处理方法 | |
CN1690973A (zh) | 远程复制方法及远程复制系统 | |
CN1779650A (zh) | 用于自动管理计算环境的复制数据的状态的方法和系统 | |
CN1521625A (zh) | 容错计算机系统,其再同步方法,及其再同步程序 | |
CN1889741A (zh) | 在设备管理中实现预定操作的方法及装置 | |
CN1794657A (zh) | 对终端设备进行管理的方法和系统 | |
CN1591374A (zh) | 直接存储器存取传输控制器 | |
CN1111793C (zh) | 冗余装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090610 |