CN105790825A - 一种分布式保护中控制器热备份的方法和装置 - Google Patents
一种分布式保护中控制器热备份的方法和装置 Download PDFInfo
- Publication number
- CN105790825A CN105790825A CN201410820899.1A CN201410820899A CN105790825A CN 105790825 A CN105790825 A CN 105790825A CN 201410820899 A CN201410820899 A CN 201410820899A CN 105790825 A CN105790825 A CN 105790825A
- Authority
- CN
- China
- Prior art keywords
- protocol
- controller
- message
- controllers
- master
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000001960 triggered effect Effects 0.000 claims abstract description 41
- 230000001360 synchronised effect Effects 0.000 claims description 7
- 238000012423 maintenance Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0663—Performing the actions predefined by failover planning, e.g. switching to standby network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/03—Arrangements for fault recovery
- H04B10/032—Arrangements for fault recovery using working and protection systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0037—Operation
- H04Q2011/0039—Electrical control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0037—Operation
- H04Q2011/0043—Fault tolerance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0037—Operation
- H04Q2011/0045—Synchronisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
- H04Q2011/0079—Operation or maintenance aspects
- H04Q2011/0081—Fault tolerance; Redundancy; Recovery; Reconfigurability
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Electromagnetism (AREA)
- Hardware Redundancy (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
- Safety Devices In Control Systems (AREA)
Abstract
本发明公开了一种分布式保护中控制器热备份的方法,执行器接收各控制器发送的报文,根据各报文的序列号确定同一次协议触发的报文,通过同一次协议触发的报文维护各控制器的主备关系,并执行主控制器发送的报文,在协议稳态时,确定达到切换条件,执行器进行主备切换;本发明同时还公开了一种分布式保护中控制器热备份的装置。
Description
技术领域
本发明涉及光传输网络的热备份技术,尤其涉及一种分布式保护中控制器热备份的方法和装置。
背景技术
自动保护倒换(APS,automaticprotectswitching)技术已经广泛应用于光网络中,通常在设备中我们将保护系统逻辑上分为控制器、检测器、执行器、协议传递器这4部分。
控制器,为APS的核心部分,负责接收检测器、协议传递器的输入,并对输入进行保护协议计算,并下发倒换命令给执行器,在双向倒换时还会通过协议传递器发送信令给对端。
检测器,负责对工作或保护路径进行故障检测,并报给控制器作为输入。
执行器,负责接收控制器输出的倒换命令,控制业务的切换。
协议传递器,在双向倒换配置下,在发端控制器通知协议传递器发送标准中的PCC信令,在收端协议传递器收到对端的信令后通知给控制器。
集中式保护控制系统中,APS控制器通常在一个网元中的独立CPU中,比如主控板,而检测器、执行器、协议传递器一般都在业务单板上。所述网元所有保护组由统一控制器进行控制,这种模式最大的优点是保护功能实现快速,协议算法能够快速调整,但其缺点也很明显,由于集中CPU的处理负载有限,在全网保护业务较多时,倒换时间受影响。
分布式保护控制系统中,将CPU的负载分担到多个CPU,可以克服集中式的缺点,在需要保护的业务较多时,倒换时间不受影响,也能避免控制器失效带来的全网元业务保护功能失效的问题,这种场景控制器下沉到业务单板。
不论是集中式还是分布式,控制器都是自动保护倒换的核心组件,如果控制器硬件或软件失效了是无法倒换的,业务也会相应中断,为了提高光传输网络的生存能力,需要对控制器进行冗余备份保护。
在集中式保护系统中,控制器通常运行在主控板中,主控板本身采用1+1/1:1热备份的方式,即在具有自动保护倒换功能的网元中使用了两个控制器,主协议控制器和备协议控制器,为了实现热备份方式的自动保护倒换功能,如图1、2所示,传统的1:1热备份方法,有以下2种常用的方法:
1)主协议控制器和备协议控制器都能正常运行,能同时接收检测器的输入,运行完协议后只有主协议控制器下发倒换命令给执行器,备协议控制器不下发,主协议控制器和备协议控制器进行实时同步协议和定时同步协议,如果协议不一致,通常以主为准,当主协议控制器所在主控板重启、拔板、或者损坏,备协议控制器能检测到时,备协议控制器切换为新的主协议控制器,以前主也切换为备,主控板需要维护主备状态。
2)只有主协议控制器正常工作,备协议控制器不运行,只有主协议控制器接收检测器的输入或者主、备协议控制器都接收但备协议控制器过滤掉所述输入,主协议控制器计算协议后下发倒换命令给执行器,主协议控制器对备协议控制器进行实时同步协议和定时同步协议,主备切换的流程和方法1一样。
在现有分布式保护系统中,如果组网有多节点互连的场景且互连的节点作为控制器,那么会有多个控制器运行,也需要主备热备份的方式来保护控制器,如果采用传统的集中式保护中的热备份方法,会有以下缺陷:
(1)分布式保护中需要维护多个主备控制器关系、且会有多个同步协议的过程,对通信资源要求高,而集中式保护只有主备主控板之间需要维护主备状态和所有同步过程。
(2)分布式保护主备切换不如主控板及时,主控板的主备间一般有专属通道来维护主备状态,而分布式的控制器所在的业务单板之间维护主备状态只能靠临时的板间通信。
(3)随着组网越来越复杂,分布式保护中可能存在多个控制器做为热备份的场景,比如多节点互连的场景,如果互连节点个数大于2,且互连节点作为控制器,即变为1:N的热备份,传统的集中式保护的1+1/1:1热备份无法支持。
(4)分布式保护倒换时间无法达到最优,如果采取传统主备控制器的方式,也许针对不同的保护组,备控制器的执行效率更高,下发倒换命令也更快,保护倒换时间也越短。
所以在分布式保护系统中,有必要找到其它的方法来解决控制器热备份的问题。
发明内容
为解决现有存在的技术问题,本发明主要提供一种分布式保护中控制器热备份的方法和装置。
本发明的技术方案是这样实现的:
本发明提供一种分布式保护中控制器热备份的方法,该方法包括:
执行器接收各控制器发送的报文,根据各报文的序列号确定同一次协议触发的报文,通过同一次协议触发的报文维护各控制器的主备关系,并执行主控制器发送的报文,在协议稳态时,确定达到切换条件,执行器进行主备切换。
上述方案中,所述各控制器发送的报文包括:协议控制信息、协议状态信息、序列号。
上述方案中,所述通过同一次协议触发的报文维护各控制器的主备关系包括:以第一次最先收到同一协议触发的报文的控制器为主控制器,其它控制器为备控制器,在每次协议触发时,记录最先收到的报文的控制器,并在主备关系信息中对所述控制器的报文次数加1。
上述方案中,该方法还包括:设置第一超时时间T1,当执行器实际是先接收到备控制器发送的报文时,如果在第一超时时间T1内还没有接收到主控制器发送的报文,按照备控制器发送的报文来执行保护倒换操作。
上述方案中,所述协议稳态为:设置第二超时时间T2,执行器收到控制器发送的报文后,在第二超时时间T2内没有收到任何控制器发送的报文就认为保护组的保护协议在稳态;
所述切换条件为:在协议稳态下,在当前主备关系信息中存在达到第一门限N的备控制器的报文次数、且主控制器的报文次数小于N。
上述方案中,所述进行主备切换包括:执行器比较主备关系信息中备控制器的报文次数,次数最多的备控制器转变为主控制器,原主控制器变为备控制器,并清空主备关系信息中各控制器的报文次数为0。
上述方案中,该方法还包括:执行器对各控制器的协议控制信息和协议状态信息进行校验,如果有不一致的,进行协议同步或协议复位。
上述方案中,所述执行器对各控制器的协议控制信息和协议状态信息进行校验,如果有不一致的,进行协议同步或协议复位,包括:执行器在协议稳态下,根据每次最后收到各个控制器发送的报文中的协议控制信息和协议状态信息,将发送报文中协议控制信息和协议状态信息都相同的控制器分为一类,如果存在一类控制器的个数最多,向各控制器发送组播报文,组播报文中包含协议同步命令和该类控制器的协议控制状态信息,各控制器收到所述组播报文后效验各自的协议控制信息和协议状态信息,如果不一致,则进行保护协议的同步,如果一致则忽略掉;如果不存在一类控制器的个数最多,向控制器发送的组播报文中只包含协议复位命令,各控制器进行保护协议的复位后重新查询检测器的网络故障来执行协议。
本发明提供一种分布式保护中控制器热备份的装置,该装置包括:接收模块、确定模块、维护模块、报文执行模块、主备切换模块;其中,
接收模块,用于接收各控制器发送的报文;
确定模块,用于根据各报文的序列号确定同一次协议触发的报文;
维护模块,用于通过同一次协议触发的报文维护各控制器的主备关系;
报文执行模块,用于执行主控制器发送的报文;
主备切换模块,用于在协议稳态时,确定达到切换条件,进行主备切换。
上述方案中,所述各控制器发送的报文包括:协议控制信息、协议状态信息、序列号。
上述方案中,所述维护模块,具体用于以第一次最先收到同一协议触发的报文的控制器为主控制器,其它控制器为备控制器,在每次协议触发时,记录最先收到的报文的控制器,并在主备关系信息中对所述控制器的报文次数加1。
上述方案中,所述报文执行模块,还用于当实际是先接收到备控制器发送的报文时,如果在第一超时时间T1内还没有接收到主控制器发送的报文,按照备控制器发送的报文来执行保护倒换操作。
上述方案中,所述切换条件为:在协议稳态下,在当前主备关系信息中存在达到第一门限N的备控制器的报文次数、且主控制器的报文次数小于N;
所述主备切换模块,具体用于在确定达到切换条件时,比较主备关系信息中备控制器的报文次数,次数最多的备控制器转变为主控制器,原主控制器变为备控制器,并清空主备关系信息中各控制器的报文次数为0。
上述方案中,该装置还包括:校验模块,用于对各控制器的协议控制信息和协议状态信息进行校验,如果有不一致的,进行协议同步或协议复位。
上述方案中,所述校验模块,具体用于在协议稳态下,根据每次最后收到各个控制器发送的报文中的协议控制信息和协议状态信息,将发送报文中协议控制信息和协议状态信息都相同的控制器分为一类,如果存在一类控制器的个数最多,向各控制器发送组播报文,组播报文中包含协议同步命令和该类控制器的协议控制状态信息,以使各控制器收到所述组播报文后校验各自的协议控制信息和协议状态信息,如果不一致,则进行保护协议的同步,如果一致则忽略掉;如果不存在一类控制器的个数最多,向控制器发送的组播报文中只包含协议复位命令,以使各控制器进行保护协议的复位后重新查询检测器的网络故障来执行协议。
本发明提供一种执行器,该执行器包括上述的分布式保护中控制器热备份的装置。
本发明提供一种分布式保护中控制器热备份的系统,该系统包括:执行器、控制器、检测器;其中,
检测器,用于进行故障检测后,通过发送组播报文将网络故障告知各控制器;
控制器,用于接收到所述组播报文后各自单独执行保护协议,在执行完保护协议后分别发送报文给执行器,发送给执行器的报文包括:协议控制信息、协议状态信息、序列号;
执行器,用于接收各控制器发送的报文,根据各报文的序列号确定同一次协议触发的报文,通过同一次协议触发的报文维护各控制器的主备关系,并执行主控制器发送的报文,在协议稳态时,确定达到切换条件,进行主备切换。
本发明提供了一种分布式保护中控制器热备份的方法和装置,执行器接收各控制器发送的报文,根据各报文的序列号确定同一次协议触发的报文,通过同一次协议触发的报文维护各控制器的主备关系,并执行主控制器发送的报文,在协议稳态时,确定达到切换条件,执行器进行主备切换;如此,各控制器都正常运行协议,控制器自身不分主备关系、且自身也不用维护主备状态,而由各个保护组的执行器动态维护控制器的主备关系,能够支持分布式保护下的1:N(N>=1)控制器热备份的场景,另外,在协议稳态时,执行器能够进行保护协议的同步,不需要控制器之间进行主备协议同步。
附图说明
图1为主协议控制器和备协议控制器都正常运行实现1:1热备份的系统架构示意图;
图2为主协议控制器正常运行,备协议控制器不运行实现1:1热备份的系统架构示意图;
图3为本发明实施例提供的分布式保护中控制器热备份的方法的流程示意图;
图4为本发明实施例提供的分布式保护中控制器热备份的装置的结构示意图;
图5为本发明实施例提供的分布式保护中控制器热备份的系统的结构示意图。
具体实施方式
本发明实施例中,执行器接收各控制器发送的报文,根据各报文的序列号确定同一次协议触发的报文,通过同一次协议触发的报文维护各控制器的主备关系,并执行主控制器发送的报文,在协议稳态时,确定达到切换条件,执行器进行主备切换。
下面通过附图及具体实施例对本发明做进一步的详细说明。
本发明实施例实现一种分布式保护中控制器热备份的方法,如图3所示,该方法包括以下几个步骤:
步骤301:执行器接收各控制器发送的报文;
在本步骤之前,检测器进行故障检测后,通过发送组播报文将网络故障告知各控制器,各控制器接收到所述组播报文后各自单独执行保护协议,在执行完保护协议后分别发送报文给执行器;
这里,每个保护组中的多个控制器需要加入组播组,检测器发送的组播报文包括网络故障信息和唯一标识本次故障信息触发执行协议的序列号,序列号的生成可以依据时间戳或每次加1的数列;
所述控制器发送给执行器的报文包括:协议控制信息、协议状态信息、序列号,所述协议控制信息是控制器发送给执行器的业务单板实际切换交叉或开关的命令,所述协议状态信息是一些协议的关键变量值的集合,所述序列号直接使用检测器发送的组播报文中的序列号。
步骤302:执行器根据各报文的序列号确定同一次协议触发的报文,通过同一次协议触发的报文维护各控制器的主备关系;
具体的,执行器根据各报文的序列号确定同一次协议触发的报文,并以第一次最先收到同一协议触发的报文的控制器为主控制器,其它控制器为备控制器,在每次协议触发时,记录最先收到的报文的控制器,并在主备关系信息中对所述控制器的报文次数加1。
步骤303:执行器执行主控制器发送的报文;
具体的,执行器每次实际执行主控制器发送的报文,而不执行其它备控制器发送的报文,并预先设置第一超时时间T1,当执行器实际是先接收到备控制器发送的报文时,如果在第一超时时间T1内还没有接收到主控制器发送的报文,按照备控制器发送的报文来执行保护倒换操作。
步骤304:在协议稳态时,执行器确定达到切换条件,进行主备切换;
本步骤中,所述协议稳态是指:预先设置第二超时时间T2,执行器收到控制器发送的报文后,在第二超时时间T2内没有收到任何控制器发送的报文就认为保护组的保护协议在稳态。
所述切换条件为:在协议稳态下,在当前主备关系信息中存在达到第一门限N的备控制器的报文次数、且主控制器的报文次数小于N。
所述进行主备切换包括:执行器比较主备关系信息中备控制器的报文次数,次数最多的备控制器转变为主控制器,原主控制器变为备控制器,并清空主备关系信息中各控制器的报文次数为0。
这里,在协议稳态下,主控制器的报文次数先达到N时,不执行主备切换,并清空主备关系信息中各控制器的报文次数为0。
上述方法还包括:执行器对各控制器的协议控制信息和协议状态信息进行校验,如果有不一致的,进行协议同步或协议复位;
具体的,执行器在协议稳态下,根据每次最后收到各个控制器发送的报文中的协议控制信息和协议状态信息,将发送报文中协议控制信息和协议状态信息都相同的控制器分为一类,如果存在一类控制器的个数最多,向各控制器发送组播报文,组播报文中包含协议同步命令和该类控制器的协议控制状态信息,各控制器收到所述组播报文后效验各自的协议控制信息和协议状态信息,如果不一致,则进行保护协议的同步,如果一致则忽略掉;如果不存在一类控制器的个数最多,向控制器发送的组播报文中只包含协议复位命令,各控制器进行保护协议的复位后重新查询检测器的网络故障来执行协议。
为了实现上述方法,本发明还提供一种分布式保护中控制器热备份的装置,该装置设置在执行器上,如图4所示,该装置包括:接收模块41、确定模块42、维护模块43、报文执行模块44、主备切换模块45;其中,
接收模块41,可以由执行器的接口实现,用于接收各控制器发送的报文;
确定模块42,可以由执行器的处理器实现,用于根据各报文的序列号确定同一次协议触发的报文;
维护模块43,可以由执行器的存储器实现,用于通过同一次协议触发的报文维护各控制器的主备关系;
报文执行模块44,可以由执行器的处理器实现,用于执行主控制器发送的报文;
主备切换模块45,可以由执行器的处理器实现,用于在协议稳态时,确定达到切换条件,进行主备切换。
其中,所述各控制器发送的报文包括:协议控制信息、协议状态信息、序列号,所述协议控制信息是控制器发送给执行器的业务单板实际切换交叉或开关的命令,所述协议状态信息是一些协议的关键变量值的集合,所述序列号直接使用检测器发送的组播报文中的序列号。
所述维护模块43以第一次最先收到同一协议触发的报文的控制器为主控制器,其它控制器为备控制器,在每次协议触发时,记录最先收到的报文的控制器,并在主备关系信息中对所述控制器的报文次数加1。
所述报文执行模块44每次实际执行主控制器发送的报文,而不执行其它备控制器发送的报文,并预先设置第一超时时间T1,当执行器实际是先接收到备控制器发送的报文时,如果在第一超时时间T1内还没有接收到主控制器发送的报文,按照备控制器发送的报文来执行保护倒换操作。
所述协议稳态是指:预先设置第二超时时间T2,执行器收到控制器发送的报文后,在第二超时时间T2内没有收到任何控制器发送的报文就认为保护组的保护协议在稳态。
所述切换条件为:在协议稳态下,在当前主备关系信息中存在达到第一门限N的备控制器的报文次数、且主控制器的报文次数小于N。
所述主备切换模块45在确定达到切换条件时,比较主备关系信息中备控制器的报文次数,次数最多的备控制器转变为主控制器,原主控制器变为备控制器,并清空主备关系信息中各控制器的报文次数为0。
该装置还包括:校验模块46,用于对各控制器的协议控制信息和协议状态信息进行校验,如果有不一致的,进行协议同步或协议复位;
具体的,在协议稳态下,根据每次最后收到各个控制器发送的报文中的协议控制信息和协议状态信息,将发送报文中协议控制信息和协议状态信息都相同的控制器分为一类,如果存在一类控制器的个数最多,向各控制器发送组播报文,组播报文中包含协议同步命令和该类控制器的协议控制状态信息,以使各控制器收到所述组播报文后校验各自的协议控制信息和协议状态信息,如果不一致,则进行保护协议的同步,如果一致则忽略掉;如果不存在一类控制器的个数最多,向控制器发送的组播报文中只包含协议复位命令,以使各控制器进行保护协议的复位后重新查询检测器的网络故障来执行协议。
基于上述装置,本发明还提供一种执行器,该执行器包括图4所示的分布式保护中控制器热备份的装置。
基于上述执行器,本发明还提供一种分布式保护中控制器热备份的系统,如图5所示,该系统包括:执行器51、控制器52、检测器53;其中,
检测器53,用于进行故障检测后,通过发送组播报文将网络故障告知各控制器52;
控制器52,用于接收到所述组播报文后各自单独执行保护协议,在执行完保护协议后分别发送报文给执行器51,发送给执行器51的报文包括:协议控制信息、协议状态信息、序列号;
执行器51,用于接收各控制器52发送的报文,根据各报文的序列号确定同一次协议触发的报文,通过同一次协议触发的报文维护各控制器52的主备关系,并执行主控制器发送的报文,在协议稳态时,确定达到切换条件,进行主备切换;
所述执行器51包括图4所示的分布式保护中控制器热备份的装置。
下面通过具体实例对本发明的方法进行详细说明。
实施案例1
本实施例为1:2热备份主备控制器切换:
网管新建立分布式系统的保护组,将保护组的配置下发给控制器、执行器、检测器,这里总共有3个控制器,它们之间互为热备份。执行器收到配置后在内存中维护3个控制器的主备关系信息,本实施例以表的形式展现主备关系信息。
检测器第一次上报网络故障给各个控制器触发协议执行后,控制器下发倒换控制命令报文给执行器,执行器收到3个相同控制命令报文后发现最先收到控制器1发送的,暂时认为控制器1为主,更新控制器1的主备关系字段为M,其它控制器的主备关系字段为S,并将控制器1的报文次数加1,如表1所示。
控制器编号 | 主备关系 | 控制器的报文次数 |
1 | M | 1 |
2 | S | 0 |
3 | S | 0 |
表1
经过检测器多次上报网络故障信息,执行器也收到多个控制命令报文,如表2所示,其中记录的最先收到控制器2的报文次数达到10,本实施例假设N=10达到主备切换时机的条件,最先收到控制器2的报文次数最大可能的原因是执行器和控制器2的通信通道效率最高或者本保护组在控制器2中的执行效率最高,虽然在保护组初始建立阶段选取了控制器1做为主,但一定时间后,执行器择优选取了控制器2为2,增加了倒换执行效率。
控制器编号 | 主备关系 | 控制器的报文次数 |
1 | M | 3 |
2 | S | 10 |
3 | S | 1 |
表2
如表3所示,执行器进行了控制器的主备切换,更新表中控制器2的主备关系字段为M,控制器1为S,各个控制器的报文次数都清0,重新开始计数。
表3
实施案例2
本实施例为1:2热备份的控制器保护协议不一致的执行流程。
本实施例以1:2控制器热备份中出现协议控制信息和协议状态信息不一致的场景为例。检测器上报网络故障为工作SF触发控制器1-3分别执行协议,其中控制器1为主,协议稳态后进行协议同步的操作。
其中WSF、RR等为协议状态信息的缩写。
1)控制器1下发的报文中协议控制信息为Switch,协议状态信息为WSF;
2)控制器2下发的报文中协议控制信息为Switch,协议状态信息为WSF;
3)控制器3下发的报文中协议控制信息为Idle,协议状态信息为RR。
协议控制信息和状态信息有2类,Switch/WSF和Idle/RR,控制器1和2在Switch/WSF类,控制器3在Idle/RR类,这时Switch/WSF类的控制器为多数,本次协议执行以Switch/WSF为准,执行器发送组播报文给各控制器,报文内容包括Switch/WSF和协议同步命令。
控制器1和2收到组播报文后,和本身的协议控制和状态进行比较,发现一致,不做任何操作,控制器3在收到后,经过和本身的协议控制和状态Idle/RR比较发现不一致,然后进行协议同步,再次向执行器发送协议控制信息和协议状态信息报文,执行器再次进行校验,如果还是不一致,证明控制器3软件或硬件本身存在问题或控制器1和2同时执行协议错误,上报告警或事件给网管人工处理。
检测器上报网络故障为保护SD触发控制器1-3分别执行协议,其中控制器1为主,则
1)控制器1下发的报文中协议控制信息为Idle,协议状态信息为RR;
2)控制器2下发的报文中协议控制信息为Switch,协议状态信息为RR;
3)控制器3下发的报文中协议控制信息为Idle,协议状态信息为PSD。
协议控制和状态信息有3类,为Idle/RR、Switch/RR、Idle/PSD,控制器1在Idle/RR类,控制器2在Switch/RR类,控制器3在Idle/PSD类,本次协议校验无法区分出以哪个为准,执行器发送组播报文给控制器,报文内容只包括协议复位命令。
3个控制器都进行协议复位后,需要重新查询检测器的网络故障信息,触发协议运行后再次发送协议控制信息和状态信息报文给执行器。
本发明实施例所述分布式保护中控制器热备份的方法如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本发明实施例不限制于任何特定的硬件和软件结合。
相应的,本发明实施例还提供一种计算机存储介质,其中存储有计算机程序,该计算机程序用于执行本发明实施例的上述分布式保护中控制器热备份的方法。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (17)
1.一种分布式保护中控制器热备份的方法,其特征在于,该方法包括:
执行器接收各控制器发送的报文,根据各报文的序列号确定同一次协议触发的报文,通过同一次协议触发的报文维护各控制器的主备关系,并执行主控制器发送的报文,在协议稳态时,确定达到切换条件,执行器进行主备切换。
2.根据权利要求1所述的方法,其特征在于,所述各控制器发送的报文包括:协议控制信息、协议状态信息、序列号。
3.根据权利要求2所述的方法,其特征在于,所述通过同一次协议触发的报文维护各控制器的主备关系包括:以第一次最先收到同一协议触发的报文的控制器为主控制器,其它控制器为备控制器,在每次协议触发时,记录最先收到的报文的控制器,并在主备关系信息中对所述控制器的报文次数加1。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:设置第一超时时间T1,当执行器实际是先接收到备控制器发送的报文时,如果在第一超时时间T1内还没有接收到主控制器发送的报文,按照备控制器发送的报文来执行保护倒换操作。
5.根据权利要求1所述的方法,其特征在于,所述协议稳态为:设置第二超时时间T2,执行器收到控制器发送的报文后,在第二超时时间T2内没有收到任何控制器发送的报文就认为保护组的保护协议在稳态;
所述切换条件为:在协议稳态下,在当前主备关系信息中存在达到第一门限N的备控制器的报文次数、且主控制器的报文次数小于N。
6.根据权利要求5所述的方法,其特征在于,所述进行主备切换包括:执行器比较主备关系信息中备控制器的报文次数,次数最多的备控制器转变为主控制器,原主控制器变为备控制器,并清空主备关系信息中各控制器的报文次数为0。
7.根据权利要求2所述的方法,其特征在于,该方法还包括:执行器对各控制器的协议控制信息和协议状态信息进行校验,如果有不一致的,进行协议同步或协议复位。
8.根据权利要求7所述的方法,其特征在于,所述执行器对各控制器的协议控制信息和协议状态信息进行校验,如果有不一致的,进行协议同步或协议复位,包括:执行器在协议稳态下,根据每次最后收到各个控制器发送的报文中的协议控制信息和协议状态信息,将发送报文中协议控制信息和协议状态信息都相同的控制器分为一类,如果存在一类控制器的个数最多,向各控制器发送组播报文,组播报文中包含协议同步命令和该类控制器的协议控制状态信息,各控制器收到所述组播报文后效验各自的协议控制信息和协议状态信息,如果不一致,则进行保护协议的同步,如果一致则忽略掉;如果不存在一类控制器的个数最多,向控制器发送的组播报文中只包含协议复位命令,各控制器进行保护协议的复位后重新查询检测器的网络故障来执行协议。
9.一种分布式保护中控制器热备份的装置,其特征在于,该装置包括:接收模块、确定模块、维护模块、报文执行模块、主备切换模块;其中,
接收模块,用于接收各控制器发送的报文;
确定模块,用于根据各报文的序列号确定同一次协议触发的报文;
维护模块,用于通过同一次协议触发的报文维护各控制器的主备关系;
报文执行模块,用于执行主控制器发送的报文;
主备切换模块,用于在协议稳态时,确定达到切换条件,进行主备切换。
10.根据权利要求9所述的装置,其特征在于,所述各控制器发送的报文包括:协议控制信息、协议状态信息、序列号。
11.根据权利要求10所述的装置,其特征在于,所述维护模块,具体用于以第一次最先收到同一协议触发的报文的控制器为主控制器,其它控制器为备控制器,在每次协议触发时,记录最先收到的报文的控制器,并在主备关系信息中对所述控制器的报文次数加1。
12.根据权利要求9所述的装置,其特征在于,所述报文执行模块,还用于当实际是先接收到备控制器发送的报文时,如果在第一超时时间T1内还没有接收到主控制器发送的报文,按照备控制器发送的报文来执行保护倒换操作。
13.根据权利要求9所述的装置,其特征在于,所述切换条件为:在协议稳态下,在当前主备关系信息中存在达到第一门限N的备控制器的报文次数、且主控制器的报文次数小于N;
所述主备切换模块,具体用于在确定达到切换条件时,比较主备关系信息中备控制器的报文次数,次数最多的备控制器转变为主控制器,原主控制器变为备控制器,并清空主备关系信息中各控制器的报文次数为0。
14.根据权利要求10所述的装置,其特征在于,该装置还包括:校验模块,用于对各控制器的协议控制信息和协议状态信息进行校验,如果有不一致的,进行协议同步或协议复位。
15.根据权利要求14所述的装置,其特征在于,所述校验模块,具体用于在协议稳态下,根据每次最后收到各个控制器发送的报文中的协议控制信息和协议状态信息,将发送报文中协议控制信息和协议状态信息都相同的控制器分为一类,如果存在一类控制器的个数最多,向各控制器发送组播报文,组播报文中包含协议同步命令和该类控制器的协议控制状态信息,以使各控制器收到所述组播报文后校验各自的协议控制信息和协议状态信息,如果不一致,则进行保护协议的同步,如果一致则忽略掉;如果不存在一类控制器的个数最多,向控制器发送的组播报文中只包含协议复位命令,以使各控制器进行保护协议的复位后重新查询检测器的网络故障来执行协议。
16.一种执行器,其特征在于,该执行器包括权利要求9至15任一项所述的分布式保护中控制器热备份的装置。
17.一种分布式保护中控制器热备份的系统,其特征在于,该系统包括:执行器、控制器、检测器;其中,
检测器,用于进行故障检测后,通过发送组播报文将网络故障告知各控制器;
控制器,用于接收到所述组播报文后各自单独执行保护协议,在执行完保护协议后分别发送报文给执行器,发送给执行器的报文包括:协议控制信息、协议状态信息、序列号;
执行器,用于接收各控制器发送的报文,根据各报文的序列号确定同一次协议触发的报文,通过同一次协议触发的报文维护各控制器的主备关系,并执行主控制器发送的报文,在协议稳态时,确定达到切换条件,进行主备切换。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410820899.1A CN105790825B (zh) | 2014-12-25 | 2014-12-25 | 一种分布式保护中控制器热备份的方法和装置 |
PCT/CN2015/097578 WO2016101825A1 (zh) | 2014-12-25 | 2015-12-16 | 一种分布式保护中控制器热备份的方法和装置 |
EP15871893.2A EP3247055A4 (en) | 2014-12-25 | 2015-12-16 | Method and apparatus for hot standby of controllers in distributed protection |
US15/539,598 US20180269963A1 (en) | 2014-12-25 | 2015-12-16 | Method and apparatus for hot standby of controllers in distributed protection |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410820899.1A CN105790825B (zh) | 2014-12-25 | 2014-12-25 | 一种分布式保护中控制器热备份的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105790825A true CN105790825A (zh) | 2016-07-20 |
CN105790825B CN105790825B (zh) | 2020-08-14 |
Family
ID=56149247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410820899.1A Active CN105790825B (zh) | 2014-12-25 | 2014-12-25 | 一种分布式保护中控制器热备份的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20180269963A1 (zh) |
EP (1) | EP3247055A4 (zh) |
CN (1) | CN105790825B (zh) |
WO (1) | WO2016101825A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112235150A (zh) * | 2020-12-16 | 2021-01-15 | 北京宇信科技集团股份有限公司 | 主备机自动接管方法和系统 |
CN112671575A (zh) * | 2020-12-21 | 2021-04-16 | 盛科网络(苏州)有限公司 | 工作链路的切换方法及装置、存储介质、电子装置 |
WO2021073221A1 (zh) * | 2019-10-17 | 2021-04-22 | 北京全路通信信号研究设计院集团有限公司 | 一种列控dmi数据冗余控制方法和系统 |
CN112740121A (zh) * | 2018-09-18 | 2021-04-30 | 克诺尔商用车制动系统有限公司 | 用于车辆的控制架构 |
CN115190577A (zh) * | 2022-05-11 | 2022-10-14 | 四川创智联恒科技有限公司 | 一种o-ran系统时序同步互备份方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108390781A (zh) * | 2018-02-12 | 2018-08-10 | 王磊 | 一种主机自动热备份的方法与系统 |
US12120226B2 (en) * | 2020-11-13 | 2024-10-15 | Citrix Systems, Inc. | Preventing HTTP cookie stealing using cookie morphing |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101167311A (zh) * | 2005-04-25 | 2008-04-23 | 汤姆森特许公司 | 网格网络中的多播路由协议 |
US20130322232A1 (en) * | 2012-06-01 | 2013-12-05 | Telefonaktiebolaget L M Ericsson (Publ) | Enhancements to PIM Fast Re-Route with Upstream Activation Packets |
CN103944974A (zh) * | 2014-04-02 | 2014-07-23 | 华为技术有限公司 | 一种协议报文处理方法、控制器故障处理方法及相关设备 |
CN104168193A (zh) * | 2014-08-12 | 2014-11-26 | 华为技术有限公司 | 一种虚拟路由器冗余协议故障检测的方法及路由设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60204940T2 (de) * | 2002-03-27 | 2006-04-20 | Lightmaze Solutions Ag | Intelligentes optisches Netzelement |
CN100499491C (zh) * | 2005-01-01 | 2009-06-10 | 华为技术有限公司 | 复用段保护倒换的热备份装置及其方法 |
CN101350679B (zh) * | 2007-07-18 | 2012-09-05 | 华为技术有限公司 | 基于以太网无源光网络的保护倒换方法、系统和设备 |
US8305877B2 (en) * | 2009-09-10 | 2012-11-06 | Tyco Electronics Subsea Communications Llc | System and method for distributed fault sensing and recovery |
CN102075245A (zh) * | 2011-01-19 | 2011-05-25 | 中兴通讯股份有限公司 | 一种光网络自动保护倒换方法及装置 |
CN104125079B (zh) * | 2013-04-23 | 2017-11-17 | 华为技术有限公司 | 一种确定双机热备份配置信息的方法及装置 |
-
2014
- 2014-12-25 CN CN201410820899.1A patent/CN105790825B/zh active Active
-
2015
- 2015-12-16 EP EP15871893.2A patent/EP3247055A4/en not_active Withdrawn
- 2015-12-16 WO PCT/CN2015/097578 patent/WO2016101825A1/zh active Application Filing
- 2015-12-16 US US15/539,598 patent/US20180269963A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101167311A (zh) * | 2005-04-25 | 2008-04-23 | 汤姆森特许公司 | 网格网络中的多播路由协议 |
US20130322232A1 (en) * | 2012-06-01 | 2013-12-05 | Telefonaktiebolaget L M Ericsson (Publ) | Enhancements to PIM Fast Re-Route with Upstream Activation Packets |
CN103944974A (zh) * | 2014-04-02 | 2014-07-23 | 华为技术有限公司 | 一种协议报文处理方法、控制器故障处理方法及相关设备 |
CN104168193A (zh) * | 2014-08-12 | 2014-11-26 | 华为技术有限公司 | 一种虚拟路由器冗余协议故障检测的方法及路由设备 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112740121A (zh) * | 2018-09-18 | 2021-04-30 | 克诺尔商用车制动系统有限公司 | 用于车辆的控制架构 |
WO2021073221A1 (zh) * | 2019-10-17 | 2021-04-22 | 北京全路通信信号研究设计院集团有限公司 | 一种列控dmi数据冗余控制方法和系统 |
CN112235150A (zh) * | 2020-12-16 | 2021-01-15 | 北京宇信科技集团股份有限公司 | 主备机自动接管方法和系统 |
CN112671575A (zh) * | 2020-12-21 | 2021-04-16 | 盛科网络(苏州)有限公司 | 工作链路的切换方法及装置、存储介质、电子装置 |
CN112671575B (zh) * | 2020-12-21 | 2022-04-29 | 苏州盛科通信股份有限公司 | 工作链路的切换方法及装置、存储介质、电子装置 |
CN115190577A (zh) * | 2022-05-11 | 2022-10-14 | 四川创智联恒科技有限公司 | 一种o-ran系统时序同步互备份方法 |
CN115190577B (zh) * | 2022-05-11 | 2023-10-13 | 四川创智联恒科技有限公司 | 一种oran系统时序同步互备份方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3247055A1 (en) | 2017-11-22 |
CN105790825B (zh) | 2020-08-14 |
US20180269963A1 (en) | 2018-09-20 |
WO2016101825A1 (zh) | 2016-06-30 |
EP3247055A4 (en) | 2018-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105790825B (zh) | 一种分布式保护中控制器热备份的方法和装置 | |
EP3627767B1 (en) | Fault processing method and device for nodes in cluster | |
CN108270669B (zh) | Sdn网络的业务恢复装置、主控制器、系统及方法 | |
CN101150430B (zh) | 一种通过心跳机制实现网络接口板倒换的方法 | |
EP2045965B1 (en) | Resource state monitoring method, device and communication network | |
CN103780407A (zh) | 分布式弹性网络互连(drni)中网关动态切换方法和装置 | |
CN103532753B (zh) | 一种基于内存换页同步的双机热备方法 | |
JP2013030863A (ja) | スイッチ装置の制御システム、その構成制御装置および構成制御方法 | |
CN104753828A (zh) | 一种sdn控制器、数据中心系统和路由连接方法 | |
EP3121996B1 (en) | Synchronization failure processing method and system for clock and time synchronization network | |
WO2018233642A1 (zh) | 列车网络节点和基于CANopen协议的列车网络节点监测方法 | |
CN104243239B (zh) | 一种sdn集群中控制器的状态检测方法和装置 | |
CN105471622A (zh) | 一种基于Galera的控制节点主备切换的高可用方法及系统 | |
CN109921942B (zh) | 云平台切换控制方法、装置、系统及电子设备 | |
WO2012065435A1 (zh) | 一种传送网中的路径回切方法及装置 | |
WO2016095344A1 (zh) | 链路切换方法、装置及线卡 | |
CN105095008A (zh) | 一种适用于集群系统的分布式任务故障冗余方法 | |
CN102209008A (zh) | 一种用于智能弹性架构的多激活检测方法和设备 | |
CN103297279A (zh) | 一种多软件进程系统上软件控制的主备单盘倒换方法 | |
CN109347655B (zh) | 基于网络数据的故障恢复系统和方法及存储介质 | |
CN113794765A (zh) | 基于文件传输的网闸负载均衡方法及装置 | |
CN103051482A (zh) | 基于fc交换机的一种端口隔离及恢复的实现方法 | |
CN102118266A (zh) | 工业以太网双链路冗余技术 | |
CN103840965B (zh) | 一种增强rstp中故障快速收敛的方法 | |
TW202005410A (zh) | 多節點裝置及其備援通訊方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |