CN106850263B - 一种备平面中转发设备的配置错误检测方法、装置和系统 - Google Patents

一种备平面中转发设备的配置错误检测方法、装置和系统 Download PDF

Info

Publication number
CN106850263B
CN106850263B CN201611228020.XA CN201611228020A CN106850263B CN 106850263 B CN106850263 B CN 106850263B CN 201611228020 A CN201611228020 A CN 201611228020A CN 106850263 B CN106850263 B CN 106850263B
Authority
CN
China
Prior art keywords
equipment
sandbox system
forwarding device
routing protocol
checked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611228020.XA
Other languages
English (en)
Other versions
CN106850263A (zh
Inventor
陈锐
尹相东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huawei Digital Technologies Co Ltd
Original Assignee
Beijing Huawei Digital Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huawei Digital Technologies Co Ltd filed Critical Beijing Huawei Digital Technologies Co Ltd
Priority to CN201611228020.XA priority Critical patent/CN106850263B/zh
Publication of CN106850263A publication Critical patent/CN106850263A/zh
Application granted granted Critical
Publication of CN106850263B publication Critical patent/CN106850263B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0866Checking the configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开了一种备平面中转发设备的配置错误检测方法、装置和系统,在具有主平面和备平面的网络中,针对待检测设备,从主平面中确定出相应的测试设备,在每个待检测设备和测试设备中都设置处于沙箱系统中的路由协议处理实例,并建立沙箱系统之间的连接,根据测试任务设置第一设备中沙箱系统的故障类型,通过模拟的故障环境将第二设备的沙箱系统中的路由协议处理实例切换为主用设备,以此检测第二设备是否具有配置错误。在网络正常使用主平面提供服务的前提下,通过沙箱系统模拟故障环境检测备平面中转发设备切换为主用设备时的业务处理情况,可以有效的发现备平面中转发设备是否具有配置错误,从而提高了备平面中转发设备的稳定性。

Description

一种备平面中转发设备的配置错误检测方法、装置和系统
技术领域
本发明涉及通信领域,特别是涉及一种备平面中转发设备的配置错误检测方法、装置和系统。
背景技术
在网络中,例如IP网络,避免业务中断很重要,当一个转发设备或者说转发设备间链路出现故障时,需要快速的重新确定出接替该转发设备、并能够继续提供该转发设备所处理业务的其他转发设备。为此,可以将转发设备进行主备的区分,从而形成主平面和备平面,主平面中的转发设备作为网络的主用设备,为网络提供所能实现的正常功能和业务处理,备平面中的转发设备作为主平面中转发设备的备用设备。在主平面中的转发设备出现故障时,能够快速的从备平面中确定出转发设备进行主备切换,顶替故障的主用设备并能够继续提供故障设备在故障前所处理的业务。
随着网络复杂性的不断提高,网络协议的日益复杂,网络的运营商需要管理海量转发设备,而每台转发设备上都有上千条配置。如果一台转发设备的配置出现错误,则很有可能导致这台转发设备在提供服务时出现故障。可见,配置错误是转发设备出现故障的原因之一。
如果当前主平面中转发设备的配置出现错误时,该转发设备的业务将无法开通,因此主平面中转发设备的配置错误很容易被发现。然而备平面的转发设备平时并不处理实质性的业务,但是一般配置错误都是在处理业务时才能发现,故如果备平面中转发设备出现了配置错误,在未切换为主用设备时是不会处理实质性业务的,从而导致备平面中转发设备即使出现配置错误,也难以被提前发现,或者说,难以在被切换成主用设备前发现。
这样就可能导致当主平面中转发设备出现故障,需要备平面中转发设备接替继续处理业务时,若接替的转发设备具有配置错误,将很快在处理业务时出现故障,由于一般不会为一台备用设备再配置备用设备,故在备用设备主备切换后出现故障时,将有可能导致业务中断,甚至造成重大事故。可见,如何准确的确定出备平面中转发设备的配置错误是亟需解决的问题。
发明内容
为了解决上述技术问题,本发明实施例提供了一种备平面中转发设备的配置错误检测方法、装置和系统,可以准确的确定出备平面中转发设备的配置错误。
第一方面,本发明提供了一种备平面中转发设备的配置错误检测方法,应用于网络中,所述网络包括具有转发设备的主平面和备平面,所述方法包括:
从备平面中选择待检测设备,所述待检测设备为待检测是否具有配置错误的转发设备;
从主平面中确定出与所述待检测设备主备对应的转发设备作为测试设备;
在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中;
建立所述待检测设备和测试设备中沙箱系统之间的连接关系;
根据检测任务设置第一设备中沙箱系统的故障类型,所述第一设备为所述测试设备中与第二设备具有主备关系的一个转发设备,所述第二设备为所述检测任务所要检测的一个待检测设备;
根据所述第二设备中沙箱系统的运行情况检测出所述第二设备是否具有配置错误。
在第一方面的第一种可能的实现方式中,针对第三设备,所述第三设备为所述待检测设备中的一个转发设备或所述测试设备中的一个转发设备,所述在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中,包括:
为所述第三设备配置第一路由协议处理实例;
将所述第一路由协议处理实例设置到沙箱系统中,通过沙箱系统屏蔽所述第一路由协议处理实例向所述第三设备的转发芯片下发的路由转发表项,并屏蔽所述第一路由协议处理实例向未设置在沙箱系统中的其他转发设备中路由协议处理实例发送的路由协议报文。
结合第一方面或者第一方面的第一种可能的实现方式,在第二种可能的实现方式中,针对第四设备,所述第四设备为所述待检测设备中的一个转发设备或所述测试设备中的一个转发设备,所述在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中,包括:
为所述第四设备配置第二路由协议处理实例;
将所述第二路由协议处理实例设置到沙箱系统中,通过沙箱系统对向所述第四设备发送的路由协议报文进行过滤,具体包括:
若路由协议报文为未设置在沙箱系统中的其他路由协议处理实例所发送的,将除了用于告知相邻状态的路由协议报文以外的路由协议报文过滤掉;
若路由协议报文为设置在沙箱系统中的其他路由协议处理实例所发送的,不进行过滤。
在第一方面的第三种可能的实现方式中,所述建立所述待检测设备和测试设备中沙箱系统之间的连接关系,包括:
根据所述网络的网络拓扑建立所述待检测设备和测试设备中沙箱系统之间的连接关系。
结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述根据所述网络的网络拓扑建立所述待检测设备和测试设备中沙箱系统之间的连接关系,包括:
在所述待检测设备和测试设备中沙箱系统之间建立专用网络隧道;
当一个设置在沙箱系统中设置的路由协议处理实例向另一个设置在沙箱系统中设置的路由协议处理实例发送路由协议报文时,对所发送的路由协议报文进行针对所述专用网络隧道的报文封装。
在第一方面的第五种可能的实现方式中,所述根据所述第二设备中沙箱系统的运行情况检测出所述第二设备是否具有配置错误,包括:
通过网络级巡检的方式,对所述待检测设备和测试设备进行巡检;
根据网络级巡检所采集的路由数据,确定出收敛后的各个沙箱系统之间的网络拓扑;
根据收敛后的网络拓扑以及对所述第一设备中沙箱系统设置的故障类型,判断所述第二设备是否能够接替所述第一设备处理业务;
若可以,所述第二设备的不具有配置错误;
若不可以,所述第二设备具有配置错误。
第二方面,本发明提供了一种备平面中转发设备的配置错误检测装置,应用于网络中,所述网络包括具有转发设备的主平面和备平面,所述配置错误检测装置包括选择单元、配置单元、建立单元、设置单元和检测单元:
所述选择单元,用于从备平面中选择待检测设备,所述待检测设备为待检测是否具有配置错误的转发设备;
所述选择单元还用于从主平面中确定出与所述待检测设备主备对应的转发设备作为测试设备;
所述配置单元,用于在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中;
所述建立单元,用于建立所述待检测设备和测试设备中沙箱系统之间的连接关系;
所述设置单元,用于根据检测任务设置第一设备中沙箱系统的故障类型,所述第一设备为所述测试设备中与第二设备具有主备关系的一个转发设备,所述第二设备为所述检测任务所要检测的一个待检测设备;
所述检测单元,用于根据所述第二设备中沙箱系统的运行情况检测出所述第二设备是否具有配置错误。
在第二方面的第一种可能的实现方式中,针对第三设备,所述第三设备为所述待检测设备中的一个转发设备或所述测试设备中的一个转发设备,所述配置单元还用于为所述第三设备配置第一路由协议处理实例;将所述第一路由协议处理实例设置到沙箱系统中,通过沙箱系统屏蔽所述第一路由协议处理实例向所述第三设备的转发芯片下发的路由转发表项,并屏蔽所述第一路由协议处理实例向未设置在沙箱系统中的其他转发设备中路由协议处理实例发送的路由协议报文。
结合第二方面或者第二方面的第一种可能的实现方式,在第二种可能的实现方式中,针对第四设备,所述第四设备为所述待检测设备中的一个转发设备或所述测试设备中的一个转发设备,所述配置单元还用于为所述第四设备配置第二路由协议处理实例;将所述第二路由协议处理实例设置到沙箱系统中,通过沙箱系统对向所述第四设备发送的路由协议报文进行过滤,具体包括:若路由协议报文为未设置在沙箱系统中的其他路由协议处理实例所发送的,将除了用于告知相邻状态的路由协议报文以外的路由协议报文过滤掉;若路由协议报文为设置在沙箱系统中的其他路由协议处理实例所发送的,不进行过滤。
在第二方面的第三种可能的实现方式中,所述建立单元还用于根据所述网络的网络拓扑建立所述待检测设备和测试设备中沙箱系统之间的连接关系。
结合第二方面的第三种可能的实现方式,在第四种可能的实现方式中,所述建立单元还用于在所述待检测设备和测试设备中沙箱系统之间建立专用网络隧道;当一个设置在沙箱系统中设置的路由协议处理实例向另一个设置在沙箱系统中设置的路由协议处理实例发送路由协议报文时,对所发送的路由协议报文进行针对所述专用网络隧道的报文封装。
在第二方面的第五种可能的实现方式中,所述检测单元包括巡检子单元、确定子单元和判断子单元:
所述巡检子单元,用于通过网络级巡检的方式,对所述待检测设备和测试设备进行巡检;
所述确定子单元,用于根据网络级巡检所采集的路由数据,确定出收敛后的各个沙箱系统之间的网络拓扑;
所述判断子单元,用于根据收敛后的网络拓扑以及对所述第一设备中沙箱系统设置的故障类型,判断所述第二设备是否能够接替所述第一设备处理业务;若可以,所述第二设备的不具有配置错误;若不可以,所述第二设备具有配置错误。
第三方面,本发明提供了一种配置错误检测系统,应用于网络中,所述网络包括具有转发设备的主平面和备平面,所述配置错误检测系统包括待检测设备和测试设备,所述待检测设备为备平面中待检测是否具有配置错误的转发设备,所述测试设备为主平面中与所述待检测设备主备对应的转发设备;
在所述待检测设备和测试设备中配置有设置在沙箱系统中的,能够实现路由协议功能的路由协议处理实例,所述待检测设备和测试设备中沙箱系统之间建立有连接关系;
第一设备中沙箱系统设置有根据检测任务确定的故障类型,所述第一设备为所述测试设备中与第二设备具有主备关系的一个转发设备,所述第二设备为所述检测任务所要检测的一个待检测设备;
所述第二设备中的沙箱系统根据所述故障类型,进行相应的主备切换,以继续处理所述第一设备中沙箱系统由于所述故障类型而中断的业务。
由上述技术方案可以看出,在具有主平面和备平面的网络中,针对备平面中需要检测配置的待检测设备,从主平面中确定出由待检测设备作为备用设备的主用设备,也就是测试设备,在每个待检测设备和测试设备中都设置处于沙箱系统中的路由协议处理实例,并建立这些沙箱系统之间的连接,根据测试任务,将需要测试的第二设备所对应的主用设备如第一设备的沙箱系统进行故障处理,通过模拟的故障环境将第二设备的沙箱系统中的路由协议处理实例切换为主用设备,以此检测第二设备是否具有配置错误。由于沙箱系统之间的路由协议报文流转并不会影响到网络中实际路由协议报文的发送,故可以在网络正常使用主平面提供服务的前提下,通过各个沙箱系统所构成的沙箱网络,模拟出可能的故障环境来检测备平面中转发设备切换为主用设备时的业务处理情况,可以有效的发现备平面中转发设备可能出现的配置错误,从而提高了备平面中转发设备的稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一种网络中具有转发设备的主平面和备平面的示意图;
图2为本发明实施例提供的一种备平面中转发设备的配置错误检测方法的流程图;
图3为本发明实施例提供的一种沙箱系统之间通过专用网络隧道发送路由协议报文的示意图;
图4为本发明实施例提供的一种沙箱系统中模拟链路故障的示意图;
图5a为本发明实施例提供的一种沙箱系统接收用于告知相邻状态的路由协议报文的示意图;
图5b为本发明实施例提供的一种沙箱系统过滤路由协议报文的示意图;
图6为本发明实施例提供的一种第二设备是否具有配置错误的确定方式的流程图;
图7a为本发明实施例提供的一种实际网络拓扑的结构示意图;
图7b为本发明实施例提供的一种模拟故障环境形成的理论网络拓扑的结构示意图;
图7c为本发明实施例提供的一种转发设备存在配置错误时形成的沙箱网络拓扑的结构示意图;
图8为本发明实施例提供的一种沙箱系统模拟设备故障的示意图;
图9为本发明实施例提供的一种备平面中转发设备的配置错误检测装置的结构示意图;
图10为本发明实施例提供的一种配置错误检测系统的结构示意图。
具体实施方式
下面结合附图,对本发明的实施例进行描述。
随着网络技术的发展,为避免业务的中断,往往将转发设备进行主备的区分,从而形成主平面和备平面,在网络的正常运行中,主平面中的转发设备作为网络的主用设备处理实质性业务,为网络提供所能实现的正常功能和业务处理。备平面中的转发设备作为主平面中转发设备的备用设备,完成与主平面中转发设备的数据同步,以便于当主平面中的转发设备出现故障时,能够快速从备平面中确定出相应的转发设备顶替主平面中出现故障的转发设备,继续提供故障设备在出现故障前所处理的业务。例如图1所示,转发设备可以包括用户边缘路由器(Customer Edge router,CE)和运营商边缘路由器(Provider Edgerouter,PE),CE2和PE2属于主平面中的两个转发设备,CE1和PE1属于备平面中的两个转发设备,其中PE1是PE2的备用设备,即PE1具有与PE2相同的功能,可以实现相同的业务处理,CE1是CE2的备用设备,即CE1具有与CE2相同的功能,可以实现相同的业务处理,在网络运行过程中,CE2和PE2作为主用设备处理实质性业务,当CE2出现故障无法实现某些业务处理时,CE1可以顶替CE2实现这些业务处理。
为实现相应的业务处理,每台转发设备中都有上千条配置,当一台转发设备的配置出现错误时,可能会导致这台转发设备在提供服务时出现故障,可见,配置错误是转发设备出现故障的原因之一。
对于转发设备中配置错误的检测,可以在转发设备作为主用设备处理实质性业务时,通过对转发设备能否实现该业务处理来判别。在网络正常运行时,主平面中的转发设备作为主用设备处理实质性业务,当该转发设备存在配置问题时,该转发设备的业务将无法开通即该转发设备无法实现该业务处理,因此,可以很容易发现主平面中的转发设备是否存在配置错误,但是在主平面中的转发设备作为主用设备处理实质性业务时,备平面中的转发设备作为备用设备,并未处理实质性业务,因此很难发现备平面中转发设备是否存在配置错误。
为了检测备平面中转发设备的配置错误,一种可行的检测方式,可以在实际网络中进行主备平面的切换,可以通过维护命令触发网络实现主备平面的切换,当切换至备平面后,此时备平面中的转发设备作为主用设备处理实质性业务,若备平面中的某个转发设备存在配置错误,则该转发设备的业务无法开通即该转发设备无法实现该业务处理,说明该转发设备存在配置错误。
但是这种检测方式是在网络实际运行时进行主备平面的切换,当切换至备平面后,若备平面中的转发设备存在配置错误,则可能导致当前网络业务的中断。
为此,本发明实施例提供一种备平面中转发设备的配置错误检测方法、装置和系统,在具有主平面和备平面的网络中,针对备平面中需要检测配置的待检测设备,从主平面中确定出由待检测设备作为备用设备的主用设备,也就是测试设备,在每个待检测设备和测试设备中都设置处于沙箱系统中的路由协议处理实例,并建立这些沙箱系统之间的连接,根据测试任务,将需要测试的第二设备所对应的主用设备如第一设备的沙箱系统进行故障处理,通过模拟的故障环境将第二设备的沙箱系统中的路由协议处理实例切换为主用设备,以此检测第二设备是否具有配置错误。由于沙箱系统之间的路由协议报文流转并不会影响到网络中实际路由协议报文的发送,故可以在网络正常使用主平面提供服务的前提下,通过各个沙箱系统所构成的沙箱网络,模拟出可能的故障环境来检测备平面中转发设备切换为主用设备时的业务处理情况,可以有效的发现备平面中转发设备可能出现的配置错误,从而提高了备平面中转发设备的稳定性。
接下来,详细介绍本发明实施例所提供的一种备平面中转发设备的配置错误检测方法。图2为本发明实施例提供的一种备平面中转发设备的配置错误检测方法的流程图,应用于网络中,所述网络包括具有转发设备的主平面和备平面,该方法包括:
S201:从备平面中选择待检测设备。
备平面中的转发设备的个数有至少一个,待检测设备可以根据检测需求从备平面中的转发设备中确定出,待检测设备可以是待检测是否具有配置错误的转发设备,待测试设备的个数可以包括至少一个,例如,在备平面中具有100台转发设备,需要对其中的10台转发设备检测是否具有配置错误,则这10台转发设备即为待检测设备。
S202:从主平面中确定出与所述待检测设备主备对应的转发设备作为测试设备。
从备平面中选择出待检测设备后,需要对待检测设备进行配置错误的检测,当待检测设备作为主用设备处理实质性业务时,才可以检测该待检测设备是否存在配置错误。由于在网络正常运行中,一般是主平面中的转发设备作为主用设备处理实质性业务,因此,当需要对待检测设备进行配置错误的检测时,首先需要从主平面的转发设备中确定出与该待检测设备主备对应的转发设备。以便于后续操作中可以将主平面中的转发设备设置故障,使得待检测设备可以作为主用设备处理实质性业务,实现对该待检测设备配置错误的检测。
主平面中的每一个转发设备都可以从备平面的转发设备中找到与其对应的一个备用设备,即主平面中的一个转发设备可以实现的业务处理,相应的可以在备平面中找到可以实现相同业务处理的一个转发设备,备平面中的一个转发设备作为主平面中一个转发设备的备用设备,这两个转发设备具有主备对应关系。例如,主平面中的一个转发设备1可以实现业务处理A,在备平面中的一个转发设备2与转发设备1保持数据的同步可以实现与转发设备1相同的业务处理A,则转发设备1和转发设备2是具有主备对应的转发设备。
由于备平面中转发设备作为主平面中转发设备的备用设备,可以实现与主平面中转发设备相同的业务处理,因此,可以根据所述待检测设备可以实现的业务处理,从主平面中的转发设备中选择出可以实现相同业务处理的转发设备,该转发设备是与待检测设备主备对应的转发设备,可以将该转发设备作为测试设备。或者,可以根据主平面中转发设备与备平面中其对应的备用设备的主备对应关系,建立一个主备对应关系列表,当选择好待检测设备后,可以查找该主备对应关系列表从主平面中确定出与待检测设备具有主备对应的转发设备作为测试设备。
S203:在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中。
路由协议处理实例可以作为一个转发设备实现相应业务处理的主要依据。该转发设备根据路由协议处理实例能够实现的业务处理即为与路由协议相关的功能。
在每个转发设备中可以设置有一个路由协议处理实例,在网络运行中,转发设备可以依据于该路由协议处理实例来实现与路由协议相关的功能。
在本发明实施例中,为了不影响转发设备的正常工作,同时又能实现主备平面的切换,可以在待检测设备和测试设备中除原本具有的路由协议处理实例之外,再配置出一个能够实现路由协议功能的路由协议处理实例。也就是说,作为待检测设备和测试设备的转发设备的路由协议程序需要具有支持多实例的功能,从而可以实现在一台转发设备上部署多个路由协议处理实例的可能。配置出的路由协议处理实例可以实现与转发设备中原本具有的路由协议处理实例相同的路由协议功能,即配置出的路由协议处理实例可以模拟原本具有的路由协议处理实例所能实现的业务处理。
待检测设备和测试设备的正常工作可以依据于原本具有的路由协议处理实例实现,对待检测设备进行是否具有配置错误的检测时,则可以依据于配置出的路由协议处理实例来模拟主备平面的切换,从而实现对待检测设备是否具有配置错误的检测。
为了确保配置出的路由协议处理实例对原本的路由协议处理实例不会产生影响,可以将配置出的路由协议处理实例设置到沙箱系统中。
沙箱系统相当于建立了一个基本上与外界隔离的系统环境,其作用在于沙箱系统之间可以实现相互通信,并且不会对沙箱系统之外的真实业务处理产生影响,因此,可以利用沙箱系统中的路由协议处理实例来模拟主备切换,而不是直接让待检测设备本身从备用设备切换成主用设备,沙箱系统间的主备切换不会对网络或者转发设备的正常工作产生影响。
S204:建立所述待检测设备和测试设备中沙箱系统之间的连接关系。
将配置好的路由协议处理实例设置到沙箱系统中后,为保证沙箱系统之间的良好通信,首先需要在沙箱系统之间建立连接关系。为了能够起到有效检测备用设备的配置情况,需要明确该备用设备是否能够在当前网络环境中实现正确配置下所能实现的功能,为了达到这一目的,沙箱系统之间的连接关系需要与待检测设备所在网络的网络拓扑一致,从而才能起到真实的模拟当前网络的组网结构的作用。故可选的,可以根据所述网络的网络拓扑建立所述待检测设备和测试设备中沙箱系统之间的连接关系。
例如图1所示,CE2和PE2为测试设备,CE1和PE1为待检测设备,CE2和CE1具有主备对应关系,PE2和PE1具有主备对应关系,分别在CE2、PE2、CE1和PE1中配置有设置到沙箱系统中的路由协议处理实例,为了能够起到检测配置信息是否正确的目的,各设备之间的连接并非随意互连,根据网络拓扑可以确定出PE2中沙箱系统分别与PE1中的沙箱系统和CE2中的沙箱系统具有连接关系,CE1中沙箱系统分别与PE1中的沙箱系统和CE2中的沙箱系统具有连接关系。
当确定出各沙箱系统之间的连接关系后,在建立连接关系时可以通过建立专用网络隧道,来实现个沙箱系统之间的通信。该专用网络隧道只为沙箱系统之间的通信提供服务,该专用网络隧道具体可以是在三层虚拟专用网络(Layer 3Virtual Private Network,L3VPN)中所建立的网络隧道。
沙箱系统之间的通信主要是进行路由协议处理实例的交互,为了避免沙箱系统之间交互的路由协议报文被正常工作的转发设备原有的路由协议处理实例接收后,导致网络拓扑的变化,影响正常的业务处理,可以将这些路由协议报文进行额外的封装。具体的,当一个设置在沙箱系统中设置的路由协议处理实例向另一个设置在沙箱系统中设置的路由协议处理实例发送路由协议报文时,对所发送的路由协议报文进行针对所述专用网络隧道的报文封装。封装后的路由协议报文仅可以在设置在沙箱系统中的路由协议处理实例之间进行发送,即封装后的路由协议报文仅可以被设置在沙箱系统中的路由协议处理实例接收,不会被未设置在沙箱系统中的其他路由协议处理实例接收,因此不会对网络的正常运行产生影响。
通过在沙箱系统之间建立专用网络隧道,并对沙箱系统之间发送的路由协议报文进行专用网络隧道的报文封装,保证了沙箱系统之间的通信不会对转发设备的正常工作产生影响。
如图3所示,在转发设备A和转发设备B中,除原本具有的路由协议处理实例外,还分别配置有设置在沙箱系统中的路由协议处理实例,沙箱系统之间路由协议报文的交互是通过沙箱系统之间建立的专用网络隧道即L3VPN的网络隧道进行的,由于在L3VPN的网络隧道中发送的路由协议报文是经过特定封装后的路由协议报文,因此这些特定封装后的路由协议报文只在L3VPN中发送,并不会发送到网络中其他未设置在沙箱系统中的路由协议处理实例处,故不会影响网络中正常的路由协议报文的发送。从图中可以看出,沙箱系统中路由协议处理实例之间的交互,与转发设备中原本具有的路由协议处理实例之间的交互,是相互独立的两个交互过程,并不会相互影响,由此保证了网络的正常运行。
S205:根据检测任务设置第一设备中沙箱系统的故障类型。
以第二设备即待检测设备中的一个待检测设备为例,与该第二设备具有主备关系的一个测试设备可以称作第一设备。
在网络正常运行中,第一设备作为主用设备处理实质性业务,当需要对备平面中的第二设备进行配置错误的检测时,需要将备平面中的第二设备切换为主用设备,为此,需要将主平面中的第一设备设置故障,从而使得备平面中相应的第二设备可以作为主用设备处理实质性业务,当第二设备处理实质性业务时可以实现对该第二设备是否具有配置错误的检测。
对第二设备的是否具有配置错误的检测,可以是对第二设备的整体配置进行检测,也可以是对第二设备的端口信息的配置进行检测,即检测任务可以是对第二设备的整体配置进行检测,也可以是是对第二设备的端口信息的配置进行检测。对于第二设备的检测任务不同,则设置第一设备的故障类型也不同。
然而,直接将第一设备进行故障设置,或者直接对将第一设备和第二设备进行主备切换显然有可能会影响到网络的正常服务,为了不影响网络的正常运行,可以利用设置在沙箱系统中路由协议处理实例模拟故障环境,即可以在沙箱系统中设置所需故障类型。当需要对第二设备的整体配置进行检测时,此时第一设备中沙箱系统的故障类型属于设备故障,可以通过网络级巡检命令将第一设备中沙箱系统关闭。当需要对第二设备的端口信息的配置进行检测时,此时第一设备中沙箱系统的故障类型属于链路故障,可以通过网络级巡检命令将第一设备中沙箱系统指定的端口关闭。
S206:根据所述第二设备中沙箱系统的运行情况检测出所述第二设备是否具有配置错误。
根据设置的第一设备中沙箱系统的故障类型,可以明确当第二设备转为主用设备时,理论上应该要实现的业务处理。当设置好第一设备中沙箱系统的故障类型后,第二设备中沙箱系统开始运行,此时可以根据第二设备中沙箱系统的运行情况确定出第二设备中沙箱系统是否可以实现该业务处理,当可以实现该业务处理时,说明第二设备没有配置错误,当无法实现该业务处理时,说明第二设备具有配置错误。
如图4所示,在转发设备A、转发设备B和转发设备C中分别配置有设置在沙箱系统中的路由协议处理实例,其中转发设备A是转发设备C的备用设备,当需要对转发设备A和转发设备B进行通信的端口信息是否存在配置错误的检测时,可以通过设置转发设备C中沙箱系统的故障,设置为转发设备C和转发设备B进行通信的端口出现链路故障,导致转发设备C的沙箱系统中的路由协议处理实例无法与转发设备B的沙箱系统中的路由协议处理实例之间进行业务处理,转发设备A作为转发设备C的备用设备,此时可以通过设置在转发设备A和转发设备C的沙箱系统中的路由协议处理实例模拟主备切换,模拟切换后,转发设备A沙箱系统中的路由协议处理实例切换为主用设备,而转发设备C沙箱系统中的路由协议处理实例切换为备用设备,当转发设备A的沙箱系统中的路由协议处理实例可以实现与转发设备B的沙箱系统中的路由协议处理实例之间的业务处理,则说明转发设备A的端口信息不存在配置错误,当转发设备A的沙箱系统中的路由协议处理实例无法实现与转发设备B的沙箱系统中的路由协议处理实例之间的业务处理,则说明转发设备A的端口信息存在配置错误。
由上述技术方案可以看出,在具有主平面和备平面的网络中,针对备平面中需要检测配置的待检测设备,从主平面中确定出由待检测设备作为备用设备的主用设备,也就是测试设备,在每个待检测设备和测试设备中都设置处于沙箱系统中的路由协议处理实例,并建立这些沙箱系统之间的连接,根据测试任务,将需要测试的第二设备所对应的主用设备如第一设备的沙箱系统进行故障处理,通过模拟的故障环境将第二设备的沙箱系统中的路由协议处理实例切换为主用设备,以此检测第二设备是否具有配置错误。由于沙箱系统之间的路由协议报文流转并不会影响到网络中实际路由协议报文的发送,故可以在网络正常使用主平面提供服务的前提下,通过各个沙箱系统所构成的沙箱网络,模拟出可能的故障环境来检测备平面中转发设备切换为主用设备时的业务处理情况,可以有效的发现备平面中转发设备可能出现的配置错误,从而提高了备平面中转发设备的稳定性。
在本发明实施例中,通过沙箱系统中配置的路由协议处理实例来模拟主备平面的切换,以此来检测备平面中转发设备的配置错误,其中在沙箱系统之间进行模拟主要是为了避免对网络的正常工作产生影响。沙箱系统之间的操作之所以不会对网络的正常工作产生影响,主要是因为本发明实施例对沙箱系统设置的屏蔽功能,接下来将对沙箱系统所设置的屏蔽功能展开介绍。
以第三设备即待检测设备中的一个转发设备或测试设备中的一个转发设备为例,例如第三设备可以是上述的第一设备或者第二设备,所述在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中,包括:
为所述第三设备配置第一路由协议处理实例;
将所述第一路由协议处理实例设置到沙箱系统中,通过沙箱系统屏蔽所述第一路由协议处理实例向所述第三设备的转发芯片下发的路由转发表项,并屏蔽所述第一路由协议处理实例向未设置在沙箱系统中的其他转发设备中路由协议处理实例发送的路由协议报文。
第一路由协议处理实例可以是能够实现第三设备的路由协议功能的实例。在第三设备正常工作时,如果出现网络拓扑的变化,第三设备中路由协议处理实例所需维护的路由转发表项中的信息将会发生变化,为了保证第三设备可以及时根据变化后的网络拓扑进行相关操作,会将变化后的路由转发表项下发到第三设备的转发芯片中。但是,对于沙箱系统的路由协议处理实例之间进行交互时,若在模拟过程中出现网络拓扑的变化,该路由协议处理实例所需维护的路由转发表项中的信息将会发生变化,考虑到路由转发表项的变化仅是在沙箱系统之间进行模拟操作时产生的变化,并非是网络实际运行中产生的变化,为了不影响网络的实际运行,沙箱系统需要屏蔽第一路由协议处理实例向第三设备的转发芯片下发路由转发表项。
例如,CE1是CE2的备用设备,在CE1和CE2中分别配置有设置在沙箱系统中的路由协议处理实例,正常工作时,CE2可以通过指定端口实现与媒体网关(Media Gateway,MGW)的通信,例如CE2可以通过端口1实现与MGW1之间的通信,当设置CE2中沙箱系统端口1链路故障时,即CE2沙箱系统中端口1无法实现与MGW1的通信,此时CE1中沙箱系统相应的一个端口1,可以顶替CE2沙箱系统中端口1来完成与MGW1的通信,此时路由转发表项中的信息发生变化,由原来的CE2中的端口1与MGW1相连,变成CE1中的端口1,与MGW1相连。但是上述路由转发表项中的信息发生变化仅是在沙箱系统中模拟主备平面转换时出现的变化,并非是网络实际运行中产生的变化,为了不影响网络的实际运行,CE1沙箱系统中的路由协议处理实例向CE1转发芯片下发路由表项的操作会被沙箱系统屏蔽。
沙箱系统的屏蔽功能除了可以屏蔽向第三设备的转发芯片下发路由转发表项外,为了保证沙箱系统之间的路由协议报文流转不影响网络中实际路由协议报文的发送,沙箱系统可以自动屏蔽向未设置在沙箱系统中的其他转发设备中路由协议处理实例发送路由协议报文,以保证沙箱系统之间发送的路由协议报文只在沙箱系统之间进行,不会发送到非沙箱系统中的其他路由协议处理实例中。
一般情况下,对于一个转发设备而言,设置在该转发设备中的路由协议处理实例之间不会进行路由协议报文的发送,例如,第三设备中除原本具有的路由协议处理实例A之外,还配置有设置在沙箱系统中的路由协议处理实例B,由于沙箱系统的屏蔽功能,路由协议处理实例B和路由协议处理实例A之间不会发送路由协议报文。
通过上述沙箱系统的屏蔽功能,充分保证了沙箱系统之间的模拟操作不会对实际网络的运行产生影响,从而可以实现在不影响网络正常使用主用设备提供服务的前提下,通过各个沙箱系统所构成的沙箱网络,模拟出可能的故障环境来检测备平面中转发设备切换为主用设备时的业务处理情况,可以有效的发现备平面中转发设备可能出现的配置错误。
第二设备作为第一设备的备用设备,为了能够实现与第一设备相同的业务处理,第二设备中的路由协议处理实例需要与第一设备中的路由协议处理实例保持同步。路由协议处理实例的核心数据是路由表,第一设备为保证能够实现正常的业务处理,需要对第一设备中的路由表进行实时的维护。第二设备作为第一设备的备用设备,也需要对第二设备中的路由表进行实时的维护。在本发明实施例中,第一设备和第二设备除原本具有的路由协议处理实例外,均配置有设置在沙箱系统中的路由协议处理实例,为保证第一设备配置的设置在沙箱系统中的路由协议处理实例可以模拟原本具有的路由协议处理实例所能实现的业务处理,需要对第一设备沙箱系统中路由协议处理实例所对应的路由表进行实时的维护。第二设备作为第一设备的备用设备,也需要对第二设备沙箱系统中路由协议处理实例所对应的路由表进行实时的维护。由此可知,对于第一设备和第二设备,除本身需要维护的路由表外,还需要对沙箱系统中的路由表进行维护。
以第四设备即待检测设备中的一个转发设备或测试设备中的一个转发设备为例,在第四设备中本身需要维护一个路由表,若第四设备为主用设备时,该路由表为维持正常业务处理所需的路由表,该路由表的容量可能会很大,有些情况下需要占用GByte量级的存储空间,故在该路由表已经占据了第四设备中大量的内存空间的情况下,第四设备中剩余的内存空间已经无法承受再维护一份镜像的路由表,也即设置到沙箱系统中的路由表无法通过直接拷贝原有的路由表的方式实现对路由表的快速建立。
针对这种情况,需要尽量减少为沙箱系统中路由协议处理实例所维护的路由表的大小,以减轻转发设备的维护压力。路由表中可以包含有至少一个路由表项,当转发设备进行针对一类路由协议报文的发送处理,对应的可以生成一个路由表项,生成的路由表项的项数越多,则由路由表项组成的路由表所占用的内存空间越大。为此,以第四设备为例,可以对第四设备中沙箱系统内的第二路由协议处理实例所需处理的路由协议报文进行过滤,以此来减少针对第二路由协议处理实例所需维护路由表项的项数,从而减小了第四设备中第二路由协议处理实例所对应路由表占用的内存空间。具体的,所述在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中,包括:
为所述第四设备配置第二路由协议处理实例;
将所述第二路由协议处理实例设置到沙箱系统中,通过沙箱系统对向所述第四设备发送的路由协议报文进行过滤,具体包括:
若路由协议报文为未设置在沙箱系统中的其他路由协议处理实例所发送的,将除了用于告知相邻状态的路由协议报文以外的路由协议报文过滤掉;
若路由协议报文为设置在沙箱系统中的其他路由协议处理实例所发送的,不进行过滤。
以第四设备为例,第二路由协议处理实例主要是为了能够模拟第四设备原本具有的路由协议处理实例所能实现的业务处理,但是需要尽量降低维护第二路由协议处理实例所对应了路由表的大小,对于该沙箱系统的路由表中包含的路由表项能够实现该业务处理即可,对于与实现该业务处理无关的路由协议报文可以进行过滤,以及网络中处理实际业务所需的路由协议报文也可以进行过滤,以此来减少生成的路由表项的项数,从而减少路由表占用的内存空间。其中,与实现该业务处理相关的路由协议报文可以包括沙箱系统之间发送的路由协议报文,以及与第四设备相邻的不包含沙箱系统的转发设备发送的用于告知相邻状态的路由协议报文。第四设备的沙箱系统接收用于告知相邻状态的路由协议报文,是为了从该路由协议报文中得知与其相邻的转发设备的存在,从而可以根据第四设备中配置的信息,实现与该转发设备之间业务处理。
如图5a所示,转发设备A中没有配置设置在沙箱系统中的路由协议处理实例,转发设备B中配置有设置在沙箱系统中的路由协议处理实例,当转发设备A向转发设备B发送用于告知相邻状态的路由协议报文(例如HELLO报文)时,则转发设备B中原本具有的路由协议处理实例和沙箱系统中的路由协议处理实例可以分别接收该HELLO报文。但是当转发设备A向转发设备B发送的是除了HELLO报文以外的路由协议报文,例如连接状态更新报文(LinkState Update,LSU)、连接状态响应报文(Link State Ack,LSA)和连接状态请求报文(LinkState Request,LSR)时,转发设备B中的沙箱系统会过滤掉这些路由协议报文,如图5b所示,转发设备B沙箱系统中的路由协议处理实例不会接收到这些路由协议报文。
通过第四设备中沙箱系统对发送路由协议报文的过滤,有效减少了沙箱系统中路由协议处理实例对路由协议报文的处理任务,减少了所生成的路由表项的项数,从而减少了路由表占用的内存空间,实现在第四设备中配置路由表,从而使得配置的路由协议处理实例可以实现与原本具有的路由协议处理实例相同的业务处理。
在本发明实施例中,第二设备中沙箱系统的实际运行情况可以通过网络级巡检的方式确定,通过将第二设备中沙箱系统的实际运行情况与配置正确时理论上应该出现的运行情况进行比较,可以判断出第二设备是否具有配置错误。其中,沙箱系统之间的运行情况可以通过各个沙箱系统之间的网络拓扑反映出。接下来将对第二设备是否具有配置错误的确定方式展开介绍,如图6所示,具体步骤如下:
S601:通过网络级巡检的方式,对所述待检测设备和测试设备进行巡检。
S602:根据网络级巡检所采集的路由数据,确定出收敛后的各个沙箱系统之间的网络拓扑。
路由数据可以用于标识待检测设备和测试设备在进行业务处理时所形成的路径信息。以第一设备和第二设备为例,网络级巡检主要是对第一设备和第二设备的实际运行情况进行检测。通过网络级巡检可以采集到第一设备和第二设备的路由数据,根据路由数据可以确定出第一设备和第二设备沙箱系统之间的网络拓扑。
例如图7a所示,在转发设备A、转发设备B和转发设备C中分别配置有设置在沙箱系统中的路由协议处理实例,转发设备A(第二设备)是转发设备C(第一设备)的备用设备,在进行业务处理时可以形成的实际网络拓扑如图7a所示,转发设备A、转发设备B和转发设备C之间相互连接。
S603:根据收敛后的网络拓扑以及对所述第一设备中沙箱系统设置的故障类型,判断所述第二设备是否能够接替所述第一设备处理业务。
根据第一设备中沙箱系统设置的故障类型可以确定出第二设备在顶替第一设备后应该形成的网络拓扑。
S604:若可以,所述第二设备的不具有配置错误。
S605:若不可以,所述第二设备具有配置错误。
为了后续方便介绍,可以将S602中确定出的收敛后的各个沙箱系统之间的网络拓扑称为沙箱网络拓扑,将S603中根据第一设备中沙箱系统设置的故障类型确定出的网络拓扑称为理论网络拓扑,可以将沙箱网络拓扑和理论网络拓扑进行比较,从而判断出第二设备是否具有配置错误。
当各个沙箱系统之间沙箱网络拓扑与理论网络拓扑相同时,说明第二设备可以顶替出现故障的第一设备来实现第一设备未出现故障时所能实现的业务处理,即能够接替所述第一设备处理业务,由此可知,第二设备没有配置错误。
当各个沙箱系统之间沙箱网络拓扑与理论网络拓扑不同时,说明第二设备无法顶替出现故障的第一设备来实现第一设备未出现故障时所能实现的业务处理,即无法接替所述第一设备处理业务,由此可知,第二设备具有配置错误。
例如,在转发设备A、转发设备B和转发设备C中分别配置有设置在沙箱系统中的路由协议处理实例,转发设备A(第二设备)是转发设备C(第一设备)的备用设备,在网络正常运行时,转发设备C作为主用设备可以与转发设备B进行实质性的业务处理,当需要对转发设备A和转发设备B进行通信的端口信息是否存在配置错误的检测时,可以将转发设备C中沙箱系统的故障类型设置为转发设备C和转发设备B进行通信的端口出现链路故障,导致转发设备C的沙箱系统中的路由协议处理实例无法与转发设备B的沙箱系统中的路由协议处理实例之间进行业务处理,转发设备A作为转发设备C的备用设备,此时可以通过设置在转发设备A和转发设备C的沙箱系统中的路由协议处理实例模拟主备切换,模拟切换后,转发设备A沙箱系统中的路由协议处理实例切换为主用设备,而转发设备C沙箱系统中的路由协议处理实例切换为备用设备。
根据沙箱系统所模拟的转发设备C的故障类型设置为转发设备C中与转发设备B进行通信的端口出现链路故障,理论上通过路由收敛,应该形成的理论网络拓扑如图7b所示,转发设备A(第二设备)的沙箱系统和转发设备C(第一设备)的沙箱系统之间连接,转发设备A的沙箱系统与转发设备B的沙箱系统之间连接。如果根据S602确定出的沙箱网络拓扑与图7b所示的理论网络拓扑相同时,则说明转发设备A和转发设备B进行通信的端口信息不存在配置错误。
如果根据S602确定出的沙箱网络拓扑如图7c所示,转发设备A(第二设备)的沙箱系统和转发设备C(第一设备)的沙箱系统之间连接,转发设备A的沙箱系统和转发设备C的沙箱系统均未与转发设备B的沙箱系统连接。可知确定出的各沙箱系统之间的沙箱网络拓扑与上述配置正确时理论上应该形成的理论网络拓扑不相同,说明转发设备A和转发设备B进行通信的端口信息存在配置错误。
网络拓扑是反映第二设备是否能够实现相应的业务处理的关键因素,通过上述将沙箱系统之间的网络拓扑与理论上形成的网络拓扑进行比较,可以准确判断出第二设备是否能够实现相应的业务处理,从而可以准确的确定出第二设备是否具有配置错误。
本发明实施例提供的方法可以实现对备平面中转发设备的配置错误进行检测,下面将以一个具体实例对该检测方法进行介绍,如图8所示,CE2和PE2属于主平面中的两个转发设备,CE1和PE1属于备平面中的两个转发设备,其中PE1是与PE2主备对应的转发设备,CE1是与CE2主备对应的转发设备,CE2分别与MGW1-MGW4连接,CE1作为CE2的备用设备也与MGW1-MGW4分别连接,在网络运行过程中,CE2和PE2作为主用设备,CE2可以与MGW1-MGW4之间可以进行实质性业务处理。当需要对CE1的整体配置检测是否具有配置错误时,可以通过沙箱系统模拟故障环境,设置CE2中沙箱系统的故障类型为设备故障,此时CE2的沙箱系统中的路由协议处理实例已经无法实现与MGW1-MGW4之间的业务处理,CE1作为CE2的备用设备可以通过设置在CE1和CE2的沙箱系统中的路由协议处理实例模拟主备切换,模拟切换后,CE1沙箱系统中的路由协议处理实例切换为主用设备,而CE2沙箱系统中的路由协议处理实例切换为备用设备。如果MGW1-MGW4直接配置了到CE1和CE2的路由信息,CE2配置了到MGW1-MGW4的路由信息,CE1没有配置到MGW1-MGW4的路由信息,那么,在沙箱系统的路由表中,PE1和PE2存在到达MGW1-MGW4的路由信息。当设置CE2中沙箱系统的故障类型为设备故障,由于CE1没有配置到MGW1-MGW4的路由信息,无法实现与MGW1-MGW4之间的业务处理,由此可以发现CE1存在配置错误。经过路由收敛,PE2来源于CE2的路由会老化,PE1来源于PE2的路由也会老化,由于最终PE1和PE2无法生成到达MGW1-MGW4的路由,则相应的路由表中的路由信息会发生变化。虽然网络级巡检过程中,PE1和PE2沙箱系统的路由协议实例的路由表发生变化,但是向PE1和PE2的转发芯片下发路由转发表项的动作被沙箱系统屏蔽,因此不会影响真实环境中发往MGW1-MGW4的业务。PE2发往PE1的通告MGW1-MGW4链路状态老化的路由协议报文被封装在沙箱系统专用的L3VPN的网络隧道中发送,仅被PE1的沙箱系统中的路由协议实例处理,不影响PE1中正常工作的路由协议处理实例,不会引起实际网络运行中路由震荡。
本发明的装置实施例
图9为本发明实施例提供的一种备平面中转发设备的配置错误检测装置的结构示意图,应用于网络中,所述网络包括具有转发设备的主平面和备平面,所述配置错误检测装置900包括选择单元901、配置单元902、建立单元903、设置单元904和检测单元905:
所述选择单元901,用于从备平面中选择待检测设备,所述待检测设备为待检测是否具有配置错误的转发设备。
所述选择单元901还用于从主平面中确定出与所述待检测设备主备对应的转发设备作为测试设备。
所述配置单元902,用于在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中。
所述建立单元903,用于建立所述待检测设备和测试设备中沙箱系统之间的连接关系。
所述设置单元904,用于根据检测任务设置第一设备中沙箱系统的故障类型,所述第一设备为所述测试设备中与第二设备具有主备关系的一个转发设备,所述第二设备为所述检测任务所要检测的一个待检测设备。
所述检测单元905,用于根据所述第二设备中沙箱系统的运行情况检测出所述第二设备是否具有配置错误。
可选的,针对第三设备,所述第三设备为所述待检测设备中的一个转发设备或所述测试设备中的一个转发设备,所述配置单元902还用于为所述第三设备配置第一路由协议处理实例;将所述第一路由协议处理实例设置到沙箱系统中,通过沙箱系统屏蔽所述第一路由协议处理实例向所述第三设备的转发芯片下发的路由转发表项,并屏蔽所述第一路由协议处理实例向未设置在沙箱系统中的其他转发设备中路由协议处理实例发送的路由协议报文。
可选的,针对第四设备,所述第四设备为所述待检测设备中的一个转发设备或所述测试设备中的一个转发设备,所述配置单元902还用于为所述第四设备配置第二路由协议处理实例;将所述第二路由协议处理实例设置到沙箱系统中,通过沙箱系统对向所述第四设备发送的路由协议报文进行过滤,具体包括:若路由协议报文为未设置在沙箱系统中的其他路由协议处理实例所发送的,将除了用于告知相邻状态的路由协议报文以外的路由协议报文过滤掉;若路由协议报文为设置在沙箱系统中的其他路由协议处理实例所发送的,不进行过滤。
可选的,所述建立单元903还用于根据所述网络的网络拓扑建立所述待检测设备和测试设备中沙箱系统之间的连接关系。
可选的,所述建立单元903还用于在所述待检测设备和测试设备中沙箱系统之间建立专用网络隧道;当一个设置在沙箱系统中设置的路由协议处理实例向另一个设置在沙箱系统中设置的路由协议处理实例发送路由协议报文时,对所发送的路由协议报文进行针对所述专用网络隧道的报文封装。
可选的,所述检测单元905包括巡检子单元、确定子单元和判断子单元:
所述巡检子单元,用于通过网络级巡检的方式,对所述待检测设备和测试设备进行巡检;
所述确定子单元,用于根据网络级巡检所采集的路由数据,确定出收敛后的各个沙箱系统之间的网络拓扑;
所述判断子单元,用于根据收敛后的网络拓扑以及对所述第一设备中沙箱系统设置的故障类型,判断所述第二设备是否能够接替所述第一设备处理业务;若可以,所述第二设备的不具有配置错误;若不可以,所述第二设备具有配置错误。
图9为从网络设备侧描述本发明技术方案的装置实施例,图9所对应实施例中特征的说明可以参见图2所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,在具有主平面和备平面的网络中,针对备平面中需要检测配置的待检测设备,从主平面中确定出由待检测设备作为备用设备的主用设备,也就是测试设备,在每个待检测设备和测试设备中都设置处于沙箱系统中的路由协议处理实例,并建立这些沙箱系统之间的连接,根据测试任务,将需要测试的第二设备所对应的主用设备如第一设备的沙箱系统进行故障处理,通过模拟的故障环境将第二设备的沙箱系统中的路由协议处理实例切换为主用设备,以此检测第二设备是否具有配置错误。由于沙箱系统之间的路由协议报文流转并不会影响到网络中实际路由协议报文的发送,故可以在网络正常使用主平面提供服务的前提下,通过各个沙箱系统所构成的沙箱网络,模拟出可能的故障环境来检测备平面中转发设备切换为主用设备时的业务处理情况,可以有效的发现备平面中转发设备可能出现的配置错误,从而提高了备平面中转发设备的稳定性。
接下来从系统的角度进一步说明本发明的技术方案。
图10为本发明实施例提供的一种配置错误检测系统的结构示意图,应用于网络中,所述网络包括具有转发设备的主平面和备平面,所述配置错误检测系统1000包括待检测设备1001和测试设备1002,所述待检测设备1001为备平面中待检测是否具有配置错误的转发设备,所述测试设备1002为主平面中与所述待检测设备主备对应的转发设备;
在所述待检测设备和测试设备中配置有设置在沙箱系统中的,能够实现路由协议功能的路由协议处理实例,所述待检测设备和测试设备中沙箱系统之间建立有连接关系;
第一设备中沙箱系统设置有根据检测任务确定的故障类型,所述第一设备为所述测试设备中与第二设备具有主备关系的一个转发设备,所述第二设备为所述检测任务所要检测的一个待检测设备;
所述第二设备中的沙箱系统根据所述故障类型,进行相应的主备切换,以继续处理所述第一设备中沙箱系统由于所述故障类型而中断的业务。
由上述技术方案可以看出,在具有主平面和备平面的网络中,配置错误检测系统包括待检测设备和测试设备,在每个待检测设备和测试设备中都配置有设置在沙箱系统中的路由协议处理实例,并建立这些沙箱系统之间的连接,根据测试任务,将需要测试的第二设备所对应的主用设备如第一设备的沙箱系统设置故障类型,第二设备中的沙箱系统根据所述故障类型,进行相应的主备切换,以继续处理所述第一设备中沙箱系统由于所述故障类型而中断的业务,以此检测第二设备是否具有配置错误。由于沙箱系统之间的路由协议报文流转并不会影响到网络中实际路由协议报文的发送,故可以在网络正常使用主平面提供服务的前提下,通过各个沙箱系统所构成的沙箱网络,模拟出可能的故障环境来检测备平面中转发设备切换为主用设备时的业务处理情况,可以有效的发现备平面中转发设备可能出现的配置错误,从而提高了备平面中转发设备的稳定性。
本发明实施例中提到的第一设备和第一路由协议处理实例的“第一”只是用来做名字标识,并不代表顺序上的第一。该规则同样适用于“第二”、“第三”和“第四”。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-only memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明的一些具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (13)

1.一种备平面中转发设备的配置错误检测方法,其特征在于,应用于网络中,所述网络包括具有转发设备的主平面和备平面,所述方法包括:
从备平面中选择待检测设备,所述待检测设备为待检测是否具有配置错误的转发设备;
从主平面中确定出与所述待检测设备主备对应的转发设备作为测试设备;
在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中;
建立所述待检测设备和测试设备中沙箱系统之间的连接关系;
根据检测任务设置第一设备中沙箱系统的故障类型,所述第一设备为所述测试设备中与第二设备具有主备关系的一个转发设备,所述第二设备为所述检测任务所要检测的一个待检测设备;
根据所述第二设备中沙箱系统的运行情况检测出所述第二设备是否具有配置错误。
2.根据权利要求1所述的方法,其特征在于,针对第三设备,所述第三设备为所述待检测设备中的一个转发设备或所述测试设备中的一个转发设备,所述在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中,包括:
为所述第三设备配置第一路由协议处理实例;
将所述第一路由协议处理实例设置到沙箱系统中,通过沙箱系统屏蔽所述第一路由协议处理实例向所述第三设备的转发芯片下发的路由转发表项,并屏蔽所述第一路由协议处理实例向未设置在沙箱系统中的其他转发设备中路由协议处理实例发送的路由协议报文。
3.根据权利要求1或2所述的方法,其特征在于,针对第四设备,所述第四设备为所述待检测设备中的一个转发设备或所述测试设备中的一个转发设备,所述在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中,包括:
为所述第四设备配置第二路由协议处理实例;
将所述第二路由协议处理实例设置到沙箱系统中,通过沙箱系统对向所述第四设备发送的路由协议报文进行过滤,具体包括:
若路由协议报文为未设置在沙箱系统中的其他路由协议处理实例所发送的,将除了用于告知相邻状态的路由协议报文以外的路由协议报文过滤掉;
若路由协议报文为设置在沙箱系统中的其他路由协议处理实例所发送的,不进行过滤。
4.根据权利要求1所述的方法,其特征在于,所述建立所述待检测设备和测试设备中沙箱系统之间的连接关系,包括:
根据所述网络的网络拓扑建立所述待检测设备和测试设备中沙箱系统之间的连接关系。
5.根据权利要求4所述的方法,其特征在于,所述根据所述网络的网络拓扑建立所述待检测设备和测试设备中沙箱系统之间的连接关系,包括:
在所述待检测设备和测试设备中沙箱系统之间建立专用网络隧道;
当一个设置在沙箱系统中设置的路由协议处理实例向另一个设置在沙箱系统中设置的路由协议处理实例发送路由协议报文时,对所发送的路由协议报文进行针对所述专用网络隧道的报文封装。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第二设备中沙箱系统的运行情况检测出所述第二设备是否具有配置错误,包括:
通过网络级巡检的方式,对所述待检测设备和测试设备进行巡检;
根据网络级巡检所采集的路由数据,确定出收敛后的各个沙箱系统之间的网络拓扑;
根据收敛后的网络拓扑以及对所述第一设备中沙箱系统设置的故障类型,判断所述第二设备是否能够接替所述第一设备处理业务;
若可以,所述第二设备不具有配置错误;
若不可以,所述第二设备具有配置错误。
7.一种备平面中转发设备的配置错误检测装置,其特征在于,应用于网络中,所述网络包括具有转发设备的主平面和备平面,所述配置错误检测装置包括选择单元、配置单元、建立单元、设置单元和检测单元:
所述选择单元,用于从备平面中选择待检测设备,所述待检测设备为待检测是否具有配置错误的转发设备;
所述选择单元还用于从主平面中确定出与所述待检测设备主备对应的转发设备作为测试设备;
所述配置单元,用于在所述待检测设备和测试设备中配置能够实现路由协议功能的路由协议处理实例并设置到沙箱系统中;
所述建立单元,用于建立所述待检测设备和测试设备中沙箱系统之间的连接关系;
所述设置单元,用于根据检测任务设置第一设备中沙箱系统的故障类型,所述第一设备为所述测试设备中与第二设备具有主备关系的一个转发设备,所述第二设备为所述检测任务所要检测的一个待检测设备;
所述检测单元,用于根据所述第二设备中沙箱系统的运行情况检测出所述第二设备是否具有配置错误。
8.根据权利要求7所述的配置错误检测装置,其特征在于,针对第三设备,所述第三设备为所述待检测设备中的一个转发设备或所述测试设备中的一个转发设备,所述配置单元还用于为所述第三设备配置第一路由协议处理实例;将所述第一路由协议处理实例设置到沙箱系统中,通过沙箱系统屏蔽所述第一路由协议处理实例向所述第三设备的转发芯片下发的路由转发表项,并屏蔽所述第一路由协议处理实例向未设置在沙箱系统中的其他转发设备中路由协议处理实例发送的路由协议报文。
9.根据权利要求7或8所述的配置错误检测装置,其特征在于,针对第四设备,所述第四设备为所述待检测设备中的一个转发设备或所述测试设备中的一个转发设备,所述配置单元还用于为所述第四设备配置第二路由协议处理实例;将所述第二路由协议处理实例设置到沙箱系统中,通过沙箱系统对向所述第四设备发送的路由协议报文进行过滤,具体包括:若路由协议报文为未设置在沙箱系统中的其他路由协议处理实例所发送的,将除了用于告知相邻状态的路由协议报文以外的路由协议报文过滤掉;若路由协议报文为设置在沙箱系统中的其他路由协议处理实例所发送的,不进行过滤。
10.根据权利要求7所述的配置错误检测装置,其特征在于,所述建立单元还用于根据所述网络的网络拓扑建立所述待检测设备和测试设备中沙箱系统之间的连接关系。
11.根据权利要求10所述的配置错误检测装置,其特征在于,所述建立单元还用于在所述待检测设备和测试设备中沙箱系统之间建立专用网络隧道;当一个设置在沙箱系统中设置的路由协议处理实例向另一个设置在沙箱系统中设置的路由协议处理实例发送路由协议报文时,对所发送的路由协议报文进行针对所述专用网络隧道的报文封装。
12.根据权利要求7所述的配置错误检测装置,其特征在于,所述检测单元包括巡检子单元、确定子单元和判断子单元:
所述巡检子单元,用于通过网络级巡检的方式,对所述待检测设备和测试设备进行巡检;
所述确定子单元,用于根据网络级巡检所采集的路由数据,确定出收敛后的各个沙箱系统之间的网络拓扑;
所述判断子单元,用于根据收敛后的网络拓扑以及对所述第一设备中沙箱系统设置的故障类型,判断所述第二设备是否能够接替所述第一设备处理业务;若可以,所述第二设备不具有配置错误;若不可以,所述第二设备具有配置错误。
13.一种配置错误检测系统,其特征在于,应用于网络中,所述网络包括具有转发设备的主平面和备平面,所述配置错误检测系统包括待检测设备和测试设备,所述待检测设备为备平面中待检测是否具有配置错误的转发设备,所述测试设备为主平面中与所述待检测设备主备对应的转发设备;
在所述待检测设备和测试设备中配置有设置在沙箱系统中的,能够实现路由协议功能的路由协议处理实例,所述待检测设备和测试设备中沙箱系统之间建立有连接关系;
第一设备中沙箱系统设置有根据检测任务确定的故障类型,所述第一设备为所述测试设备中与第二设备具有主备关系的一个转发设备,所述第二设备为所述检测任务所要检测的一个待检测设备;
所述第二设备中的沙箱系统根据所述故障类型,进行相应的主备切换,以继续处理所述第一设备中沙箱系统由于所述故障类型而中断的业务,以根据所述第二设备中沙箱系统的运行情况检测出所述第二设备是否具有配置错误。
CN201611228020.XA 2016-12-27 2016-12-27 一种备平面中转发设备的配置错误检测方法、装置和系统 Active CN106850263B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611228020.XA CN106850263B (zh) 2016-12-27 2016-12-27 一种备平面中转发设备的配置错误检测方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611228020.XA CN106850263B (zh) 2016-12-27 2016-12-27 一种备平面中转发设备的配置错误检测方法、装置和系统

Publications (2)

Publication Number Publication Date
CN106850263A CN106850263A (zh) 2017-06-13
CN106850263B true CN106850263B (zh) 2019-10-18

Family

ID=59136661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611228020.XA Active CN106850263B (zh) 2016-12-27 2016-12-27 一种备平面中转发设备的配置错误检测方法、装置和系统

Country Status (1)

Country Link
CN (1) CN106850263B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111147449A (zh) * 2019-12-09 2020-05-12 杭州迪普科技股份有限公司 一种包过滤策略的测试方法、装置、系统及设备、介质
CN111835575B (zh) * 2020-08-07 2021-12-17 迈普通信技术股份有限公司 一种防止设备失联方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102741824A (zh) * 2009-12-15 2012-10-17 迈克菲股份有限公司 用于行为沙箱化的系统和方法
CN103699479A (zh) * 2012-09-27 2014-04-02 百度在线网络技术(北京)有限公司 一种沙盒测试环境构建系统及构建方法
CN104184774A (zh) * 2013-05-24 2014-12-03 阿里巴巴集团控股有限公司 一种基于沙箱环境的信息处理方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100262671A1 (en) * 2009-04-14 2010-10-14 Si Ruo Chen Delay Parameter Testing for Multiple-Device Master-slave Configuration Using a Single-Device Testing System

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102741824A (zh) * 2009-12-15 2012-10-17 迈克菲股份有限公司 用于行为沙箱化的系统和方法
CN103699479A (zh) * 2012-09-27 2014-04-02 百度在线网络技术(北京)有限公司 一种沙盒测试环境构建系统及构建方法
CN104184774A (zh) * 2013-05-24 2014-12-03 阿里巴巴集团控股有限公司 一种基于沙箱环境的信息处理方法和系统

Also Published As

Publication number Publication date
CN106850263A (zh) 2017-06-13

Similar Documents

Publication Publication Date Title
US9191290B2 (en) Methods and devices for monitoring a data path
US8111627B2 (en) Discovering configured tunnels between nodes on a path in a data communications network
US7983174B1 (en) Method and apparatus for diagnosing a fault in a network path
US9137101B2 (en) Multi-layer network diagnostic tracing
CN103078791B (zh) Oam报文处理方法、设备及系统
CA2995566A1 (en) Systems and methods for managing network health
CN104270309B (zh) 一种ip ran设备下实现多跳bfd的方法
CN101695036B (zh) 一种irf链路的检测方法及装置
US7512841B2 (en) Method and system for network fault analysis
CN103581025B (zh) 路由信息处理方法、设备及系统
US11336564B1 (en) Detection of active hosts using parallel redundancy protocol in software defined networks
US20230061491A1 (en) Improving efficiency and fault tolerance in a software defined network using parallel redundancy protocol
CN106850263B (zh) 一种备平面中转发设备的配置错误检测方法、装置和系统
CN107979499A (zh) 基于有状态数据平面的网络多点故障恢复方法
CN111130927A (zh) 一种网络层通信终端设备业务测试自动化实现方法
CN112003747A (zh) 云虚拟网关的故障定位方法
US20230254244A1 (en) Path determining method and apparatus, and computer storage medium
CN106878066A (zh) 故障检测方法及装置
CN107347014A (zh) 一种网络故障检测方法和系统
CN105450518B (zh) 一种mpls-tp环网故障排除方法及装置
CN101521593A (zh) 数据链路层故障定位的方法及装置
CN113037622B (zh) 一种防止bfd震荡的系统及方法
CN102215143B (zh) 一种会话故障检测方法和路由设备
WO2017027108A1 (en) Systems and methods for managing network health
JP5367002B2 (ja) 監視サーバおよび監視プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant