CN101212366B - 以太环网中的故障检测方法、系统及主节点 - Google Patents

以太环网中的故障检测方法、系统及主节点 Download PDF

Info

Publication number
CN101212366B
CN101212366B CN2007103039075A CN200710303907A CN101212366B CN 101212366 B CN101212366 B CN 101212366B CN 2007103039075 A CN2007103039075 A CN 2007103039075A CN 200710303907 A CN200710303907 A CN 200710303907A CN 101212366 B CN101212366 B CN 101212366B
Authority
CN
China
Prior art keywords
port
message
node
host node
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007103039075A
Other languages
English (en)
Other versions
CN101212366A (zh
Inventor
王明辉
赵里遥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Information Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN2007103039075A priority Critical patent/CN101212366B/zh
Publication of CN101212366A publication Critical patent/CN101212366A/zh
Application granted granted Critical
Publication of CN101212366B publication Critical patent/CN101212366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Small-Scale Networks (AREA)

Abstract

本发明提供了一种以太环网中的故障检测方法,所述以太环网包括形成环状结构的主节点和一个以上传输节点,该方法包括:主节点从主端口和副端口双向发送健康检测报文进行链路故障检测;主节点检测到链路出现故障后,从主端口和副端口双向发送协议报文给各个传输节点,并根据传输节点的响应进行故障定位。另外,本发明还提供了一种以太环网中的故障检测系统及主节点。本发明能够避免广播风暴的产生,实现故障定位。

Description

以太环网中的故障检测方法、系统及主节点
技术领域
本发明涉及以太环网技术,尤其涉及以太环网中的故障检测方法、系统及主节点。
背景技术
鉴于故障保护倒换迅速、故障自愈能力强等诸多优点,以太环网技术近年来受到了越来越多运营商的青睐。图1示出了以太环网结构示意图,包括一个主节点(Master Node)和多个传输节点(Transit Node),它们构成一个环状结构。各个节点连在以太环网上的两个端口,其中一个称为主端口(Primary Port),另一个称为副端口(Secondary Port)。在正常情况下,为避免产生环路,主节点只打开主端口、而阻塞副端口,以避免报文在环路上循环传输而导致的广播风暴;当环网上的某段链路出现故障无法进行数据传输时,主节点将打开副端口,使数据流避开因故障而断开的链路,实现数据流的正常传送。
通常,主节点通过轮询机制(Polling Mechanism)和告警机制(AlertMechanism)来检测环路是否发生故障。其中,轮询机制是指:主节点周期性地从主端口发送健康检测报文即HELLO报文,并判断是否能够从自身副端口上收到该HELLO报文,如果收到,则确定环路正常,主端口阻塞副端口;如果未收到,则确定环路发生故障,主节点打开副端口。告警机制是指:各个传输节点实时检测自身两个端口的状态,当检测到端口失效即DOWN掉时,向主节点上报LINK_DOWN报文,通知主节点该端口发生故障,主节点收到通知后打开副端口,并及时采取相应处理措施排除故障。在实际应用中,这两种机制通常结合使用。
但是,并不是所有的故障都会导致端口状态发生变化,都会产生故障通知报文。比如,当两个传输节点之间的链路出现单通故障(光纤链路的使用、节点内部交换芯片故障都容易产生单通故障),导致环上一个方向的链路正常,而另一个方向的链路不通时,端口状态并不会发生变化,传输节点也不会向主节点上报故障通知报文。对于这种无通知故障,主节点无法感知到,这可能会导致主节点在轮询机制中作出错误的决策。比如,假设主节点主端口到副端口方向的链路故障,而副端口到主端口方向的链路正常,则在这种情况下,主节点必然在副端口接收不到自身从主端口发出的HELLO报文。按照现有轮询机制,此时主端口将打开副端口,但是,由于副端口到主端口方向的链路正常,因此主节点打开副端口后必然会产生单向环路,从而形成广播风暴。
也就是说,现有的故障检测机制不能发现单通等无通知故障,容易产生广播风暴等恶劣后果。另外,由于无通知故障没有故障通知报文,主节点无法根据故障通知报文确定故障发生的具体位置,因此,即使主节点能够检测出无通知故障,在检测出无通知故障后如何进行故障定位也是一个难题。如果不能够准确进行故障定位,则会造成故障长期得不到处理,从而导致环网在很长一段时间内都无法正常工作。
发明内容
有鉴于此,本发明的主要目的在于提供一种以太环网中的故障检测方法、系统及主节点,避免广播风暴的发生,实现故障定位。
为达到上述目的,本发明提供的技术方案如下:
一种以太环网中的故障检测方法,所述以太环网包括形成环状结构的主节点和一个以上传输节点,该方法包括:
主节点从主端口和副端口双向发送健康检测报文进行链路故障检测,在所述链路故障检测过程中,各个传输节点用于转发所述健康检测报文;
主节点检测到链路出现双向故障后,从主端口和副端口双向发送协议报文给各个传输节点,并根据传输节点的响应进行故障定位;
其中,当所述协议报文为端口检测报文时,所述故障定位包括:传输节点收到端口检测报文后分别检测自身两个端口的链路状态,并在检测出链路故障后,阻塞与故障链路相连的故障端口,通过故障通知报文将故障端口信息发送给主节点;主节点收到故障通知报文后,使副端口处于打开状态,并根据收到的故障通知报文进行故障定位。
所述主节点从主端口和副端口双向发送健康检测报文进行链路故障检测的过程包括:主节点周期性地从主端口和副端口发送健康检测报文,发出的健康检测依次经过各个传输节点在环上传输,主节点在副端口接收从主端口发出的健康检测报文,在主端口接收从副端口发出的健康检测报文,如果主节点在主端口和副端口都能接收到健康检测报文,则确定链路正常,主节点使副端口处于阻塞状态;如果主节点在主端口和副端口都接收不到健康检测报文,则确定链路出现双向故障,主节点使副端口处于打开状态;如果主节点仅能在主端口和副端口中的一个端口上接收到健康检测报文,则确定链路出现单通故障,主节点使副端口处于阻塞状态。
所述传输节点检测自身两个端口链路状态的过程包括:传输节点分别向自身两个端口所连链路的对端发送请求报文,如果成功接收到对端的应答报文,则确定该链路正常;如果没有接收到对端的应答报文,则确定该链路出现故障。
当所述协议报文为状态检测报文时,所述故障定位过程包括:传输节点收到状态检测报文后,通过状态通知报文将自身收包情况上报给主节点;主节点根据收到的状态通知报文及环网拓扑信息进行故障定位。
所述传输节点将自身收包情况上报给主节点包括:传输节点收到状态检测报文后,随机延迟一段时间再将自身收包情况上报给主节点。
所述主节点进行故障定位后进一步包括:主节点向故障节点发送故障通知报文,通知故障节点阻塞故障端口;故障节点收到故障通知报文后阻塞故障端口,并在阻塞完毕后向主节点返回故障阻塞报文;主节点收到故障阻塞报文后,使副端口处于打开状态。
一种主节点,位于具有环状结构的以太环网中,所述以太环网包括一个主节点和一个以上传输节点,该主节点包括:故障检测单元和故障定位单元,其中,
故障检测单元,用于从主节点的主端口和副端口双向发送健康检测报文进行链路故障检测,并在检测到链路出现故障后通知故障定位单元;在所述链路故障检测过程中,各个传输节点用于转发所述健康检测报文;
故障定位单元,用于在获知链路出现双向故障后,从主节点的主端口和副端口双向发送协议报文给各个传输节点,并根据传输节点的响应进行故障定位;
其中,在所述协议报文为端口检测报文时,所述传输节点收到端口检测报文后,分别检测自身两个端口的链路状态,并在检测出链路故障后,阻塞与故障链路相连的故障端口,通过故障通知报文将故障端口信息发送给所述故障定位单元;所述故障定位单元收到故障通知报文后,使副端口处于打开状态,并根据收到的故障通知报文进行故障定位。
所述故障检测单元周期性地从主节点的主端口和副端口发送健康检测报文,发出的健康检测依次经过各个传输节点在环上传输,故障检测单元在副端口接收从主端口发出的健康检测报文,在主端口接收从副端口发出的健康检测报文,如果故障检测单元在主端口和副端口都能接收到健康检测报文,则确定链路正常,使副端口处于阻塞状态;如果故障检测单元在主端口和副端口都接收不到健康检测报文,则确定链路出现双向故障,使副端口处于打开状态;如果故障检测单元仅能在主端口和副端口中的一个端口上接收到健康检测报文,则确定链路出现单通故障,使副端口处于阻塞状态;并且,故障检测单元在检测到双向故障和单向故障后通知故障定位单元。
在所述协议报文为状态检测报文时,所述传输节点收到状态检测报文后,通过状态通知报文将自身收包情况上报给所述主节点;
所述故障定位单元根据传输节点发来的状态通知报文及环网拓扑信息进行故障定位。
所述故障定位单元进一步用于,在故障定位后向故障节点发送故障通知报文,通知故障节点阻塞故障端口,并在收到故障节点发来的故障阻塞报文后,使副端口处于打开状态;
所述故障节点收到故障通知报文后阻塞故障端口,并在阻塞完毕后向主节点返回故障阻塞报文。
一种以太环网中的故障检测系统,包括主节点和一个以上传输节点,
所述主节点,用于从主端口和副端口双向发送健康检测报文进行链路故障检测,在所述链路故障检测过程中,各个传输节点用于转发所述健康检测报文;在检测到链路出现双向故障后,从主端口和副端口双向发送协议报文给各个传输节点,并根据传输节点的响应进行故障定位;
其中,当所述协议报文为端口检测报文时,所述故障定位包括:传输节点收到端口检测报文后分别检测自身两个端口的链路状态,并在检测出链路故障后,阻塞与故障链路相连的故障端口,通过故障通知报文将故障端口信息发送给主节点;主节点收到故障通知报文后,使副端口处于打开状态,并根据收到的故障通知报文进行故障定位。
由此可见,本发明通过从主节点的主端口和副端口双向发送健康检测报文,可以检测出环网中存在的无通知故障,能够成功发现单通问题,避免广播风暴的产生;并且,在检测到链路出现故障后,可以通过从主端口和副端口双向发送协议报文,根据传输节点对协议报文的响应实现故障定位。实现故障定位后,网管就可以对发生故障的位置及时采取处理措施以排除故障,从而使得环网能够快速恢复正常工作状态。
附图说明
图1为现有技术中的以太环网结构示意图;
图2为本发明中的故障检测方法示例性流程图;
图3为本发明实施例一中的主节点状态转换示意图;
图4为本发明实施例二中的以太环网结构示意图;
图5为本发明实施例二中的主节点状态转换示意图;
图6为本发明中主节点的示例性结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,下面参照附图并举实施例,对本发明作进一步详细说明。
为了解决现有技术中的问题,本发明提供了一种以太环网中的故障检测方法。图2示出了该方法的示例性流程图,主要包括以下步骤:
步骤201:主节点从主端口和副端口双向发送HELLO报文进行链路故障检测;
步骤202:主节点检测到链路出现故障后,从主端口和副端口双向发送协议报文给各个传输节点,并根据传输节点的响应进行故障定位。
其中,主节点双向发送HELLO报文具体可通过以下方式实现:主节点周期性地从主端口和副端口发送HELLO报文,发出的HELLO依次经过各个传输节点在环上传输,主节点在副端口接收从主端口发出的HELLO报文,在主端口接收从副端口发出的HELLO报文,并根据这两个端口的HELLO报文接收情况判断链路是否出现故障。如果主节点在主端口和副端口都能够接收到HELLO报文,则说明链路一切正常没有出现故障,主节点阻塞副端口;如果主节点在主端口和副端口都接收不到HELLO报文,则说明两个方向的链路都出现了故障(下称双向故障),主节点打开副端口;如果主节点仅能在主端口和副端口中的一个端口上接收到HELLO报文,则说明链路出现了单通故障,即其中一个方向的链路出现了故障,而另一个方向的链路正常,此时为了防止因形成单向环路而造成广播风暴的情况发生,主节点应阻塞副端口。可见,采取上述双向检测方案,主节点可以检测出环网中存在的无通知故障,能够成功发现单通问题,避免广播风暴的产生。
在具体实现时,可以预先设置一个接收时间阈值,主节点从一个端口发出HELLO报文后,如果在预设的接收时间阈值内没有从另一个端口接收到所述HELLO报文,则确定该HELLO报文丢失,其中一个环路方向出现了故障。另外,为了防止由于链路瞬断造成主节点某一瞬间不能在一个端口接收到从另一个端口发出的HELLO报文而导致故障误判的情况发生,这里可以预先设置一个次数阈值,当主节点连续未收到HELLO报文的次数达到预设的次数阈值时,才确定某一方向的链路出现了故障。比如,设置次数阈值为3,当主节点连续从主端口发出3个HELLO报文后,如果在副端口都没有接收到主端口发出的HELLO报文,则确定主端口到副端口方向的链路出现了故障。
其中,关于双向HELLO报文的发送方式,主要有以下几种:主节点先从一个端口发送HELLO报文进行一个环路方向的故障检测,该方向检测完毕后,主节点再从另一个端口发送HELLO报文进行另一个环路方向的故障检测;或者,为了节省故障检测时间,提高检测效率,主节点同时或交替从主端口和副端口发送HELLO报文,一并进行两个环路方向的故障检测。
通过上述双向检测过程检测出链路出现故障后,应进行故障定位,确定发生故障的位置,并及时通知网管,以便网管能够及时采取措施进行故障处理,尽快使环路恢复正常。下面通过两个具体实施例对检测出故障后的故障定位过程进行详细说明。
实施例一
主节点检测出链路出现故障后,从主端口和副端口双向发送端口检测(CHK_PORT)报文,通知各传输节点进行端口连接状态检测;各传输节点收到主节点发来的CHK_PORT报文后,分别检测自身在环上的两个端口的链路状态,如果检测出链路故障,则阻塞与故障链路相连的端口即故障端口,并向主节点发送故障通知(FAULT_NOTIFY)报文,该FAULT_NOTIFY报文中携带故障端口信息。主节点根据故障端口信息便可获知故障的具体位置,然后通知网管进行故障处理。
其中,传输节点检测自身两个端口链路状态的过程可通过以下方式实现:传输节点接收到CHK_PORT报文后,向端口所连链路对端的传输节点发送请求报文,并判断是否接收到对端的应答报文,如果成功接收到对端的应答报文,则确定该链路正常;如果连续发出若干个请求报文后都没有收到对端的应答报文,则确定链路出现故障,此时传输节点将阻塞与该故障链路相连的端口,并向主节点发送FAULT_NOTIFY报文,通知主节点该端口发生了故障。对于传输节点连在环上的两个端口,都执行上述端口链路状态检测过程。
现有协议中,为主节点定义了两种状态:完整(Complete)状态和故障(Failed)状态,当链路一切正常时,主节点处于完整状态;当链路出现故障时,主节点转换为故障状态。图3示出了本实施例中主节点的状态转换示意图,下面对图3进行详细说明。
初始时,主节点双向发送HELLO报文,并阻塞副端口。如果主节点在主端口和副端口上都能接收到HELLO报文即收到双向HELLO报文,则说明链路正常,主节点进入完整状态;如果主节点在主端口和副端口上都没有收到HELLO报文即没有收到双向HELLO报文,则说明链路出现双向故障,主节点进入故障状态;如果主节点只能在一个端口上收到HELLO报文即只收到单向HELLO报文,则说明链路出现单通故障,此时主节点也进入完整状态,并向各个传输节点发送CHK_PORT报文,通知各传输节点进行端口连接状态检测。
在完整状态下,主节点双向发送HELLO报文,并阻塞副端口。对于处于完整状态的主节点,如果连续丢失若干个如3个双向HELLO报文,即主节点从主端口和副端口共发出3个HELLO报文后,在主端口和副端口都没有接收到HELLO报文,则可判定链路出现双向故障,此时主节点应打开副端口,切换至故障状态,并发送CHK_PORT报文通知各传输节点进行端口连接状态检测;如果处于完整状态的主节点连续丢失3个单向HELLO报文,即主节点从一个端口连续发出3个HELLO报文后,在另一个端口都没有接收到发出的HELLO报文,则可判定链路出现单通故障,此时主节点保持完整状态不变,依然阻塞副端口,并发送CHK_PORT报文通知各传输节点进行端口连接状态检测;如果主节点在完整状态仍能收到双向HELLO报文,则维持完整状态不变。另外,如果主节点在完整状态收到传输节点上报的LINK_DOWN报文,也切换至故障状态。
在故障状态下,主节点双向发送HELLO报文,并打开副端口。在故障节点得到处理,故障端口恢复正常即UP后,应先将故障端口置于预阻塞(Pre-Forwarding)状态,处于预阻塞状态的端口不能转发业务报文,只能转发协议报文。对于处于故障状态的主节点,如果收到双向HELLO报文,则可判定链路恢复正常,此时主节点应阻塞副端口,切换至完整状态,并向传输节点发送环路恢复正常(RING-UP-FLUSH-FDB)报文;故障节点收到主节点发来的RING-UP-FLUSH-FDB报文后,将预阻塞的端口置于正常转发状态。如果处于故障状态的主节点只接收到单向HELLO报文,则此时主节点应立即阻塞副端口,维持故障状态不变,并发送CHK_PORT报文通知各传输节点进行端口连接状态检测。如果主节点在故障状态仍不能收到任何方向的HELLO报文,则维持故障状态不变。
各传输节点收到CHK_PORT报文后,进行端口连接状态检测,在检测到故障端口后,阻塞故障端口,并向主节点发送FAULT_NOTIFY报文通知主节点。处于完整状态的主节点收到FAULT_NOTIFY报文后,打开副端口,切换至故障状态;处于故障状态的主节点收到FAULT_NOTIFY报文后,打开副端口,维持故障状态不变。
实施例二
主节点检测到链路出现故障后,从主端口和副端口双向发送状态检测(CHK_STATE)报文,通知各个传输节点上报自身的收包情况。各个传输节点转发收到的CHK_STATE报文,并将收到的CHK_STATE报文上送中央处理器(CPU)处理,CPU收到后将本节点的收包情况即哪个端口收到了CHK_STATE报文的情况,通过状态通知(STATE_NOTIFY)报文的形式从两个端口同时发出,以通知主节点。其中,STATE_NOTIFY报文在各个传输节点直接硬件转发,不上送CPU处理。另外,为了防止环上所有传输节点在收到CHK_STATE报文后同时向主节点发送STATE_NOTIFY报文,对主节点CPU造成较大压力,这里各个传输节点可以随机延迟一段时间再将本节点的收包情况发送给主节点,以错开各个传输节点的发包时间,缓解主节点压力。
主节点收到各个传输节点上报的STATE_NOTIFY报文后,根据STATE_NOTIFY报文中携带的收包信息以及环网拓扑信息,就可以确定发生故障的位置,即哪个节点的哪个端口出现了问题。之后,主节点再向故障节点发送FAULT_NOTIFY报文,通知故障节点阻塞故障端口;故障节点完成阻塞任务后,向主节点返回故障阻塞(FAULT_BLOCK)报文通知主节点阻塞完毕。其中,关于环网拓扑信息,主节点可以通过各种途径获得,如通过邻居发现协议(NDP),这里不再赘述。
下面通过一个具体的例子对主节点根据传输节点收包情况及环网拓扑信息进行故障定位的过程进行详细说明。
参见图4所示的以太环网结构示意图,假设传输节点1、2、4、5连在环上的端口11、12、21、22、41、42、51、52及传输节点3连在环上的左侧端口31都正常,但传输节点3的右侧端口32出现单通故障,只能发报文,不能收报文。在这种情况下,当主节点检测到单通故障双向发送CHK_STATE报文时,端口11、21、31、41、51都能够接收到CHK_STATE报文,端口52、42也能够接收到CHK_STATE报文,但由于端口32不能收报文,故端口32、22、12都接收不到CHK_STATE报文。之后,各个传输节点将自身接收到CHK_STATE报文的端口号、没有接收到CHK_STATE报文的端口号以及节点自身的媒质接入控制(MAC)地址封装在STATE_NOTIFY报文中发送给主节点。主节点收到各个传输节点上报的STATE_NOTIFY报文后,便可获知所有传输节点在主端口到副端口方向的端口均能接收到CHK_STATE报文,在副端口到主端口方向上,只有传输节点的端口32、传输节点2的端口22及传输节点1的端口12收不到CHK_STATE报文。由于主节点可以通过NDP等协议获知环网上各节点的次序及相关端口号等拓扑信息,故此时主节点结合环网拓扑信息就可判断出传输节点3的端口32出现了故障。然后,主节点向传输节点3发送FAULT_NOTIFY报文,通知传输节点3阻塞故障端口32;传输节点3完成阻塞后,向主节点返回FAULT_BLOCK报文;主节点收到FAULT_BLOCK报文后,打开副端口,切换至Failed状态。
图5示出了本实施例中主节点的状态转换示意图,下面对图5进行详细说明。
初始时,主节点双向发送HELLO报文,并阻塞副端口。如果主节点收到双向HELLO报文,则说明链路正常,主节点进入完整状态;如果主节点没有收到任何方向的HELLO报文,则说明链路出现双向故障,主节点进入故障状态;如果主节点收到单向HELLO报文,则说明链路出现了单通故障,此时主节点也进入完整状态,并发送CHK_STATE报文,通知各传输节点上报各自收包情况。
在完整状态下,主节点双向发送HELLO报文,并阻塞副端口。对于处于完整状态的主节点,如果连续丢失若干个如3个双向HELLO报文,则可判定链路出现双向故障,此时主节点应立即打开副端口,切换至故障状态,并发送CHK_STATE报文通知各传输节点上报收包情况;如果处于完整状态的主节点连续丢失3个单向HELLO报文,则可判定链路出现单通故障,此时主节点保持完整状态不变,依然阻塞副端口,并发送CHK_STATE报文通知各传输节点上报收包情况;如果主节点在完整状态仍能收到双向HELLO报文,则维持完整状态不变。另外,如果主节点在完整状态收到传输节点上报的LINK_DOWN报文,也切换至故障状态。
在故障状态下,主节点双向发送HELLO报文,并打开副端口。故障节点得到处理,故障端口UP后,先将故障端口置于预阻塞状态。对于处于故障状态的主节点,如果收到双向HELLO报文,则判定链路恢复正常,此时主节点应阻塞副端口,切换至完整状态,并发送RING-UP-FLUSH-FDB报文;故障节点收到RING-UP-FLUSH-FDB报文后,将预阻塞的端口置于正常转发状态。如果处于故障状态的主节点只接收到单向HELLO报文,则此时主节点应立即阻塞副端口,并发送CHK_STATE报文通知各传输节点上报收包情况。如果主节点在故障状态仍不能收到任何方向的HELLO报文,则维持故障状态不变。
各传输节点收到CHK_STATE报文后,将自身的收包情况通过STATE_NOTIFY报文发送给主节点;主节点根据收到的STATE_NOTIFY报文及环网拓扑信息确定故障端口,并向故障端口所在的故障节点发送FAULT_NOTIFY报文,通知故障节点阻塞故障端口;故障节点收到FAULT_NOTIFY报文后阻塞故障端口,并在阻塞完成后向主节点返回FAULT_BLOCK报文。处于完整状态的主节点收到FAULT_BLOCK报文后,打开副端口,切换至故障状态;处于故障状态的主节点收到FAULT_BLOCK报文后,打开副端口,维持故障状态不变。
需要说明的是,本文中的HELLO报文、LINK_DOWN报文、CHK_PORT报文、FAULT_NOTIFY报文、RING-UP-FLUSH-FDB报文、CHK_STATE报文、STATE_NOTIFY报文和FAULT_BLOCK报文均为协议报文。其中,CHK_PORT报文、FAULT_NOTIFY报文、CHK_STATE报文、STATE_NOTIFY报文和FAULT_BLOCK报文为本发明实施例中新增的协议报文。
相应地,本发明还提供了一种主节点,该主节点位于具有环状结构的以太环网中,所述以太环网包括一个主节点和一个以上传输节点。图6示出了主节点的一种示例性结构示意图,包括:故障检测单元和故障定位单元。其中,故障检测单元,用于从主节点的主端口和副端口双向发送健康检测报文进行链路故障检测,并在检测到链路出现故障后通知故障定位单元;故障定位单元,用于在获知链路出现故障后,从主节点的主端口和副端口双向发送协议报文给各个传输节点,并根据传输节点的响应进行故障定位。
较佳地,所述故障检测单元的具体处理过程可以是:故障检测单元周期性地从主节点的主端口和副端口发送健康检测报文,发出的健康检测依次经过各个传输节点在环上传输,故障检测单元在副端口接收从主端口发出的健康检测报文,在主端口接收从副端口发出的健康检测报文,如果故障检测单元在主端口和副端口都能接收到健康检测报文,则确定链路正常,使副端口处于阻塞状态;如果故障检测单元在主端口和副端口都接收不到健康检测报文,则确定链路出现双向故障,使副端口处于打开状态;如果故障检测单元仅能在主端口和副端口中的一个端口上接收到健康检测报文,则确定链路出现单通故障,使副端口处于阻塞状态;并且,故障检测单元在检测到链路出现故障(包括双向故障和单向故障)后,通知故障定位单元。
较佳地,所述故障定位单元在获知链路出现故障后,从主节点的主端口和副端口双向发送端口检测报文通知各传输节点进行端口连接状态检测;各传输节点收到端口检测报文后,分别检测自身两个端口的链路状态,并在检测出链路故障后,阻塞与故障链路相连的故障端口,通过故障通知报文将故障端口信息发送给主节点;主节点的故障定位单元收到传输节点发来的故障通知报文后,使副端口处于打开状态,根据收到的故障通知报文进行故障定位。
另外,所述故障定位单元还可以在获知链路出现故障后,从主节点的主端口和副端口双向发送状态检测报文通知各传输节点上报收包情况;各传输节点收到状态检测报文后,通过状态通知报文将自身收包情况上报给主节点;主节点的故障定位单元根据传输节点发来的状态通知报文及环网拓扑信息进行故障定位。并且,故障定位单元还进一步用于,在故障定位后向故障节点发送故障通知报文,通知故障节点阻塞故障端口;故障节点收到故障通知报文后阻塞故障端口,并在阻塞完毕后向主节点返回故障阻塞报文;主节点的故障定位单元收到故障节点发来的故障阻塞报文后,使副端口处于打开状态。
另外,所述故障定位单元还可进一步用于,在链路恢复正常后阻塞副端口,并向传输节点发送环路恢复正常报文。
最后,本发明还提供了一种以太环网中的故障检测系统,包括主节点和一个以上传输节点。所述主节点用于从主端口和副端口双向发送健康检测报文进行链路故障检测,在检测到链路出现故障后,从主端口和副端口双向发送协议报文给各个传输节点,并根据传输节点的响应进行故障定位。该故障检测系统中的主节点可以采取图6所示结构以及上述具体实施方式实现。
以上所述对本发明的目的、技术方案和有益效果进行了进一步的详细说明,所应理解的是,以上所述并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种以太环网中的故障检测方法,所述以太环网包括形成环状结构的主节点和一个以上传输节点,其特征在于,该方法包括:
主节点从主端口和副端口双向发送健康检测报文进行链路故障检测,在所述链路故障检测过程中,各个传输节点用于转发所述健康检测报文;
主节点检测到链路出现双向故障后,从主端口和副端口双向发送协议报文给各个传输节点,并根据传输节点的响应进行故障定位;
其中,当所述协议报文为端口检测报文时,所述故障定位包括:传输节点收到端口检测报文后分别检测自身两个端口的链路状态,并在检测出链路故障后,阻塞与故障链路相连的故障端口,通过故障通知报文将故障端口信息发送给主节点;主节点收到故障通知报文后,使副端口处于打开状态,并根据收到的故障通知报文进行故障定位。
2.根据权利要求1所述的方法,其特征在于,所述主节点从主端口和副端口双向发送健康检测报文进行链路故障检测的过程包括:
主节点周期性地从主端口和副端口发送健康检测报文,发出的健康检测报文依次经过各个传输节点在环上传输,主节点在副端口接收从主端口发出的健康检测报文,在主端口接收从副端口发出的健康检测报文,如果主节点在主端口和副端口都能接收到健康检测报文,则确定链路正常,主节点使副端口处于阻塞状态;如果主节点在主端口和副端口都接收不到健康检测报文,则确定链路出现双向故障,主节点使副端口处于打开状态;如果主节点仅能在主端口和副端口中的一个端口上接收到健康检测报文,则确定链路出现单通故障,主节点使副端口处于阻塞状态。
3.根据权利要求1所述的方法,其特征在于,所述传输节点检测自身两个端口链路状态的过程包括:
传输节点分别向自身两个端口所连链路的对端发送请求报文,如果成功接收到对端的应答报文,则确定该链路正常;如果没有接收到对端的应答报文,则确定该链路出现故障。
4.根据权利要求1所述的方法,其特征在于,当所述协议报文为状态检测报文时,所述故障定位过程包括:
传输节点收到状态检测报文后,通过状态通知报文将自身收包情况上报给主节点;主节点根据收到的状态通知报文及环网拓扑信息进行故障定位。
5.根据权利要求4所述的方法,其特征在于,所述传输节点将自身收包情况上报给主节点包括:
传输节点收到状态检测报文后,随机延迟一段时间再将自身收包情况上报给主节点。
6.根据权利要求4所述的方法,其特征在于,所述主节点进行故障定位后进一步包括:
主节点向故障节点发送故障通知报文,通知故障节点阻塞故障端口;故障节点收到故障通知报文后阻塞故障端口,并在阻塞完毕后向主节点返回故障阻塞报文;主节点收到故障阻塞报文后,使副端口处于打开状态。
7.一种主节点,位于具有环状结构的以太环网中,所述以太环网包括一个主节点和一个以上传输节点,其特征在于,该主节点包括:故障检测单元和故障定位单元,其中,
故障检测单元,用于从主节点的主端口和副端口双向发送健康检测报文进行链路故障检测,并在检测到链路出现故障后通知故障定位单元;在所述链路故障检测过程中,各个传输节点用于转发所述健康检测报文;
故障定位单元,用于在获知链路出现双向故障后,从主节点的主端口和副端口双向发送协议报文给各个传输节点,并根据传输节点的响应进行故障定位;
其中,在所述协议报文为端口检测报文时,所述传输节点收到端口检测报文后,分别检测自身两个端口的链路状态,并在检测出链路故障后,阻塞与故障链路相连的故障端口,通过故障通知报文将故障端口信息发送给所述故障定位单元;所述故障定位单元收到故障通知报文后,使副端口处于打开状态,并根据收到的故障通知报文进行故障定位。
8.根据权利要求7所述的主节点,其特征在于,所述故障检测单元周期性地从主节点的主端口和副端口发送健康检测报文,发出的健康检测报文依次经过各个传输节点在环上传输,故障检测单元在副端口接收从主端口发出的健康检测报文,在主端口接收从副端口发出的健康检测报文,如果故障检测单元在主端口和副端口都能接收到健康检测报文,则确定链路正常,使副端口处于阻塞状态;如果故障检测单元在主端口和副端口都接收不到健康检测报文,则确定链路出现双向故障,使副端口处于打开状态;如果故障检测单元仅能在主端口和副端口中的一个端口上接收到健康检测报文,则确定链路出现单通故障,使副端口处于阻塞状态;并且,故障检测单元在检测到双向故障和单向故障后通知故障定位单元。
9.根据权利要求7所述的主节点,其特征在于,在所述协议报文为状态检测报文时,所述传输节点收到状态检测报文后,通过状态通知报文将自身收包情况上报给所述主节点;
所述主节点的故障定位单元根据传输节点发来的状态通知报文及环网拓扑信息进行故障定位。
10.根据权利要求9所述的主节点,其特征在于,所述故障定位单元进一步用于,在故障定位后向故障节点发送故障通知报文,通知故障节点阻塞故障端口,并在收到故障节点发来的故障阻塞报文后,使副端口处于打开状态;
所述故障节点收到故障通知报文后阻塞故障端口,并在阻塞完毕后向主节点返回故障阻塞报文。
11.一种以太环网中的故障检测系统,包括主节点和一个以上传输节点,其特征在于,
所述主节点,用于从主端口和副端口双向发送健康检测报文进行链路故障检测,在所述链路故障检测过程中,各个传输节点用于转发所述健康检测报文;在检测到链路出现双向故障后,从主端口和副端口双向发送协议报文给各个传输节点,并根据传输节点的响应进行故障定位;
其中,当所述协议报文为端口检测报文时,所述故障定位包括:传输节点收到端口检测报文后分别检测自身两个端口的链路状态,并在检测出链路故障后,阻塞与故障链路相连的故障端口,通过故障通知报文将故障端口信息发送给主节点;主节点收到故障通知报文后,使副端口处于打开状态,并根据收到的故障通知报文进行故障定位。
CN2007103039075A 2007-12-21 2007-12-21 以太环网中的故障检测方法、系统及主节点 Active CN101212366B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007103039075A CN101212366B (zh) 2007-12-21 2007-12-21 以太环网中的故障检测方法、系统及主节点

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007103039075A CN101212366B (zh) 2007-12-21 2007-12-21 以太环网中的故障检测方法、系统及主节点

Publications (2)

Publication Number Publication Date
CN101212366A CN101212366A (zh) 2008-07-02
CN101212366B true CN101212366B (zh) 2011-12-21

Family

ID=39612063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007103039075A Active CN101212366B (zh) 2007-12-21 2007-12-21 以太环网中的故障检测方法、系统及主节点

Country Status (1)

Country Link
CN (1) CN101212366B (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989934B (zh) * 2009-08-06 2017-04-05 中兴通讯股份有限公司 一种数据环网故障检测及定位的方法和系统
CN102006218B (zh) * 2009-09-03 2014-07-16 中兴通讯股份有限公司 隧道保护方法及装置
CN102088387B (zh) * 2009-12-08 2015-06-03 中兴通讯股份有限公司 环网的隧道保护方法及装置
CN102098199A (zh) * 2009-12-09 2011-06-15 上海可鲁系统软件有限公司 一种通讯故障检测方法
WO2012171216A1 (zh) 2011-06-17 2012-12-20 华为技术有限公司 以太网中环路位置检测的方法及以太网交换设备
CN102231674A (zh) * 2011-06-17 2011-11-02 中兴通讯股份有限公司 以太网远端故障的处理方法及装置
CN102244600A (zh) * 2011-08-12 2011-11-16 华为技术有限公司 一种rrpp环网中链路故障检测及处理方法、装置
CN102710442B (zh) * 2012-06-01 2014-12-10 中兴通讯股份有限公司 网络管理业务口的管理方法、通信设备及通信系统
CN103684835B (zh) * 2012-09-24 2017-02-08 华为技术有限公司 链路故障上报方法、处理方法、传输节点及主节点
CN102891771B (zh) * 2012-11-02 2016-03-02 淮南矿业(集团)有限责任公司 监控环网故障检测定位报警装置、系统和方法
CN103220201B (zh) * 2013-04-24 2016-08-17 杭州华三通信技术有限公司 一种环网故障检测保护方法和设备
CN103746912B (zh) * 2014-01-03 2017-04-12 杭州华三通信技术有限公司 一种基于子环链路的数据报文传输方法和设备
CN105429892B (zh) * 2015-10-29 2018-10-12 北京星网锐捷网络技术有限公司 一种轨道交通网络防止环路的方法及设备
CN106059880B (zh) * 2016-05-27 2020-09-25 新华三技术有限公司 一种链路故障处理方法及装置
CN105959227B (zh) * 2016-06-22 2019-09-17 重庆世纪之光科技实业有限公司 一种单向串行总线网络的拓扑学习方法、装置及系统
US20180059648A1 (en) * 2016-08-31 2018-03-01 Esab Ab Techniques for network charting and configuration in a welding or cutting system
CN106254199B (zh) * 2016-09-19 2020-03-31 重庆世纪之光科技实业有限公司 单向环形网络故障点定位方法、集中器、终端设备及系统
CN106453012B (zh) * 2016-09-22 2019-10-22 南京创瑞达电力技术有限公司 一种串行总线通信方法及装置
US10411984B2 (en) * 2016-12-12 2019-09-10 Johnson Controls Technology Company Systems and methods related to diagnostics for ethernet rings based on media redundancy protocol
US11277279B2 (en) 2016-12-12 2022-03-15 Johnson Controls Tyco IP Holdings LLP Systems and methods for incorporating a single-port ethernet device in a media protocol ring
CN108234232B (zh) * 2016-12-21 2020-10-23 杭州海康威视数字技术股份有限公司 基于总线的故障定位、环路检测方法、装置、系统及设备
CN107026780B (zh) * 2017-04-14 2020-04-17 云南电网有限责任公司电力科学研究院 一种基于物联网的配电光纤环网故障点定位方法及系统
CN107026691B (zh) * 2017-04-14 2020-02-11 云南电网有限责任公司电力科学研究院 一种自动隔离配电光纤环网故障的方法及系统
CN107040599A (zh) * 2017-04-20 2017-08-11 新华三技术有限公司 Bgp邻居连接中断方法及装置
CN107196832B (zh) * 2017-07-10 2020-02-18 杭州中威电子股份有限公司 快速环网保护方法
CN107911274A (zh) * 2017-12-29 2018-04-13 苏州联视泰电子信息技术有限公司 一种基于以太网交换芯片的环路自组织方法
CN110650074B (zh) * 2019-10-28 2021-07-13 河北远方测控技术有限公司 基于环形通讯回路的故障点定位与隔离方法
CN111030910A (zh) * 2019-12-20 2020-04-17 国网上海市电力公司 环网节点通信状态监测方法、系统及测控装置和就地模块
CN113395184A (zh) * 2020-03-11 2021-09-14 华为技术有限公司 一种故障处理方法、设备和可读存储介质
CN111901216A (zh) * 2020-09-01 2020-11-06 昆山尚尼司电子科技有限公司 Rs485环状网路的备援处理方法与系统
CN112367196B (zh) * 2020-10-30 2023-03-21 锐捷网络股份有限公司 一种检测网络通信故障的方法、装置及电子设备
CN112995002B (zh) * 2021-04-27 2021-08-03 融智通科技(北京)股份有限公司 一种交换机环网的设计方法、交换机及存储介质
CN113542056A (zh) * 2021-06-18 2021-10-22 新华三技术有限公司 一种故障检测的方法、转发设备和存储介质
CN114500161A (zh) * 2022-02-27 2022-05-13 重庆长安汽车股份有限公司 基于车载以太环网的冗余链路切换方法及可读存储介质
CN114500117B (zh) * 2022-04-15 2022-07-05 北京全路通信信号研究设计院集团有限公司 基于环网风暴流量特征的环网Master配置错误判断方法及装置
CN114844774B (zh) * 2022-04-24 2023-07-14 重庆长安汽车股份有限公司 一种车载以太环网的冗余通信系统、方法及存储介质
CN115412424B (zh) * 2022-08-17 2024-03-26 浪潮思科网络科技有限公司 一种mlag环境下双主设备检测方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1394053A (zh) * 2001-06-27 2003-01-29 华为技术有限公司 多协议标签交换快速保护倒换方法
CN1815970A (zh) * 2005-02-01 2006-08-09 华为技术有限公司 一种检测网络链路故障并定位故障的方法
CN101001192A (zh) * 2007-01-17 2007-07-18 华为技术有限公司 一种环网链路保护的方法、系统及设备
CN101043383A (zh) * 2006-03-20 2007-09-26 中兴通讯股份有限公司 一种环型网络中检测单通故障的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1394053A (zh) * 2001-06-27 2003-01-29 华为技术有限公司 多协议标签交换快速保护倒换方法
CN1815970A (zh) * 2005-02-01 2006-08-09 华为技术有限公司 一种检测网络链路故障并定位故障的方法
CN101043383A (zh) * 2006-03-20 2007-09-26 中兴通讯股份有限公司 一种环型网络中检测单通故障的方法
CN101001192A (zh) * 2007-01-17 2007-07-18 华为技术有限公司 一种环网链路保护的方法、系统及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP特开2007-124184A 2007.05.17

Also Published As

Publication number Publication date
CN101212366A (zh) 2008-07-02

Similar Documents

Publication Publication Date Title
CN101212366B (zh) 以太环网中的故障检测方法、系统及主节点
JP5073812B2 (ja) 分散型イーサネットシステムおよび該システムに基づいて障害を検出する方法
CN101262401B (zh) 一种环形网络中实现网络恢复的方法
US8179788B2 (en) Protection switching method and apparatus for use in ring network
CN102014001B (zh) 一种实现快速以太环网的方法及交换设备
US20120188912A1 (en) Method, apparatus, and system for updating ring network topology information
CN101958831B (zh) 以太环网故障恢复方法、以太环网及交换设备
JP5471240B2 (ja) スイッチ装置、リングネットワークシステム、通信制御方法、および装置のプログラム
EP2207307B1 (en) Method for processing the failure of the slave port of the master node in an ethernet ring network system
CN101094190B (zh) 以太环网保护控制报文的传输方法
CN101478469B (zh) Rrpp环链路切换的方法和系统
CN101436975B (zh) 一种在环网中实现快速收敛的方法、装置及系统
CN101714939A (zh) 一种以太环网主节点的故障处理方法及相应以太环网
CN101072155B (zh) 用于以太网自动保护系统的单光纤故障处理方法
CN101141366A (zh) 一种在环状以太网中避免数据环路的方法
CN101340346A (zh) 一种以太环网系统中环控制的方法及装置
CN104135417B (zh) 一种以太环网链路中断快速恢复的方法及相应的以太环网
CN101222402B (zh) 以太环网保护方法、系统及装置
CN101217445B (zh) 防止环路产生的方法和以太环网系统
CN101686167A (zh) 一种以太环网故障恢复的控制方法
CN101989930A (zh) 实现以太网双环的方法及其交换设备
CN101641915B (zh) 重构通信网络的方法
CN101547131B (zh) Eaps环网单通故障定位和保护方法
CN100550812C (zh) 提高快速环网可靠性的方法、系统和节点设备
CN101621443B (zh) 一种以太环网保护系统的故障恢复方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Patentee after: NEW H3C TECHNOLOGIES Co.,Ltd.

Address before: 310053 Hangzhou hi tech Industrial Development Zone, Zhejiang province science and Technology Industrial Park, No. 310 and No. six road, HUAWEI, Hangzhou production base

Patentee before: HANGZHOU H3C TECHNOLOGIES Co.,Ltd.

CP03 Change of name, title or address
TR01 Transfer of patent right

Effective date of registration: 20230620

Address after: 310052 11th Floor, 466 Changhe Road, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: H3C INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 310052 Changhe Road, Binjiang District, Hangzhou, Zhejiang Province, No. 466

Patentee before: NEW H3C TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right