CN102752125A - 一种数据链路的故障定位方法及装置 - Google Patents

一种数据链路的故障定位方法及装置 Download PDF

Info

Publication number
CN102752125A
CN102752125A CN 201110101575 CN201110101575A CN102752125A CN 102752125 A CN102752125 A CN 102752125A CN 201110101575 CN201110101575 CN 201110101575 CN 201110101575 A CN201110101575 A CN 201110101575A CN 102752125 A CN102752125 A CN 102752125A
Authority
CN
China
Prior art keywords
data link
code stream
link
fault
prbs code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110101575
Other languages
English (en)
Inventor
张见
卢明伟
尹相东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Digital Technologies Chengdu Co Ltd
Huawei Digital Technologies Co Ltd
Original Assignee
Huawei Digital Technologies Chengdu Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Digital Technologies Chengdu Co Ltd filed Critical Huawei Digital Technologies Chengdu Co Ltd
Priority to CN 201110101575 priority Critical patent/CN102752125A/zh
Publication of CN102752125A publication Critical patent/CN102752125A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种数据链路的故障定位方法及装置,相应的方法包括在由两个或两个以上路由器组成的并通过数据链路连接的路由器集群系统中,从所述系统内部向数据链路的上行链路或下行链路发送PRBS码流;根据所述PRBS码流在所述上行链路和下行链路中的环回路径确定数据链路的故障位置。本发明通过从路由器集群系统内部在系统中各设备间的上行链路或下行链路中发送PRBS码流,并根据PRBS码流的环回路径确定数据链路的故障位置,实现了在路由器集群系统中简单快速地定位数据链路故障的位置,能够有效降低业务中断的时间,具有结构简单、容易实现的特点。

Description

一种数据链路的故障定位方法及装置
技术领域
本发明属于网络通信技术领域,涉及一种数据链路的故障定位方法及装置。
背景技术
随着互联网的飞速发展和业务模型的多样变化,核心骨干网络设备对计算能力、转发能力和端口密度都提出了更高的要求。传统路由器在可靠性、性能可扩展性、规模可扩展性和服务可扩展性等方面已经不能满足下一代互联网的发展需求,因此无法实现核心层设备“大容量、可扩展”已成为电信运营商进一步发展业务的瓶颈。
现有的解决核心层设备的容量问题主要包括多台路由器集群的方式,即多台路由器通过集群技术扩展。路由器集群的基本原理是将两台或两台以上普通核心路由器通过交换网络连接起来组成一个路由系统,而对外只表现为一台逻辑路由器。这项技术使得核心路由器能够进行设备间协同工作和并行处理,实现系统容量的平滑扩展。
在现有的路由器集群系统中,两个或两个以上路由器之间在通过光接口将多个路由器连接成一个逻辑路由器后,各个路由器和用户设备之间的通过相应的数据链路进行通信。由于不同的路由器与用户设备的数据链路各不相同,如果不到现场进行故障检查,则无法对故障进行定位,因此当某两个路由器间或者路由器与用户设备间的数据链路出现故障时,只能对该路由器、用户设备及相应的数据链路组成的系统进行整体更换,增加了对故障进行检测定位的复杂度,导致了较长的业务中断时间。
发明内容
本发明的实施例提供了一种数据链路的故障定位方法及装置,能够在由两个或两个以上路由器组成并通过数据链路连接的路由器集群系统中简单快速地定位故障的位置。
一种数据链路的故障定位方法,包括:
在由两个或两个以上路由器组成的并通过数据链路连接的路由器集群系统中,从所述系统内部向数据链路的上行链路或下行链路发送PRBS码流;
根据所述PRBS码流在所述上行链路和下行链路中的环回路径确定数据链路的故障位置。
一种数据链路的故障定位装置,设置于由两个或两个以上路由器组成的并通过数据链路连接的路由器集群系统中,该装置包括:
码流发送单元,用于从所述系统内部向数据链路的上行链路或下行链路发送PRBS码流;
故障确定单元,用于根据所述PRBS码流在所述上行链路和下行链路中的环回路径确定数据链路的故障位置。
由上述本发明的实施例提供的技术方案可以看出,通过从路由器集群系统的内部向数据链路的上行链路或下行链路中发送PRBS码流,并根据PRBS码流的环回路径确定数据链路的故障位置,实现了在多集群系统中简单快速地定位数据链路故障的位置。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的实施例提供的数据链路的故障定位方法的流程示意图;
图2为本发明的实施例提供的增加发送和检查PRBS码流芯片的多框集群系统的结构示意图;
图3为本发明的实施例提供的数据链路的故障定位装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的实施例提供了一种数据链路的故障定位方法,包括在由两个或两个以上路由器组成并通过数据链路连接的路由器集群系统中,从所述系统内部向数据链路的上行链路或下行链路发送PRBS码流;根据所述PRBS码流在所述上行链路和下行链路中的环回路径确定数据链路的故障位置。该方法可用于在某两个路由器间或者路由器与用户设备间通过数据链路将多个路由器互连形成一个路由器集群系统中,并且设备间的数据链路连接不仅包括光纤链路,也包括铜质数据线等物理设备,通过将PRBS码流在数据链路中环回测试每条数据链路的方法,以检测任意一个或几个数据链路的故障并定位故障的位置。本实施例的基本原理是在路由器集群系统中的路由器或用户设备上增加码流发生器,为路由器或用户设备提供测试码流,使路由器或用户设备具备码流收发能力,通过在整个系统的数据链路中进行自发包环回,以解决由两个或两个以上路由器组成并通过数据链路连接的路由器集群系统在故障定位的过程中复杂度较高的问题。本发明可以应用在光纤传输等需要做大规模高速交叉的系统中。下面结合说明书附图对本实施例作具体说明,如图1所示,该方法具体可以包括:
步骤11,在由两个或两个以上路由器组成的并通过数据链路连接的路由器集群系统中,从所述系统内部向数据链路的上行链路或下行链路发送PRBS码流。
本实施例以图2所示的多框集群系统为例进行说明,该多框集群系统包括了交换芯片A、驱动板B、光接口板C、光接口板D和交换芯片E,在驱动板B上增加一个可发送和检查PRBS(Pseudo-Random Binary Sequence,伪随机二进制序列)码流的码流生成芯片,通过该码流生成芯片将PRBS码流分别发送给驱动板B上的码流环回芯片chip0~chip3上,这些码流环回芯片chip0~chip3具有在数据链路中发送PRBS码流、检测及接收PRBS码流,从而实现为驱动板B提供PRBS码流环回的功能。
具体的,当由用户或者系统内部定时触发故障检测时,首先由码流生成芯片生成PRBS码流,再分别通过码流环回芯片chip0在上行链路、chip3在下行链路发送PRBS码流。若需要检测交换芯片A和驱动板B之间的数据链路的故障,只需一组码流发送环回芯片即可完成整个数据链路的故障定位,则只需通过交换芯片A向驱动板B发送PRBS码流,再从驱动板B向交换芯片A环回PRBS码流,即可实现交换芯片A与驱动板B之间的数据链路的上行链路或下行链路的故障定位;同理,交换芯片A、驱动板B、光接口板C、光接口板D或交换芯片E之间的任意一条数据链路的故障都可以通过上行链路与下行链路实现环回,以完成对数据链路的故障检测。
步骤12、根据所述PRBS码流在所述上行链路和下行链路中的环回路径确定数据链路的故障位置。
在光接口板C和光接口板D的上行和下行两条链路上分别设置CDR(Clockand Data Recovery,时钟数据恢复)器件,能够对发送的PRBS码流进行滤波以及收发PRBS码流,并能够与驱动板B上的芯片chip0~chip3实现同样的功能;驱动板B通过发送PRBS码流及环回的功能实现对系统中链路上所有单板的检测达到故障定位至FRU(Field Replace Unit,现场可更换单元)。
具体的,当需要检测交换芯片A和驱动板B之间的数据链路的故障时,会将交换芯片A和驱动板B之间的上行链路与下行链路的环回路径进行如步骤11所述的PRBS码流环回,如果所述环回路径完好,即交换芯片A和驱动板B之间的上行路径和下行路径都能完成PRBS码流环回,则表示交换芯片A和驱动板B之间的数据链路不存在故障,如果某条数据链路的所述环回路径产生了中断,即交换芯片A和驱动板B之间的上行路径或下行路径中的至少一个路径没有完成PRBS码流环回,则表示在该数据链路上出现了故障。以图2所示的路由器集群系统为例,交换芯片A、驱动板B、光接口板C、光接口板D和交换芯片E之间的8条链路分别是a、b、c、d、e、f、g和h,任意一条路径都可以通过该路径两端连接的单板之间的PRBS码流的环回判断是否存在故障。
采用本实施例的技术方案,通过在路由器集群系统的设备间的上行链路或下行链路中发送PRBS码流,并根据PRBS码流的环回路径确定数据链路的故障位置,实现了在路由器集群系统中准确定位数据链路故障的位置,能够有效降低业务中断的时间,具有结构简单、容易实现的特点。
需要说明的是,本领域普通技术人员可以理解实现上述各方法实施例中的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
本发明的实施例还提供了一种数据链路的故障定位装置,设置于由两个或两个以上路由器组成的并通过数据链路连接的路由器集群系统中,如图3所示,该装置包括码流发送单元31和故障确定单元32,码流发送单元31用于从所述系统内部向数据链路的上行链路或下行链路发送PRBS码流;故障确定单元32用于根据所述PRBS码流在所述上行链路和下行链路中的环回路径确定数据链路的故障位置。
可选的,在码流发送单元中可以包括滤波子单元,用于通过时钟数据恢复CDR对PRBS码流进行滤波后发送。
可选的,在故障确定单元中可以包括中断位置确定子单元和FRU定位子单元,中断位置确定子单元用于如果根据所述PRBS码流确定所述环回路径完好,则确定所述环回路径不存在故障,如果根据所述PRBS码流确定某条数据链路的环回路径产生了中断,则确定在该条数据链路上出现了故障;FRU定位子单元用于将故障位置定位到现场可更换单元FRU。
上述装置中包含的各单元的处理功能的具体实施方式在之前的方法实施例中已经描述,在此不再重复描述。
需要注意的是,在上述装置实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
采用本实施例的技术方案,通过从路由器集群系统内部向设备间的上行链路或下行链路中发送PRBS码流,并根据PRBS码流的环回路径确定数据链路的故障位置,实现了在路由器集群系统中简单快速地定位数据链路故障的位置,能够有效降低业务中断的时间,具有结构简单、容易实现的特点。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1.一种数据链路的故障定位方法,其特征在于,包括:
在由两个或两个以上路由器组成的并通过数据链路连接的路由器集群系统中,从所述系统内部向数据链路的上行链路或下行链路发送伪随机二进制序列PRBS码流;
根据所述PRBS码流在所述上行链路和下行链路中的环回路径确定数据链路的故障位置。
2.根据权利要求1所述的方法,其特征在于,所述发送PRBS码流包括:
通过时钟数据恢复CDR对PRBS码流进行滤波后发送。
3.根据权利要求1所述的方法,其特征在于,所述确定数据链路的故障位置包括:
如果根据所述PRBS码流确定所述环回路径完好,则确定所述环回路径不存在故障,如果根据所述PRBS码流确定某条数据链路的环回路径产生了中断,则确定在该条数据链路上出现了故障。
4.根据权利要求3所述的方法,其特征在于,所述确定数据链路的故障位置还包括:
将所述故障位置定位到现场可更换单元FRU。
5.一种数据链路的故障检测装置,其特征在于,设置于由两个或两个以上路由器组成的并通过数据链路连接的路由器集群系统中,该装置包括:
码流发送单元,用于从所述系统内部向数据链路的上行链路或下行链路发送伪随机二进制序列PRBS码流;
故障确定单元,用于根据所述PRBS码流在所述上行链路和下行链路中的环回路径确定数据链路的故障位置。
6.根据权利要求5所述的装置,其特征在于,在码流发送单元中包括:
滤波子单元,用于通过时钟数据恢复CDR对PRBS码流进行滤波后发送。
7.根据权利要求5所述的装置,其特征在于,在故障确定单元中包括:
中断位置确定子单元,用于如果根据所述PRBS码流确定所述环回路径完好,则确定所述环回路径不存在故障,如果根据所述PRBS码流确定某条数据链路的环回路径产生了中断,则确定在该条数据链路上出现了故障。
8.根据权利要求7所述的装置,其特征在于,在故障确定单元中还包括:
FRU定位子单元,用于将故障位置定位到现场可更换单元FRU。
CN 201110101575 2011-04-20 2011-04-20 一种数据链路的故障定位方法及装置 Pending CN102752125A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110101575 CN102752125A (zh) 2011-04-20 2011-04-20 一种数据链路的故障定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110101575 CN102752125A (zh) 2011-04-20 2011-04-20 一种数据链路的故障定位方法及装置

Publications (1)

Publication Number Publication Date
CN102752125A true CN102752125A (zh) 2012-10-24

Family

ID=47032036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110101575 Pending CN102752125A (zh) 2011-04-20 2011-04-20 一种数据链路的故障定位方法及装置

Country Status (1)

Country Link
CN (1) CN102752125A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105190337A (zh) * 2013-03-07 2015-12-23 菲尼萨公司 自测试集成电路
CN106452975A (zh) * 2016-11-18 2017-02-22 上海斐讯数据通信技术有限公司 一种测试路由器的方法及系统
CN107566036A (zh) * 2016-06-30 2018-01-09 瞻博网络公司 自动检测通信中的错误并且自动确定该错误的源
CN109765482A (zh) * 2019-03-11 2019-05-17 世芯电子科技(无锡)有限公司 一种多芯片间高速互连测试方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105190337A (zh) * 2013-03-07 2015-12-23 菲尼萨公司 自测试集成电路
CN105190337B (zh) * 2013-03-07 2017-03-08 菲尼萨公司 自测试集成电路
CN107566036A (zh) * 2016-06-30 2018-01-09 瞻博网络公司 自动检测通信中的错误并且自动确定该错误的源
US10404570B2 (en) 2016-06-30 2019-09-03 Juniper Networks, Inc. Automatically detecting an error in a communication and automatically determining a source of the error
CN107566036B (zh) * 2016-06-30 2020-08-04 瞻博网络公司 自动检测通信中的错误并且自动确定该错误的源
CN106452975A (zh) * 2016-11-18 2017-02-22 上海斐讯数据通信技术有限公司 一种测试路由器的方法及系统
CN106452975B (zh) * 2016-11-18 2019-10-11 上海斐讯数据通信技术有限公司 一种测试路由器的方法及系统
CN109765482A (zh) * 2019-03-11 2019-05-17 世芯电子科技(无锡)有限公司 一种多芯片间高速互连测试方法

Similar Documents

Publication Publication Date Title
CN101826989B (zh) 一种故障处理方法和装置
Kamal et al. Overlay protection against link failures using network coding
US20140258772A1 (en) Utilizing backward defect indications in y-cable protection switching
CN103210612B (zh) 通信装置、通信系统以及通信方法
CN1710887A (zh) 在分组网络中实现单个服务的故障保护和恢复的方法和设备
Kamal et al. Efficient and agile 1+ N protection
CN102118277A (zh) 丢包检测方法和装置及路由器
CN101160824A (zh) 一种不同级别串接连接监视故障相关性的处理方法和装置
CN1934561A (zh) 网络拓扑的恢复机制
CN100563145C (zh) Rpr中的捆绑接口及其实现方法和装置
CN1514585A (zh) 用于检测连接故障的方法,系统和网络实体
US8855487B2 (en) Method and device for obtaining routing information of electro-optical multi-layer network
CN101436945A (zh) 一种组播业务故障保护的方法、系统及装置
CN102752125A (zh) 一种数据链路的故障定位方法及装置
CN102014011A (zh) 环网保护方法与系统
CN102611610A (zh) 一种多条相同路径隧道集中管理的方法和系统
CN111682966B (zh) 带故障主动报告功能的网络通信装置,系统及其方法
US20120275785A1 (en) Systems and methods for reconfiguration of a circuit switched ring to a packet switched ring
CN102143076B (zh) 一种多重保护叠加的保护组实现方法和装置
Ramamurthy et al. Multi-layer design of IP over WDM backbone networks: Impact on cost and survivability
KR20080035388A (ko) 지.엠.피.엘.에스 기반 네트워크에서 물리계층의 레이블 스위칭 경로에 대한 연결성 검사 방법 및 그 시스템
CN102546345A (zh) 利用生成树协议实现弹性分组环跨环保护的方法
CN102843260B (zh) Ip ran 前向兼容mstp环网系统的通道保护方法
CN103117924B (zh) 一种保护倒换方法和设备
CN100461737C (zh) 弹性分组环节点内部连接故障处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121024