CN104797947A - 基于序列的链路故障定位 - Google Patents
基于序列的链路故障定位 Download PDFInfo
- Publication number
- CN104797947A CN104797947A CN201380059573.5A CN201380059573A CN104797947A CN 104797947 A CN104797947 A CN 104797947A CN 201380059573 A CN201380059573 A CN 201380059573A CN 104797947 A CN104797947 A CN 104797947A
- Authority
- CN
- China
- Prior art keywords
- network element
- sequence number
- sequence
- link
- ray
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/07—Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
- H04B10/075—Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
- H04B10/077—Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using a supervisory or additional signal
- H04B10/0771—Fault location on the transmission path
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0686—Additional information in the notification, e.g. enhancement of specific meta-data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/34—Signalling channels for network management communication
- H04L41/344—Out-of-band transfers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
- H04L43/0864—Round trip delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
- H04L43/106—Active monitoring, e.g. heartbeat, ping or trace-route using time related information in packets, e.g. by adding timestamps
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Electromagnetism (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
对于网络元件或服务器终端站确定由两个网络元件使用的通信链路中的故障的估计物理位点的方法和设备。在实施例中,第一和第二网络元件生成链路失效指示,其包括代表相应的网络元件何时检测到故障的时间值。在其他实施例中,链路失效指示包括在通信链路上在第一与第二网络元件之间传输的时间值。计算这些时间值之间的时间距离,其用于计算故障的估计物理位点。在一些实施例中,链路失效指示包括在通信链路上在网络元件之间传输或即将传输的序列数。计算序列数之间的序列距离,并且其用于计算故障的估计物理位点。
Description
技术领域
本发明的实施例涉及联网领域;并且更具体地,涉及通信链路中故障的估计物理位点的确定。
背景技术
许多通信网络依靠有形通信链路(例如,双绞线铜布线、同轴电缆、光纤)以在网络的节点之间提供传输介质。尽管物理通信链路提供例如速度和安全等许多益处,这样的链路易受缺陷或破损的影响,这些缺陷或破损可以降低或破坏网络功能性。这样的缺陷从定位和修理链路所需要的劳动力和时间两者来看是昂贵的(还有在该时间期间的停止服务的成本)。
通常用于表征光纤的一个装置是光时域反射计(OTDR)。OTDR可以利用光纤执行多种任务,其包括估计光纤的长度、估计总衰减和估计故障的位点。OTDR将光信号注入光纤,其的部分朝OTDR装置反射回。这些后向反射(即,后向散射)OTDR信号允许OTDR进行计算来估计光纤长度并且估计光纤中故障的物理位点。
在许多应用中,OTDR集中在网络中的几个位点内。然而,OTDR关于使用的光纤的长度和牵涉的节点跳转的数量可以支持多大的光纤电缆厂有限制。在其他应用中,便携式OTDR装置由服务人员手动使用,但该配置从时间和劳动力成本(因为需要人类体力劳动)方面尤其昂贵。因此,具有用于检测和定位网络故障而不需要人为干预或额外硬件部件的半自动或全自动技术方案,这将是可取的。此外,具有对光和金属布线两者都起作用的这样的技术方案,这将是可取的。
发明内容
描述用于确定在由第一网络元件和第二网络元件使用的物理通信链路中的故障的估计物理位点的方法。根据本发明的实施例,方法包括从第一网络元件接收第一链路失效指示。该第一链路失效指示包括来自由第一网络元件在物理通信链路上从第二网络元件接收的第一多个位的第一序列数。该第一序列数属于第一序列。第一链路失效指示还包括第二序列数,其截至(as of)第一网络元件检测到出现故障的时间作为第二多个位的部分由第一网络元件在物理通信链路上恰好传输或即将传输到第二网络元件。该第二序列数属于第二序列。方法进一步包括基于第一序列数、第二序列数、第三序列数和第四序列数计算故障的估计物理位点。该第三序列数属于第二序列并且来自由第二网络元件在物理通信链路上从第一网络元件接收的第二多个位。第四序列数属于第一序列并且截至第二网络元件检测到出现故障的时间作为第一多个位的部分由第二网络元件在物理通信链路上恰好传输或即将传输到第一网络元件。
在本发明的实施例中,描述第一网络元件,其确定要由该第一网络元件和第二网络元件使用的物通信链路中的故障的估计物理位点。第一网络元件包括一个或多个物理网络接口集,其配置成在物理通信链路上将第一多个位传输到第二网络元件,该第一多个位包括属于第一序列的多个序列数。物理网络接口集还配置成在物理通信链路上从第二网络元件接收第二多个位,其包括属于第二序列的多个序列数。物理网络接口集进一步配置成从第二网络元件接收第一链路失效指示。该第一链路失效指示包括来自由第二网络元件在物理通信链路上接收的第一多个位的第一序列数。该第一序列数属于第一序列。第一链路失效指示还包括第二序列的第二序列数,其截至第一网络元件检测到出现故障的时间作为第二多个位的部分由第二网络元件在物理通信链路上恰好传输或即将传输到第一网络元件。第一网络元件还包括链路故障检测模块,其配置成检测出现物理通信链路的故障,并且作为响应,生成第二链路失效指示。该第二链路失效指示包括来自第二多个位、属于第二序列的第三序列数,和第一序列的第四序列数,其截至通过链路故障检测模块对出现故障的所述检测的时间作为第一多个位的部分由第一网络元件在物理通信链路上恰好传输或即将传输到第二网络元件。第一网络元件还包括链路故障定位模块,其配置成基于第一序列数、第二序列数、第三序列数和第四序列数计算故障的估计物理位点。
根据本发明的实施例,描述这样的设备,其确定要由第一网络元件和第二网络元件使用的物理通信链路中的故障的估计物理位点。该设备包括一个或多个物理网络接口集,其配置成从第一网络元件接收第一链路失效指示。该第一链路失效指示包括来自由第一网络元件在物理通信链路上从第二网络元件接收的第一多个位的第一序列数。该第一序列数属于第一序列。第一链路失效指示还包括第二序列的第二序列数,其截至第一网络元件检测到出现故障的时间作为第二多个位的部分由第一网络元件在物理通信链路上恰好传输或即将传输到第二网络元件。一个或多个物理网络接口集还配置成从第二网络元件接收第二链路失效指示。该第二链路失效指示包括来自由第二网络元件在物理通信链路上接收的第二多个位的第三序列数。该第三序列数属于第二序列。第二链路失效指示还包括第一序列的第四序列数,其截至第二网络元件检测到出现故障的时间作为第一多个位的部分由第二网络元件在物理通信链路上恰好传输或即将传输到第一网络元件。设备还包括链路故障定位模块,其配置成基于第一序列数、第二序列数、第三序列数和第四序列数计算故障的估计物理位点。
本发明的实施例使用时间值和/或时戳来使定位链路故障位点。
根据本发明,描述用于确定由第一网络元件和第二网络元件使用的物理通信链路中的故障的估计物理位点的方法。该方法包括从第一网络元件接收第一链路失效指示。该第一链路失效指示包括第一时间值,其由第一网络元件生成或由第一网络元件在物理通信链路上从第二网络元件接收。方法进一步包括确定第一时间值与第二时间值之间的时间距离。该第二时间值由第二网络元件生成或由第二网络元件在物理通信链路上从第一网络元件接收。方法进一步包括基于时间距离计算故障的估计物理位点。
根据本发明的所述,描述第一网络元件,其确定要由该第一网络元件和第二网络元件使用的物理通信链路中的故障的估计物理位点。第一网络元件包括一个或多个物理网络接口集、链路故障检测模块和链路故障定位模块。该一个或多个物理网络接口集配置成在物理通信链路上将第一多个位传输到第二网络元件。物理网络接口集进一步配置成在物理通信链路上从第二网络元件接收第二多个位。物理网络接口集还配置成从第二网络元件接收第一链路失效指示,其包括由第二网络元件生成或由第二网络元件在物理通信链路上从第一网络元件接收的第一时间值。链路故障检测模块配置成检测出现物理通信链路的故障,并且作为响应,生成第二链路失效指示,其包括第二时间值。链路故障定位模块配置成确定第一时间值与第二时间值之间的时间距离,并且基于该时间距离计算故障的估计物理位点。
在实施例中,描述这样的设备,其确定要由第一网络元件和第二网络元件使用的物理通信链路中的故障的估计物理位点。该设备包括第一网络元件和第二网络元件。设备包括一个或多个物理网络接口集。该物理网络接口集配置成从第一网络元件接收第一链路失效指示,其包括要由第一网络元件生成或由第一网络元件在物理通信链路上从第二网络元件接收的第一时间值。物理网络接口集还配置成从第二网络元件接收第二链路失效指示,其包括第二时间值。该第二时间值要由第二网络元件生成或由第二网络元件在物理通信链路上从第一网络元件接收。设备还包括链路故障定位模块。链路故障定位模块配置成确定第一时间值与第二时间值之间的时间距离,并且基于该时间距离计算故障的估计物理位点。
因此,本发明的公开实施例允许链路故障的快速且准确定位而不需要额外的硬件或体力劳动。
附图说明
本发明通过参考下列描述和附图而最好地理解,这些附图用于图示本发明的实施例。在图中:
图1图示根据本发明的一个实施例的通信网络,其包括两个网络元件之间的通信链路的故障;
图2图示根据本发明的一个实施例用于使用时间值信息来定位链路故障的方法;
图3图示根据本发明的一个实施例通信链路上用于定位故障位点的不同类型的序列值和时戳的传输;
图4图示根据本发明的一个实施例的通信链路上的长号(tromboned)(即,环回)序列值的传输;
图5图示根据本发明的一个实施例从每个网络元件的着眼点的图4的观察通信链路错误特性;
图6图示根据本发明的一个实施例使用已知序列和分组内错误位点来定位链路故障;
图7图示根据本发明的一个实施例使用已知序列和错误位流位点来定位链路故障;
图8图示根据本发明的一个实施例链路故障随时间的序列值的传输和接收;
图9图示作为出现链路故障的时间点处的失效检测业务使用两个不同的序列数集的本发明的实施例;
图10图示在网络元件A检测到链路故障时的图9的实施例;
图11图示在网络元件B检测到链路故障时的图9的实施例;
图12图示根据本发明的一个实施例用于通过使用基于序列的信息来确定物理通信链路中的故障的估计物理位点的流程;以及
图13图示根据本发明的一个实施例用于通过使用基于时间的信息来确定物理通信链路中的故障的估计物理位点的流程。
具体实施方式
在下列描述中,阐述许多具体细节。然而,理解可在没有这些具体细节的情况下实践本发明的实施例。在其他实例中,为了不使本描述难以理解,可未详细地示出众所周知的电路、结构和技术。本领域内普通技术人员利用包括的描述将能够实现适当的功能性而没有过度实验。
在说明书中对“一个实施例”、“实施例”、“示例实施例”等的引用指示描述的实施例可包括特定特征、结构或特性,但每个实施例可不一定包括该特定特征、结构或特性。此外,这样的短语不一定都指相同的实施例。此外,当特定特征、结构或特性连同实施例描述时,认为连同其他无论是否明确描述的实施例实现这样的特征、结构或特性,这在本领域内技术人员的知识内。
在下列描述和权利要求中,可使用术语“耦合”和“连接”连同它们的派生词。要理解这些术语不规定为是彼此的同义词。“耦合”用于指示彼此可或可不直接物理或电接触的两个或以上的元件彼此共同操作或相互作用。“连接”用于指示彼此耦合的两个或以上的元件之间的通信的建立。
电子装置(例如,终端站、网络元件)使用计算机可读介质来存储和传输(在内部和/或在网络上利用其他电子装置)代码(由软件指令组成)和数据,例如非暂时性有形计算机可读介质(例如磁盘;光盘;只读存储器;闪速存储器装置等计算机可读存储介质)和暂时性计算机可读传输介质(例如,电、光、声或其他形式的传播信号-例如载波、红外信号)。另外,这样的电子装置典型地包括一个或多个处理器集,其耦合于一个或多个其他部件,例如一个或多个非暂时性机器可读介质(来存在代码和/或数据)、用户输入/输出装置(例如,键盘、触屏和/或显示器)和网络连接(以使用传播信号来传输代码和/或数据)。处理器集和其他部件的耦合典型地通过一个或多个总线和网桥(也称作总线控制器)。从而,指定电子装置的非暂时性计算机可读介质典型地存储指令以供在该电子装置的一个或多个处理器上执行。本发明的实施例的一个或多个部分可使用软件、固件和/或硬件的不同组合来实现。
如本文使用的,网络元件(例如,路由器、交换机、网桥)是包括硬件和软件的联网设备件,其使网络上的其他设备(例如,其他网络元件、终端站)通信互连。一些网络元件是“多服务网络元件”,其提供对多个联网功能(例如,路由、桥接、交换、层2聚合、会话边界控制、服务质量和/或订户管理)的支持,和/或提供对多个应用服务(例如,数据、语音和视频)的支持。订户终端站(例如,服务器、工作站、便携式电脑、笔记本、掌上电脑、移动电话、智能电话、多媒体电话、IP语音(VOIP)电话、用户设备、终端、便携式媒体播放器、GPS单元、游戏系统、机顶盒)访问互联网上提供的内容/服务和/或在互联网上覆盖的虚拟专用网络(VPN)上提供的内容/服务。这些内容/服务典型地由属于服务或内容提供商的一个或多个终端站(例如,服务器终端站)或参与对等服务的终端站提供,并且可包括例如公共网页(例如,免费内容、店面、搜索服务)、私人网页(例如,提供电子邮件服务的用户名/密码访问网页)和/或通过VPN的企业网络。典型地,订户终端站耦合于(例如,通过耦合于接入网络(有线或无线地)的客户端设备)边缘网络元件,其耦合于(例如,通过一个或多个核心网络元件)其他边缘网络元件,这些其他边缘网络元件耦合于其他终端站(例如,服务器终端站)。
网络元件通常分成控制平面和数据平面(有时称为转发平面和媒体平面)。在网络元件是路由器(或实现路由功能性)的情况下,控制平面典型地确定要如何路由(例如,数据的下一个跳跃和该数据的外发端口)数据(例如,分组),并且数据平面负责转发该数据。例如,控制平面典型地包括一个或多个路由协议(例如,边界网关协议(BGP)、内部网关协议(IGP)(例如,开放最短路径优先(OSPF)、路由信息协议(RIP)、中间系统到中间系统(IS-IS))、标签分配协议(LDP)、资源预留协议(RSVP)),其与其他网络元件通信来交换路由并且基于一个或多个路由度量来选择那些路由。
典型地,网络元件包括一个或多个线卡集、一个或多个控制卡集以及可选地,一个或多个服务卡(有时称为资源卡)的集。这些卡通过一个或多个机构(例如,使线卡耦合的第一全网格和使卡中的全部耦合的第二全网格)耦合在一起。线卡集构成数据平面,而控制卡集提供控制平面并且通过线卡与外部网络元件交换分组。服务卡集可以提供专门处理(例如,层4至层7服务(例如,firewall、IPsec、IDS、P2P)、VoIP会话边界控制器、移动无线网关(GGSN、演进分组系统(EPS)网关))。通过示例,服务卡可用于终止IPsec隧道并且执行随从验证和加密算法。
在本发明的一些实施例中,通信链路的每个末端处的网络元件检测到由故障引起的链路的不能接受的低质量的通信信道。该不能接受的低质量可采用许多方式检测,其包括来自光学接收器的直接信号损失(LOS)指示,或未能接收从不正确位到不正确码字到不正确分组的一个或多个预期值。在这些实施例中,故障的位点可以基于代表每个网络元件相应地检测该低链路质量的时间的相应时间值而确定。
另外,本发明的实施例使用在物理通信链路上传输的业务-例如时戳或序列数-来定位沿链路出现的失效。在这些实施例中,通过进行在链路的每个末端上发送和/或接收什么数据的分析,可以确定该链路的故障的位点。在一些实施例中,该业务使用带外光层操作、实施和管理(OAM)通信数据来传输,其允许通信链路上传输的业务的细粒度控制。然而,其他实施例使用专用故障监测信道来输送对于检测并且定位故障有用的业务。在再其他实施例中,故障监测信息可连同通信链路上的普通承载业务一起交错。
尽管本文公开的许多实施例从光学通信链路和OAM链路方面说明本发明,本发明的其他实施例使用例如双绞线铜、同轴等非光学链路。从而,本发明的方法一般能适用于几乎任何物理层通信系统。然而,故障定位的准确性将取决于通信系统的特性。当通信系统允许完全控制特性时-例如在OAM带外通信中-准确性是相对高的。然而,当通信系统不允许控制链路上的业务的特性(例如,传输的突发分组、具有改变长度的分组、差的时钟质量,等)时,准确性可降低。
图1图示根据本发明的一个实施例的通信网络,其包括两个网络元件110A-110B之间的点到点通信链路118的故障128。在描绘的实施例中,通信链路提供用于网络管理业务的OAM信道119A和对其他网络业务提供数据传输的多个其他信道119B-119N。网络元件‘A’110A、网络元件‘B’110B和管理装置130每个包括一组端口(相应地,115A、115B和115C),其允许使用网络的通信。在一些实施例中,网络元件‘A’110A和网络元件‘B’110B也通过辅助通信链路160连接,其可以是有线(例如,光纤链路、类别5或6电缆,等)或无线的(例如,电气和电子工程师协会(IEEE)802.11、蜂窝、卫星,等)。在本发明的实施例中,通信链路118是光纤链路并且网络元件110A-110B中的每个是采用密集波分复用(DWDM)的光开关,但在其他实施例中,这些元件和技术不同。
图1还图示管理装置130,其包括能够使用链路故障定位模块136来确定故障的近似位点的管理模块132。但是,在一些实施例中,未使用管理装置130;相反,网络元件‘A’110A和网络元件‘B’110B中的一个或两个包括管理模块(132A,132B),其提供管理装置130的管理模块132的相同或相似功能性。此外,网络元件(110A,110B)的管理模块(132A,132B)可包括管理装置130中的管理模块132的模块或部件(例如,136,137,139)中的任一个。
在通信链路118的整个操作中,网络元件‘A’110A和网络元件‘B’110B将使用通信链路118的一个或多个信道119A-119N来将数据传输到其他网络元件以及从其他网络元件接收数据。然而,在某一时刻(或可能地,在一定间隔内),通信链路118可产生链路故障128(其削弱或消除通信链路118在网络元件110A-110B之间传输数据的能力)。该链路故障128影响业务在两个方向上行进-从而,从网络元件‘A’110A到网络元件‘B’110B的业务以及从网络元件‘B’110B到网络元件‘A’110A的业务将受到影响。
在出现链路故障的时刻,已经经过链路故障128的位点的任何传输中的数据将到达相应的网络元件(110A,110B)而没有由于链路失效引起的错误。然而,在链路故障的时候还未经过链路故障位点128的任何传输中的数据将带有错误(由于链路失效引起)地到达或将根本没有到达。相似地,继出现链路故障后由任一网络元件(110A,110B)传输的任何数据也将以错误(由于链路失效引起)到达或将根本没有到达。
图示的通信链路118包括在链路中点129与网络元件‘A’110A之间的点处的链路故障位点128。根据本发明的实施例,通过网络元件‘A’110A和网络元件‘B’110B传输和接收失效检测业务120A-120B,管理模块132能够确定链路故障128的位点。在一些实施例中,确定的位点是从网络元件‘A’110A到链路故障128的距离(即,链路故障长度A 151A)、从网络元件‘B’110B到链路故障128的距离(即,链路故障长度B 151B)或从链路中点129到链路故障128的距离(即,链路故障长度C 151C)。
因为网络元件‘A’110A和网络元件‘B’110B两者都完全控制在通信链路118上作为失效检测业务120A-120B所传输的,网络元件110A-110B可根据特定配置插入或修改该业务以包括特定时间值或序列数。然后,在网络元件(例如,110A)检测到链路故障时,该网络元件将传输链路失效指示122A到管理模块132。链路失效指示122A可包括一个或多个时间值124A和/或一个或多个序列数125A。在各种实施例中,时间值124A可包括由网络元件110A的时钟模块112A提供的代表初始检测链路故障的时间点的时间、来自在检测到链路故障之前接收的最后的有效接收分组内的时戳和来自时钟模块112A的指示在检测到链路故障之前何时接收最后的有效分组的时间值中的一个或多个。另外,在各种实施例中,序列数125A可包括来自在检测到故障之前在OAM信道119A上作为失效检测业务120B接收的最后的有效分组内的序列数、要在OAM信道119A上发送失效检测业务120A时使用的下一个序列数或用于在OAM信道119A上传输失效检测业务120A的最后的序列数中的一个或多个。在实施例中,序列数125A来自由PRBS模块(例如,135A、135B)生成的伪随机二进制序列(PRBS)。在使用PRBS的某些实施例中,PRBS由线性反馈移位寄存器(LFSR)(例如,138A、138B)生成。在其他实施例中,可使用其他相似的时间值和/或序列数。
在一些实施例中,管理模块132高速缓存接收的链路失效指示(例如,122A-122B)。利用来自通信链路118的每侧的接收链路失效指示122A-122B,链路故障定位模块136能够通过计算离已知参考点(例如,151A、151B、151C)的链路故障距离来确定链路故障位点128。在本发明的各种实施例中,确定链路故障长度的计算可进一步使用通信链路118的链路长度150、通信链路118的往返时间(RTT)或通信链路118的传播速度。在一些实施例中,确定的链路故障位点128可以是计算的链路故障长度,并且在其他实施例中,确定的链路故障位点128可以是基于计算的链路故障长度的地理位点标识符。确定的链路故障位点可作为故障137的计算估计物理位点而进一步由链路故障定位模块136存储。
在本发明的实施例中,失效检测业务120A-120B包括截至传输时间被印时戳的分组,或包括序列数的分组/数据报,或作为位流的至少部分或作为分组有效载荷的部分传输的众所周知的序列或模式。
在失效检测业务120A-120B在通信链路118的OAM信道119A上传输的实施例中,要放置在分组内的时戳或序列数可以放置在OAM分组的开销部分内。在一些实施例中,这些时戳或序列值可以放置在这些分组的有效载荷中(例如,发送专用分组以包含这些时戳或序列值)。然而,这些选择可以在OAM业务影响与估计的链路故障位点的准确性之间引入权衡。特别地,这些技术之间的权衡牵涉分组开销中的空间(可能每个分组中),其是一个类型的效率降低。备选方案是发送专用分组,其具有可能更短的分组开销;但接着降低的效率由专用分组的比例表示。在两个情况下,分组的大小或专用分组可以注入流的速率影响只着眼于时戳(而不是看分组内部)的方法的分辨率。在某些实施例中,序列数的插入在时间上精确地隔开(即,在明确定义、精确的间隔)以便允许从其处得到的故障位点结果的确定性增加。
在实施例中,链路故障定位模块136计算由网络元件110A-110B报告的时间值或序列数之间的距离。该距离(其在这里描述为返回从一个序列数移到另一个的序列步的数量(或,在更特定的情况下,两个时间值之间的时间量)的通用dist()函数的结果)可使用链路的长度150、链路的RTT或链路的传播速率来变换以允许确定链路故障位点128。关于这些计算的另外的细节稍后在本文呈现。
在链路失效指示122A-122B包括时戳(来自接收的业务、传输的业务,和/或由网络元件110A-110B生成)的实施例中,链路故障位点128可使用通信链路的时戳和RTT来确定。链路故障位点的空间分辨率仅受到时戳准确性和分辨率连同作为失效检测业务120A-120B的部分传输的数据单位的大小/长度的限制。例如,如果不间断的一系列64字节分组以千兆以太网速度(即,每秒1千兆(Gbps))传输,在64个字节将以1Gbps在512纳秒内传输时,链路故障位点的分辨率将在近似100米内,并且1微秒在光纤电缆的传播速度是近似200米。
为了提高故障位点估计准确性,本发明的实施例实现同步方案来使网络元件110A-110B的时钟同步,从而能够在共同参考帧中生成时戳。在一些实施例中,每个时钟模块112A-112B使用网络时间协议(NTP)(互联网工程任务组(IETF)请求评论(RFC)5905)来使它相应的时钟保持同步,但其他实施例可使用其他时钟同步方案,其包括但不限于,精确时间协议(电气和电子工程师协会(IEEE)1588标准)或全球定位系统(GPS)。在其他实施例中,管理模块132能够将由网络元件110A-11B中的一个或两个报告的时戳变换成共同参考帧。
在使用时戳的一个实施例中,链路故障位点128采用下列方式计算。首先,在圆‘1’处,链路故障128在通信链路118中出现。在描绘的图1的实施例中,比起到网络元件‘B’110B,链路故障128略微更接近网络元件‘A’110A,因此网络元件‘A’110A将在网络元件‘B’110B之前检测到链路故障的存在。从而,在圆‘2’处,网络元件‘A’110A的链路故障检测模块134A检测到故障的存在。这时,在圆‘3’处,网络元件‘A’110A将包括第一时间值124A(或在一些实施例中,超过一个时间值)的链路失效指示122A传输到管理装置130。在一些实施例中,时间值在网络元件‘A’110A检测到链路故障的存在(例如,检测到链路的LOS、检测到许多有故障位/分组/码字,等)时由网络元件‘A’110A的时钟模块112A生成;在其他实施例中,时间值是作为失效检测业务120B的部分来自由网络元件‘B’110B传输的分组的时戳。在其他实施例中,时间值是网络元件确定它首先接收由于故障引起的有故障分组(或未接收预期分组,等)的时间。在时间值是来自由网络元件‘B’110B传输的分组的时戳的实施例中,分组是在网络元件‘A’110A检测到链路故障之前接收的失效检测业务120B的最后的分组。管理模块132可将接收的链路失效指示122A存储在链路失效指示存储位点139中。
在圆‘4’处,网络元件‘B’110B的链路故障检测模块134B检测到链路故障的存在。在该描绘的示例中,圆‘4’在圆‘3’处网络元件‘A’传输链路失效指示122A后出现。在实践中,因为通信链路118的传播速度可比网络元件‘A’110A检测故障并且传输链路失效指示122A的能力更快,圆‘4’在圆‘3’之前出现,这也是可能的。在圆‘5’处,网络元件‘B’110B将包括第二时间值124B(或在一些实施例中,多个时间值)的链路失效指示122B传输到管理装置130。与第一时间值124A相似,第二时间值124B可以是在网络元件‘B’检测到链路故障的存在时由时钟模块112B生成的时间值,或作为失效检测业务120A的部分来自由网络元件‘A’传输的分组的时戳。在时间值是来自由网络元件‘A’110A传输的分组的时戳的实施例中,分组是在网络元件‘B’110B检测到链路故障之前接收的失效检测业务120A的最后的分组。管理模块132可将接收的链路失效指示122B存储在链路失效指示存储位点139中。在一些实施例中,在圆‘5’处,网络元件‘B’110B在未失效的辅助通信链路160上将链路失效指示122B传输到网络元件‘A’110A,并且该链路失效指示122B可以连同由网络元件‘A’110A的链路失效检测模块134A生成(或由管理模块132A生成)的链路失效指示122C一起被管理模块132A用于计算链路故障128的估计物理位点。在其他实施例中,在网络元件‘A’110A将经由辅助通信链路160将它的链路失效指示122A传输到网络元件‘B’110B时,出现描绘的实施例的镜像,该链路失效指示122A可以连同由网络元件‘B’110B的链路失效检测模块134B生成(或由管理模块132B生成)的链路失效指示122D一起被它的管理模块132B用于计算链路故障128的估计物理位点。
在第一时间值124A和第二时间值124B在时间参考系中不同步的实施例中,链路故障定位模块136将每个值变换到相同的时间参考系。这些时间值124A-124B然后在圆‘6’处用于计算链路故障128的估计物理位点。
在某些实施例中,链路故障128的估计物理位点的计算是两步过程。首先,生成时间值124A-125B或序列数125A-125B之间的时间或序列距离,这允许计算与链路故障位点128关联的比例位点。在第二步骤中,标度该比例位点以通过参考与通信链路118的特性有关的辅助信息(例如通信链路118的传播速度、通信链路118的物理长度150和/或通信链路118的传播延迟)来确定链路故障的地理位点。在其他实施例中,描述通信链路118的方面的其他元数据可用于标度目的。在本文描述对于第一级时间值距离计算和第二级标度计算的某些示范性公式;然而,存在这些公式的许多变化形式使得本领域内技术人员能够修改公式以使用不同的步骤或数据值来获得相同结果。
从高层次立场来看-假设所有时间值在共同时间参考系中同步-如果第一时间值124A等于第二时间值124B,则因为故障的迹象花费相等的时间量到达链路的每个末端,失效应精确地在链路129的中间。如果第一时间值124A小于(即,早于)第二时间值124B,则失效应更接近网络元件‘A’110A定位。相似地,如果第一时间值124A大于第二时间值124B(即,在其之后出现),则失效应更接近网络元件‘B’110B定位。
在一些实施例中,时间值距离和比例标度的计算只在一个步骤中计算。使用时间值124A-124B和通信链路118的传播速度(例如,对于光纤链路,近似2*10^8 m/s),链路故障定位模块136可配置成使用下列公式(其中结果的符号指示中点的哪侧包括故障)计算从链路中点129到链路故障128的距离(即,链路故障长度‘C’151C):
链路故障定位模块136还可配置成故障的估计物理位点(作为离网络元件110A-110B中的一个的距离)。在实施例中,链路故障定位模块136使用时间值124A-124B来计算时间值距离并且使用通信链路的传播速度和通信链路的往返时间(RTT)来标度该距离,该传播速度和往返时间可以由网络元件110A-110B通过众所周知的手段(例如在通信链路上传输一个单位的信息以及确定对于要接收的响应需要多少时间)来限定、得到或测量。
因此,链路故障长度‘A’151A可根据下列公式计算:
相似地,链路故障长度‘B’151B可根据下列公式计算:
每个长度公式(Length_A、Length_B、Length_C)是相当通用的并且可以与很多种配置一起使用。另外,时间值可采用很多种方式生成。
在实施例中,时间值在网络元件(例如,网络元件‘A’110A)首先确定网络链路可能存在故障时由时钟模块(例如,112A)生成。在一个实施例中,在网络元件检测到确定数量的出错分组时确定可能故障。例如,该可能故障可限定为在一定间隔(在其期间接收特定数量的连续出错分组)开始时或在特定时间范围内接收特定数量或百分比的出错分组时出现。尽管链路故障的检测被本领域内技术人员很好地理解,检测可以牵涉检测信号损失(LoS)、帧校验序列(FCS)、校验和方案(例如,奇偶位、校验位,等)、循环冗余校验(CRC)、码字违反的失效、光功率下降、误码率(BER)增加、重复码或纠错码中的问题等中的一个或多个。在一些实施例中,每个时间值然后将具有在最后的有效分组的末端到第一无效(即,出错)分组的末端之间发生的故障的内在不确定性,这可进一步并发分组长度(例如,巨型帧)和分组间间隙(例如千兆无源光网络(GPON)中的突发模式上游信道)中的变化。
然而,在使用多个信道的波分复用(WDM)系统中,来自许多信道的出错分组信息可以相关来提高计算的估计故障位点的准确性。例如,在具有运送一个通信链路的许多通信信道的一些实施例中,来自信道中的每个的信息(例如,出错分组信息、序列数、时戳,等)可以一起共同用于生成失效的时间值。在这样的实施例中,如果对多个信道中的每个独立生成失效的近似时间,这些近似时间值可平均来生成更准确的失效时间估计。备选地,在其他实施例中,多个计算的近似失效检测时间中最早的那个用作失效签名的估计时间值。
在一些实施例中,估计的故障位点的分辨率通过使用位流作为失效检测业务120A-120B而提高。例如,伪随机二进制序列(PRBS)可以交错到位流内。采用相似的方式,前向纠错(FEC)块(例如Reed-Solomon码)可以用于更准确地确定指示链路故障开始的特定位点。由于技术限制,基于第一失效位位点的链路故障位点的距离分辨率将在亚米级范围内。
使用序列数的备选实施例牵涉由网络元件110A-110B中的每个使用计数器。在实施例中,网络元件110A-110B中的每个传输计数器重设消息来重设简单计数器。例如,在将计数器重设消息从网络元件‘A’110A传输到网络元件‘B’110B的时刻,网络元件‘A’110A重设计数器。该计数器可具有绑定到位传输的明确定义的增量,例如“每128个传输位,计数器增加1”。在接收计数器重设消息时,网络元件‘B’110B将重设它对应的计数器。然后,在数据由网络元件‘A’110A传输并且被网络元件‘B’110B接收时,每个网络元件将根据限定的计数器增量使相应的计数器增加。该相同的规程也在相反方向上(即,从网络元件‘B’110B到网络元件‘B’110B)使用来使第二对计数器同步。例如,网络元件‘B’110B将传输计数器重设消息并且重设第二计数器。在接收计数器重设消息时,网络元件‘A’110A将重设它的第二计数器。在实施例中,每个末端处的计数器根据互相商定同步时钟的时刻来自动重设,例如在每一毫秒开始时。最终,在检测到链路失效的时候,这四个计数器的值用作发送到管理模块132的序列数125A-125B,该管理模块132计算第一组计数器与第二组计数器之间的序列距离,其可以用于计算链路故障128的估计物理位点。
在使用分组作为失效检测业务120A-120B的实施例中,失效位点分辨率准确性可以通过使用背对背传输的短的专用分组(即,具有小的分组间间隙)而提高。在对于失效检测业务120A-120B传输使用OAM信道119A的那些实施例中,这可容易实现为网络元件110A-110B中的每个完全控制该信道。例如,如果网络元件110A-110B在信道119A上没有任何传统OAM业务要发送,相反可以传输故障监测帧。相似地,网络元件110A-110B可具有将大的OAM业务批次分段成小的分组。尽管这可以降低传统OAM业务的效率(因为更多的分组需要更多分组报头和处理开销),这使估计的失效位点分辨率准确性明显增加。当然,相似的技术可应用于使用非OAM信道(例如,信道119B)或非信道化媒体的实施例,因为随着增加合适的故障监测开销,常规数据业务也可以充当失效检测业务120A-120B。
尽管在图1中图示的系统包括独立管理装置130,其包括管理模块132,本发明的实施例具有管理模块132作为网络元件‘A’110A和网络元件‘B’110B中的一个或两个的部分(参见管理模块132A-132B)。例如,在管理模块132作为网络元件‘A’110A的部分而存在的实施例中,链路失效指示122A仍由网络元件‘A’110A生成,但在它直接提供给管理模块132A时可不直接传输到另一个装置。然而,在该实施例中,网络元件‘B’110B仍生成并且传输链路失效指示122B,但相反它在辅助通信链路160上传输到网络元件‘A’110A(因为通信链路118有故障)。在一些实施例中,管理模块132作为两个网络元件110A-110B的部分而存在,并且每个网络元件将在辅助通信链路160上将它的生成链路失效指示122A-122B传输到其他网络元件。在该情形中,由管理模块132A-132B中的每个生成的故障的计算估计物理位点可在一起分析来形成链路故障的聚集估计物理位点。
图2图示根据本发明的一个实施例用于使用时间值信息来定位链路故障的方法。图2包括通信链路118,其允许网络元件‘A’110A与网络元件‘B’110B之间的双向通信(例如,它在每个方向上输送信号)。每个网络元件110A-110B包括一天的时间的时钟模块(112A,112B),其同步到共同参考帧。在本发明的某些实施例中,该同步通过NTP、精确时间协议或基于GPS的同步中的一个而提供。
在200A处,在未知位点“L”和时间“t0”处,通信链路118立即并且在两个方向上失效。链路118的修理通过确定失效128的位点“L”而促进。
失效的后果(例如信号损失(LOS)或增加的错误率)将传播到网络元件‘A’110A,在这里是在时间“tA”=“t0”+“ΔtA”处观察到(由标号204指示)。同样,在时间“tB”=“t0”+“ΔtB”处在网络元件‘B’110B处观察到失效(由标号206指示)。失效128的位点可以由管理模块132(未在图2中绘出,并且可作为网络元件110A-110B中的一个或多个的部分或作为独立装置的部分而存在)的链路故障定位模块136通过计算简单比例而从“ΔtA”和“ΔtB”确定。
在一个实施例中,如果每个网络元件在通信链路118上将持续系列的时戳传输到另一网络元件,在失效之前即刻越过失效所在地的每个末端处将存在一个最后的时戳。该最后的时戳将在链路的远端由另一网络元件接收,该另一网络元件可以通过从它自己的当前时间扣除接收的最后时戳而得到Δt(A或B)。
在另一个实施例中,“t0”的值确定为“Δt”推导步。通信链路的单向延迟202(“Δ1way”202)是往返时间(RTT)的一半,该往返时间(RTT)可以在通信链路的安装或操作期间例如用OTDR或通过简单的环回来测量并且在之后的正常操作期间可能时常被证实/更新。例如IEEE 1588等同步协议包括RTT或单向延迟的估计。如果同步协议在考虑中的通信链路118上运行,RTT可因此被认为是同步的负作用。
假设RTT(并且因此Δ1way 202)是已知的,则:
则,通过代换:
因此,
因此,
之前的方程不需要时戳,但假设网络元件110A和110B互相同步,即,它们的时钟一致。
如上文指出的,在本发明的实施例中,每个网络元件110A-110B传输连续系列的时戳,由此避免需要互相同步。例如,考虑在200B处图示的示例,其中网络元件‘A’110A和网络元件‘B’110B的时钟域相差某一未知校正因子“Toffset”。每个网络元件110A-110B在通信链路上朝另一个传输时戳。在朝网络元件‘A’110A的方向上,最后的时戳“tfB”240在失效之前即刻经过故障位点128。同样,最后的时戳“tfA”242在从网络元件‘A’110A朝网络元件‘B’110B的方向上经过故障位点128。
在网络元件110A处,时戳“tfB”240在当地时间“tA”(网络元件‘A’110A观察到失效的时刻)接收。在网络元件‘A’110A的初始时间,tfB应通过增加未知的“Toffset”来校正。这可表达为:
网络元件‘B’110B的对应方程是:
注意如与从网络元件‘B’110B到网络元件‘A’110A的转换相比较,偏移在从网络元件‘A’110A的时域转换到网络元件‘B’110B时具有相反符号。
如果全部四个值在单个分析点处(例如,在故障定位模块136处)可用,时戳可重新定位到它们自己的时钟域内并且增量可使用下列方程独立计算而不必知道域之间的偏移:
这时,“Toffset”退出计算。
利用从网络元件‘A’110A和网络元件‘B’110B两者的透视在时域中已知的故障128的相对位置,故障的物理位点可通过参考例如链路长度或GIS数据等辅助信息来确定,并且作为距离、地图坐标或采用有意义且有帮助的任何其他形式呈现给修理人员。
要理解该结果的准确性和分辨率受到许多因子的影响,其包括网络元件110A-110B之间的同步失配、链路失效的精确时刻的不确定性、从信道开始失效直到它完全失效的非零时间、传输的时戳的重复率、以有限数据速率发送时戳所需要的时间、随机误差和其他因子。本领域内技术人员将能够评价每个因子的相对效应并且不管怎样确定是否可以实现最终故障位点目标。
如在上文参考图1详述的,本发明的实施例不必依靠例如时戳或生成的时钟时间值(例如,124A-124B)等时间值,而相反可使用序列数(例如,125A-125B)。图3图示根据本发明的一个实施例在通信链路上用于定位故障位点的不同类型的序列值的传输。在这样的实施例中,数字的一个或多个序列在允许计算估计链路故障位点的网络元件110A-110B之间传输。本发明的实施例允许仅使用一个序列(例如如在图4的示例中描绘的长号(或环回)序列中)或在每个方向上使用截然不同的序列。这序列可以是简单的(例如,具有增加或减小1的值)或可以是复杂的(例如,伪随机序列)。在示例300中,网络元件‘B’110B传输第一严格单调递增序列302,而网络元件‘A’110A传输第二严格单调递增序列304。在示例310中,网络元件‘B’110B传输严格单调递减序列312,而网络元件‘A’110A传输伪随机二进制序列(PRBS)314。例如,示例320图示其中网络元件‘B’110B传输印时戳的分组322并且网络元件‘A’110A也传输印时戳的分组324(其可与其他印时戳分组322相同或不相同)的情形。根据实施例,印时戳分组的使用(如在示例320中)可以视为传输序列数并且使用序列数相关公式而不是基于时间值的公式。
在使用序列数的大部分实施例(例如在图3中描绘的那些)中,链路故障的估计物理位点可通过使用下列信息来确定:在网络元件‘A’110A确定出现链路故障之前由它接收的最后的有效序列数(“last_valid_A”),在故障确定的时候即将由网络元件‘A’110A传输的下一个序列数(“next_A”)、在网络元件‘B’110B确定出现链路故障之前由它接收的最后的有效序列数(“last_valid_B”)和在故障确定的时候即将由网络元件‘B’110B传输的下一个序列数(“next_B”)。这些序列值允许提供到链路故障的比例计算的第一计算(参见下文的“prop_fault_dist_from_A”和“prop_fault_dist_from_B”)。该比例距离然后通过使用与通信链路有关的额外信息而进一步能够变换成到链路故障的地理距离(参见下文的“geo_fault_dist_from_A”和“geo_fault_dist_from_B”),该额外信息包括但不限于通信链路的长度、链路的RTT、通信链路的传播速度等中的一个或多个。在一些实施例中,“next_A”和“next_B”的值不是下一个序列数,而是自故障确定的时间起传输的最后的序列数。在一个实施例中,使用下列方程:
如上文提到的,函数dist()是对于特定序列计算从一个序列数移到另一个序列数的序列步数量的函数的通用表示。从而,每个类型的序列(例如,302、304、312、314,等)将可能需要dist()的不同实现。例如,对于第一严格单调递增序列302(其中该序列是增加一的整数序列)的dist()可通过简单地进行两个自变数的简单扣除而找到-从值“3”移到值“1”需要两个序列步,这与3-1相同。然而,对于PRBS,dist()函数将采用本领域内技术人员已知的许多方式实现(例如逐步通过PRBS来查找序列数同时对中间值的数量计数),并且简单地需要返回根据该特定PRBS从一个序列数移到另一个序列数的序列步的数量。
在示例300中,last_valid_A的值是2,因为它是将有效地到达网络元件‘A’110A的第一序列302的最后的序列数。接着,next_A的值是59,因为在网络元件‘A’110A首先检测到序列数‘3’未正确到达时,网络元件‘A’110A即将将‘59’传输到网络元件‘B’110B。相似地,last_valid_B的值是54,因为它是将有效地到达网络元件‘B’110B的第二序列304的最后的序列数。next_B的值是9,因为在网络元件‘B’110B检测到它未接收序列数55时,它即将将序列数9作为第一序列302的部分传输到网络元件‘A’110A。
在该实施例中,dist()函数由于使用具有在每步增加一的整数的序列而用简单的扣除(dist(x,y)=x-y)来计算距离。因此,d1将等于7(因为9-2=7)并且d2的值将是5(因为59-54=5)。接着,可计算比例距离,并且prop_fault_dist_from_A=(5/(5+7))=5/12,其指示链路故障估计为近似在从网络元件‘A’110A到网络元件‘B’110B的5/12途中存在。相似地,prop_fault_dist_from_B=(7/(5+7))=7/12,其指示链路故障估计为近似在从网络元件‘B’110B到网络元件‘A’110A的7/12途中存在。最后,可标度这些比例距离以导致链路故障的地理位点。在该实施例中,标度使用链路长度出现:假设链路的长度(link_length)是100米,则geo_fault_dist_from_A=41.6米,并且geo_fault_dist_from_B=58.3米。
在示例310中,last_valid_B的值=12并且last_valid_A的值=8。同样,next_B的值=1,因为在网络元件‘B’110B确定出现失效的时刻,它即将将值‘1’作为严格单调递减序列312的部分传输。然而,因为由网络元件‘A’110A发送的失效检测业务120A是PRBS 314,我们将假设在PRBS中在‘52’后的三个序列步的序列数是‘18’,因此next_A=18。从而,随着对于d1的dist(x,y)函数限定为等于(y-x),d1将等于7。然而,对于d2的dist(x,y)不是简单的增加或扣除,并且相反返回在自变数值之间的序列步的数量。因此,为了找到dist(next_A, last_valid_B)或dist(18, 12),必须知道从15到18是PRBS 314的5个序列步,因此d2=5。使用这些值,结果与上文在300中的相同,其中链路长度是100米:geo_fault_dist_from_A=41.6米并且geo_fault_dist_from_B=58.3米。
在本发明的一些实施例中,PRBS 314的个体值分解成位部分并且被逐位传输。从而,尽管示例310的PRBS 314争取包括每个分组内的完整PRBS 314数,在某些实施例中,每个分组仅包括PRBS 314数的一个位。在这样的实施例中,每个网络元件110A-110B配置成使来自限定数量的连续分组/帧(例如,滑动窗口)的该“一个位”组合来形成PRBS数。
例如,考虑传输下列位的情形,每分组一个:P1=1,P2=0,P3=0,P4=1,P5=0,P6=1,P7=1,P8=0。假设4位PRBS序列,截至分组P4的滑动窗口序列数限定为从分组P1到P4或二进制1001b(其是9)的位。然后,截至分组P5的序列数限定为从分组P2至P5或二进制0100b(其是4)的位。该方法提供非常高效的方式来传递序列数,并且尽管连续数之间的距离的计算并不轻松,在软件中实现起来很简单。此外,这样的序列的生成对于本领域内技术人员是众所周知的。
在实施例中,PRBS使用PRBS模块(例如,135A、135B)的线性反馈移位寄存器(例如,138A、138B)或“LFSR”来生成,其中所谓的PRBS的阶是移位寄存器的长度。具有大小N的滑动窗口指由这样的发生器发出的N个最近位。这样的实施例的一个性质是如果滑动窗口具有与PRBS发生器的阶相同的大小,在发生器的一个循环期间滑动窗口的每个实例包含唯一并且因此明确的值。因此,假如PRBS的阶和它的位插入率足以跨越重复之前链路的传输延迟时间,PRBS值之间的距离可以是确定且明确的。
如上文提到的,320的示例包括第一序列的时戳322和第二序列的时戳324。在描绘的示例中,这两个序列是相同的,但在其他实施例中,序列不必相同。在描绘的示例中,每个网络元件(110A,110B)在特定时间间隔(“间隔”,在这里是“02”)传输序列的每个时戳。在该实施例中,除了任意两个时戳(即,dist(x, y))之间的距离设置为等于((x-y)/间隔)这一事实以外,计算与上文的相同。例如,为了使用next_B=“17”和last_valid_A=“03”来计算d1,我们从17扣除3并且除以间隔02来得到结果7。
关于这些公式的另外的细节将在图9、图10和图11中描绘的示例中呈现。
图4图示根据本发明的一个实施例在通信链路上长号(即,环回)序列值的传输。在图4中呈现的序列包括传输长号序列数402的集作为失效检测业务120A-120B的网络元件‘A’110A和网元件‘B’110B。在该示例中,因为在由网络元件‘B’110B接收序列数时,相同的序列数然后循环(或传输)回到网络元件‘B’110B,序列数被认为是“长号”。在图4的该示例中,网络元件‘A’110A即将从网络元件‘B’110B接收网络元件‘A’110A之前已经发送的序列数‘1’。之后不久,网络元件‘A’110A将从网络元件‘B’110A接收序列数‘2’。采用该方式,网络元件‘A’110A因为它知道它应接收什么值以及甚至它应接收每个值的近似时间而能够检测通信链路是否在没有业务更改故障的情况下工作。例如,因为序列数‘3’在线路上并且定位在链路故障128后面,该序列数将受到链路故障128的影响并且将未采用正确形式到达网络元件‘A’。那时,使网络元件‘A’110A能够检测到通信链路可能有问题。相似地,在网络元件‘B’110B未接收序列数‘9’,它通过了解传输序列或通过简单检测链路上的错误业务而也可以推断通信链路的可能失效。
图4的实施例可相似地使用如上文描述的对于d1、d2、prop_fault_dist_from_A、prop_fault_dist_from_B、geo_fault_dist_from_A和geo_fault_dist_from_A的“基于序列的”公式。从而,last_valid_B=8并且last_valid_A=2。相似地,next_A=3并且next_B=9。在具有长号值的该示例中,dist()函数通过取扣除两个值得结果的绝对值而实现:。因此,并且,正如来自图3的示例300、310和320中的一样。
图5图示根据本发明的一个实施例从每个网络元件的着眼点的图4的观察通信链路错误特性。图5包括图示从网络元件‘A’110A的角度(如在图4中描绘的)的接收错误率的第一曲线图500A,和图示从网络元件‘B’110B的角度的接收错误率的第二曲线图500B。如本领域内众所周知的,通信网络典型地对于传输业务观察到由于噪声、干扰、失真或位同步错误引起的错误率(例如,误码率)。从而,在典型的操作条件下,通常经历特定范围的通信错误百分比。当接收数据中的错误百分比超出限定范围(尤其持续一段持续时间)时,它可以是链路中的故障的指示。在某些实施例中,当链路故障影响业务开始到达网络元件时,错误率首先激增并且然后平稳(即,保持近似恒定)。
图5中的每个曲线图500A-500B包括指示时间的x轴和指示观察的错误数量的y轴。每个曲线图500A-500B还包括覆盖的接收分组序列数集,其指示接收对应序列数所在的曲线图中的近似时间点。
在第一曲线图500A中,在网络元件‘A’110A接收序列数‘1’和‘2’时,曲线图指示出现相对小数量的错误,数量上略微有变化。然而,在网络元件‘A’110A开始接收序列数‘3’时,曲线图突然激增并且快速增加。该错误水平在接收具有序列数‘3’、‘4’及以后的分组中自始至终保持为高的。在一些实施例中,一旦由曲线图指示的错误率增加到特定值(在链路故障影响的业务515开始的时候指示),故障确定为可能出现。在其他实施例中,一旦由曲线图指示的错误率上升到特定值以上并且持续某一限定时段地保持在该值以上,故障确定为可能出现。在该情况下,假设维持近期错误率,网络元件可以“回溯”并且识别链路故障影响业务515的开始。在实施例中,时戳在故障的第一指示处记录,并且关于故障是否出现的决议在稍后的时间通过使用滤波算法出现。尽管是从网络元件‘B’110B的角度来看,第二曲线图500B图示与第一曲线图500A相同的概念。在接收具有序列数‘6’、‘7’和‘8’的分组时,由曲线图指示的错误率在相对低错误率范围内变化。然而,在意在包括序列数‘9’的分组到达时,由曲线图指示的错误率突然激增并且快速增加到高范围值,其保持在链路故障影响业务525的开始时的比率之上。
在图4的配置的某些实施例中,每个网络元件(110A-110B)将形成链路失效指示(122A-122B),其包含代表网络元件检测到链路故障(而不是报告序列号)的时间的时间值(124A-124B)。链路故障定位模块136将使用这些时间值来形成时间值之间的时间距离并且然后进行标度来确定地理链路故障位点128。
图6图示根据本发明的一个实施例使用已知序列和分组内错误位点来定位链路故障。尽管之前的示例图示使用序列数或时戳,描绘的图6的示例既可使用已知序列又可使用时间值或时戳。图6的分组600A-600B包括这样的位模式,其允许在子分组级检测链路故障,例如在使用8b/10b线路编码或FEC块差错的系统中检测码字违反。在该描绘的示例中,模式是‘1’和‘0’的简单重复。在接收错误(即,违反模式)的配置数量的位时,接收网络元件可生成时间值以在计算估计故障位点中使用。备选地,接收网络元件可使用来自包含错误位的分组内的时戳,并且基于该分组内的第一错误位的位点来调整该时戳。该调整的时戳然后可用于计算估计故障位点。
从而,传输的分组600A(如由网络元件‘B’110B放置在线路上)包括第一分组601A、第二分组602A、第三分组603A和第四分组604A。这些分组601A-604A中的每个包括相同的重复位模式,其在这里图示为‘10101010’。然而,尽管在线路上,链路故障128在传输的第二分组602A处于故障点时出现。
图示的底部部分描绘作为接收分组600B从网络元件‘A’110A的传输分组600A的角度。尽管接收的第一分组601B与传输的第一分组601A相同,接收的第二分组602B由于链路故障而与传输的第二分组602A不一样。在该示例中,链路故障促使所有分组只显示为‘1’。从而,以接收的第二分组602B的第三个位开始,所有后续位是‘1’。因此,接收的第三分组603B和接收的第四分组604B两者都包括只是‘1’位的位模式。
在实施例中,网络元件‘A’110A因为尽管接收的第二分组602B应是‘0’但相反它作为‘1’到达而将检测到它的第四个位的错误。这被认为是第一错误位点604。在实施例中,网络元件‘A’110A配置成检查一系列位来找错误并且如果特定数量的这些位出错则确定出现链路故障。例如,在描绘的图6的实施例中,错误指示范围606可以是四个连续位的集,并且如果找到两个错误,确定出现链路故障。在该描绘的情形中,错误指示范围606应是‘0101’但相反作为‘1111’到达,因此确定出现故障。因此,在一些实施例中,网络元件‘A’110A使用与第二接收分组602B的第一错误位点604的接收关联的时间值作为链路故障的首次发现的时间值,但在其他实施例中,它使用它检测到指示错误的错误指示范围606的时间的时间值。
图7图示根据本发明的一个实施例使用已知序列和错误位流位点来定位链路故障。该实施例与在图6中图示的实施例相似,因为两者都使用‘10’模式,所不同的是图7的实施例未使用独立分组而相反传输模式的位流702A。图的顶部部分描绘从网络元件‘B’110B的角度的传输位流透视700A,其包括重复‘10’位的传输位流702A模式。图的底部部分描绘从网络元件‘A’110A的角度的接收位流透视700B,其包括接收位流702B(其包括由于链路故障128引起的连续‘1’位的集)。网络元件‘A’110A首先在包含‘1’的第一错误位点704(在这里它根据模式应包含‘0’)处观察到位错误。在实施例中,网络元件‘A’110A在特定错误指示范围706(例如,十六个位)内继续寻找特定数量的位错误(例如,六个位错误)。在该情形中,因为相反所有预期‘0’位作为‘1’位被接收,在该十六个位错误指示范围706内存在八个位错误,因此确定链路故障。在实施例中,网络元件‘A’110A报告在指示第一错误位点作为时间值124A到达的时刻的链路失效指示中的时间值(即使网络元件截至该时刻不能确定出现链路故障也如此);在其他实施例中,网络元件‘A’110A报告在指示错误指示范围706确定为具有必需数量的错误时的点并且从而指示链路故障的链路失效指示中的时间值。
要理解尽管图6和图7(如图示的)包括从网络元件‘B’110B传输到网络元件‘A’110A的数据,在一些实施例中,相似的数据(即,遵循模式的数据)也要从网络元件‘A’110A传输到网络元件‘B’110B。在一些实施例中,在两个传输方向上使用相同模式;然而在其他实施例中,每个模式可不同。
图8图示根据本发明的一个实施例随时间的链路故障的序列值的传输和接收。图示800A描绘从网络元件‘B’110B传输到网络元件‘A’110A的序列,其每次包括通信链路上的四个分组,它们散布在四个链路部分802上。图示800B描绘从网络元件‘A’110A传输到网络元件‘B’110B的不同序列,其每次也包括通信链路上的四个分组,它们相似地散布在四个链路部分802上。在本发明的实施例中,两个序列都在通信链路的双向信道上传输;在其他实施例中,序列在通信链路的两个独立信道上传输。在两个图示800A-800B中,链路故障在时间‘T5’在第四链路部分中的某处出现。因为第四链路部分更接近网络元件‘B’110B,则网络元件‘B’110B将在时间‘T6’接收无效分组,并且可在接收该无效分组时传输825具有时间值‘T6’的链路失效指示。
网络元件‘A’110A最终在时间‘T9’检测到链路失效,这时标记为‘N’的无效分组到达。那时,网络元件‘A’传输820链路失效指示,其包括时间值‘T9’。当然,在其他实施例中,网络元件110A-110B相反都传输一个或多个序列数而不是时间值。链路失效指示然后由链路失效定位模块136用于计算故障的估计物理位点,如在本文在别处描述的。
图9、图10和图11一起最好理解为每个图示本发明的实施例的操作中的不同时间点。图9图示使用两个不同序列数集作为链路故障出现的时间点的失效检测业务的本发明的实施例。在该实施例中,网络元件‘A’110A传输失效检测业务120B,其包括序列x、-x、x+1、-(x+1)、x+2、-(x+2)等的序列数。另一方面,网络元件‘B’110B传输失效检测业务120A,其包括序列x、x+1、x+2、x+3的序列数。每个网络元件110A-110B跟踪最后的接收序列数907A-907B、最后的接收有效序列数906A-906B和要传输的下一个序列数905A-905B。
在描绘的时间点,出现链路故障128并且其将破坏尚未越过链路故障位点128的链路上的数据中的一些。尽管网络元件‘B’110B将适当接收具有序列值‘-4’的分组作为最后的非错误分组909B,它然后将接收意在包括序列值‘5’的第一错误分组911B。相似地,网络元件‘A’110A将接收具有序列值‘18’的分组作为最后的非错误分组909A,但它然后将接收意在包括序列值‘19’的第一错误分组911A。那时,链路故障定位模块136(这里未描绘)将计算由确定的链路故障长度‘A’915A和链路故障长度‘B’915B中的一个或多个表示的链路故障的估计位点,或基于确定的链路故障长度‘A’915A和链路故障长度‘B’915B中的一个或多个来计算链路故障的估计位点。
图10图示在网络元件‘A’110A检测到链路故障时图9的实施例。这时,接收907A第一错误分组911A的序列数‘19’,并且分组确定为无效的。在该实施例中,这触发网络元件‘A’110A确定出现链路故障。作为响应,网络元件‘A’110A将链路失效指示122A传输到管理模块132,该链路失效指示122A包括两个序列数125A:最后的非错误接收分组906A的序列数(‘18’)以及要在确定链路故障时传输905A的下一个序列数(‘9’)。该链路失效指示122A由管理模块132存储在链路失效指示139存储位点内。
图11图示在网络元件‘B’110B检测到链路故障时图9的实施例。在网络元件‘A’110A检测到链路故障(如在图10中图示的)之后的时间点,网络元件‘B’110B将在第一错误分组911B(具有序列数‘5’)到达时检测到链路失效。在该实施例中,这触发网络元件‘B’110B确定出现链路故障。作为响应,网络元件‘B’110B将链路失效指示122B传输到管理模块132,该链路失效指示122B包括两个序列数125B:最后的非错误接收分组906B的序列数(‘-4’)以及要在确定链路故障时传输905B的下一个序列数(‘29’)。该链路失效指示122B由管理模块132存储在链路失效指示139存储位点内。
从网络元件110A-110B中的每个接收链路失效指示122A-122B后,管理模块132通过进行链路失效计算1115来确定链路故障137的计算估计物理位点。在描绘的实施例中,管理模块132使用这样的过程,其采用在上文呈现的对于d1、d2、prop_fault_dist_from_A、prop_fault_dist_from_B、geo_fault_dist_from_A和geo_fault_dist_from_B的公式的微小变化。
在1115A处,管理模块132确定与来自失效检测业务120A(其由网络元件‘B’110B发送)的值有关的序列距离。因为该序列是x、x+1、x+2等,18与29之间的距离可以通过扣除(即,dist(x,y)实现为等于,其是11(即‘d1’))而确定。在1115B处,管理模块132确定与来自失效检测业务120B(其由网络元件‘A’110A发送)的值有关的序列距离。因为该序列是x、-x、x+1、-(x+1)等,9与-4之间的距离是9(即‘d2’)。
如本文早先描述的,管理模块132可通过首先确定比例故障距离(或故障率)并且然后在地理上标度比例来找到物理故障距离而计算链路故障距离。在1115C中,管理模块132确定故障率以供在计算离网络元件‘A’110A的故障距离中使用,该故障率等于(d2/(d1+d2))或(9/(9+11))=0.45。该值指示失效在从网络元件‘A’110A到网络元件‘B’110B的45%途中。在515D处,管理模块132使该值(0.45)乘以链路长度来产生这样的结果,其指示远离网络元件‘A’110A(其中估计存在链路故障)的单位(例如,米、千米、码、英尺、英里等)数量。
备选地,管理模块132可进行相同的计算来计算故障相对于网络元件‘B’110B的估计物理位点。在1115E处,计算故障率,其等于(d1/(d1+d2))或(11/(9+11))=0.55。该值指示失效在从网络元件‘B’110B到网络元件‘A’110A的55%途中。在1115F处,该故障率乘以链路长度来产生最后结果:指示远离网络元件‘B’110B(其中估计存在链路故障)的单位数量。
在一些实施例中,链路故障定位模块136进一步使用计算的故障率和从故障到链路中点129或网络元件110A-110B中的一个的计算距离中的一个或多个来使得故障的计算估计物理位点成为地理位点。例如,链路故障定位模块可使用地理数据(例如由地理信息系统(GIS)或电缆路由的计算机化地图等提供的)来识别故障定位所在的地理位点(例如,纬度、经度、城市、街道名称、街道交口、建筑名称、地图上的位点等中的一个或多个)。该地理位点可作为图解地图或文本指示通过用户设备装置的显示器呈现给用户。
图12图示根据本发明的一个实施例用于通过使用基于序列的信息来确定物理通信链路中的故障的估计物理位点的流程。在1202处,网络元件从第一网络元件接收第一链路失效指示。该第一链路失效指示包括来自第一多个位的第一序列数,该第一多个位由第一网络元件在物理通信链路上从第二网络元件接收。该第一序列数属于第一序列。第一链路失效指示还包括第二序列数,其截至第一网络元件检测到出现故障的时间作为第二多个位的部分由第一网络元件在物理通信链路上恰好传输或即将传输到第二网络元件。该第二序列数属于第二序列。
在1204处,网络元件基于第一序列数、第二序列数、第三序列数和第四序列数计算故障的估计物理位点。第三序列数(其属于第二序列)来自由第二网络元件在物理通信链路上从第一网络元件接收的第二多个位。第四序列数(其属于第一序列)截至第二网络元件检测到出现故障的时间作为第一多个位的部分由第二网络元件在物理通信链路上恰好传输或即将传输到第一网络元件。
在实施例中,计算1204牵涉确定第一与第四序列数之间的第一序列距离和确定第二与第三序列数之间的第二序列距离1206。每个序列距离代表在特定序列中的两个序列数之间移动所需要的步骤数量。在实施例中,计算1204进一步牵涉基于第一和第二序列距离计算故障率,以及然后使用代表物理通信链路的特性的值来标度故障率1208。在一些实施例中,该值是物理通信链路的传播速度、物理通信链路的物理长度和物理通信链路的传播延迟中的一个。
在实施例中,第一、第二、第三和第四多个位中的每个是分组。然而,在其他实施例中,这些是帧(例如,同步数字系列(SDH)帧、OTN帧)或位流的部分。在其他实施例中,这些多个位取自线路码符号的部分,例如在序列数通过线路码符号内的专用位交错(或许每次一个位(或以两个或以上位的组))到业务内的时候。在其他实施例中,多个位取自-每次一个或多个-前向纠错(FEC)码字。
在某些实施例中,网络元件通过确定(1)第一序列数与第四序列数之间的第一序列距离和(2)第二序列数与第三序列数之间的第二序列距离来计算故障的估计物理位点。在使用某些序列的某些实施例中,序列距离可以通过简单地从序列数中的一个扣除另一个而确定。
在某些实施例中,网络元件基于第一序列距离和第二序列距离计算故障率。该故障率指示远离故障定位所在的第一或第二网络元件中的一个的链路的百分比。在某些实施例中,网络元件通过使该故障率乘以物理通信链路的长度来产生远离故障定位所在的第一或第二网络元件中的一个的距离(采用特定测量单位)而标度故障率。在其他实施例中,故障率使用代表物理通信链路的特性的某一其他值来标度,其包括但不限于链路的距离、链路的传播速度和链路的传播延迟中的一个或多个。
在各种实施例中,在失效检测业务120A和失效检测业务120B内使用的序列属于一个序列或属于独立序列。此外,序列可具有相似的类型或具有不同的类型(严格单调递增整数序列、严格单调递减整数序列、伪随机二进制序列、其他模式,等)。
在一些实施例中,通信链路是光链路。在这些实施例中的一些中,第一和第二网络元件都是波长选择开关并且信道是带外操作、实施和管理(OAM)信道。在使用无源光网络(PON)的其他实施例中,第一网络元件是光线路终端(OLT)并且第二网络元件是光网络单元(ONU)。PON可使用多个光网络单元(ONU)的时分复用,其中每个ONU根据它分配的上游传输时间生成时戳或序列数。在其他实施例中,网络元件是路由器、交换机、网桥、光传输网络(OTN)交换机等。在一些实施例中,信道是带内,这意指故障检测业务与数据并排发送。
在使用图12的流程的一些实施例中,执行流程的网络元件是第二网络元件。然而,在一些其他实施例中,执行流程的网络元件既不是第一网络元件也不是第二网络元件。
图13图示根据本发明的一个实施例用于通过使用基于时间的信息来确定物理通信链路中的故障的估计物理位点的流程。在1302处,网络元件从第一网络元件接收第一链路失效指示。该第一链路失效指示包括第一时间值,其由第一网络元件生成或由第一网络元件在物理通信链路上从第二网络元件接收。在1304处,网络元件确定接收第一链路失效的第一时间值与第二时间值之间的时间距离。该第二时间距离由第二网络元件生成,或由第二网络元件在物理通信链路上从第一网络元件接收。在1306处,网络元件基于确定的时间值计算故障的估计物理位点。在实施例中,该计算进一步基于通信链路的长度、通信链路的传播速度和通信链路的传播延迟中的一个或多个。
在某些实施例中,第一时间值指示第一网络元件何时检测到出现故障并且第二时间值指示第二网络元件何时检测到出现故障。通过第一和第二网络元件中的每个的该检测可在该网络元件在物理通信链路的信道上接收包含错误数据(即,定位在分组中的任何地方的错误位)的一个或多个分组时出现。第一和第二时间值可取自在信道上传输的分组,或可分别由第一和第二网络元件生成。
在某些实施例中,第一和第二网络元件两者都使用网络时间协议(NTP)来使它们的相应时钟保持同步,从而使它们生成的任何时间值能够在共同参考帧中同步。在其他实施例中,网络元件配置成将第一和第二网络元件放置到共同参考帧内。
尽管图中的流程图示出由本发明的某些实施例执行的操作的特定顺序,应理解这样的顺序是示范性的(例如,备选实施例可按不同顺序执行操作、使某些操作组合、与某些操作重叠,等)。另外,尽管本发明已经从若干实施例方面描述,本领域内技术人员将认识到本发明不限于描述的实施例,可以在附上的权利要求的精神和范围内带有修改和更改地实践。描述从而视为说明性而非限制性的。
Claims (27)
1. 一种用于确定在由第一网络元件(XA10A)和第二网络元件(XA10B)使用的物理通信链路(XA18)中的故障(XA28)的估计物理位点的方法,所述方法包括:
从所述第一网络元件(XA10A)接收第一链路失效指示(XA22A),其中所述第一链路失效指示(XA22A)包括:
第一序列数(XJ06A),其来自由所述第一网络元件(XA10A)在所述物理通信链路(XA18)上从所述第二网络元件(XA10B)接收的第一多个位,其中所述第一序列数(XJ06A)属于第一序列(XG02),和
第二序列数(XJ05A),其截至所述第一网络元件(XA10A)检测到出现故障的时间作为第二多个位的部分由所述第一网络元件(XA10A)在所述物理通信链路(XA18)上恰好传输或即将传输到所述第二网络元件(XA10B),其中所述第二序列数(XJ05A)属于第二序列(XG04);以及
基于所述第一序列数(XA06A)、所述第二序列数(XJ05A)、第三序列数(XJ06B)和第四序列数(XJ05B)计算所述故障(XA28)的估计物理位点,
其中所述第三序列数(XJ06B)属于所述第二序列(XG04)并且来自由所述第二网络元件(XA10B)在所述物理通信链路(XA18)上从所述第一网络元件(XA10A)接收的第二多个位,并且
其中所述第四序列数(XJ05B)属于所述第一序列(XG02)并且截至所述第二网络元件(XA10B)检测到出现故障的时间作为所述第一多个位的部分由所述第二网络元件(XA10B)在所述物理通信链路(XA18)上恰好传输或即将传输到所述第一网络元件(XA10A)。
2. 如权利要求1所述的方法,其中所述第一序列(XG02)和所述第二序列(XG04)中的一个或两个是伪随机二进制序列(PRBS)。
3. 如权利要求2所述的方法,其中生成所述PRBS使得所述PRBS的每个序列数是位的滑动窗口的值,其中选择所述滑动窗口的大小来形成明确序列数。
4. 如权利要求3所述的方法,其中所述PRBS由线性反馈移位寄存器(LFSR)(XA38A)生成。
5. 如权利要求3所述的方法,其中所述PRBS的每个序列数通过使多个位组交错到在所述通信链路上传输的业务内而传输,其中所述多个位组中的每个位组包括代表所述序列数的一部分的一个或多个位。
6. 如权利要求5所述的方法,其中所述多个位组中的每个位组使用以下中的一个来交错:
线路码符号,其包括专用于交错序列数位的一个或多个位位点;以及
前向纠错(FEC)码字,其包括专用于交错序列数位的一个或多个位位点。
7. 如权利要求1所述的方法,其中所述计算包括:
确定所述第一序列数(XJ06A)与所述第四序列数(XJ05B)之间的第一序列距离(XN15A);以及
确定所述第二序列数(XJ05A)与所述第三序列数(XA06B)之间的第二序列距离(XN15B)。
8. 如权利要求7所述的方法,其中所述计算进一步基于:
基于所述第一序列距离(XN15A)和所述第二序列距离(XN15A)计算故障率(XN15C);以及
使用代表所述物理通信链路(XA18)的特性的值来标度所述故障率(XN15C)。
9. 如权利要求8所述的方法,其中所述物理通信链路(XA18)的特性是以下中的一个或多个:
所述物理通信链路(XA18)的传播速度;
所述物理通信链路(XA18)的长度(XA50);以及
所述物理通信链路(XA18)的传播延迟。
10. 如权利要求1所述的方法,其中:
所述物理通信链路(XA18)是光链路;并且
所述第一、第二、第三和第四序列数在所述物理通信链路(XA18)的带外操作、实施和管理(OAM)信道(XA19A)上传输。
11. 一种第一网络元件(XA10A),用于确定要由所述第一网络元件(XA10A)和第二网络元件(XA10B)使用的物理通信链路(XA18)中的故障(XA28)的估计物理位点,所述第一网络元件(XA10A)包括:
一个或多个物理网络接口(XA15A)的集,其配置成:
在所述物理通信链路(XA18)上将第一多个位(XA20A)传输到所述第二网络元件(XA10B),所述第一多个位(XA20A)包括属于第一序列(XG02)的多个序列数;
在所述物理通信链路(XA18)上从所述第二网络元件(XA10B)接收第二多个位(XA20B),所述第二多个位(XA20B)包括属于第二序列(XG04)的多个序列数;以及
从所述第二网络元件(XA10B)接收第一链路失效指示(XA22B),所述第一链路失效指示包括:
第一序列数(XJ06B),其来自由所述第二网络元件(XA10B)在所述物理通信链路(XA18)上接收的第一多个位(XA20A),其中所述第一序列数(XJ06B)属于所述第一序列(XG02),以及
所述第二序列(XG04)的第二序列数(XJ05B),其截至所述第二网络元件(XA10B)检测到出现故障的时间作为所述第二多个位(XA20B)的部分由所述第二网络元件(XA10B)在所述物理通信链路(XA18)上恰好传输或即将传输到所述第一网络元件(XA10A);
链路故障检测模块(XA34),其配置成:
检测出现所述物理通信链路(XA18)的故障,以及
响应于所述检测,生成第二链路失效指示(XA22C),所述第二链路失效指示包括:
第三序列数(XJ06A),其来自所述第二多个位(XA20B)、属于所述第二序列(XG04),和
所述第一序列(XG02)的第四序列数(XJ05A),其截至通过所述链路故障检测模块(XA34)对出现故障的所述检测的时间作为所述第一多个位(XA20A)的部分由所述第一网络元件(XA10A)在所述物理通信链路(XA18)上恰好传输或即将传输到所述第二网络元件(XA10B);以及
链路故障定位模块(XA36),其配置成基于所述第一序列数、所述第二序列数、所述第三序列数和所述第四序列数计算所述故障(XA28)的估计物理位点。
12. 如权利要求11所述的第一网络元件(XA10A),其中所述第一序列(XG02)和所述第二序列(XG04)中的一个或两个是伪随机二进制序列(PRBS)。
13. 如权利要求12所述的第一网络元件,其中生成所述PRBS使得所述PRBS的每个序列数是位的滑动窗口的值,其中选择所述滑动窗口的大小来形成明确序列数。
14. 如权利要求13所述的第一网络元件,其进一步包括配置成生成所述PRBS的线性反馈移位寄存器(LFSR)(XA38A)。
15. 如权利要求13所述的第一网络元件(XA10A),其中所述物理网络接口(XA15A)的集配置成通过使多个位组交错到在所述物理通信链路(XA18)上传输的业务内而传输所述PRBS的每个序列数,其中所述多个位组中的每个位组包括代表所述序列数的一部分的一个或多个位。
16. 如权利要求15所述的第一网络元件(XA10A),其中所述多个位组中的每个位组使用以下中的一个来交错:
线路码符号,其包括专用于交错序列数位的一个或多个位位点;以及
前向纠错(FEC)码字,其包括专用于交错序列数位的一个或多个位位点。
17. 如权利要求11所述的第一网络元件(XA10A),其中所述链路故障定位模块(XA36)通过配置成以下来计算所述故障(XA28)的估计物理位点:
确定所述第一序列数(XJ06B)与所述第四序列数(XJ05A)之间的第一序列距离(XN15A);以及
确定所述第二序列数(XJ06A)与所述第三序列数(XJ05B)之间的第二序列距离(XN15A)。
18. 如权利要求17所述的第一网络元件(XA10A),其中所述链路故障定位模块(XA36)通过进一步配置成以下来计算所述故障(XA28)的估计物理位点:
基于所述第一序列距离(XN15A)和所述第二序列距离(XN15A)计算故障率(XN15C);以及
使用代表所述物理通信链路(XA18)的特性的值来标度所述故障率(XN15C)。
19. 如权利要求11所述的第一网络元件(XA10A),其中:
所述物理通信链路(XA18)是光链路;并且
所述第一、第二、第三和第四序列数在所述物理通信链路(XA18)的带外操作、实施和管理(OAM)信道(XA19A)上传输。
20. 一种设备,用于确定要由第一网络元件(XA10A)和第二网络元件(XA10B)使用的物理通信链路(XA18)中的故障(XA28)的估计物理位点,所述设备包括:
一个或多个物理网络接口(XA15C)的集,其配置成:
从所述第一网络元件(XA10A)接收第一链路失效指示(XA22A),其包括:
第一序列数(XJ06A),其来自由所述第一网络元件(XA10A)在所述物理通信链路(XA18)上从所述第二网络元件(XA10B)接收的第一多个位(XA20A),其中所述第一序列数(XJ06A)属于第一序列(XG02),以及
第二序列(XG04)的第二序列数(XJ05A),其截至所述第一网络元件(XA10A)检测到出现故障的时间作为第二多个位的部分由所述第一网络元件(XA10A)在所述物理通信链路(XA18)上恰好传输或即将传输到所述第二网络元件(XA10B),以及
从所述第二网络元件(XA10B)接收第二链路失效指示(XA22B),其包括:
第三序列数(XJ06B),其来自由所述第二网络元件(XA10B)在所述物理通信链路(XA18)上接收的第二多个位(XA20B),其中所述第三序列数属于所述第二序列(XG04),以及
所述第一序列(XG02)的第四序列数(XJ05B),其截至所述第二网络元件(XA10B)检测到出现故障的时间作为所述第一多个位的部分由所述第二网络元件(XA10B)在所述物理通信链路(XA18)上恰好传输或即将传输到所述第一网络元件(XA10A);以及
链路故障定位模块(XA36),其配置成基于所述第一序列数(XA06A)、第二序列数(XA05A)、第三序列数(XA06B)和第四序列数(XA05B)计算所述故障(XA28)的估计物理位点。
21. 如权利要求20所述的设备,其中所述第一序列(XG02)和所述第二序列(XG04)中的一个或两个是伪随机二进制序列(PRBS)。
22. 如权利要求20所述的设备,其中所述第一、第二、第三和第四序列数中的每个序列数通过使多个位组交错到在所述通信链路(XA18)上传输的业务内而传输,其中对于所述序列数的所述多个位组中的每个位组包括代表所述序列数的一部分的一个或多个位。
23. 如权利要求22所述的设备,其中所述多个位组中的每个位组使用以下中的一个来交错:
线路码符号,其包括专用于交错序列数位的一个或多个位位点;以及
前向纠错(FEC)码字,其包括专用于交错序列数位的一个或多个位位点。
24. 如权利要求20所述的设备,其中所述链路故障定位模块(XA36)通过配置成以下来计算所述故障(XA28)的估计物理位点:
确定所述第一序列数(XJ06A)与所述第四序列数(XJ05B)之间的第一序列距离(XN15A);以及
确定所述第二序列数(XJ05A)与所述第三序列数(XJ06B)之间的第二序列距离(XN15A)。
25. 如权利要求24所述的设备,其中所述链路故障定位模块(XA36)通过进一步配置成以下来计算所述故障(XA28)的估计物理位点:
基于所述第一序列距离(XN15A)和所述第二序列距离(XN15A)计算故障率(XN15C);以及
使用代表所述物理通信链路(XA18)的特性的值来标度所述故障率(XN15C)。
26. 一种由服务器终端站执行以用于确定由第一光开关(XA10A)和第二光开关(XA10B)使用的光链路(XA18)中的故障(XA28)的估计物理位点的方法,所述方法包括:
从所述第一光开关(XA10A)接收第一链路失效指示(XA22A),其中所述第一链路失效指示(XA22A)包括:
第一序列数(XJ06A),其来自在所述光链路(XA18)上从所述第二光开关(XA10B)接收的第一多个位(XA20A),以及
第二序列数(XJ05A),其截至所述第一光开关(XA10A)检测到出现故障的时间作为第二多个位的部分由所述第一光开关(XA10A)在所述光链路(XA18)上恰好传输或即将传输到所述第二光开关(XA10B),以及
基于所述第一序列数(XJ06A)、所述第二序列数(XA05A)、第三序列数(XJ06B)和第四序列数(XJ05B)通过以下来计算所述故障(XA28)的估计物理位点:
确定所述第一序列数(XA06A)与所述第四序列数(XA05B)之间的第一距离;
确定所述第二序列数(XA05A)与所述第三序列数(XJ06B)之间的第二距离,以及
基于所述第一距离和所述第二距离确定所述故障的估计物理位点,
其中所述第三序列数(XJ06B)来自由所述第二光开关(XA10B)在所述光链路(XA18)上从所述第一光开关(XA10A)接收的第二多个位,并且
其中所述第四序列数(XJ05B)截至所述第二光开关(XA10B)检测到出现故障的时间作为所述第一多个位的部分由所述第二光开关(XA10B)在所述光链路(XA18)上恰好传输或即将传输到所述第一光开关(XA10A)。
27. 一种服务器终端站,用于确定由第一光开关(XA10A)和第二光开关(XA10B)使用的光链路(XA18)中的故障(XA28)的估计物理位点,所述服务器终端站包括:
一个或多个物理网络端口(XA15C)的集,其配置成:
从所述第一光开关(XA10A)接收第一链路失效指示(XA22A),其包括:
第一序列数(XJ06A),其来自由所述第一光开关(XA10A)在所述光链路(XA18)上从所述第二光开关(XA10B)接收的第一多个位(XA20A),其中所述第一序列数(XJ06A)属于第一序列(XG02),以及
第二序列(XG04)的第二序列数(XJ05A),其截至所述第一光开关(XA10A)检测到出现故障的时间作为第二多个位的部分由所述第一光开关(XA10A)在所述光链路(XA18)上恰好传输或即将传输到所述第二光开关(XA10B),以及
从所述第二光开关(XA10B)接收第二链路失效指示(XA22B),其包括:
第三序列数(XJ06B),其来自由所述第二光开关(XA10B)在所述光链路(XA18)上接收的第二多个位,其中所述第三序列数属于所述第二序列(XG04),以及
所述第一序列(XG02)的第四序列数(XJ05B),其截至所述第二光开关(XA10B)检测到出现故障的时间作为所述第一多个位的部分由所述第二光开关(XA10B)在所述光链路(XA18)上恰好传输或即将传输到所述第一光开关(XA10A);以及
链路故障定位模块(XA36),其配置成基于所述第一序列数(XJ06A)、第二序列数(XJ05A)、第三序列数(XJ06B)和第四序列数(XJ05B)通过以下来计算所述故障(XA28)的估计物理位点:
确定所述第一序列数(XA06A)与所述第四序列数(XA05B)之间的第一距离;以及
确定所述第二序列数(XA05A)与所述第三序列数(XJ06B)之间的第二距离,以及
基于所述第一距离和所述第二距离确定所述故障的估计物理位点。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/677,263 US9002197B2 (en) | 2012-11-14 | 2012-11-14 | Sequence-based link fault localization |
US13/677263 | 2012-11-14 | ||
PCT/IB2013/059586 WO2014076595A1 (en) | 2012-11-14 | 2013-10-23 | Sequence-based link fault localization |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104797947A true CN104797947A (zh) | 2015-07-22 |
Family
ID=50001037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380059573.5A Pending CN104797947A (zh) | 2012-11-14 | 2013-10-23 | 基于序列的链路故障定位 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9002197B2 (zh) |
EP (1) | EP2920598A1 (zh) |
CN (1) | CN104797947A (zh) |
WO (1) | WO2014076595A1 (zh) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9680567B2 (en) * | 2011-03-03 | 2017-06-13 | Acacia Communications, Inc. | Fault localization and fiber security in optical transponders |
US8948587B2 (en) * | 2012-06-27 | 2015-02-03 | Centurylink Intellectual Property Llc | Use of dying gasp to locate faults in communications networks |
CN103973496B (zh) * | 2014-05-21 | 2017-10-17 | 华为技术有限公司 | 故障诊断方法及装置 |
CN104796192B (zh) * | 2014-08-06 | 2018-01-16 | 深圳市亚光通信有限公司 | 一种智能实时多路光纤监测系统和方法 |
US9547570B2 (en) * | 2015-01-29 | 2017-01-17 | Huawei Technologies Co., Ltd. | Devices, systems and methods for debugging network connectivity |
US9806801B2 (en) * | 2015-11-03 | 2017-10-31 | Ciena Corporation | In-service optical fault isolation systems and methods |
DE102015121940A1 (de) * | 2015-12-16 | 2017-06-22 | Intel IP Corporation | Eine Schaltung und ein Verfahren zum Anhängen eines Zeitstempels an eine Tracenachricht |
CN107509213B (zh) * | 2016-06-14 | 2020-11-17 | 中国联合网络通信集团有限公司 | 通讯网络故障网元定位的方法及系统 |
EP3577799B1 (en) * | 2017-02-01 | 2023-08-30 | British Telecommunications public limited company | Optical fibre event location |
EP3655746A1 (en) | 2017-07-20 | 2020-05-27 | British Telecommunications Public Limited Company | Optical fibre |
CN110971436B (zh) * | 2018-09-30 | 2023-04-07 | 阿里巴巴集团控股有限公司 | 业务处理方法、装置及电子设备 |
US11140063B2 (en) * | 2019-02-25 | 2021-10-05 | Adtran, Inc. | Dynamic subscriber network physical impairment detection techniques |
US11025502B2 (en) * | 2019-10-09 | 2021-06-01 | Verizon Patent And Licensing Inc. | Systems and methods for using machine learning techniques to remediate network conditions |
US11936423B2 (en) * | 2020-02-19 | 2024-03-19 | Nec Corporation | Fault detection apparatus, fault detection method, and submarine cable system |
US11176026B2 (en) | 2020-02-20 | 2021-11-16 | International Business Machines Corporation | Assignment of test case priorities based on combinatorial test design model analysis |
US11307975B2 (en) | 2020-02-20 | 2022-04-19 | International Business Machines Corporation | Machine code analysis for identifying software defects |
US11086768B1 (en) | 2020-02-20 | 2021-08-10 | International Business Machines Corporation | Identifying false positives in test case failures using combinatorics |
US11663113B2 (en) | 2020-02-20 | 2023-05-30 | International Business Machines Corporation | Real time fault localization using combinatorial test design techniques and test case priority selection |
US11101884B1 (en) | 2020-03-24 | 2021-08-24 | Ciena Corporation | Localizing anomalies of a fiber optic network within the context of a geographic map |
US12119880B2 (en) | 2020-08-10 | 2024-10-15 | Nokia Solutions And Networks Oy | Rapid polarization tracking in an optical channel |
CN112202492B (zh) * | 2020-09-01 | 2021-10-01 | 中国移动通信集团广东有限公司 | 一种光缆故障定位方法、装置及电子设备 |
US11650340B2 (en) | 2020-12-01 | 2023-05-16 | Nokia Solutions And Networks Oy | Detection of seismic disturbances using optical fibers |
US20220286201A1 (en) * | 2021-03-04 | 2022-09-08 | Nokia Solutions And Networks Oy | Detection of ambient disturbances using dispersive delays in optical fibers |
WO2023004492A1 (en) * | 2021-07-26 | 2023-02-02 | Atvent Solutions Inc. | Fault location in an optical fiber network |
CN113890184B (zh) * | 2021-08-27 | 2024-08-09 | 北京四方继保工程技术有限公司 | 一种利用增加监视信息实现纵差通道故障定位的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6954882B2 (en) * | 2001-06-15 | 2005-10-11 | International Business Machines Corporation | Method and apparatus for fault location in a loop network |
KR20060053679A (ko) * | 2004-11-17 | 2006-05-22 | 엘지전자 주식회사 | 망관리 시스템에서의 랜 단절시 데이터 복원 장치 및 그방법 |
US20080232795A1 (en) * | 2007-03-21 | 2008-09-25 | Adva Ag Optical Networking | Method And System For Localizing An Attenuation Change Location In An Optical Waveguide |
CN101815004A (zh) * | 2010-03-03 | 2010-08-25 | 烽火通信科技股份有限公司 | 无源光网络的设备业务配置方法 |
CN102331548A (zh) * | 2011-05-31 | 2012-01-25 | 重庆大学 | 一种配网电缆单相接地故障的故障定位方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6715354B2 (en) | 1998-02-24 | 2004-04-06 | Massachusetts Institute Of Technology | Flaw detection system using acoustic doppler effect |
TW526335B (en) | 1998-11-12 | 2003-04-01 | Nippon Kouatsu Electric Co Ltd | Fault point location system |
US6442708B1 (en) * | 1999-12-14 | 2002-08-27 | Honeywell International Inc. | Fault localization and health indication for a controller area network |
CN101707537B (zh) * | 2009-11-18 | 2012-01-25 | 华为技术有限公司 | 故障链路定位方法、告警根因分析方法及设备、系统 |
US9680567B2 (en) | 2011-03-03 | 2017-06-13 | Acacia Communications, Inc. | Fault localization and fiber security in optical transponders |
-
2012
- 2012-11-14 US US13/677,263 patent/US9002197B2/en active Active
-
2013
- 2013-10-23 EP EP13824163.3A patent/EP2920598A1/en not_active Withdrawn
- 2013-10-23 WO PCT/IB2013/059586 patent/WO2014076595A1/en active Application Filing
- 2013-10-23 CN CN201380059573.5A patent/CN104797947A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6954882B2 (en) * | 2001-06-15 | 2005-10-11 | International Business Machines Corporation | Method and apparatus for fault location in a loop network |
KR20060053679A (ko) * | 2004-11-17 | 2006-05-22 | 엘지전자 주식회사 | 망관리 시스템에서의 랜 단절시 데이터 복원 장치 및 그방법 |
US20080232795A1 (en) * | 2007-03-21 | 2008-09-25 | Adva Ag Optical Networking | Method And System For Localizing An Attenuation Change Location In An Optical Waveguide |
CN101815004A (zh) * | 2010-03-03 | 2010-08-25 | 烽火通信科技股份有限公司 | 无源光网络的设备业务配置方法 |
CN102331548A (zh) * | 2011-05-31 | 2012-01-25 | 重庆大学 | 一种配网电缆单相接地故障的故障定位方法 |
Also Published As
Publication number | Publication date |
---|---|
US20140133844A1 (en) | 2014-05-15 |
EP2920598A1 (en) | 2015-09-23 |
WO2014076595A1 (en) | 2014-05-22 |
US9002197B2 (en) | 2015-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104797947A (zh) | 基于序列的链路故障定位 | |
US9178755B2 (en) | Time-based link fault localization | |
US8605598B2 (en) | Frame loss measurement method, system, and apparatus | |
CN106330376B (zh) | 通信网络中的时间同步的方法、系统和节点 | |
CN101404597B (zh) | 一种网络质量指标的获取方法、系统及装置 | |
US9071394B2 (en) | Remote timing communications | |
CN104429002B (zh) | 确定光通信网络中的光通信路径的特性 | |
EP2497233B1 (en) | Disjoint path computation algorithm | |
CN102428676B (zh) | 向不遵从oam的客户端发送数据传输路径属性的方法 | |
RU2638645C2 (ru) | Способ для определения опорных синхросигналов, подвергнутых воздействию изменения в асимметрии задержки трассы распространения между узлами в сети связи | |
US8531983B2 (en) | System and method for identifying a length of an installed fiber cable | |
RU2011119536A (ru) | Способ применения экземпляра службы к сети mpls (варианты) и сеть mpls | |
CN103379032A (zh) | 跨域端到端路由的获取方法及装置、子路由计算实体 | |
CN105024844A (zh) | 一种计算跨域路由的方法、服务器以及系统 | |
CN103168440A (zh) | 时间路径补偿方法和装置 | |
CN106211306A (zh) | 一种通信网络延时抖动平滑方法、装置及系统 | |
CN105228183A (zh) | 上行数据异常处理方法及装置 | |
Li et al. | Availability analytical model for permanent dedicated path protection in WDM networks | |
Tapolcai et al. | Internet optical infrastructure | |
CN103974152B (zh) | 一种光网络分配单元 | |
CN102752169B (zh) | 传输监控方法及装置 | |
CN105141358B (zh) | 智能变电站过程层光纤传输延时测量方法 | |
Kleinheksel et al. | Optical quorum cycles for efficient communication | |
CN101026563A (zh) | 一种获得路由开销的方法、装置及系统 | |
Sambo et al. | Experimental demonstration of network automation based on QoT estimation and monitoring in both single-and multi-domains |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150722 |