CN1998185A - 基于以太网的通信系统中的故障管理 - Google Patents

基于以太网的通信系统中的故障管理 Download PDF

Info

Publication number
CN1998185A
CN1998185A CN200480042923.8A CN200480042923A CN1998185A CN 1998185 A CN1998185 A CN 1998185A CN 200480042923 A CN200480042923 A CN 200480042923A CN 1998185 A CN1998185 A CN 1998185A
Authority
CN
China
Prior art keywords
fault
equipment
ethernet
termination
cable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200480042923.8A
Other languages
English (en)
Inventor
罗斯·A.·杰米森
约翰·K.·威克斯
保罗·A.·伊利尔斯
迈克尔·J.·米泽尔
维尼·R·森基
哈米德·R·瑞泽
詹姆斯·布恰安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adva Optical Networking SE
Original Assignee
Adva Optical Networking SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adva Optical Networking SE filed Critical Adva Optical Networking SE
Publication of CN1998185A publication Critical patent/CN1998185A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/40006Architecture of a communication node
    • H04L12/40032Details regarding a bus interface enhancer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/4013Management of data rate on the bus
    • H04L12/40136Nodes adapting their rate to the physical link properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/065Generation of reports related to network devices

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Quality & Reliability (AREA)
  • Environmental & Geological Engineering (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供了一种单端以太网管理系统和方法。该系统为用户提供一个以太网接口并对其进行监视,也可对从单端对故障进行检测和隔离。该方法可以在系统上执行以提供从第一端到第二端的以太网服务。在以太网服务建立之后,该方法从第一端监视服务,以便检测故障的发生并识别服务质量下降问题。如果发生了故障,所述方法能自动地执行故障隔离过程,将第一和第二端之间的故障的位置隔离。此外,所述方法还可根据故障的位置或类型对故障的一个或多个潜在原因进行分类。

Description

基于以太网的通信系统中的故障管理
背景技术
本发明通常涉及通信服务,特别地,涉及配置和管理以太网服务的系统和方法。
使用并入以太网的系统的通信公司在对其系统进行管理时面临着许多困难。这些困难通常是由于以太网标准和设备缺少特征而造成的,这些特征能使以太网服务按载波分类方式进行配置。例如,以太网通常需要多对铜线(例如第5类(CAT5)电缆)用于10/100Base-T接口。而基于铜线的以太网接口是有距离限制的(CAT5敷设电缆大约为100米),并且通常没有能力对基于铜线的以太网链路的电缆故障进行诊断。此外,对以太网链路的载波分类性能的监视和诊断能力是有限。现有的监视和诊断过程往往要经由非基于标准的命令行接口或图形用户接口(GUI)来利用复杂的提供命令并要求人类用户遵循人工排障步骤的顺序。此外,需要一个简单的网络管理协议(SNMP)操作支持系统(OSS)覆盖程序来监视以太网的性能。
对故障问题进行诊断往往需要一个操作人员或一个技术员登陆到以太网链路的两侧,这样不仅增加了排障的复杂性,而且如果在相对的一端包括用户设备时,这将是极其困难或不可能的。由于通常是不可能从单端对以太网连接进行端对端诊断,所以故障隔离时往往要派出一个技术员找到网络中指定点的“链条”,直到把该故障的位置隔离。这就耗用了时间和资金。
因此,需要一种以太网服务的单端提供、监视和测试的系统和方法。此外,期望通过多种介质来提供载波分类服务。
发明内容
一种用于检测和诊断以太网服务接口中的故障的方法和系统提供了技术的进步。可以从通信链路中的第一点检测和诊断出故障,其中所述通信链路包括以太网服务接口并且该链路端接于第二点。所述方法包括从第一点监视链路以检测故障的发生,其中所述故障发生在第一和第二点之间。当检测出故障时,对至少一个故障的属性进行识别,其中所述故障属性是从第一点来识别的,并且根据所识别的故障属性,对该故障的一个或多个潜在原因进行分类。
附图说明
图1是示出从以太网连接的单端进行建立、管理和故障隔离的方法的流程图。
图2是执行图1所示的方法的典型网络。
图3和图4是示出在图2所示的网络中从以太网连接的单端进行建立、管理和故障隔离的另一实施例的流程图。
图5是执行图1所示的方法的另一个典型网络。
图6和图7是示出在图5所示的网络中从以太网连接的单端进行建立、管理和故障隔离的另一实施例的流程图。
图8示出了用于在端接和非端接之间对线路状态进行远程切换的一个典型系统的实施例。
图9和图10示出了用于在端接和非端接之间对线路状态进行远程切换的一个典型系统的另一实施例。
具体实施方式
本发明通常涉及通信服务,特别地,涉及配置和管理以太网服务的系统和方法。然而,应该知道以下的公开提供了用于实现本发明的不同特征的许多不同的实施例或例子。下面将描述部件及其配置的具体例子,以便简化本公开。当然,这些仅仅是例子,而并不意在限制本发明。此外,本发明将重复在各例中的参考数字和/或文字。这一重复的目的是要达到简化和清晰,而其本身并不是用于规定所讨论的各种实施例和/或配置之间的关系。
参考图1,在一个实施例中,方法10可操作用于从网络的单端提供事先服务、正在服务和脱离服务的以太网性能。正如稍后将要详细说明的,这可使服务提供商提供并监视以太网服务接口,以及以成本高效的方式对该以太网服务接口内的故障进行检测和诊断。这种功能是可以,例如,通过使用电缆检测设备为端对端服务的老式设备(legacy equipment)添加监视和诊断性能来实现。
在步骤12,建立初始状态。这可能包括,例如,建立链路,检查链路的状态,验证服务,测试电缆长度,获取服务参数以及类似的操作。在步骤14,判断链路状态是否满足某种预定的性能标准。如果链路状态失败,那么方法10跳到步骤24,在其中尝试隔离该故障。方法10继续进行到步骤26,在其中纠正该故障。纠正的类型取决于该故障,并且范围可以从激活自动纠正过程到派出机动车辆将技术员送达到诊断出故障的地方。而后,方法10返回到步骤14。
如果链路状态通过步骤14,方法10继续到步骤16,在其中进行自动谈判过程。如果如在步骤18中确定的,自动谈判过程失败,方法10跳到步骤24和26以隔离并纠正该故障。如果自动谈判成功,方法10继续到步骤20,在其中监视链路故障、服务质量下降以及其它问题。这种监视可以包括将当前的服务状况(例如,包丢失)和预定的一组参数相比较。如果如在步骤22中确定的发生了故障,方法10继续到步骤24和26,以隔离并纠正该故障。由此,该方法可以从以太网连接的单端(例如和服务提供商一端)识别并隔离以太网连接中的一个问题。
现在参考图2,一个典型网络30可提供这样的一个框架,在其中可执行图1的方法10以从服务提供商32向多个用户设备34提供以太网服务。服务提供商32可以位于可通过设备36,诸如构成SONET网络37的一部分的同步光学网络(SONET)分插复用器(add/dropADM)连接到网络30的中央办公室或类似的地点。设备36经由光纤连接到另一设备38,所述设备38由于以太网连通性要求的距离限制而相对靠近用户设备34。包括SONET ADM技术的设备38,可操作以将用于用户设备34的数据与通过SONET网络传输的其它数据隔离,也可以在发送给设备36之前,从用户设备34添加数据。该设备通过适于以太网通信的敷设电缆40(例如第5类(CAT5)电缆)连接到用户设备34上。每一条电缆都可连接到第2层(L2)开关42,以便在每一用户设备34上终止以太网服务。此外,时域反射计(TDR)(未示出)可以设置在设备38和L2开关42之间或是在设备38本身之中。TDR有助于沿着电缆40及其有关的设备34,38进行故障隔离。
在本例中,设备38包括多个作为模块给出的10/100BaseT以太网端口(未示出)。这些以太网端口经由标准以太网电缆(10Base TX,100Base TX)使用户设备34直接连接到设备38。按这种直接连接方式,与设备38的以太网端口相关联的公用以太网物理层(PHY)可以提供提高的以太网端口的链路状况的可见性并提供提高的监视性能。以太网端口被模拟成用户端口。
参考图3和4,在另一实施例中,方法50利用步骤52-78可通过服务提供商32实现对设备38及其有关部件的单端管理,以便如下所述通过以太网服务接口进行预置、监视以及问题诊断。在本例中,方法50是通过在数据传输服务中扩展事务处理语言1(TL1)命令所提供的性能来实现的。特殊命令和有关信息的更加详细的说明公开于2002年12月9日提交的美国临时专利申请序列号(代理人记录号31873.18)中,其全部内容正如在此全部复制一样,在此引用包含。也可以使用其它的管理接口和协议,如SNMP、CLI、CORBA、CMISE和GUI。
在步骤52处开始,建立一个链路并确定链路的参数。这可能包括利用默认为预定值的端口参数,提供以太网模块(例如,通过使用ENT-EQPT命令)并提供以太网服务接口(例如,通过使用ENT-E100命令)。通过将其中一个接口连接到一个传输设备(例如,设备36)来创建一个以太网服务。其它的性能,诸如超量开通(例如,在其中服务/用户所需的带宽超过了网络的容量)和端口参数(例如,端口速度极限)的控制等也可以加以定义。
当把以太网接口置于正在服务之前,方法50在步骤54处确定当前链路状态(例如,好或坏)。如果该链路状态是坏的,方法50进入故障隔离阶段,这将稍后参考图4加以说明。如果链路状态是好的,方法50继续到步骤56,在其中启动自动谈判过程。如果如在步骤58中所确定的,自动谈判未成功,方法50继续到图4的故障隔离阶段。如果自动谈判成功,方法50继续到步骤60,在其中捕获链路参数(例如,电缆状态和电缆长度)。所捕获的参数可用于未来的故障隔离。例如,在未来的故障报告中可使用所捕获的电缆长度来确定将故障报告为“近端”的(例如,服务提供商的设备一端、设备38)或“远端”(例如用户设备34的一端)。
尽管未示出,在将以太网接口置于正在服务状态之前,其它步骤仍可执行。例如,如果以太网接口在自动谈判期间支持远程故障指示,那么方法50就可对这种指示器进行检查。此外,方法50还包括自动IN-Service(AINS)技术,其允许操作人员在将一条物理电缆接到端口之前将以太网端口置于正在服务状态。该端口上的任何报警都会被抑制,直到方法50在某个预定的时间段(例如,10秒)在该端口上检测到有效信号为止。一旦这一时间段经过,该端口将恢复到正常的操作模式并将开始报警。
一旦将以太网接口置于正在服务,方法50继续到步骤62、64并执行监视操作。该监视可以检查链路故障、载波和/或信号损失、低光亮状况(用于光纤接口),自动谈判的重新启动,远程故障指示,以及诸如因链路参数不正确(例如,电缆状态和长度)而产生的故障。该监视也可以检查其它的故障以及服务质量下降等问题,也可收集统计数据以进行趋势分析。如果在步骤64检测到一个故障,该方法切换到脱离服务自主状态(OOS-AU)并继续到图4的步骤66,尝试隔离该故障。
应该知道一些测试将在以太网接口处于正在服务状态时发生,而其它测试可能要求该接口从服务中移除(例如,破坏性测试)。例如,在本例中,可能要进行正在服务的测试,以便在100/1000Mbps模式的正常操作期间对电缆长度进行测试。脱离服务的测试可能容许对设备38和其有关端口以及接到设备38的电缆进行测试。此外,脱离服务的测试还可以经由内部回送测试对设备输出发送器和输入接收器进行测试,也可以对端接和非端接以太网电缆问题进行分析。非端接分析包括,例如沿电缆的故障隔离和为每一条连接到端口的电缆,识别断路、短路以及阻抗的不匹配等问题。在一条适当端接的电缆上估计电缆长度可用于对后续故障的位置进行识别。
参考图4并继续参考图3,一个和多个测试是自动运行的,以确定在步骤64中检测出的故障是由本地设备故障、远程设备故障还是电缆问题所引起的。在步骤66处,在本地设备上进行本地回送测试。如果在步骤68中确定本地回送测试失败,则如步骤70所指示的,该故障就可能是本地设备故障所引起的。可以采取纠正措施,并且方法50返回到步骤56。
如果本地回送测试通过,那么该故障就不在本地设备内,方法50继续到步骤72,在其中对电缆状态进行检查。所述电缆状态可以利用,例如图2描述的具有集成TDR性能或独立TDR的以太网PHY来确定,它可能是由许多问题所造成的。例如,一条无效的以太网电缆长度可能是由不恰当的端接所造成的,而相对于原始特征值(在步骤60处获得)的电缆长度的变化可指示出该电缆的变化(例如,增加了一段坏电缆)。如果在步骤74处确定该电缆的状态无效(例如该电缆断开或破裂),那么如在步骤78处所示,该故障可能是电缆问题引起的。如果该电缆的状态有效,那么该故障可能是远程设备故障所引起的。可以在步骤80处采取纠正措施,并且方法50返回到步骤52。应该知道图4可以扩展,以纳入各种故障状况,比如自动谈判失败等。
因此,图3和4的方法50可利用图2的网络30的部件提供并管理以太网服务。此外,方法50还可对故障进行检测和隔离,以便使服务提供商32快速识别和定位以太网服务的中断和潜在中断。在检测到一个故障并将其隔离之后,可以针对该故障、各种故障属性(例如,类型、位置)以及类似的信息产生一个详细的报告。
参考图5,在另一个实施例中,典型网络90提供了这样的框架,在其中可以执行图1的方法10以从服务提供商92向多个用户设备94提供以太网服务。服务提供商92通过基于SONET的光纤连接98连接到设备96。设备96可操作通过铜线网络100利用,例如能够在铜线网络100上传输以太网帧的Ethernet Media eXtension(EMX)服务将服务提供商92连接到设备102(例如,介质转换器)。正如本领域所公知的那样,本例中的网络100是包括双绞铜线的本地环路设备。
设备102包括经由数字用户线路(例如DSL、SHDSL、VDSL,它们在此都统称为DSL)与设备96进行通信的接口(例如,调制解调器)和一个经由与以太网兼容的敷设电缆104为用户设备94提供以太网服务的以太网接口。设备102可为用户设备94提供10/100BaseT接口端口并可以在一个广域网(WAN)接口上使用DSL技术,以便将以太网链路范围延伸到几千英尺以外。如果提供了一个WAN接口,那么设备102提供了提高的设备的用户以太网端口的环路状况的可见性并提供了提高的监视性能,以及通过DSL环路管理技术和嵌入式管理通道提供了提高的WAN链路管理。按这一方式,WAN扩展相关的问题就可以得到诊断而且单端管理特征也可以在用户接口上得以实现。
在本例中,无论是以太网还是DSL接口都可通过模块提供它们各自的端口。以太网端口被模拟成用户端口,为了激活该端口,首先提供(手动的或自动的)以太网模块。然后提供在模块上的以太网端口。
在本例中,每个太网端口都与AINS相关,其每一个使得以太网端口在物理电缆接到该端口之前就预提供于就绪状态中。该以太网端口上的任何报警都会被抑制,直到在某个预定的时间段(例如,10秒)内在该端口上检测到有效信号为止。一旦该时间段经过,该以太网端口将恢复到正常的操作模式并将开始报警。
一旦使用电缆和设备诊断特征检测出一个故障,设备102也可以进行自动以太网故障隔离,这一点将在后面更加详细地说明。例如,当在用户设备和设备102之间检测出一个链路故障时,自动隔离诊断就会在设备102上进行设备端口回送,以检查发送器和接收器功能。如果没有检测出发送器和接收器故障,那么将报告环路故障。此外,设备102可将以太网服务扩展到载波服务区域并对操作人员隐藏DSL链路管理细节。因此,由于该系统可自动提供DSL链路,所以在创建“远程”以太网端口时就没有必要手动地提供DSL链路。
一旦检测出预定状况或事件,以太网端口会产生报警。例如,报警的产生可以基于链路故障、超时传输(例如,站发送了比容许的数据包长度长的时间段的情况)接收或远程故障等。报警是从设备102到设备96报告的,所述设备96再将警报报告给操作人员92。
经由设备102的DSL接口(和模块)实现的DSL链路和端口也可能成为故障源。例如,设备102可以监视DSL接口的报警状态,如信号丢失,同步丢失以及环路衰减缺陷(例如,超过了环路衰减阈值)等。DSL端口和设备故障可能引发与网络端接、功率损失、调制解调器故障、端口模块移除(例如,端接端口的调制解调器被移除)以及不匹配的提供(例如,提供的模块与在安装槽内的实际模块不匹配)有关的报警。
性能监视可以在两点上发生。首先,EtherStat性能监视可以在设备120的以太网端口上进行,以容许服务提供商在预定分界点对用户设备的输入通信量状况进行监视。其次,既可在设备96上也可在设备102上监视DSL链路,以提供与服务提供商96和用户设备102之间的数字本地环路的状况和性能有关的信息。统计数据可按前述加以收集。例如,可生成定期报告,对DSL和以太网链路随时间变化的状态做出详细的描述。
DSL链路的性能可按上游和下游方向加以监视。在下游方向,与设备102有关的调制解调器收集被转发到设备96的性能计数。在上游方向,DSL链路是在DSL模块上的端接点加以监视的。性能监视可以收集各种不同的统计,正如在先包含的美国临时专利申请序列号(代理人记录号31873.18)所公开的。
当通过DSL介质提供以太网服务时,DSL环路可能是非端接的(例如,设备102不存在或物理上并未连接上)或设备102存在并且物理上已连接上了。在操作人员能将一个非端接的环路连接到一个端口上来执行单端环路的资格诊断的情况下,该环路可以是非端接的。在这种情况下,操作人员可以对设备96发出一个诊断命令,以使该操作人员在事先服务激活期间描述/测试该DSL环路。如果设备102已物理上连接上并已被提供(例如,服务已经或正在运行并且必须进行诊断以隔离一个故障状况),该操作人员可对设备102(诊断以太网端口问题)或对已接到设备102上的以太网服务(诊断DSL链路问题)发出诊断命令。
如前所述,某些诊断测试可以在连接处于正在服务状态时执行,而另一些则要求必须将连接设置成脱离服务状态。在设备102的以太网端口上进行的正在服务的诊断仅限于对以太网接口进行测试。在本例中,除了性能监视之外,在DSL环路上不提供正在服务的诊断。
脱离服务的测试(例如,破坏性测试)可以使用与设备102有关的诊断来完成。设备102和与该设备有关的以太网服务在测试的时候必须处于脱离服务状态。这种测试使操作人员对以太网端口和与用户设备94有关的电缆上的故障,以及与DSL端口和DSL物理链路有关的故障进行测试和隔离。如果设备102在测试期间处于正在服务状态,那么就只能进行电缆长度(例如,非破坏性的)测试。
有许多脱离服务的测试可在设备102上完成。这种测试包括在以太网端口上的端口发送器和接收器检查,其使用内部回送对输出发送器或接收器输入故障进行检测。不论是非端接(TDR测试)还是端接的电缆都可以进行以太网电缆问题分析。DSL设备端口发送器和接收器诊断可以使用内回送来执行,以对输出发送器或接收器输入故障进行检测。
DSL链路诊断可以使用单端环路诊断从设备96执行,以确定一个非端接DSL数字本地环路(DLL)的某些特征,诸如环路长度、环路端接(例如,环路是断路还是短路)、环路规格、上下游容量(bps)、理想的上下游容量(bps)(例如,不考虑实现损耗的影响的容量)以及双端的环路测试等。
应该知道图1的方法10可按另一种网络配置实现,诸如在DS3WAN接口上使用以太网帧传输和/或在光纤接口上的以太网。
参考图6和7,在另一实施例中,方法106利用步骤108-156允许服务提供商92实现对设备102及其有关的部件进行单端管理,以便如下所述通过以太网接口进行预置、监视以及问题诊断。在本例中,方法106是通过在数据传输服务中扩展DSL命令所提供的性能来实现的。特殊命令和有关信息的更加详细的说明公开于并在先包含于本发明的美国临时专利申请序列号(代理人记录号31873.18)中。应该知道在检测到并隔离一个故障之后可采取纠正措施,但这种措施并未在图6和7上明确地标注出来。
在步骤108处开始,建立一个链路并确定链路的参数。在将以太网接口置于正在服务状态之前,方法106在步骤110处确定当前的DSL链路状态(例如,好或坏)。如果该链路状态是坏,方法106就进入故障隔离阶段,这一点将参考图7加以说明。如果该链路状态是好,方法106就继续到步骤112,在其中捕获DSL参数。方法106接着继续到步骤114,在其中确定以太网链路状态。如果以太网链路状态不好,那么方法106进入故障隔离阶段,这一点将参考图7加以说明。如果以太网链路状态是好,方法106继续到步骤116,在其中捕获以太网链路参数(例如,电缆状态和电缆长度)。
方法106接着继续到步骤118、120并执行监视操作。该监视可检查链路故障、载波和/或信号损失,低光亮状况(用于光纤接口)、自动谈判的重新启动、远程故障指示以及链路参数变化,如电缆状态和长度的变化等。该监视也可检查其它故障和服务质量下降等问题,也可收集统计数据以便进行趋势分析。如果在步骤120处发现了一个故障,该方法就切换到脱离服务自主状态(OOS-AU)并继续到图7的步骤122,尝试隔离该故障。
参考图7并继续参考图6,一个和多个测试是自动运行的,以便确定在步骤120处检测出的故障是否是由于本地设备故障、远程设备故障或是电缆问题所引起的。在步骤122处,确定DSL链路状态。如果该链路状态是好的,方法106继续到步骤124、126,在其中进行以太网本地回送测试并确定该测试是否通过或失败了。如果在步骤126处确定该测试失败了,那么如在步骤128处所示,该故障可能是由设备故障所引起的。方法106于是返回步骤110。
如果在步骤126处确定该测试通过了,那么方法106进行电缆测试并在步骤130、132处确定该测试是否通过或失败了。如果在步骤132处确定该测试失败了,那么如在步骤134处所示,该故障可能是因电缆问题所引起的。方法106于是返回步骤114。如果在步骤132处确定该测试通过了,那么该方法继续到步骤136,在其中启动自动谈判过程。
在步骤138处,确定自动谈判过程成功还是失败。如自动谈判过程失败,如在步骤140处所示,该故障可能是因远程设备问题所引起的。然而,如果自动谈判过程成功了,该方法就返回步骤114并如前所述地检查以太网链路状态。
返回图7的步骤122,如果DSL链路状态被确定是坏的,方法106前进到步骤142,在其中进行DSL回送测试。如果在步骤144处确定该测试失败,如在步骤128处所示,该故障可能是因设备故障所引起的。方法106于是返回到步骤110。
如果在步骤144处确定该测试通过了,那么方法106进行电缆测试并在步骤146,148处确定该测试通过还是失败。如果在步骤148处确定该测试失败了,如在步骤150处所示,该故障可能是因电缆问题所引起的。方法106于是返回步骤114。如果在步骤148处确定该测试通过了,那么该方法继续到步骤152,在其中启动DSL链路握手。在步骤154处,确定握手成功还是失败。如果握手失败,如在步骤156处所示,该故障可能是因远程设备问题所引起的。然而,如果握手成功了,该方法返回步骤110并且如上所述检查DSL链路状态。
因此,图6和7的方法106利用图5的网络90的部件提供并管理以太网服务。此外,方法106还可对故障进行检测和隔离,以使服务提供商92能迅速识别并定位以太网服务的中断和潜在中断。在检测到一个故障并将其隔离之后,可以针对该故障、各种故障属性(例如,类型、位置)以及类似信息产生一个详细的报告。
现在参考图8-10,在另一实施例中,如下所述TDR的性能和操作(如前所述)可以在DSL和/或以太网环境中得以加强。利用反射信号操作的TDR技术通常在恰当地端接的线路上不起作用。因此,为了使TDR技术的效益最大化,作为特征的线路不被端接,这往往意味着技术人员需要访问一个站点和物理地取消该连接。一旦移除了该连接,测试就可在线路上进行。然而,派技术人员移除该连接既耗时间又昂贵,并且如果该连接是在用户家里或用户的设备上那么就更加困难了。
特别参考图8,一个典型DSL环境包括服务提供商线路侧的设备160和DSL调制解调器164,它们都可以位于用户家里。设备160可以与DSL单元162相连接,以便使设备160和调制解调器164经由线路166进行通信。调制解调器164可以包括模拟前端170、DSL处理器/数字信号处理器172、服务侧接口(例如,以太网)、微控制器或处理器176,以及这些部件之间的各种连接和接口。
在本例中,调制解调器164还包括电路168,它可以访问模拟前端170和处理器176。电路168包括中继器178,所述中继器连接两个开关180、182和处理器176。
除了DSL通信之外,线路166还可以包括带外控制通道(例如,嵌入式操作通道或EOC),它可使设备160经由EOC消息发送来监视并控制调制解调器164。在本例中,如下所述,EOC消息发送与电路168一起可使设备160断开DSL线路端接。
为了断开该线路,服务提供商会经由线路166的EOC向调制解调器164发送一个命令,指示调制解调器164将其本身断开一段时间‘t’。该时间t可以是例如预定的或作为一个参数包含在该命令中的。在接收到该消息时,调制解调器164启动计时器并激励中继器178打开开关180、182。这将获得由时间t确定的时间段内的非端接线路。在这一时间内,服务提供商可以运行诊断诊断过程以描述该线路的特点。当计时结束,处理器176就去激励该中继器178,其关闭开关180、182,重建该线路。因此,与DSL线路相关的TDR的效果可通过远程影响该线路的端接而得到提高。
特别地参考图9和10,一个典型的以太网环境包括服务器提供商设备184和数字设备188。为了便于说明,数字设备188是位于用户家里的一台计算机,但是应该知道设备188可以是适用于本公开的任何类型的数字设备。设备184与以太网单元186相连接,它使得设备184和计算机188经由线路190进行通信。
除了本领域已知的各种部件(例如,处理器、存储器、总线、I/O设备、网络接口等,其中没有一个在图中示出),计算机188可以包括如图10所示的电路192。在本例中,电路192包含在置于计算机188内的网络接口卡(NIC)中。NIC与一个在网络上识别NIC的介质访问控制(MAV)号相关联。应该知道该电路可以和计算机188内的其它部件或计算机188外部的设备相连接。
电路192包括控制单元194,其连接到由线路196、198标识的数据通道。控制单元194经由线路204也连接到控制寄存器200和计时器寄存器202上。寄存器200、202馈送到含有中继器208的门206。中继器208用于在编程在寄存器202中的持续期间内通过寄存器200将线路196与其正常端接电路断开。
为了将该线路断开,服务器提供商可以经由带内信号发送机构向NIC和有关的电路192发出一个命令。该命令包括NIC将自身置于离线状态且NIC NIC必须保持离线状态一定的时间量的指令。在接收该命令时,控制单元194就为控制和计时寄存器200、202加载上适当的值以激活该中继器并将NIC置于离线状态。这可以通过例如改变该线路阻抗使之成为端接的(阻抗)或非端接的(无阻抗)的来实现。当与计时器寄存器202有关的时间段经过后,电路192使中继器208去激励并将NIC置于在线状态。由此,与以太网连接有关的TDR的效果可以通过远程影响线路的端接而得到提高。
虽然已经参考优选实施例示出并描述了本发明,然而本领域的普通技术人员应该理解,在不背离本发明的精神和范围的情况下可以进行各种形式上和细节上的改变。例如,如果希望获得带内回送请求功能,那么通过结合电缆测试技术和异常监视技术可以获得这种功能,以便得出一台设备是否正常工作。因此,与本发明相一致的,权利要求书应该从广义的方式进行解释。

Claims (24)

1.一种从一个通信链路中的第一点对以太网服务接口中的故障进行检测和诊断的方法,其中所述通信链路包括以太网服务接口并且所述通信连接在第二点终止,所述方法包括:
从第一点对所述链路进行监视,以检测是否有故障发生,其中所述故障发生在第一点和第二点之间;
当检测到故障时,识别至少一个故障属性,其中所述故障属性是从第一点识别的;以及
根据已识别出的故障属性分类该故障的一个或多个潜在原因。
2.根据权利要求1的方法,其中该故障属性包括故障位置。
3.根据权利要求2的方法,其中该故障属性包括故障类型。
4.根据权利要求1-3中任一个的方法,其中所述识别故障属性包括从第一点执行诊断过程以隔离该故障。
5.根据权利要求4的方法,其中所述执行诊断过程包括执行回送测试并根据该回送测试结果,检查在第一点和第二点之间构成所述通信链路的一部分的电缆的状态。
6.根据权利要求5的方法,其中如果回送测试表明在其上执行回送测试的设备中不存在问题,则对电缆的状态进行检查。
7.根据权利要求6的方法,其中所述分类该故障的一个或多个潜在原因包括使用本地回送测试结果或电缆状态,以识别该故障是否是由与第一点有关的设备、与第二点有关的设备、位于第一点和第二点之间的设备、或是构成第一点和第二点之间的所述通信链路的一部分的电缆所引起的。
8.根据权利要求6和7中任一个的方法,进一步包括:
在一个DSL连接上进行至少一个数字用户线路(DSL)测试,其中DSL连接包括所述通信链路的一部分;以及
确定DSL测试是否成功,其中没有成功表明该故障与该DSL连接有关。
9.根据权利要求1-8中任一个的方法,进一步包括:
确定一个链路的状态是好还是坏;
如果该链路状态是好,则执行自动谈判过程;
确定该自动谈判过程是否成功;以及
如果自动谈判过程成功,则捕获该通信链路的至少一个参数。
10.根据权利要求9的方法,其中所述至少一个参数至少包括在第一点和第二点之间构成所述通信链路的一部分的电缆的状态或该电缆的长度。
11.一种对构成通信系统一部分的以太网服务接口中的故障进行检测和诊断的方法,其中检测和诊断是从该通信系统内的单个点发生的,所述方法包括:
识别多个与以太网服务接口有关的操作参数,其中该操作参数建立一个基线,以监视以太网服务接口;
从单个点对以太网服务接口进行监视,以至少部分基于该操作参数检测故障;以及
从单个点出发对已发现的故障进行诊断,其中该诊断可操作将故障与至少一个故障位置和故障类型联系起来。
12.根据权利要求11的方法,其中该诊断包括在该通信系统上执行一系列测试,其中该测试可操作将故障与以太网服务接口隔离。
13.根据权利要求11和12中任一个的方法,进一步包括从单个点提供以太网服务接口。
14.一种从一个通信链路的第一端对与以太网服务接口有关的故障进行检测和诊断的系统,其中该链路从第一端延伸并端接于第二端,并且该链路包括所述以太网服务接口,所述系统包括:
可访问第一端的第一通信设备;
可访问第二端的第二通信设备;
连接第一和第二设备的电缆;以及
与第一设备有关的软件,用于检测故障并确定该故障是否与第一设备、第二设备或电缆有关。
15.根据权利要求14的系统,进一步包括第三通信设备,其中该第二端端接于第三设备,并且其中该软件可操作以确定该故障是否与第三设备有关。
16.根据权利要求15的系统,其中所述电缆的至少一部分包括数字用户线路,其中该软件可操作以诊断并检测该故障是否与该数字用户线路有关。
17.一种在远程数字设备上控制线路端接状态的方法,该方法包括:
向数字设备发送命令,其中该命令包括该数字设备将该线路端接状态从端接改变为非端接的指令;
在远程设备上设置一个预定的时间段;
在远程设备上监视该预定的时间段;以及
当该预定的时间段经过时,自动地将线路端接状态从非端接改变为端接。
18.根据权利要求17的方法,其中该命令进一步包括所述预定的时间量;
19.根据权利要求17和18中任一个的方法,其中该数字设备是一个网络接口卡,并且其中该命令使用带内信号发送机构经由以太网发送。
20.根据权利要求17-19中任一个的方法,其中该数字设备是数字用户线路(DSL)调制解调器,并且其中该命令经由DSL通道发送。
21.一种能对一个通信链路的端接状态进行远程控制的设备,所述设备包括:
可操作以响应经由该通信链路接收的端接命令的控制器;和
可访问该控制器的中继器,其中该中继器可操作以响应于控制器在端接和非端接之间改变所述端接状态。
22.根据权利要求21的设备,进一步包括可访问所述控制器的计时器,其中所述控制器响应于该命令引导该中继器将该状态改变为非端接的,并且其中该中继器在与所述计时器有关的一个预定时间段经过后将该状态改变为端接的。
23.根据权利要求21和22中任一个的设备,进一步包括,可操作以作为介质访问控制帧接收所述命令的以太网接口。
24.根据权利要求21-23中任一个的设备,进一步包括,可操作以经由DSL通道接收所述命令的数字用户线路接口。
CN200480042923.8A 2004-03-18 2004-03-18 基于以太网的通信系统中的故障管理 Pending CN1998185A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/IB2004/000817 WO2005094000A1 (en) 2004-03-18 2004-03-18 Fault management in a ethernet based communication system

Publications (1)

Publication Number Publication Date
CN1998185A true CN1998185A (zh) 2007-07-11

Family

ID=34957219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200480042923.8A Pending CN1998185A (zh) 2004-03-18 2004-03-18 基于以太网的通信系统中的故障管理

Country Status (7)

Country Link
EP (1) EP1733506B1 (zh)
JP (1) JP2007529806A (zh)
CN (1) CN1998185A (zh)
AU (1) AU2004317680A1 (zh)
CA (1) CA2559565A1 (zh)
MX (1) MXPA06010615A (zh)
WO (1) WO2005094000A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102148721A (zh) * 2011-01-21 2011-08-10 华为技术有限公司 电路检测的方法和装置
CN102035716B (zh) * 2009-09-29 2013-04-24 中国移动通信集团公司 路由更新方法、系统及路由器
CN103493433A (zh) * 2011-04-18 2014-01-01 瑞典爱立信有限公司 通信网络中服务的服务质量监测的方法和设备
CN103514245A (zh) * 2012-06-06 2014-01-15 丛林网络公司 创建用户可见处理跟踪的可搜索和全局数据库
CN115190035A (zh) * 2012-04-05 2022-10-14 艾斯兰股份有限公司 用于提供移动设备支持服务的系统、方法、装置和介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1992650B (zh) * 2005-12-30 2011-05-11 中兴通讯股份有限公司 一种ip分组承载网的呼叫导通检测方法
US9306802B2 (en) 2013-06-14 2016-04-05 Honeywell International Inc. Displaying FTE cable status as UCN cable status
CN103401724B (zh) * 2013-07-08 2016-08-24 宁波高新区晓圆科技有限公司 数据通信性能测试仪及其实现方法
US9191496B1 (en) 2014-04-22 2015-11-17 Adtran, Inc. Digital subscriber line fault locating systems and methods
CN105306272B (zh) 2015-11-10 2019-01-25 中国建设银行股份有限公司 信息系统故障场景信息收集方法及系统
CN108508874B (zh) * 2018-05-08 2019-12-31 网宿科技股份有限公司 一种监控设备故障的方法和装置
US11973640B1 (en) * 2021-07-14 2024-04-30 Juniper Networks, Inc. Physical layer issue detection based on client-side behavior assessments

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5923849A (en) * 1996-05-07 1999-07-13 International Network Services Method of auditing communication traffic
US6108713A (en) * 1997-02-11 2000-08-22 Xaqti Corporation Media access control architectures and network management systems
US6694455B1 (en) * 2000-06-16 2004-02-17 Ciena Corporation Communications network and method performing distributed processing of fault and alarm objects

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102035716B (zh) * 2009-09-29 2013-04-24 中国移动通信集团公司 路由更新方法、系统及路由器
CN102148721A (zh) * 2011-01-21 2011-08-10 华为技术有限公司 电路检测的方法和装置
CN103493433A (zh) * 2011-04-18 2014-01-01 瑞典爱立信有限公司 通信网络中服务的服务质量监测的方法和设备
US9325587B2 (en) 2011-04-18 2016-04-26 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for quality of service monitoring of services in a communication network
CN103493433B (zh) * 2011-04-18 2016-10-19 瑞典爱立信有限公司 通信网络中服务的服务质量监测的方法和设备
CN115190035A (zh) * 2012-04-05 2022-10-14 艾斯兰股份有限公司 用于提供移动设备支持服务的系统、方法、装置和介质
CN115190035B (zh) * 2012-04-05 2024-04-30 艾斯兰股份有限公司 用于提供移动设备支持服务的系统、方法、装置和介质
CN103514245A (zh) * 2012-06-06 2014-01-15 丛林网络公司 创建用户可见处理跟踪的可搜索和全局数据库
CN103514245B (zh) * 2012-06-06 2018-11-27 丛林网络公司 创建用户可见处理跟踪的可搜索和全局数据库

Also Published As

Publication number Publication date
CA2559565A1 (en) 2005-10-06
EP1733506A1 (en) 2006-12-20
WO2005094000A1 (en) 2005-10-06
AU2004317680A1 (en) 2005-10-06
JP2007529806A (ja) 2007-10-25
MXPA06010615A (es) 2006-12-19
EP1733506B1 (en) 2012-08-15

Similar Documents

Publication Publication Date Title
US20070022331A1 (en) Single-ended ethernet management system and method
US6888800B1 (en) High performance digital loop diagnostic technology
US5309428A (en) Token ring local area network testing apparatus for phase jitter testing
US5363366A (en) Token ring local area network testing apparatus for obtaining beacon domain information
EP1585301B1 (en) Apparatus and method for testing and fault isolation in a communication network
CN101170447A (zh) 基于主动探针的服务故障诊断系统及其方法
US5365513A (en) Token ring local area network testing apparatus for matching its speed to ring speed
CN100370747C (zh) 一种通信设备及其内部链路故障的定位方法
JP5348809B2 (ja) ダウンリンクの物理リンク故障診断の方法、システム及び装置
CN103250404B (zh) 用于确定dsl电信线路的全局线路特性的诊断引擎及其使用方法
CN1998185A (zh) 基于以太网的通信系统中的故障管理
CN110417623A (zh) 智能变电站以太网交换机故障诊断方法
US5425017A (en) Token ring local area network testing apparatus inserted in an active "T" co
US7719992B1 (en) System for proactive time domain reflectometry
JP2011501593A (ja) 光通信ネットワークの診断方法
US20030226072A1 (en) Hidden failure detection
US9124683B2 (en) Diagnostic engine
CA2504970A1 (en) Method and system for surveilling a telecommunications network link
Cisco Chapter 4: Maintenance and Troubleshooting Overview
US20110313692A1 (en) Enhanced Intelligent Patch Panel Diagnostic Management
KR20060126619A (ko) 이더넷 기반 통신시스템에서의 장애 관리 시스템 및 방법
CN100394730C (zh) 高可用系统中快速检测错误的方法
KR100735394B1 (ko) 대칭/비대칭 디지털 가입자 라인 시스템의 장애 진단방법
US7116638B1 (en) Method for identifying mis-optioned data communications circuits
KR20070080182A (ko) 초고속 인터넷 가입자 댁내 장치의 상태 정보 보고 방법 및그 초고속 인터넷 가입자 댁내 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070711