WO2016116002A1 - Otn网络故障节点自动检测的方法及装置 - Google Patents

Otn网络故障节点自动检测的方法及装置 Download PDF

Info

Publication number
WO2016116002A1
WO2016116002A1 PCT/CN2016/070883 CN2016070883W WO2016116002A1 WO 2016116002 A1 WO2016116002 A1 WO 2016116002A1 CN 2016070883 W CN2016070883 W CN 2016070883W WO 2016116002 A1 WO2016116002 A1 WO 2016116002A1
Authority
WO
WIPO (PCT)
Prior art keywords
loopback
network element
otn network
otn
request
Prior art date
Application number
PCT/CN2016/070883
Other languages
English (en)
French (fr)
Inventor
董建全
李荆晶
宗辉
殷少戈
Original Assignee
中兴通讯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中兴通讯股份有限公司 filed Critical 中兴通讯股份有限公司
Publication of WO2016116002A1 publication Critical patent/WO2016116002A1/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/077Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using a supervisory or additional signal

Definitions

  • the present application relates to, but is not limited to, the field of communication technologies, and in particular, to a method and apparatus for automatically detecting an OTN (Optical Transport Network) network fault node.
  • OTN Optical Transport Network
  • the OTN network related protocols have completely defined the fault detection and alarm details of each layer, but the fault intelligent demarcation is basically blank.
  • the carrier transmission network if a node fails, it often requires a large number of artificial The faulty node can only be found after manual analysis.
  • the embodiment of the invention provides a method and a device for automatically detecting an OTN network fault node, which can effectively improve the accuracy of the network fault prompt.
  • a method for automatically detecting an OTN network fault includes: a first OTN network element adopting a preset extension field to a next site of the first OTN network element
  • the second OTN network element sends a loopback operation request, and the second OTN network element performs a loopback operation according to the received loopback operation request, to obtain an execution result of the loopback operation;
  • the first OTN The network element receives the execution result returned by the second OTN network element by using the preset extension field; the first OTN network element performs a network fault prompt according to the execution result.
  • the first OTN network element sends a preset extension field to the next station of the first OTN network element
  • the second OTN network element sends a loopback operation request, where the first OTN network element sends the reserved field of the electrical layer overhead of the optical channel data unit ODUk to the next OTN network element of the next OTN network element.
  • the first OTN network element Receiving, by the first OTN network element, the execution result returned by the second OTN network element, by using the preset extension field, that: the first OTN network element is reserved by using the extended ODUk electrical layer overhead
  • the field receives the execution result returned by the second OTN network element.
  • the first OTN network element performs the network fault prompting according to the execution result, and the method includes: after the first OTN network element determines that the loopback is successful according to the execution result, and the first OTN network element end The alarm is not released, and the first OTN network element prompts that the second OTN network element is abnormal.
  • the loopback operation request sending module is configured to send a loopback operation request to the next OTN network element of the next OTN network element by using a preset extension field, where the second OTN network element receives the loopback operation The loopback operation to the request performs a corresponding loopback operation to obtain an execution result of the loopback operation;
  • the fault prompting module is configured to perform a network fault prompt according to the execution result.
  • the fault prompting module is configured to: after determining that the loopback is successful according to the execution result, and the alarm of the first OTN network element end is not released, prompting that the second OTN network element is abnormal.
  • the device further includes: a query request sending module, configured to send a request message for querying the abnormal line side board information to the second OTN network element; and the positioning information receiving module is configured to extend the ODUk layer
  • the reserved field of the overhead receives the location information returned by the second OTN network element, where the location information includes at least one of: a subrack number, a board slot number, and an intra-board number; the fault prompt
  • the module is further configured to perform a network failure prompt according to the positioning information.
  • the loopback operation request includes: an operation type, a request status, a hop counter, and an internal hop counter
  • the operation type includes at least: a network level near-end loopback request, a network level near-end loopback response, and a network level.
  • One or more of a remote loopback request, a network level remote loopback response, a device level loopback request, a device level loopback response, a query peer location information request, and a query location information response, and the request state is at least Includes one or more of outer loopback, inner loopback, and cancel loopback.
  • Embodiments of the present invention further provide a computer readable storage medium storing computer executable instructions, the method for implementing automatic detection of the OTN network fault node when the computer executable instructions are executed.
  • the embodiments of the present invention can greatly improve the positioning efficiency of various network interruption problems caused by transmission node failures during the network construction and network maintenance phases, and reduce the cost of customer network construction and network maintenance.
  • FIG. 1 is a schematic diagram of functional entities of a communication device in the prior art
  • FIG. 2 is a flowchart of a method for automatically detecting an OTN network fault node according to an embodiment of the present invention
  • FIG. 3 is a structural block diagram of an apparatus for automatically detecting an OTN network fault node according to an embodiment of the present invention
  • FIG. 4 is a schematic structural diagram of an ODUk frame structure, an ODUk, and an optical channel payload unit OPUk overhead of an optical channel data unit;
  • FIG. 5 is a schematic structural diagram of an OTN device according to an embodiment of the present invention.
  • FIG. 6 is a schematic diagram of network level loopback in an embodiment of the present invention.
  • FIG. 7 is a schematic diagram of device level loopback according to an embodiment of the present invention.
  • FIG. 8 is a schematic diagram of network level fault location according to an embodiment of the present invention.
  • FIG. 9 is a schematic diagram of network continuity testing in a network construction phase according to an embodiment of the present invention.
  • the method and device for automatically detecting an OTN network fault node in the embodiment of the present invention may be disposed in a network composed of a plurality of function boards, a functional entity device and a plurality of such devices, and a network
  • the segment-by-segment self-test inside the distributed device and the distributed device demarcates the faulty node, and is applied to scenarios such as intelligent node troubleshooting after the network interruption, transmission line during the network construction phase, and device continuity test.
  • FIG. 2 is a flowchart of a method for automatically detecting an OTN network fault node according to an embodiment of the present invention. As shown in FIG. 2, the method includes the following steps:
  • the first OTN network element receives the execution result returned by the second OTN network element by using the reserved field of the extended ODUk electrical layer overhead.
  • the preset extension is not limited in the embodiment of the present invention. The specific form of the field.
  • the network intelligent self-test overhead interface is defined: the interaction between the OTN network elements is performed by extending the reserved field of the ODUk electrical layer overhead.
  • Numbering Operation type meaning Value 1 NO_OP No operation 0x00 2 NETWORK_NEAR_LOOP_REQ Network-level near-end loopback request 0x01 3 NETWORK_NEAR_LOOP_RSP Network-level near-end loopback response 0x02
  • hop counter value reference the default value of the hop counter is 0, the value range is 0 to 31; it is used to indicate which device in the network to operate this time. If the hop counter is not 0, the device does not operate, and the counter will be hopped. After subtracting 1 and passing it to the next network element;
  • Internal hop counter value reference: The internal hop counter defaults to 0; it is used to indicate the internal loopback point of the device. If the counter is not 0, the loopback operation is performed at the corresponding loopback node in the device according to the number of counters;
  • the devices can perform loopback positioning by using the above ODUk overhead field.
  • the A site serves as the source to initiate network-level automatic loopback delimitation, and then the B station and the Z station.
  • the loopback operation is performed on the loopback point.
  • the values are as follows:
  • the step of initiating the intelligent detection is as follows: the startup of the intelligent self-test can be started in the following scenario: after the duration of the unprotected path failure exceeds the threshold, the service flow is automatically started after the service is switched, and the service flow is locked after the protection channel is started. Manual start and other methods.
  • the loopback detection step of the current monitoring point is terminated: after the service board in the site A detects the cost response of the site B, the service port and the current port state are reported to the master SFL module.
  • the A site "SFL module” judges that the operation is successful and the previous alarm disappears.
  • the local connection is normal.
  • a site "SFL module” indicates that the service board inserts the cancel loopback indication in the direction of the B site:
  • Site A Site A
  • Site B Site B's "SFL Module” records the results of this operation.
  • the step of intelligently delimiting the segment is performed continuously: the main process of this step is “the outer ring of the network element 1 and the outer ring of the network element 1”; and the “outer ring of the network element 2” “, network element 2 remote inner ring”..., the step continues to loop back and delimit, and each time the next network element is sent, the network element A station initiates a "hop counter" plus one operation.
  • the step of outputting a network fault intelligent positioning result :
  • a path continuity test table has been generated by initiating the "SFL module" of the network element A site in the above manner. Finally, it is output to maintenance personnel in the form of network management messages, forms, and visual interfaces.
  • the step of outputting the network fault intelligent positioning result is completed, if it is confirmed that it is not a transmission line failure, but a device X station internal failure. The user can choose to further locate the internal fault node of the device. At this point, the initiating network element A station continues to initiate the intelligent positioning operation.
  • Site A After receiving the information, Site A ends all operations and outputs the corresponding information to the user. At this point, the entire intelligent positioning process is over.
  • FIG. 7 is a schematic diagram of network level fault intelligent positioning according to an embodiment of the present invention.
  • the client side device 1 and the client side device 2 are connected through a plurality of OTN devices.
  • An example of a scenario in which the client side device 1 receives a direction signal abnormality in the case where a fault occurs in the B station in FIG. 7 after the fault occurs, the client side device and the plurality of devices in the middle detect an abnormality.
  • the automatic delimitation function is started on the OTN A station at the near end of the customer side device 1; the A station directly performs the inner ring operation on the local line side interface, and the loopback detection does not alarm, then the loopback is continued.
  • the OTN A station passes the ODUk overhead field to instruct the next station B station to perform the network-level near-end outer loopback request operation, and after the B-station operation, returns to the current state; if the A-station detection still has no alarm, the A-site and the A-site are excluded.
  • the transmission line between the B stations; the OTN A station continues to instruct the station B station to cancel the loopback operation, and after the B station operation, returns to the current state; the OTN A station instructs the next station B station to perform the network level remote inner loopback operation, After the operation of the B station, the current status is returned.
  • the A site determines that the loopback is successful, the local alarm is not released, and it can be confirmed that the fault occurs inside the B site.
  • the output information indicates that the B site has an abnormal indication; at the same time, the NE level delimitation has been successfully performed.
  • FIG. 8 is a schematic diagram of intelligent location of internal node faults in a device according to an embodiment of the present invention.
  • the fault has been delimited to an internal abnormality of the B site.
  • the maintenance personnel need to further check the abnormal boards and abnormal units inside the B site.
  • the internal remote line side of the B station is formed into a single board.
  • Example of a frame chip failure The maintenance personnel continue to operate at the A site, and after the B site is abnormal, continue to select to enable the "device internal node demarcation"; the A site passes the ODUk overhead field to instruct the next site B station to perform the device level loopback request.
  • the framing chip is skipped at the third loopback point of the line-side board, and the inner loop operation is performed on the switch chip. After the success, the current state is returned. After the site A determines that the loopback is successful. If the local alarm is cleared, the "Query Node Location Information" operation is sent to the B site. The B site returns the abnormal line side board information (subrack number, slot number, internal fault node number). The output information of the A site indicates that an abnormality occurs in the X-slot module of the X-slot X-slot board in the B-site, prompting the user to solve the problem. At this point, the internal chip level demarcation of the device has been successfully performed.
  • the test results are turned on for each line starting point (records 1, 2 in the table below). And prompt the next adjacent node to initiate the continuity test.
  • the neighboring node B initiates the pilot test, because the turn-on detection is bidirectional, so the line that has been detected with the peer end is not repeatedly detected. After B completes the continuity test, records 3 and 4 are generated. After each network element is completed in sequence, the final network connection continuity test brief is generated as follows:
  • an embodiment of the present invention further provides a computer readable storage medium storing computer executable instructions, which are implemented when the computer executable instructions are executed to implement automatic detection of the OTN network fault node.
  • each module/unit in the above embodiment may be implemented in the form of hardware, for example, by implementing an integrated circuit to implement its corresponding function, or may be implemented in the form of a software function module, for example, executing a program stored in the memory by a processor. / instruction to achieve its corresponding function.
  • the invention is not limited to any specific form of combination of hardware and software.

Landscapes

  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种OTN网络故障节点自动检测的方法,包括:第一OTN网元通过预设的扩展字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求,由所述第二OTN网元根据接收到的所述环回操作请求进行相应的环回操作,得到所述环回操作的执行结果;所述第一OTN网元通过所述预设的扩展字段接收所述第二OTN网元返回的所述执行结果;所述第一OTN网元根据所述执行结果进行网络故障提示。该方法可以极大提升建网及网络维护阶段中,各类由于传输节点故障导致的网络中断问题的定位效率,降低客户建网及网络维护成本。

Description

OTN网络故障节点自动检测的方法及装置 技术领域
本申请涉及但不限于通信技术领域,尤其涉及一种光传送网(OTN,Optical Transport Network)网络故障节点自动检测的方法及装置。
背景技术
目前主流通信设备都是由多个功能单板、模块分布式组成的一个功能实体。如图1所示,以典型光传送网(OTN,Optical Transport Network)设备为例,硬件平台主要由子架、不同功能的物理单板、模块化单元共同组成。
目前OTN网络相关协议已经对各层故障检测、告警细节定义的非常完备了,但在故障智能定界方面基本还是空白,在运营商传输网络中,如果某一节点故障后,往往需要大量的人为手工分析排查后才能找到故障节点。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供了一种OTN网络故障节点自动检测的方法及装置,能够有效提高网络故障提示的准确性。
依据本发明实施例的一个方面,提供了一种OTN网络故障自动检测的方法,所述方法包括:第一OTN网元通过预设的扩展字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求,由所述第二OTN网元根据接收到的所述环回操作请求进行相应的环回操作,得到所述环回操作的执行结果;所述第一OTN网元通过所述预设的扩展字段接收所述第二OTN网元返回的所述执行结果;所述第一OTN网元根据所述执行结果进行网络故障提示。
可选地,
所述第一OTN网元通过预设的扩展字段向所述第一OTN网元的下一站 点第二OTN网元发送环回操作请求,包括:第一OTN网元通过扩展光通道数据单元ODUk电层开销的预留字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求;
所述第一OTN网元通过所述预设的扩展字段接收所述第二OTN网元返回的所述执行结果,包括:所述第一OTN网元通过所述扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的所述执行结果。
可选地,所述第一OTN网元根据所述执行结果进行网络故障提示,包括:所述第一OTN网元根据所述执行结果判断环回成功后,且所述第一OTN网元端的告警没有解除,所述第一OTN网元提示所述第二OTN网元发生异常。
可选地,所述方法还包括:所述第一OTN网元向所述第二OTN网元发送查询异常的线路侧单板信息的请求消息;所述第一OTN网元通过扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的定位信息,所述定位信息至少包括:子架号、单板槽位号和板内序号中的一种或多种;所述第一OTN网元根据所述定位信息进行网络故障提示。
可选地,所述环回操作请求包括:操作类型、请求状态、跳计数器和内部跳计数器,所述操作类型至少包括:网络级近端环回请求、网络级近端环回响应、网络级远端环回请求、网络级远端环回响应、设备级别环回请求、设备级别环回响应、查询对端定位信息请求和查询定位信息响应中的一种或多种,所述请求状态至少包括:外环回、内环回和取消环回中的一种或多种。
依据本发明实施例的另一个方面,还提供了一种OTN网络故障节点自动检测的装置,所述装置包括:
环回操作请求发送模块,设置为通过预设的扩展字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求,其中,由所述第二OTN网元根据接收到的所述环回操作请求进行相应的环回操作,得到所述环回操作的执行结果;
执行结果接收模块,设置为通过所述预设的扩展字段接收所述第二OTN网元返回的所述执行结果;
故障提示模块,设置为根据所述执行结果进行网络故障提示。
可选地,所述环回操作请求发送模块是设置为通过扩展ODUk电层开销的预留字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求;所述执行结果接收模块是设置为通过所述扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的所述执行结果。
可选地,所述故障提示模块是设置为:根据所述执行结果判断环回成功后,且所述第一OTN网元端的告警没有解除,提示所述第二OTN网元发生异常。
可选地,所述装置还包括:查询请求发送模块,设置为向所述第二OTN网元发送查询异常的线路侧单板信息的请求消息;定位信息接收模块,设置为通过扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的定位信息,所述定位信息至少包括:子架号、单板槽位号和板内序号中的一种或多种;所述故障提示模块还设置为根据所述定位信息进行网络故障提示。
可选地,所述环回操作请求包括:操作类型、请求状态、跳计数器和内部跳计数器,所述操作类型至少包括:网络级近端环回请求、网络级近端环回响应、网络级远端环回请求、网络级远端环回响应、设备级别环回请求、设备级别环回响应、查询对端定位信息请求和查询定位信息响应中的一种或多种,所述请求状态至少包括:外环回、内环回和取消环回中的一种或多种。
本发明实施例还提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令被执行时实现所述OTN网络故障节点自动检测的方法。
本发明实施例可以极大提升建网及网络维护阶段中,各类由于传输节点故障导致的网络中断问题的定位效率,降低客户建网及网络维护成本。
在阅读并理解了附图和详细描述后,可以明白其他方面。
附图概述
图1为现有技术中通信设备的功能实体示意图;
图2为本发明实施例中OTN网络故障节点自动检测的方法的流程图;
图3为本发明实施例中OTN网络故障节点自动检测的装置的结构框图;
图4为光通道数据单元ODUk帧结构、ODUk和光通道净荷单元OPUk开销的结构示意图;
图5为本发明实施例中OTN设备的结构示意图;
图6为本发明实施例中网络级环回示意图;
图7为本发明实施例中设备级别环回示意图;
图8为本发明实施例中网络级故障定位示意图;
图9为本发明实施例中建网阶段网络导通测试示意图。
本发明的实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例中的一种OTN网络故障节点自动检测的方法及装置,可布置在多个功能单板、模块分布式组成的一个功能实体设备及多个此类设备组成的网络中,通过网络级和分布式设备内部的逐段自检来定界故障节点,从而应用于网络中断后的故障节点智能排查、建网阶段的传输线路及设备导通测试等场景。
图2为本发明实施例中OTN网络故障节点自动检测的方法的流程图,如图2所示,该方法包括如下步骤:
步骤S201、第一OTN网元通过预设的扩展字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求,由第二OTN网元根据接收到的环回操作请求进行相应的环回操作,得到环回操作的执行结果;
可选地,第一OTN网元通过扩展ODUk电层开销的预留字段向第一OTN网元的下一站点第二OTN网元发送环回操作请求,当然可以理解的是,在本发明实施例中并不限定预设的扩展字段的具体形式。
可选地,环回操作请求包括:操作类型、请求状态、跳计数器和内部跳计数器,所述操作类型至少包括:网络级近端环回请求、网络级近端环回响 应、网络级远端环回请求、网络级远端环回响应、设备级别环回请求、设备级别环回响应、查询对端定位信息请求和查询定位信息响应中的一种或多种,所述请求状态至少包括:外环回、内环回和取消环回中的一种或多种。
步骤S203、第一OTN网元通过预设的扩展字段接收第二OTN网元返回的执行结果;
可选地,第一OTN网元通过扩展ODUk电层开销的预留字段接收第二OTN网元返回的执行结果,当然可以理解的是,在本发明的实施例中并不限定预设的扩展字段的具体形式。
步骤S205、第一OTN网元根据执行结果进行网络故障提示。
可选地,在本发明实施例中,第一OTN网元根据执行结果判断环回成功后,且第一OTN网元端的告警没有解除,此时第一OTN网元提示第二OTN网元发生异常。
在本发明实施例中,在第一OTN网元提示第二OTN网元发生异常之后,所述方法还包括:第一OTN网元向第二OTN网元发送查询异常的线路侧单板信息的请求消息;第一OTN网元通过扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的定位信息,所述定位信息至少包括:子架号、单板槽位号和板内序号中的一种或多种;此时第一OTN网元可以根据定位信息进行网络故障提示。
在本发明实施例中,对于OTN网络级,通过扩展OTN设备间的ODUk开销字段,实现在起始设备节点发起测试,通知对接设备对外部接口逐一进行接口环回操作,实现网络级的“导通测试”。对于OTN设备级别,发现异常设备后,可以选择对设备内部节点进行定界,即对发生异常的“业务数据流”经过的单板、模块进行逐段的环回检测,以便快速发现故障节点。
图3为本发明实施例中OTN网络故障节点自动检测的装置的结构框图,如图3所示,该装置包括:
环回操作请求发送模块301,设置为通过预设的扩展字段向第一OTN网元的下一站点第二OTN网元发送环回操作请求,其中,由第二OTN网元根据接收到的环回操作请求进行相应的环回操作,得到环回操作的执行结果; 环回操作请求包括:操作类型、请求状态、跳计数器和内部跳计数器,所述操作类型至少包括:网络级近端环回请求、网络级近端环回响应、网络级远端环回请求、网络级远端环回响应、设备级别环回请求、设备级别环回响应、查询对端定位信息请求和查询定位信息响应中的一种或多种,所述请求状态至少包括:外环回、内环回和取消环回中的一种或多种;
执行结果接收模块303,设置为通过所述预设的扩展字段接收第二OTN网元返回的所述执行结果;
故障提示模块305,设置为根据执行结果进行网络故障提示。
可选地,在本发明实施例中,环回操作请求发送模块301是设置为通过扩展ODUk电层开销的预留字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求;
相应地,所述执行结果接收模块303是设置为通过所述扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的所述执行结果。
可选地,在本发明实施例中,所述故障提示模块305是设置为根据所述执行结果判断环回成功后,且所述第一OTN网元端的告警没有解除,提示所述第二OTN网元发生异常。
可选地,在本发明实施例中,上述装置还包括:查询请求发送模块,设置为向所述第二OTN网元发送查询异常的线路侧单板信息的请求消息;定位信息接收模块,设置为通过扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的定位信息,所述定位信息至少包括:子架号、单板槽位号和板内序号中的一种或多种;故障提示模块305还设置为根据所述定位信息进行网络故障提示。
下面以OTN网络中扩展ODUk开销方式为例,当然可以理解的是,如果应用于其它网络,只需要在对应网络协议中扩展类似字段进行部署,下面介绍OTN设备间帧格式:
OTN网络内部的信号格式是统一的,即OTN设备之间的光线路信号,是一种多个特定波长合波后的信号,每个特定波长在电层具有特定帧格式(光通道传输单元OTUk),如图4所示,在本实施例中描述的OTN设备之间的 环回配合测试,就是通过在图中所示的ODUk开销中的预留字段传递信息实现,其中PM表示路径监测;FTFL:故障类型&故障位置上报通道;TTI:路径跟踪标识;TCM:串联连接监听;EXP:实验;BIP8:比特间插奇偶校验;SAPI:源接入点标识;GCC:通用通信通道;BEI:后向误码指示;DAPI:目的接入点标识;APS:自动保护倒换谐调通道;BDI:后向缺陷指示;RES:为将来国际标准预留;PCC:保护通信控制通道;STAT:状态;ACT:激活/去激活控制通道;BIAE:后向输入定位误码;PSI:净荷结构标识。具体帧格式在ITU-T G.709协议中有详细定义,在此不再敷述。
如图5所示,本发明实施例中的所述OTN设备包括以下模块:管理平面的网络管理设备、控制平面的设备主控单板以及传送平面的由设备总线连接起来的各个分布式业务单板、交叉单板。在上述分布式系统中,将“故障智能定位(SFL,Smart Fault Location)模块”(本文简称为“SFL模块”)部署在主控单板上。“SFL模块”记录系统中的单板配置及业务流交叉配置,并通过维护接口上报给网管服务器。“SFL模块”通过内部控制平面和各业务板交互进行各种网络级和设备级别的检测。
在本发明实施例中,网络智能自检开销接口定义:OTN网元之间的交互则通过扩展ODUk电层开销的预留字段进行交互。
扩展开销字段占4字节(byte),每个byte中的每个位(bit)含义如下表所示:
Figure PCTCN2016070883-appb-000001
其中,(1)“操作类型”的取值参考:
编号 操作类型 含义 取值
1 NO_OP 无操作 0x00
2 NETWORK_NEAR_LOOP_REQ 网络级近端环回请求 0x01
3 NETWORK_NEAR_LOOP_RSP 网络级近端环回响应 0x02
4 NETWORK_FAR_LOOP_REQ 网络级远端环回请求 0x03
5 NETWORK_FAR_LOOP_RSP 网络级远端环回响应 0x04
6 DEVICE_LOOP_REQ 设备级别环回请求 0x05
7 DEVICE_LOOP_RSP 设备级别环回响应 0x06
8 QUERY_REQ 查询对端定位信息请求 0x07
9 QUERY_RSP 查询定位信息响应 0x08
(2)“请求状态”的取值参考:
编号 请求状态 含义 取值
1 NO_REQ 无操作 0x00
2 OUTER_LOOP 外环回 0x01
3 INNER_LOOP 内环回 0x02
4 CLR_LOOP 取消环回 0x03
(3)“跳计数器”取值参考:跳计数器默认为0,取值范围0~31;用于指示本次操作网络中哪个设备,跳计数器如果不为0则本设备不操作,将跳计数器减1后传递给下一个网元;
(4)“内部跳计数器”取值参考:内部跳计数器默认为0;用于指示设备内部环回点,计数器如果不为0则按照计数器数量在设备内部对应环回节点进行环回操作;
(5)“执行结果”的取值参考:
编号 执行结果 含义 取值
1 OK 成功 0x00
2 FAIL 失败 0x01
3 其它错误码自行扩展    
(6)“定位信息”取值参考:
Figure PCTCN2016070883-appb-000002
Figure PCTCN2016070883-appb-000003
按照上述接口,设备之间通过上述ODUk开销字段即可进行设备间配合进行环回定位,如图6中A站点作为源点启动网络级自动环回定界,则对B站和Z站4个环回点进行环回操作,取值如下:
环回点2环回:
“操作类型”=网络级近端环回请求,“请求状态”=外环回,“跳计数器”=0;
环回点3环回:
“操作类型”=网络级远端环回请求,“请求状态”=内环回,“跳计数器”=0;
环回点4环回:
“操作类型”=网络级近端环回请求,“请求状态”=内环回,“跳计数器”=1;
环回点5环回:
“操作类型”=网络级远端环回请求,“请求状态”=内环回,“跳计数器”=1。
在本发明实施例中,启动智能检测步骤:智能自检的启动可以配置在如下场景下启动:无保护路径故障持续时间超过阈值后自动启动、业务倒换后将业务流锁定在保护通道后启动、手动启动等方式。
以图6为例,维护人员在A站点启动检测,则A站点在“SFL模块”记录当前业务单板及告警状态等信息,然后控制业务板向B站点发起环回点2环回操作。B站点业务板通过开销检测收到环回点2环回请求后,通过控制平面将信息上报给主控板“SFL模块”,“SFL模块”按照对端的请求查询本端配置后正确下发环回指示,成功后指示业务板在反方向下插开销,将执行结果以“操作类型=环回响应”通过开销通知对端,以环回点2为示例,即返回:
“操作类型”=网络级近端环回响应,“请求状态”=外环回,“跳计数器”=0,“执行结果”=成功。
在本发明实施例中,结束当前监测点环回检测步骤:A站点中业务板检测到B站点的开销响应后,将响应携带信息及当前端口状态上报给主控“SFL模块”。A站点“SFL模块”判断本次操作成功且之前的告警消失,则可认 为本端连接正常。A站点“SFL模块”指示业务板向B站点方向下插取消环回指示:
“操作类型”=网络级近端环回请求,“请求状态”=取消环回,“跳计数器”=0。
B站点检测到开销后,处理流程类似启动智能检测步骤,取消当前环回,并通过开销返回响应:
“操作类型”=网络级近端环回响应,“请求状态”=取消环回,“跳计数器”=0,“执行结果”=成功。
A站点,B站点的“SFL模块”都记录本次操作结果。
在本发明实施例中,持续逐段进行智能定界的步骤:此步骤主要过程即“网元1近端外环”、“网元1远端内环”;“网元2近端外环”、“网元2远端内环”…,步骤持续环回定界,每进行下一个网元时发起网元A站点将“跳计数器”进行加1操作即可。
在本发明实施例中,输出网络故障智能定位结果的步骤:
通过上述方式发起网元A站点的“SFL模块”已经生成了一张路径通断测试表。最终通过网管报文、表格、可视化界面等形式输出给维护人员。
在本发明实施例中,定界故障网元设备内部单板及芯片的步骤:
在输出网络故障智能定位结果的步骤完成后,如果确认不是传输线路故障,而是某设备X站点内部故障。用户可以选择进一步定位设备内部故障节点。此时发起网元A站点继续启动智能定位操作。
“操作类型”=设备级别环回请求,“请求状态”=内环回,“跳计数器”=X站点跳数,“内部跳计数器”=1。
返回本次操作结果:X站点业务板通过开销检测收到设备级别环回请求后,通过控制平面将信息上报给主控板“SFL模块”,“SFL模块”查询上一次操作的节点(应对应远端内环),根据“内部跳计数器”计算后下发对应业务单板模块或芯片环回点进行内环操作;将执行结果以“操作类型=环回响应”通过开销通知对端:
“操作类型”=设备级别环回响应,“请求状态”=内环回,“跳计数器”=X 站点跳数,“内部跳计数器”=1,“执行结果”=成功。
持续内部逐段环回:然后A站点根据操作结果不断将“内部跳计数器”累加,直至定位到故障模块后,A站点取消环回下发查询操作:
“操作类型”=查询对端定位信息请求,“跳计数器”=X站点跳数,“内部跳计数器”=n。
最终定位出故障模块:X站点将“内部跳计数器”=n对应的单板及模块信息通过响应传递给对端:
“操作类型”=查询对端定位信息响应,“跳计数器”=X站点跳数,“内部跳计数器”=n,
“定位信息:子架号=x单板槽位号=y板内序号=z”。
A站点收到信息后结束所有操作,并将对应信息输出给用户。至此整个智能定位过程结束。
图7为本发明实施例中网络级故障智能定位的示意图。如图7所示,其中,客户侧设备1和客户侧设备2之间经过多个OTN设备连接。以图7中B站内部发生故障导致客户侧设备1接收方向信号异常场景举例:故障发生后,客户侧设备及中间多个设备检测异常。维护人员发现异常后,立即在客户侧设备1近端的OTN A站启动自动定界功能;A站则直接在本端线路侧接口进行内环操作,环回检测没有告警则取消环回继续下一步操作;OTN A站通过ODUk开销中字段,指示下一站点B站进行网络级近端外环回请求操作,B站操作后,返回当前状态;A站检测依然没有告警,则排除A站点和B站点之间的传输线路;OTN A站继续指示站点B站进行取消环回操作,B站操作后,返回当前状态;OTN A站指示下一站点B站进行网络级远端内环回操作,B站操作后,返回当前状态;A站点判断环回成功后,本端告警没有解除,则可确认故障发生在B站点内部。输出信息,提示B站点发生异常的指示;至次,已经成功进行网元级别定界。
图8为本发明实施例中设备内部节点故障智能定位的示意图。如图8所示,基于上述场景,故障已经定界到B站点内部异常。维护人员需要进一步排查B站点内部异常单板及异常单元。以图8中B站内部远端线路侧单板成 帧芯片故障举例:维护人员在A站点继续操作,提示B站点发生异常后,继续选择启动“设备内部节点定界”;A站点通过ODUk开销字段,指示下一站点B站进行设备级别环回请求:“操作类型”=设备级别环回请求,“请求状态”=内环回,“跳计数器”=0,“内部跳计数器”=1。B站点分析“内部跳计数器”=1,则在线路侧单板下一环回点,对应的成帧芯片光口侧进行内环操作,成功后返回当前状态;A站点检测故障未消除,则指示B站点取消当前环回;A站点继续指示下一站点B站进行“出接口侧下一节点内部环回”操作:“操作类型”=设备级别环回请求,“请求状态”=内环回,“跳计数器”=0,“内部跳计数器”=2。B站点分析“内部跳计数器”=2,则在线路侧单板第3环回点,跳过成帧芯片,对交换芯片进行内环操作,成功后返回当前状态;A站点判断环回成功后,本端告警解除,则向B站点发出“查询节点位置信息”操作,B站点返回异常的线路侧单板信息(子架号,槽位号,内部故障节点编号)。A站点输出信息,提示B站点内部X子架X槽位单板X序号模块发生异常,提示用户进行解决。至次,已经成功进行设备内部芯片级别定界。
图9为本发明实施例中网络建立时线路导通测试场景的示意图。如图9所示,新建OTN网络包含A、B、C、D、E五个城际OTN设备节点,用户在割接业务前检测整个网络线路的通断情况,假设网络中D和E之间的传输连接是有问题的。维护人员在站点A下发网元级别或整个网络导通测试指令,以整个网络导通测试为例。站点A控制模块通过查询交叉连接配置,记录当前站点各个业务流;逐一向线路侧各光口,对端发起导通测试请求,并记录结果;站点A结束导通测试后,生成以本站点为起点的各条线路导通测试结果(下表记录1、2)。并提示下一相邻节点启动导通测试。相邻节点B启动导检,因为导通检测都是双向的,所以已经配合对端检测过的线路不再重复检测。B完成导通检测后生成记录3、4。各网元依次完成后,生成最终的网络连接导通测试简报如下:
编号 起始节点 终结节点 导通测试结果
1 站点A 站点B OK
2 站点A 站点E OK
3 站点B 站点C OK
4 站点B 站点E OK
5 站点C 站点D OK
6 站点D 站点E FAIL
此外,本发明实施例还提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令被执行时实现所述OTN网络故障节点自动检测的方法。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
工业实用性
本发明实施例提供一种OTN网络故障节点自动检测的方法及装置,可以极大提升建网及网络维护阶段中,各类由于传输节点故障导致的网络中断问题的定位效率,降低客户建网及网络维护成本。

Claims (11)

  1. 一种光传送网OTN网络故障自动检测的方法,所述方法包括:
    第一OTN网元通过预设的扩展字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求,由所述第二OTN网元根据接收到的所述环回操作请求进行相应的环回操作,得到所述环回操作的执行结果;
    所述第一OTN网元通过所述预设的扩展字段接收所述第二OTN网元返回的所述执行结果;
    所述第一OTN网元根据所述执行结果进行网络故障提示。
  2. 如权利要求1所述的方法,其中,
    所述第一OTN网元通过预设的扩展字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求,包括:
    所述第一OTN网元通过扩展光通道数据单元ODUk电层开销的预留字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求;
    所述第一OTN网元通过所述预设的扩展字段接收所述第二OTN网元返回的所述执行结果,包括:
    所述第一OTN网元通过所述扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的所述执行结果。
  3. 如权利要求2所述的方法,其中,所述第一OTN网元根据所述执行结果进行网络故障提示,包括:
    所述第一OTN网元根据所述执行结果判断环回成功后,且所述第一OTN网元端的告警没有解除,所述第一OTN网元提示所述第二OTN网元发生异常。
  4. 如权利要求3所述的方法,所述方法还包括:
    所述第一OTN网元向所述第二OTN网元发送查询异常的线路侧单板信息的请求消息;
    所述第一OTN网元通过扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的定位信息,所述定位信息至少包括:子架号、单板槽位号和 板内序号中的一种或多种;
    所述第一OTN网元根据所述定位信息进行网络故障提示。
  5. 如权利要求1所述的方法,其中,所述环回操作请求包括:操作类型、请求状态、跳计数器和内部跳计数器,所述操作类型至少包括:网络级近端环回请求、网络级近端环回响应、网络级远端环回请求、网络级远端环回响应、设备级别环回请求、设备级别环回响应、查询对端定位信息请求和查询定位信息响应中的一种或多种,所述请求状态至少包括:外环回、内环回和取消环回中的一种或多种。
  6. 一种OTN网络故障节点自动检测的装置,应用于第一OTN网元侧,所述装置包括:
    环回操作请求发送模块,设置为通过预设的扩展字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求,其中,由所述第二OTN网元根据接收到的所述环回操作请求进行相应的环回操作,得到所述环回操作的执行结果;
    执行结果接收模块,设置为通过所述预设的扩展字段接收所述第二OTN网元返回的所述执行结果;
    故障提示模块,设置为根据所述执行结果进行网络故障提示。
  7. 如权利要求6所述的装置,其中,所述环回操作请求发送模块是设置为通过扩展光通道数据单元ODUk电层开销的预留字段向所述第一OTN网元的下一站点第二OTN网元发送环回操作请求;
    所述执行结果接收模块是设置为通过所述扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的所述执行结果。
  8. 如权利要求7所述的装置,其中,所述故障提示模块是设置为:根据所述执行结果判断环回成功后,且所述第一OTN网元端的告警没有解除,提示所述第二OTN网元发生异常。
  9. 如权利要求8所述的装置,所述装置还包括:
    查询请求发送模块,设置为向所述第二OTN网元发送查询异常的线路侧单板信息的请求消息;
    定位信息接收模块,设置为通过扩展ODUk电层开销的预留字段接收所述第二OTN网元返回的定位信息,所述定位信息至少包括:子架号、单板槽位号和板内序号中的一种或多种;
    所述故障提示模块还设置为根据所述定位信息进行网络故障提示。
  10. 如权利要求6所述的装置,其中,所述环回操作请求包括:操作类型、请求状态、跳计数器和内部跳计数器,所述操作类型至少包括:网络级近端环回请求、网络级近端环回响应、网络级远端环回请求、网络级远端环回响应、设备级别环回请求、设备级别环回响应、查询对端定位信息请求和查询定位信息响应中的一种或多种,所述请求状态至少包括:外环回、内环回和取消环回中的一种或多种。
  11. 一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令被执行时实现权利要求1至5任一项所述的方法。
PCT/CN2016/070883 2015-01-19 2016-01-14 Otn网络故障节点自动检测的方法及装置 WO2016116002A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510026357.1A CN105871569B (zh) 2015-01-19 2015-01-19 Otn 网络故障节点自动检测的方法及装置
CN201510026357.1 2015-01-19

Publications (1)

Publication Number Publication Date
WO2016116002A1 true WO2016116002A1 (zh) 2016-07-28

Family

ID=56416420

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2016/070883 WO2016116002A1 (zh) 2015-01-19 2016-01-14 Otn网络故障节点自动检测的方法及装置

Country Status (2)

Country Link
CN (1) CN105871569B (zh)
WO (1) WO2016116002A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112787843A (zh) * 2020-06-16 2021-05-11 中兴通讯股份有限公司 故障节点的检测方法和存储介质及电子装置
CN112953857A (zh) * 2021-02-24 2021-06-11 迈普通信技术股份有限公司 一种板卡间内部通道测试方法及分布式网络设备
CN113689693A (zh) * 2021-07-21 2021-11-23 阿波罗智联(北京)科技有限公司 路侧设备的异常处理方法、设备和智慧高速监控平台
CN113903168A (zh) * 2021-08-17 2022-01-07 浙江大华技术股份有限公司 故障检测方法、故障检测装置以及计算机可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109660373B (zh) * 2017-10-10 2021-12-24 深圳市中兴微电子技术有限公司 远端环回检测的方法及通信设备、计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5528580A (en) * 1994-12-21 1996-06-18 Electronics And Telecommunications Research Institute Add-drop control apparatus
CN101202677A (zh) * 2007-12-12 2008-06-18 华为技术有限公司 检测链路的方法及装置
CN101511100A (zh) * 2009-01-16 2009-08-19 华为技术有限公司 一种链路检测的方法、装置和系统
CN101902369A (zh) * 2010-07-23 2010-12-01 中兴通讯股份有限公司 背板交叉系统的故障定位方法及装置
CN102291266A (zh) * 2011-09-13 2011-12-21 中兴通讯股份有限公司 环回检测方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101505240B (zh) * 2008-02-05 2011-03-30 华为技术有限公司 一种故障检测方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5528580A (en) * 1994-12-21 1996-06-18 Electronics And Telecommunications Research Institute Add-drop control apparatus
CN101202677A (zh) * 2007-12-12 2008-06-18 华为技术有限公司 检测链路的方法及装置
CN101511100A (zh) * 2009-01-16 2009-08-19 华为技术有限公司 一种链路检测的方法、装置和系统
CN101902369A (zh) * 2010-07-23 2010-12-01 中兴通讯股份有限公司 背板交叉系统的故障定位方法及装置
CN102291266A (zh) * 2011-09-13 2011-12-21 中兴通讯股份有限公司 环回检测方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112787843A (zh) * 2020-06-16 2021-05-11 中兴通讯股份有限公司 故障节点的检测方法和存储介质及电子装置
CN112787843B (zh) * 2020-06-16 2022-04-29 中兴通讯股份有限公司 故障节点的检测方法和存储介质及电子装置
CN112953857A (zh) * 2021-02-24 2021-06-11 迈普通信技术股份有限公司 一种板卡间内部通道测试方法及分布式网络设备
CN112953857B (zh) * 2021-02-24 2022-02-22 迈普通信技术股份有限公司 一种板卡间内部通道测试方法及分布式网络设备
CN113689693A (zh) * 2021-07-21 2021-11-23 阿波罗智联(北京)科技有限公司 路侧设备的异常处理方法、设备和智慧高速监控平台
CN113689693B (zh) * 2021-07-21 2022-11-15 阿波罗智联(北京)科技有限公司 路侧设备的异常处理方法、设备和智慧高速监控平台
CN113903168A (zh) * 2021-08-17 2022-01-07 浙江大华技术股份有限公司 故障检测方法、故障检测装置以及计算机可读存储介质

Also Published As

Publication number Publication date
CN105871569A (zh) 2016-08-17
CN105871569B (zh) 2020-08-04

Similar Documents

Publication Publication Date Title
WO2016116002A1 (zh) Otn网络故障节点自动检测的方法及装置
US10623293B2 (en) Systems and methods for dynamic operations, administration, and management
US10091023B2 (en) Systems and methods to detect and recover from a loop in an Ethernet ring protected network
JP4818768B2 (ja) 情報処理システム、障害通知方法および障害通知プログラム
US20080112333A1 (en) Communicating an operational state of a transport service
US20100202772A1 (en) Method and Device For Validating a Link Attribute In The Nodes Of Automatically Switched Optical Network
EP1868322B1 (en) A method for implementing network protection combining the network element double-adscription and the ringnet protection
CN107517117B (zh) 一种ip层oam告警方法、装置及网络节点
US20120281523A1 (en) Method and apparatus for coordinating fault recovery techniques among domains
CN106464356B (zh) 一种流氓光网络单元的检测方法、装置及系统
US9203719B2 (en) Communicating alarms between devices of a network
WO2017166546A1 (zh) 一种长发光光网络单元的检测方法、装置及光线路终端
CN107431655B (zh) 分段保护中的故障传播的方法和设备
EP2827506B1 (en) Method for changing overhead and preventing subnets from switching simultaneously, device, network element, and network
EP2426861A1 (en) Method and apparatus for detecting ethernet operation, administration and maintenance (oam)
WO2015070917A1 (en) Correlation of event reports
EP2981025B1 (en) Method, network and system for protection switching
US8965199B2 (en) Method and apparatus for automatically restoring node resource state in WSON system
US20150280975A1 (en) Communication system and node
WO2018041275A1 (zh) 故障确定、信息发送方法及装置、源端设备、宿端设备
US10862706B2 (en) Detection of node isolation in subtended ethernet ring topologies
US8571182B2 (en) Systems and methods of masking non-service affecting alarms in a communication system
CN111344962B (zh) 光网络单元的网络接口切换方法及光网络单元
EP2849370B1 (en) Method for an enhanced failure localization in an optical data transmission network, optical data transmission network and program product
US20220329316A1 (en) Electrical layer subnetwork connection protection method, apparatus, and system

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16739749

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16739749

Country of ref document: EP

Kind code of ref document: A1