CN107347014B - 一种网络故障检测方法和系统 - Google Patents

一种网络故障检测方法和系统 Download PDF

Info

Publication number
CN107347014B
CN107347014B CN201610290796.8A CN201610290796A CN107347014B CN 107347014 B CN107347014 B CN 107347014B CN 201610290796 A CN201610290796 A CN 201610290796A CN 107347014 B CN107347014 B CN 107347014B
Authority
CN
China
Prior art keywords
l3ptn
connectivity
node
connectivity monitoring
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610290796.8A
Other languages
English (en)
Other versions
CN107347014A (zh
Inventor
杨辉宇
王强
贾嘉
詹鹏飞
姚紫腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Guangdong Co Ltd filed Critical China Mobile Group Guangdong Co Ltd
Priority to CN201610290796.8A priority Critical patent/CN107347014B/zh
Publication of CN107347014A publication Critical patent/CN107347014A/zh
Application granted granted Critical
Publication of CN107347014B publication Critical patent/CN107347014B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity

Abstract

本发明实施例公开了一种网络故障检测方法和系统,网络节点主动发起网络连通性故障定位排查,其中,所述网络节点包括:核心分组网演进EPC落地L3 PTN节点或者L2/L3 PTN节点。本发明实施例提供的网络故障检测方法和系统,降低维护人员的操作复杂度,提高管理维护的效率。

Description

一种网络故障检测方法和系统
技术领域
本发明涉及传输与IP技术领域,尤其涉及一种网络故障检测方法和系统。
背景技术
为继承传统传送网高可靠性与可维护性,分组传送网(PTN,Packet TransportNetwork)网络引入了操作管理维护(OAM,Operation Administration and Maintenance)随路探针的概念。根据网络应用场景,PTN OAM主要分为L2与L3两个层面。L2PTN主要用于2G/3G基站业务回传以及各类传输租赁专线;L2OAM依照网络模型分为伪线PW、标签交换路径LSP、端口等多个层次并与业务随路传送,根据使用类型可以主动和按需开启,作用包括故障指示、缺陷定位与性能监测。L3PTN主要仅用于4G基站业务回传场景;L3 OAM仅仅继承了IP网络Ping、Traceroute的基本功能,且只能按需手动触发。但在4G回传的PTN网络中,网络核心层采用具备3层OAM功能,汇聚边缘接入设备采用L2层的OAM,不支持L3层的OAM功能,因此不支持端到端的OAM检测。
现有的PTN+L3OAM技术中,L2PTN设备不支持L3层OAM功能,L3层OAM机制采用按需的OAM测量机制,一般在故障产生后发起按需的连通性检测,不能主动的发起网络中的连通性故障;而且L3PTN网络中的三层路由通过维护人员静态配置完成,网络中由于路由配置错误引起的连通性问题不能产生告警,不易发现。
发明内容
为解决上述技术问题,本发明实施例提供一种网络故障检测方法和系统,降低维护人员的操作复杂度,提高管理维护的效率。
本发明的技术方案是这样实现的:
本发明实施例提供一种网络故障检测方法,所述方法包括:
网络节点主动发起网络连通性故障定位排查,其中,所述网络节点包括:核心分组网演进EPC落地L3PTN节点或者L2/L3PTN节点。
进一步地,所述网络节点主动发起网络连通性故障定位排查,包括:
所述EPC落地L3PTN节点发起端到端S1业务的网络连通性故障定位排查;
或者,
所述L2/L3PTN节点发起端到端X2业务的网络连通性故障定位排查;
或者,
所述L2/L3PTN节点发起全网轮询网络连通性故障定位排查。
进一步地,所述EPC落地L3PTN节点发起端到端S1业务的网络连通性故障定位排查,包括:
所述EPC落地L3PTN节点向本地SGW/MME节点发起第一连通性监测操作;
若所述第一连通性监测失败,通过验证链路的连通性和验证路由配置正确性成功时,确定第一排查故障成功;
若所述第一连通性监测成功,或者所述第一排查故障成功,所述EPC落地L3PTN节点向基站eNodeB发起第二连通性监测;
若所述第二连通性监测失败,所述EPC落地L3PTN节点向L2/L3PTN节点发起第三连通性监测操作;
若所述第三连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、标签交换路径LSP连通性检查成功时,确定第二排查故障成功;
若所述第三连通性监测成功,或者所述第二排查故障成功,所述L2/L3PTN节点向所述eNodeB发起第四连通性监测操作;
若所述第四连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第三故障排查成功。
进一步地,所述L2/L3PTN节点发起端到端X2业务的网络连通性故障定位排查,包括:
所述L2/L3PTN节点向本地eNodeB站点发起第五连通性监测操作;
若所述第五连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第四排查故障成功;
若所述第五连通性监测成功,或者所述第四排查故障成功,所述L2/L3PTN节点向远端eNodeB站点发起第六连通性监测操作;
若所述第六连通性监测失败,所述L2/L3PTN节点向远端L2/L3PTN节点发起第七连通性监测操作;
若所述第七连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、LSP连通性检查成功时,确定第五排查故障成功;
若所述第七连通性监测成功,或者所述第五排查故障成功,远端L2/L3PTN节点向远端eNodeB站点发起第八连通性监测操作;
若所述第八连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第六排查故障成功。
进一步地,所述L2/L3PTN节点发起全网轮询网络连通性故障定位排查,包括:
所述L2/L3PTN节点向所有本地eNodeB发起轮询连通性监测操作;
或者,
所述L2/L3PTN节点向核心层所有EPC落地L3PTN节点的落地接口发起轮询连通性监测操作;
或者,
所述L2/L3PTN节点向核心层所有远端L2/L3PTN节点的L2/L3转发接口发起轮询连通性监测操作;
或者,
所述L2/L3PTN节点向所有除本地网络外的网络归属区域的eNodeB发起轮询连通性监测操作。
进一步地,连通性监测操作为:所述第一连通性监测操作、所述第二连通性监测操作、所述第三连通性监测操作、所述第四连通性监测操作、所述第五连通性监测操作、所述第六连通性监测操作、所述第七连通性监测操作、所述第八连通性监测操作、或者轮询连通性监测操作;
所述连通性监测操作包括:
接收L3OAM报文,所述L3OAM携带标识信息、IP地址和生存时间TTL值;
通过所述标识信息确定所述L3OAM报文是否为需要环回响应、通过所述IP地址确定所述L3OAM报文是否为本地接收,确定所述TTL值是否满足预设条件;
当所述L3OAM报文是需要环回的报文,且所述L3OAM报文本地接收,且所述TTL值满足预设条件,将所述L3OAM报文的IP地址进行置换,重新设置所述TTL值为默认值,环回发送重新设置的所述L3OAM报文。
本发明实施例提供一种网络故障检测系统,所述系统包括:EPC落地L3PTN节点、L2/L3PTN节点,其中,
所述EPC落地L3PTN节点,用于发起端到端S1业务的网络连通性故障定位排查;
所述L2/L3PTN节点,用于发起端到端X2业务的网络连通性故障定位排查;或者,
所述L2/L3PTN节点,用于发起全网轮询网络连通性故障定位排查。
进一步地,所述EPC落地L3PTN节点,具体用于向本地SGW/MME节点发起第一连通性监测操作;还用于若所述第一连通性监测失败,通过验证链路的连通性和验证路由配置正确性成功时,确定第一排查故障成功;还用于若所述第一连通性监测成功,或者所述第一排查故障成功,向基发起第二连通性监测;还用于若所述第二连通性监测失败,所述EPC落地L3PTN节点向L2/L3PTN节点发起第三连通性监测操作;还用于若所述第三连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、LSP连通性检查成功时,确定第二排查故障成功;
所述L2/L3PTN节点,具体用于若所述第三连通性监测成功,或者所述第二排查故障成功,向所述eNodeB发起第四连通性监测操作;还用于若所述第四连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第三故障排查成功。
进一步地,所述L2/L3PTN节点,具体用于向本地eNodeB站点发起第五连通性监测操作;还用于若所述第五连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第四排查故障成功;还用于若所述第五连通性监测成功,或者所述第四排查故障成功,向远端eNodeB站点发起第六连通性监测操作;还用于若所述第六连通性监测失败,向远端L2/L3PTN节点发起第七连通性监测操作;还用于若所述第七连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、LSP连通性检查成功时,确定第五排查故障成功;还用于若所述第七连通性监测成功,或者所述第五排查故障成功,远端L2/L3PTN节点向远端eNodeB发起第八连通性监测操作;还用于若所述第八连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第六排查故障成功。
进一步地,所述L2/L3PTN节点,具体用于向所有本地eNodeB发起轮询连通性监测操作;
或者,
所述L2/L3PTN节点,具体用于向核心层所有EPC落地L3PTN节点的落地接口发起轮询连通性监测操作;
或者,
所述L2/L3PTN节点,具体用于向核心层所有远端L2/L3PTN节点的L2/L3转发接口发起轮询连通性监测操作;
或者,
所述L2/L3PTN节点,具体用于向所有除本地网络外的网络归属区域的eNodeB发起轮询连通性监测操作。
本发明实施例提供了一种网络故障检测方法和系统,网络节点主动发起网络连通性故障定位排查,其中,所述网络节点包括:EPC落地L3PTN节点或者L2/L3PTN节点。本发明实施例提供的网络故障检测方法和系统,由EPC落地L3PTN节点或者L2/L3PTN节点等核心层设备完成L3层的连通性检测,自动的发现网络中的连通性故障,并主动上报,降低维护人员的操作复杂度,提高管理维护的效率。
附图说明
图1为本发明实施例提供的一种网络故障检测方法流程示意图一;
图2为本发明实施例提供的端到端S1业务故障定位排查示例图;
图3为本发明实施例提供的端到端S1业务故障定位和排查流程示例图;
图4为本发明实施例提供的一种网络故障检测方法流程示意图二;
图5为本发明实施例提供的端到端X2业务故障定位排查示例图;
图6为本发明实施例提供的端到端X2业务的故障定位排查流程示例图;
图7为本发明实施例提供的L3PTN网络轮询端到端故障定位排查示例图;
图8为本发明实施例提供的L2PTN设备支持L3OAM功能示例图;
图9为本发明实施例提供的一种网络故障检测系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明实施例提供一种网络故障检测方法,所述网络故障检测方法应用于网络系统,所述网络系统包括:至少一个EPC落地L3PTN节点、至少一个L2/L3PTN节点,该方法可以包括:网络节点主动发起网络连通性故障定位排查,其中,所述网络节点包括:核心分组网演进EPC落地L3PTN节点或者L2/L3PTN节点。
其中,核心分组网演进(EPC,Evolved Packet Core),也可以称为4G的核心网。EPC中的核心网设备包括移动性管理设备MME、服务网关S-GW、PDN网关P-GW以及用于存储用户签约信息的HSS和用于计费和策略控制的单元PCRF等。
服务网关(SGW,Serving GateWay)是移动通信网络EPC中的重要网元。EPC网络实际上是原3G核心网PS域的演进版本,而SGW的功能和作用与原3G核心网SGSN网元的用户面相当,即在新的EPC网络中,控制面功能和媒体面功能分离更加彻底。
分组传送网(PTN,Packet Transport Network)是指一种光传送网络架构,具体技术为:在IP业务和底层光传输媒质之间设置了一个层面,它针对分组业务流量的突发性和统计复用传送的要求而设计,以分组业务为核心并支持多业务提供,具有更低的总体使用成本(TCO),同时秉承光传输的传统优势,包括高可用性和可靠性、高效的带宽管理机制和流量工程、便捷的OAM和网管、可扩展、较高的安全性等。
根据运营商网络运营的实际需要,通常将网络的管理工作划分为3大类:操作(Operation)、管理(Administration)、维护(Maintenance),简称OAM。操作主要完成日常网络和业务进行的分析、预测、规划和配置工作;维护主要是对网络及其业务的测试和故障管理等进行的日常操作活动。
一种可能的实现方式中,EPC落地L3PTN节点发起端到端S1业务的网络连通性故障定位排查。
其中,S1业务是eNodeB通过MME来中转传输数据和信令。
一种可能的实现方式中,L2/L3PTN节点发起端到端X2业务的网络连通性故障定位排查。
其中,X2业务是eNodeB之间切换进行数据和信令的直接传输。
一种可能的实现方式中,L2/L3PTN节点发起全网轮询网络连通性故障定位排查。
其中,轮询(Polling)是一种CPU决策如何提供周边设备服务的方式,又称“程控输出入”(Programmed I/O)。轮询法的概念是,由CPU定时发出询问,依序询问每一个周边设备是否需要其服务,有即给予服务,服务结束后再问下一个周边,接着不断周而复始。
现有技术中,OAM主要采用按需的连通性监测机制,当网络中出现由于路由配置故障或者业务连通性故障时,不能主动的上报端到端的连通性监测告警,需由维护人员手工的发起按需的端到端连通性检测,不能主动的上报网络中的故障信息,故障定位效率很低。本发明实施例提供的网络故障检测方法,由核心层设备完成L3层的连通性检测,自动的发现网络中的连通性故障,并主动上报,降低维护人员的操作复杂度,提高管理维护的效率。
本发明实施例提供一种网络故障检测方法,如图1所示,该方法可以包括:
步骤101、EPC落地L3PTN节点向本地SGW/MME节点发起第一连通性监测操作;
步骤102、若所述第一连通性监测失败,通过验证链路的连通性和验证路由配置正确性成功时,确定第一排查故障成功;
步骤103、若所述第一连通性监测成功,或者所述第一排查故障成功,所述EPC落地L3PTN节点向基站eNodeB发起第二连通性监测;
步骤104、若所述第二连通性监测失败,所述EPC落地L3PTN节点向L2/L3PTN节点发起第三连通性监测操作;
步骤105、若所述第三连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、LSP连通性检查成功时,确定第二排查故障成功;
步骤106、若所述第三连通性监测成功,或者所述第二排查故障成功,所述L2/L3PTN节点向所述eNodeB发起第四连通性监测操作;
步骤107、若所述第四连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第三故障排查成功。
示例性的,L2/L3PTN节点具体可以为L2/L3PTN桥接设备,如图2所示,由EPC落地L3PTN节点自动的发起端到端S1业务的自动巡检和故障定位排查,主要包括a1、a2、a3、a4四个排查流程:
第a1流程:由EPC落地L3PTN节点向本地SGW/MME发起连通性监测ping操作;
第a2流程:由EPC落地L3PTN节点向eNodeB发起连通性监测;
第a3流程:由EPC落地L3PTN节点向L2/L3PTN桥接节点发起连通性监测ping操作;
第a4流程:由L2/L3PTN桥接节点向eNodeB发起连通性检测ping操作。
具体的,故障定位排查流程如图3所示,EPC落地L3PTN节点向本地SGW/MME节点发起连通性监测ping操作;若L3PTN节点向本地SGW/MME节点发起的连通性监测失败,联合SGW/MME节点验证链路连通性,然后验证路由配置正确性,若链路连通、路由配置正确时,排查故障成功,EPC落地L3PTN节点向基站eNodeB发起连通性监测。
若L3PTN节点向本地SGW/MME节点发起的连通性监测成功时,EPC落地L3PTN节点向基站eNodeB发起连通性监测;若EPC落地L3PTN节点向基站eNodeB发起的连通性监测成功,则结束;若EPC落地L3PTN节点向基站eNodeB发起的连通性监测失败,EPC落地L3PTN节点向L2/L3PTN节点发起连通性监测ping操作。
若EPC落地L3PTN节点向L2/L3PTN节点发起的连通性监测失败,验证路由配置正确性,网管配置/告警检查、LSP连通性检查成功时,确定排查故障成功,L2/L3PTN节点向eNodeB发起连通性监测ping操作。
若EPC落地L3PTN节点向L2/L3PTN节点发起连通性监测成功,L2/L3PTN节点向eNodeB发起连通性监测ping操作;若L2/L3PTN节点向eNodeB发起连通性监测失败,进行网管配置/告警检查,LSP/PW的LB/LT工具排查成功时,确定故障排查成功,则结束。
其中,Ping是Windows、Unix和Linux系统下的一个命令。ping也属于一个通信协议,是TCP/IP协议的一部分。利用ping命令可以检查网络是否连通,可以很好地帮助我们分析和判定网络故障。ping指的是端对端连通,通常用来作为可用性的检查。ping命令是的原理是:利用网络上机器IP地址的唯一性,给目标IP地址发送一个数据包,再要求对方返回一个同样大小的数据包来确定两台网络机器是否连接相通,时延是多少。
伪线PW是通信领域对各种仿真技术的统称,是建立在边缘路由器之间的一个点对点的连接。伪线的主要功能是仿真一些常见的业务,例如帧中继、时分复用业务(TDM)、异步传输业务(ATM)和以太网等,将被仿真的业务通过一个隐藏的核心MPLS(多协议标签交换)网络,封装到一个共同的MPLS格式中。
现有技术中,L3层OAM机制采用按需的OAM测量机制,一般在故障产生后发起按需的连通性检测,不能主动的发起网络中的连通性故障,现有的PTN+L3网络中的三层路由通过维护人员静态配置完成,网络中由于路由配置错误引起的连通性问题不能产生告警,不易发现。本发明实施例提供的网络故障检测方法,由核心层PTN设备周期性主动的发起连通性巡检功能,由核心层设备完成L3层的连通性检测,自动的发现网络中的连通性故障,并主动上报,降低维护人员的操作复杂度,提高管理维护的效率。
本发明实施例提供一种网络故障检测方法,如图4所示,该方法可以包括:
步骤201、L2/L3PTN节点向本地eNodeB站点发起第五连通性监测操作;
步骤202、若所述第五连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第四排查故障成功;
步骤203、若所述第五连通性监测成功,或者所述第四排查故障成功,所述L2/L3PTN节点向远端eNodeB站点发起第六连通性监测操作;
步骤204、若所述第六连通性监测失败,所述L2/L3PTN节点向远端L2/L3PTN节点发起第七连通性监测操作;
步骤205、若所述第七连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、LSP连通性检查成功时,确定第五排查故障成功;
步骤206、若所述第七连通性监测成功,或者所述第五排查故障成功,远端L2/L3PTN桥接设备向远端eNodeB站点发起第八连通性监测操作;
步骤207、若所述第八连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第六排查故障成功。
示例性的,L2/L3PTN节点具体可以为L2/L3PTN桥接设备,如图5所示,端到端X2业务的自动故障定位和排查流程,主要包括b1、b2、b3、b4四个排查流程:
第b1流程:L2/L3PTN桥接设备向本地eNodeB站点发起连通性检测ping操作;
第b2流程:L2/L3PTN桥接设备向远端eNodeB站点发起连通性检测ping操作;
第b3流程:L2/L3PTN桥接设备向远端L2/L3PTN桥接设备发起连通性检测ping操作;
第b4流程:远端L2/L3PTN桥接设备向远端eNodeB站点发起连通性检测ping操作。
具体的,如图6所示的端到端X2业务的故障自动巡检和排查流程,L2/L3PTN节点向本地eNodeB站点发起连通性监测ping操作;若L2/L3PTN节点向本地eNodeB站点发起的连通性监测失败,进行网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定排查故障成功,确定X2业务是否为本地eNodeB,如果不是本地eNodeB,L2/L3PTN节点向远端eNodeB站点发起连通性监测ping操作;如果是本地eNodeB,则结束。
若L2/L3PTN节点向本地eNodeB站点发起的连通性监测成功,L2/L3PTN节点向远端eNodeB站点发起连通性监测ping操作;若L2/L3PTN节点向远端eNodeB站点发起的连通性监测失败,L2/L3PTN节点向远端L2/L3PTN节点发起连通性监测ping操作;
若L2/L3PTN节点向远端L2/L3PTN节点发起的连通性监测失败,进行验证路由配置正确性、网管配置/告警检查、LSP连通性检查成功时,确定排查故障成功,远端L2/L3PTN节点向远端eNodeB站点发起连通性监测ping操作。
若L2/L3PTN节点向远端L2/L3PTN节点发起的连通性监测成功,远端L2/L3PTN节点向远端eNodeB站点发起连通性监测ping操作,如果远端L2/L3PTN节点向远端eNodeB站点发起的连通性监测成功,则结束;若远端L2/L3PTN节点向远端eNodeB站点发起的连通性监测失败,进行网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定排查故障成功,则结束。
在日常维护过程中,为减少维护人员的操作复杂度,本发明实施例提供的网络检测方法,定期的发起连通性监测工作,对网络中的路由配置正确性,业务连通性进行验证,轮询的连通性监测由L2/L3PTN桥接设备发起。
L3PTN网络故障定位轮询排查示例如图7所示,L2/L3PTN节点具体可以为L2/L3PTN桥接设备,L2/L3PTN桥接设备可以发起c1、c2、c3、c4四种轮询操作:
第c1流程:L2/L3PTN桥接设备向所有本地的eNodeB站点发起轮询ping连通性检测操作。
第c2流程:L2/L3PTN桥接设备向核心层所有EPC落地L3PTN设备的落地接口发起轮询ping连通性检测操作。
第c3流程:L2/L3PTN桥接设备向核心层所有其他L2/L3PTN桥接设备的L2/L3转发接口发起轮询ping连通性检测操作。
第c4流程:L2/L3PTN桥接设备向所有其他网络归属区域的eNodeB站点发起轮询ping连通性检测操作。
本发明实施例提供的网络故障检测方法,由核心层设备完成L3层的连通性检测,自动的发现网络中的连通性故障,并主动上报,降低维护人员的操作复杂度,提高管理维护的效率。
本发明实施例提供的网络检测方法中,L2PTN设备配置使能环回响应L3OAM功能,L2PTN设备通过对L3层OAM报文进行提取和环回处理,来进行连通性监测。
其中,连通性监测可以简单地理解为:发送方发送报文至接收方,接收方再将该报文返回至发送方,若发送方接收到接收方返回的报文,则可以确定发送方与接收方是连通性的,若发送方没有接收到接收方返回的报文,则可以确定发送方与接收方是不连通性的。具体的,本发明实施例提供的网络检测方法中的连通性监测具体如下所述:
L2PTN设备扩展支持L3层OAM功能的示意图,如图8所示,图8中中间的L3PTN设备可以理解为L2/L3PTN桥接设备,该L2/L3PTN桥接设备具备L2PTN和L3PTN的功能,作为桥接设备连接图中左侧的L2PTN设备和右侧的L3PTN设备,发送方可以理解为右侧的L3PTN设备,接收方可以理解为左侧的L2PTN设备。
L2PTN设备接收L3PTN设备发送的L3OAM报文,所述L3OAM携带标识信息、IP地址和生存时间TTL值;L2PTN设备通过所述标识信息确定所述L3OAM报文是否为需要环回响应、通过所述IP地址确定所述L3OAM报文是否为本地接收,确定所述TTL值是否满足预设条件;当所述L3OAM报文是需要环回的报文,且所述L3OAM报文本地接收,且所述TTL值满足预设条件,L2PTN设备将所述L3OAM报文的IP地址进行置换,重新设置所述TTL值,环回发送重新设置的所述L3OAM报文。
其中,L3OAM携带的IP地址包括L2PTN设备的IP地址和L3PTN设备的IP地址,L2PTN设备将所述L3OAM报文的IP地址进行置换可以理解为将接收方L2PTN设备的IP地址与发送方L3PTN设备的IP地址进行置换,即发送方改为L2PTN设备的IP地址,接收方改为L3PTN设备的IP地址,则L2PTN设备将L3OAM报文发送给L3PTN设备。
其中,生存时间值(TTL,Time To Live),该字段指定IP包被路由器丢弃之前允许通过的最大网段数量,TTL是IPv4包头的一个8bit字段。
需要说明的是,本发明实施例提供的网络检测方法中,第一连通性监测操作、第二连通性监测操作、第三连通性监测操作、第四连通性监测操作、第五连通性监测操作、第六连通性监测操作、第七连通性监测操作、第八连通性监测操作、或者轮询连通性监测操作均可以采用上述的图8所示的连通性监测方法,只是具体的发送方和接收方不同。
现有的L3PTN OAM技术中,L2PTN设备不支持L3层OAM功能,如果对L2PTN设备进行改造,需要在L2PTN增加L3层OAM的控制实体,以及对L3OAM的转发处理功能。本发明实施例中,定义了L2PTN设备支持的L3OAM功能的最小集合,不需要在L2PTN设备增加L3层OAM的控制实体,而是对L3层OAM报文进行提取和环回处理,最大化的降低了L2层PTN设备支持L3OAM功能的改造量,L3层OAM功能的处理由核心层L3PTN设备实现。该方法适用于对各种L3层OAM协议的处理,如IP OAM、TWAMP、ICMP ECHO等。
本发明实施例提供一种网络故障检测系统9,如图9所示,所述系统9包括:EPC落地L3PTN节点90、L2/L3PTN节点91,其中,
所述EPC落地L3PTN节点90,用于发起端到端S1业务的网络连通性故障定位排查;
所述L2/L3PTN节点91,用于发起端到端X2业务的网络连通性故障定位排查;或者,
所述L2/L3PTN节点91,用于发起全网轮询网络连通性故障定位排查。
进一步地,所述EPC落地L3PTN节点90,具体用于向本地SGW/MME节点发起第一连通性监测操作;还用于若所述第一连通性监测失败,通过验证链路的连通性和验证路由配置正确性成功时,确定第一排查故障成功;还用于若所述第一连通性监测成功,或者所述第一排查故障成功,向基发起第二连通性监测;还用于若所述第二连通性监测失败,所述EPC落地L3PTN节点向L2/L3PTN节点发起第三连通性监测操作;还用于若所述第三连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、LSP连通性检查成功时,确定第二排查故障成功;
所述L2/L3PTN节点91,具体用于若所述第三连通性监测成功,或者所述第二排查故障成功,向所述eNodeB发起第四连通性监测操作;还用于若所述第四连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第三故障排查成功。
进一步地,所述L2/L3PTN节点91,具体用于向本地eNodeB站点发起第五连通性监测操作;还用于若所述第五连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第四排查故障成功;还用于若所述第五连通性监测成功,或者所述第四排查故障成功,向远端eNodeB站点发起第六连通性监测操作;还用于若所述第六连通性监测失败,向远端L2/L3PTN节点发起第七连通性监测操作;还用于若所述第七连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、LSP连通性检查成功时,确定第五排查故障成功;还用于若所述第七连通性监测成功,或者所述第五排查故障成功,远端L2/L3PTN节点向远端eNodeB发起第八连通性监测操作;还用于若所述第八连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第六排查故障成功。
进一步地,所述L2/L3PTN节点91,具体用于向所有本地eNodeB发起轮询连通性监测操作;
或者,
所述L2/L3PTN节点91,具体用于向核心层所有EPC落地L3PTN节点的落地接口发起轮询连通性监测操作;
或者,
所述L2/L3PTN节点91,具体用于向核心层所有远端L2/L3PTN节点的L2/L3转发接口发起轮询连通性监测操作;
或者,
所述L2/L3PTN节点91,具体用于向所有除本地网络外的网络归属区域的eNodeB发起轮询连通性监测操作。
具体的,本发明实施例提供的网络故障检测系统的理解可以参考上述网络故障检测方法的说明,本发明实施例在此不再赘述。
本发明实施例提供的网络故障检测系统,由核心层设备完成L3层的连通性检测,自动的发现网络中的连通性故障,并主动上报,降低维护人员的操作复杂度,提高管理维护的效率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (9)

1.一种网络故障检测方法,其特征在于,所述方法包括:
网络节点主动发起网络连通性故障定位排查,其中,所述网络节点包括:核心分组网演进EPC落地L3 PTN节点或者L2/L3 PTN节点;所述网络连通性故障定位排查是L3层连通性检测;
其中,所述网络节点主动发起网络连通性故障定位排查,包括:所述EPC落地L3 PTN节点发起端到端S1业务的网络连通性故障定位排查;或者,所述L2/L3 PTN节点发起端到端X2业务的网络连通性故障定位排查;或者,所述L2/L3 PTN节点发起全网轮询网络连通性故障定位排查;
其中,所述L2/L3 PTN节点,包括:L2/L3 PTN桥接设备;L2/L3 PTN桥接设备具备L2PTN和L3PTN的功能;
其中,L2 PTN设备扩展支持L3层OAM功能,包括:
接收L3 OAM报文,所述L3 OAM携带标识信息、IP地址和生存时间TTL值;
通过所述标识信息确定所述L3 OAM报文是否为需要环回响应、通过所述IP地址确定所述L3 OAM报文是否为本地接收,确定所述TTL值是否满足预设条件;
当所述L3 OAM报文是需要环回的报文,且所述L3 OAM报文本地接收,且所述TTL值满足预设条件,将所述L3 OAM报文的IP地址进行置换,重新设置所述TTL值为默认值,环回发送重新设置的所述L3 OAM报文。
2.根据权利要求1所述的方法,其特征在于,所述EPC落地L3 PTN节点发起端到端S1业务的网络连通性故障定位排查,包括:
所述EPC落地L3 PTN节点向本地SGW/MME节点发起第一连通性监测操作;
若所述第一连通性监测失败,通过验证链路的连通性和验证路由配置正确性成功时,确定第一排查故障成功;
若所述第一连通性监测成功,或者所述第一排查故障成功,所述EPC落地L3 PTN节点向基站eNodeB发起第二连通性监测;
若所述第二连通性监测失败,所述EPC落地L3 PTN节点向L2/L3 PTN节点发起第三连通性监测操作;
若所述第三连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、标签交换路径LSP连通性检查成功时,确定第二排查故障成功;
若所述第三连通性监测成功,或者所述第二排查故障成功,所述L2/L3 PTN节点向所述eNodeB发起第四连通性监测操作;
若所述第四连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第三故障排查成功。
3.根据权利要求1所述的方法,其特征在于,所述L2/L3 PTN节点发起端到端X2业务的网络连通性故障定位排查,包括:
所述L2/L3 PTN节点向本地eNodeB站点发起第五连通性监测操作;
若所述第五连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第四排查故障成功;
若所述第五连通性监测成功,或者所述第四排查故障成功,所述L2/L3 PTN节点向远端eNodeB站点发起第六连通性监测操作;
若所述第六连通性监测失败,所述L2/L3 PTN节点向远端L2/L3 PTN节点发起第七连通性监测操作;
若所述第七连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、LSP连通性检查成功时,确定第五排查故障成功;
若所述第七连通性监测成功,或者所述第五排查故障成功,远端L2/L3 PTN节点向远端eNodeB站点发起第八连通性监测操作;
若所述第八连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第六排查故障成功。
4.根据权利要求1所述的方法,其特征在于,所述L2/L3 PTN节点发起全网轮询网络连通性故障定位排查,包括:
所述L2/L3 PTN节点向所有本地eNodeB发起轮询连通性监测操作;
或者,
所述L2/L3 PTN节点向核心层所有EPC落地L3 PTN节点的落地接口发起轮询连通性监测操作;
或者,
所述L2/L3 PTN节点向核心层所有远端L2/L3 PTN节点的L2/L3转发接口发起轮询连通性监测操作;
或者,
所述L2/L3 PTN节点向所有除本地网络外的网络归属区域的eNodeB发起轮询连通性监测操作。
5.根据权利要求2至4任一项所述的方法,其特征在于,
连通性监测操作为:第一连通性监测操作、第二连通性监测操作、第三连通性监测操作、第四连通性监测操作、第五连通性监测操作、第六连通性监测操作、第七连通性监测操作、第八连通性监测操作、或者轮询连通性监测操作。
6.一种网络故障检测系统,其特征在于,所述系统包括:EPC落地L3 PTN节点、L2/L3PTN节点,其中,
所述EPC落地L3 PTN节点,用于发起端到端S1业务的网络连通性故障定位排查;
所述L2/L3 PTN节点,用于发起端到端X2业务的网络连通性故障定位排查;或者,
所述L2/L3 PTN节点,用于发起全网轮询网络连通性故障定位排查;其中,所述L2/L3PTN节点,包括:L2/L3 PTN桥接设备;L2/L3 PTN桥接设备具备L2PTN和L3PTN的功能;
所述网络故障检测是L3层连通性检测;
其中,L2 PTN设备扩展支持L3层OAM功能,包括:
接收L3 OAM报文,所述L3 OAM携带标识信息、IP地址和生存时间TTL值;
通过所述标识信息确定所述L3 OAM报文是否为需要环回响应、通过所述IP地址确定所述L3 OAM报文是否为本地接收,确定所述TTL值是否满足预设条件;
当所述L3 OAM报文是需要环回的报文,且所述L3 OAM报文本地接收,且所述TTL值满足预设条件,将所述L3 OAM报文的IP地址进行置换,重新设置所述TTL值为默认值,环回发送重新设置的所述L3 OAM报文。
7.根据权利要求6所述的系统,其特征在于,
所述EPC落地L3 PTN节点,具体用于向本地SGW/MME节点发起第一连通性监测操作;还用于若所述第一连通性监测失败,通过验证链路的连通性和验证路由配置正确性成功时,确定第一排查故障成功;还用于若所述第一连通性监测成功,或者所述第一排查故障成功,向基发起第二连通性监测;还用于若所述第二连通性监测失败,所述EPC落地L3 PTN节点向L2/L3 PTN节点发起第三连通性监测操作;还用于若所述第三连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、LSP连通性检查成功时,确定第二排查故障成功;
所述L2/L3 PTN节点,具体用于若所述第三连通性监测成功,或者所述第二排查故障成功,向eNodeB发起第四连通性监测操作;还用于若所述第四连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第三故障排查成功。
8.根据权利要求6所述的系统,其特征在于,
所述L2/L3 PTN节点,具体用于向本地eNodeB站点发起第五连通性监测操作;还用于若所述第五连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第四排查故障成功;还用于若所述第五连通性监测成功,或者所述第四排查故障成功,向远端eNodeB站点发起第六连通性监测操作;还用于若所述第六连通性监测失败,向远端L2/L3PTN节点发起第七连通性监测操作;还用于若所述第七连通性监测失败,通过验证路由配置正确性以及网管配置/告警检查、LSP连通性检查成功时,确定第五排查故障成功;还用于若所述第七连通性监测成功,或者所述第五排查故障成功,远端L2/L3PTN节点向远端eNodeB发起第八连通性监测操作;还用于若所述第八连通性监测失败,通过网管配置/告警检查、LSP/PW的LB/LT工具排查成功时,确定第六排查故障成功。
9.根据权利要求6所述的系统,其特征在于,
所述L2/L3 PTN节点,具体用于向所有本地eNodeB发起轮询连通性监测操作;
或者,
所述L2/L3 PTN节点,具体用于向核心层所有EPC落地L3 PTN节点的落地接口发起轮询连通性监测操作;
或者,
所述L2/L3 PTN节点,具体用于向核心层所有远端L2/L3 PTN节点的L2/L3转发接口发起轮询连通性监测操作;
或者,
所述L2/L3 PTN节点,具体用于向所有除本地网络外的网络归属区域的eNodeB发起轮询连通性监测操作。
CN201610290796.8A 2016-05-04 2016-05-04 一种网络故障检测方法和系统 Active CN107347014B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610290796.8A CN107347014B (zh) 2016-05-04 2016-05-04 一种网络故障检测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610290796.8A CN107347014B (zh) 2016-05-04 2016-05-04 一种网络故障检测方法和系统

Publications (2)

Publication Number Publication Date
CN107347014A CN107347014A (zh) 2017-11-14
CN107347014B true CN107347014B (zh) 2020-12-18

Family

ID=60253467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610290796.8A Active CN107347014B (zh) 2016-05-04 2016-05-04 一种网络故障检测方法和系统

Country Status (1)

Country Link
CN (1) CN107347014B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11477117B1 (en) 2020-11-23 2022-10-18 Juniper Networks, Inc. High-availability switchover based on traffic metrics
CN114826952A (zh) * 2021-01-27 2022-07-29 中国移动通信有限公司研究院 一种用于oam检测的信息处理方法、装置和节点设备
CN113395319B (zh) * 2021-04-26 2022-09-16 国网江西省电力有限公司经济技术研究院 网络故障感知的方法、系统、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101370525A (zh) * 2005-08-19 2009-02-18 艾博特公司 双重可变结构域免疫球蛋白及其用途
CN102916843A (zh) * 2012-11-19 2013-02-06 烽火通信科技股份有限公司 利用ptn网络承载点对点专线业务的链路保护实现方法
CN103188151A (zh) * 2011-12-31 2013-07-03 中国移动通信集团广东有限公司 一种分组传送网络和在分组传送网络中传输业务的方法
CN103457851A (zh) * 2012-05-28 2013-12-18 中国移动通信集团广东有限公司 Ptn组网架构及基于该ptn组网架构的业务承载方法
CN103684818A (zh) * 2012-09-07 2014-03-26 中兴通讯股份有限公司 检测网络通道故障的方法及装置
CN103888295A (zh) * 2014-03-07 2014-06-25 烽火通信科技股份有限公司 Ptn/ipran网管中基于环回实现lsp快速检测的方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101370525A (zh) * 2005-08-19 2009-02-18 艾博特公司 双重可变结构域免疫球蛋白及其用途
CN103188151A (zh) * 2011-12-31 2013-07-03 中国移动通信集团广东有限公司 一种分组传送网络和在分组传送网络中传输业务的方法
CN103457851A (zh) * 2012-05-28 2013-12-18 中国移动通信集团广东有限公司 Ptn组网架构及基于该ptn组网架构的业务承载方法
CN103684818A (zh) * 2012-09-07 2014-03-26 中兴通讯股份有限公司 检测网络通道故障的方法及装置
CN102916843A (zh) * 2012-11-19 2013-02-06 烽火通信科技股份有限公司 利用ptn网络承载点对点专线业务的链路保护实现方法
CN103888295A (zh) * 2014-03-07 2014-06-25 烽火通信科技股份有限公司 Ptn/ipran网管中基于环回实现lsp快速检测的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PTN+L3承载TD-LTE移动回传的网络保护应用方案;黄智瀛;《电信网技术》;20121231(第12期);第22页第2栏第1-5行,图1,4 *

Also Published As

Publication number Publication date
CN107347014A (zh) 2017-11-14

Similar Documents

Publication Publication Date Title
US11451459B2 (en) Multi-hop reflector sessions
US8085670B2 (en) Method and system for originating connectivity fault management (CFM) frames on non-CFM aware switches
US8111627B2 (en) Discovering configured tunnels between nodes on a path in a data communications network
US7983174B1 (en) Method and apparatus for diagnosing a fault in a network path
US9521055B2 (en) Network connectivity management
EP2395702B1 (en) Method and device for processing fault
CN107342809B (zh) 一种业务性能监测与故障定位方法及装置
US9755929B2 (en) Method and apparatus for link check in passive optical network
CN109672619A (zh) 一种处理报文的方法、设备及系统
CN103078791B (zh) Oam报文处理方法、设备及系统
CN104683187A (zh) 一种实现路由器二层vpn业务物理接口端到端测量的方法
US20140086040A1 (en) Network system, transmission device, and fault information delivery method
CN107347014B (zh) 一种网络故障检测方法和系统
CN106685817B (zh) 一种用于盒端设备流量切换的方法和装置
CN102868569A (zh) 三层虚拟专用网的性能检测方法、节点和系统
WO2015184740A1 (zh) 检测层次信息的处理方法及装置
CN102308526B (zh) 实现连通性检测的方法、会聚设备和系统
US20080267080A1 (en) Fault Verification for an Unpaired Unidirectional Switched-Path
US7881207B2 (en) Method and system for loop-back and continue in packet-based network
CN106161124B (zh) 报文的测试处理方法及装置
CN106559234B (zh) 控制消息发送方法及装置
US7894459B2 (en) Determining availability of a network service
CN105656668B (zh) 以太业务传输方法及装置
CN108156076B (zh) 基于mpls-tp线性保护的bfd报文结构、检测方法与装置
KR101906437B1 (ko) 네트워크 보안 정책을 테스트하는 방법, 장치 및 컴퓨터 프로그램

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant