CN112636944B - Olt设备脱网智能诊断方法及系统 - Google Patents

Olt设备脱网智能诊断方法及系统 Download PDF

Info

Publication number
CN112636944B
CN112636944B CN201910952524.3A CN201910952524A CN112636944B CN 112636944 B CN112636944 B CN 112636944B CN 201910952524 A CN201910952524 A CN 201910952524A CN 112636944 B CN112636944 B CN 112636944B
Authority
CN
China
Prior art keywords
alarm
olt
equipment
service
port
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910952524.3A
Other languages
English (en)
Other versions
CN112636944A (zh
Inventor
刘宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unihub China Information Technology Co Ltd
Original Assignee
Unihub China Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unihub China Information Technology Co Ltd filed Critical Unihub China Information Technology Co Ltd
Priority to CN201910952524.3A priority Critical patent/CN112636944B/zh
Publication of CN112636944A publication Critical patent/CN112636944A/zh
Application granted granted Critical
Publication of CN112636944B publication Critical patent/CN112636944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q2011/0079Operation or maintenance aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Optical Communication System (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明提出了一种OLT设备脱网智能诊断方法及系统,该方法及系统实现了对OLT设备的脱网告警进行分析,通过判断端口流量、告警恢复时间、进行上层交换机掉电诊断等方式,进行智能化的故障定位,整个过程耗时短、定位准确;同时,该方法及系统还可以在收到BAS或交换机设备端口down告警时,通过查询二层拓扑网络关系,找到对应的OLT设备,并根据端口类型做进一步的细化分析,在影响OLT上的业务时派生OLT的业务告警,以便及时对故障产生原因进行诊断,保证底层光网络设备的正常工作,使上网客户有较佳的上网体验。

Description

OLT设备脱网智能诊断方法及系统
技术领域
本发明涉及OLT设备技术领域,尤指一种OLT设备脱网智能诊断方法及系统。
背景技术
目前,OLT设备作为底层的光网络设备,其上业务是否正常直接关系到上网客户的体验。而受网络拓扑结构影响,其业务故障发生时难以及时发现,且故障原因用传统人工方式定位较复杂,耗时长。传统业务中,只能处理OLT设备本身的脱网告警,未对设备上业务进行告警分析。
因此,亟需一种可以对OTL设备脱网进行智能诊断的方案,及时发现OLT业务告警,并对故障产生原因进行诊断。
发明内容
为解决上述问题,本发明提出了一种OLT设备脱网智能诊断方法及系统,可以对OLT设备的脱网告警进行分析,通过判断端口流量、告警恢复时间、进行上层交换机掉电诊断等方式,进行智能化的故障定位。同时,基于二层拓扑发现技术,通过查询二层拓扑网络关系,能在收到BAS(宽带接入服务器)或交换机设备端口down告警时,找到对应的OLT设备,并根据端口类型做进一步的细化分析,判断是否影响OLT上业务,若影响,则派生OLT的业务告警。
具体的,在本发明的一实施例中,提出了一种OLT设备脱网智能诊断方法,该方法包括:
获取OLT脱网告警;
根据OLT脱网告警,判断OLT设备的上联设备的ping状态;
如果所述上联设备ping通,判断所述上联设备的所有端口流量状态;
如果全部端口的流量状态为有流量,判定业务路径正常;
如果存在一定数量的零流量端口,判断所述一定数量的零流量端口的状态,如果状态一致,判定故障原因为传输断,如果状态不一致,判定故障原因为光缆断或传输断;
如果所述上联设备ping不通,判断所述上联设备的类型;
如果所述上联设备为BAS,判定故障原因为BAS ping不通;
如果所述上联设备为交换机,根据二层拓扑路径模型,获取所述OLT设备所属的所有BAS端口,并判断BAS下联口的流量,如果业务路径上都有流量,判定业务路径正常,如果任意一条业务路径无流量,判定故障原因为上层设备的光缆断、传输断或上层设备掉电。
具体的,在本发明的一实施例中,还提出了一种OLT设备脱网智能诊断系统,该系统包括:
告警获取模块,用于获取OLT脱网告警;
故障诊断模块,用于根据OLT脱网告警,判断OLT设备的上联设备的ping状态;
如果所述上联设备ping通,判断所述上联设备的所有端口流量状态;
如果全部端口的流量状态为有流量,判定业务路径正常;
如果存在一定数量的零流量端口,判断所述一定数量的零流量端口的状态,如果状态一致,判定故障原因为传输断,如果状态不一致,判定故障原因为光缆断或传输断;
如果所述上联设备ping不通,判断所述上联设备的类型;
如果所述上联设备为BAS,判定故障原因为BAS ping不通;
如果所述上联设备为交换机,根据二层拓扑路径模型,获取所述OLT设备所属的所有BAS端口,并判断BAS下联口的流量,如果业务路径上都有流量,判定业务路径正常,如果任意一条业务路径无流量,判定故障原因为上层设备的光缆断、传输断或上层设备掉电。
本发明提出的OLT设备脱网智能诊断方法及系统实现了对OLT设备的脱网告警进行分析,通过判断端口流量、告警恢复时间、进行上层交换机掉电诊断等方式,进行智能化的故障定位,整个过程耗时短、定位准确;同时,该方法及系统还可以在收到BAS或交换机设备端口down告警时,通过查询二层拓扑网络关系,找到对应的OLT设备,并根据端口类型做进一步的细化分析,在影响OLT上的业务时派生OLT的业务告警,以便及时对故障产生原因进行诊断,保证底层光网络设备的正常工作,使上网客户有较佳的上网体验。
附图说明
图1是本发明一实施例的OLT网管脱网告警派生出OLT业务脱网告警逻辑示意图。
图2是本发明一实施例的交换机/BAS端口down告警派生OLT业务脱网告警逻辑示意图。
图3是本发明一实施例的智能故障诊断流程图。
图4是本发明一实施例的脱网恢复诊断流程图。
图5是本发明一实施例的OLT设备脱网智能诊断系统架构示意图。
图6是本发明一实施例的告警获取模块的架构示意图。
图7是本发明另一实施例的OLT设备脱网智能诊断系统架构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
OLT(光线路终端)是重要的局端设备,根据本发明的实施方式,提出了一种OLT设备脱网智能诊断方法及系统。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。需要说明的是,尽管在实施例及附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
图1及图2是本发明一实施例的派生OLT业务脱网告警的方法流程图。如图1及图2所示,派生OLT业务告警主要有两方面逻辑,分别为OLT网管脱网告警派生出OLT业务脱网告警逻辑及交换机/BAS端口down告警派生OLT业务脱网告警逻辑。
具体的,如图1所示,OLT网管脱网告警派生出OLT业务脱网告警逻辑为:
步骤S101,获取脱网设备的上联设备的ping状态,并判断ping状态;若上联含多个设备,每个设备路径均需要按后续流程逻辑进行处理。故障原因结果按“路径1:故障原因1;路径2:故障原因2;……”的格式处理,所有故障原因按“或”方式关系出结果。
步骤S102,如果上联设备ping通,进一步判断上联设备的所有端口流量状态;
步骤S103,如果所有上联设备的端口都有流量,判定业务路径正常;
步骤S104,如果存在至少一个端口无流量(即,存在一个端口流量为0则为零流量,也称无流量),派生业务脱网告警。
具体的,如图2所示,交换机/BAS端口down告警派生OLT业务脱网告警逻辑为:
步骤S201,利用PON网管接收交换机端口down告警和/或BAS端口down告警,进行分析;
步骤S202,通过查询二层拓扑关系,获取对端设备类型,并根据对端设备类型,生成端口到对端设备的down告警;
具体的,步骤S202包括:
根据交换机端口down告警,查询二层拓扑关系,并根据包括BAS、交换机、OLT设备及DSLAM在内的对端设备类型进行划分,得到四种告警类型:端口到BAS的down告警、端口到交换机的down告警、端口到OLT设备的down告警及端口到DSLAM的down告警;其中,其它类型或无法识别对端设备的down告警不生成;
针对BAS端口down告警,查询二层拓扑关系,根据包括交换机和OLT设备在内的对端设备类型进行划分,得到两种告警类型:端口到交换机的down告警及端口到OLT设备的down告警;其中,其它类型或无法识别对端设备的down告警不生成。
步骤S203,筛选出端口到OLT设备的down告警;
步骤S204,进一步判断down端口的类型;
步骤S205,如果down的端口是纯物理口,进一步判断是否已有OLT业务脱网告警,如果已有,则执行步骤S206,端口down告警为衍生告警,不重复派单,如果没有,则执行步骤S207,产生新的OLT业务脱网告警,且源端口down告警不派单;
步骤S208,如果down的端口是捆绑口,进一步查看所述捆绑口对应的所有物理口是否都是down状态;
步骤S209,如果都是down状态,则判定为OLT业务脱网告警,进一步判断是否已有OLT业务脱网告警,如果已有,则执行步骤S210,端口down告警为衍生告警,不重复派单,如果没有,则执行步骤S207,产生新的OLT业务脱网告警;
步骤S211,如果不都是down状态,则继续按所述端口到OLT设备的down告警进行派单;
其中,如果生成的是新的OLT业务脱网告警,则所述端口到OLT设备的down告警不出或改为衍生告警出;否则,继续按照“端口到OLT设备的down告警”出告警。
步骤S212,按照判断后的告警类型进行派单。
在得到故障告警后,进一步需要进行智能故障诊断。具体过程包括OLT脱网故障诊断以及脱网恢复诊断。
图3是本发明一实施例的智能故障诊断流程图。如图3所示,包括:
步骤S301,基于前述派生的OLT脱网告警,进行智能故障诊断;其中,整个逻辑过程是针对OLT设备脱网告警以及OLT业务脱网告警,对OLT脱网的具体原因进行诊断,同时,可以单独新建一个独立于掉电故障原因的字段保存。
OLT设备脱网告警跟OLT业务告警要求生成在一设定时间A之后再转发,例如可以将设定时间A设定为8分钟,具体可以根据实际需要设定。
OLT业务脱网告警生成后即要进行故障原因诊断。OLT设备脱网告警生成后,在一设定时间B内判断是否有OLT业务脱网告警,如果有则OLT设备脱网告警为衍生告警,超过设定时间B没有OLT业务告警,则对OLT设备脱网告警进行故障原因诊断。可以将设定时间B设定为3分钟,具体可以根据实际需要设定。
步骤S302,根据OLT脱网告警,判断OLT设备的上联设备的ping状态。上联有多个设备的,每台设备都按照相同方式进行处理,结果按“路径1:原因1;路径2:原因2;……”的格式处理;所有原因按“或”关系出结果。
步骤S303,如果所述上联设备ping通,进一步判断所述上联设备的所有端口流量状态(有捆绑口的按捆绑口);如果所述上联设备ping不通,则执行步骤S310。
步骤S304,如果全部端口的流量状态为有流量,判定业务路径正常。
步骤S305,如果存在一定数量的零流量端口,通过反查BAS在线用户,抽取脱网OLT设备上的一定数量的用户,在对应的BAS(网管系统已采集存有账号和BAS对应关系数据)上进行在线情况检查,判断是否有相关用户信息。例如,可以抽取脱网OLT设备上的20个用户,具体可以根据实际需要配置。
执行步骤S306,如果查询到相关用户信息,认定用户在线,判定该业务路径正常。
执行步骤S307,如果未查询到相关用户信息,进一步判断所述一定数量的零流量端口的状态。其中,如果零流量端口包含捆绑口,按照捆绑口的状态进行判断。具体的,可以派生业务脱网告警(有原因)判断端口状态,只判断零流量的端口,多端口一致按UP算,不一致按DOWN算。
步骤S308,如果多端口的状态一致,则为UP,判定故障原因为传输断。
步骤S309,如果多端口的状态不一致,则为DOWN,判定故障原因为光缆断或传输断。
步骤S310,如果所述上联设备ping不通,判断所述上联设备的类型。
步骤S311,如果所述上联设备为BAS,判定故障原因为BAS ping不通。
步骤S312,如果所述上联设备为交换机,根据二层拓扑路径模型,如OLT-交换机-BAS路径模型,获取所述OLT所属的所有BAS端口;根据脱网的OLT设备到上联交换机透传的VLAN,其中,选择范围不同的两个VLAN(这两个VLAN的范围最好是一个偏大、一个偏小),根据所述两个VLAN选择业务路径。
步骤S313,判断两条业务路径(也可能是同一条业务路径)上,BAS下联口的流量;如果业务路径上都有流量,则执行步骤S306,判定业务路径正常。
步骤S314,如果任意一条业务路径无流量,进一步反查BAS在线用户。如果查询到相关用户信息,认定用户在线,则执行步骤S306,判定业务路径正常。
步骤S315,如果未查询到相关用户信息,判定故障原因为上层设备的光缆断、传输断或上层设备掉电。
在前述OLT脱网故障诊断的基础上,进一步的可以进行脱网恢复诊断。参考图4所示,为本发明一实施例的脱网恢复诊断流程图。
如图4所示,在得到故障原因后,可以对OLT业务脱网进行恢复诊断;
如果网管脱网告警恢复,将网管脱网告警在PON网管的告警表清除到历史表时,并增加触发器进行检查,如果同时有对应OLT业务脱网告警,修改OLT业务脱网告警的恢复时间为网管脱网告警的恢复时间,修改业务脱网告警的掉电原因为网管脱网告警的掉电原因,OLT业务脱网告警不再进行掉电诊断;
如果上联端口down告警恢复,记录端口down告警与派生OLT业务脱网告警的告警ID对应关系,当上联端口down告警恢复时,在IP网管上增加触发器,将IP网管上联端口down告警恢复时间同步到PON网管对应OLT业务脱网告警的恢复时间(需要做DB link)。在OLT业务脱网告警到恢复时间后,进行掉电诊断。
另外,还可以利用设置的掉电恢复时间进行掉电诊断,判断在所述掉电恢复时间内恢复的OLT网管脱网告警以及OLT业务脱网告警,记录故障原因为掉电恢复时间内恢复。掉电恢复时间可以设置为例如60秒,具体可以根据实际需要设定。
更进一步的,结合图4所示,本发明还可以进行恢复后的掉电诊断,主要是针对不同类型的故障原因。
具体的,
对于故障原因为上层设备的光缆断、传输断或上层设备掉电的故障,若为网管脱网告警,派生出业务脱网告警并把同样的原因输入;如果收到恢复告警,增加调用上联交换机掉电诊断逻辑。选取上联的业务路径,所述业务路径根据范围不同的两个VLAN选取;将上联的业务路径上涉及的所有交换机进行掉电诊断,诊断出有交换机掉电的则故障原因为汇聚交换机掉电,否则故障原因为上层设备光缆断或传输断。
对于故障原因为传输断、光缆断、上层设备光缆断或传输断的故障,如果收到恢复告警,判断故障是否是在一设定时间C内恢复,如果是,则故障原因修改为线路割接,否则保留原有故障原因。其中,可以将设定时间C设定为30分钟,即如果故障是在30分钟内恢复的,则可以判定为线路割接。
基于同一发明构思,本发明还提出了一种OLT设备脱网智能诊断系统。该系统的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的术语“单元”或者“模块”,可以是实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图5是本发明一实施例的OLT设备脱网智能诊断系统架构示意图,如图5所示,该系统包括:
告警获取模块510,用于获取OLT脱网告警;
故障诊断模块520,用于根据OLT脱网告警,判断OLT设备的上联设备的ping状态;
如果所述上联设备ping通,判断所述上联设备的所有端口流量状态;
如果全部端口的流量状态为有流量,判定业务路径正常;
如果存在一定数量的零流量端口,判断所述一定数量的零流量端口的状态,如果状态一致,判定故障原因为传输断,如果状态不一致,判定故障原因为光缆断或传输断;
如果所述上联设备ping不通,判断所述上联设备的类型;
如果所述上联设备为BAS,判定故障原因为BAS ping不通;
如果所述上联设备为交换机,根据二层拓扑路径模型,获取所述OLT设备所属的所有BAS端口,并判断BAS下联口的流量,如果业务路径上都有流量,判定业务路径正常,如果任意一条业务路径无流量,判定故障原因为上层设备的光缆断、传输断或上层设备掉电。
更进一步的,结合图6所示,为告警获取模块的架构示意图,告警获取模块510还包括:
业务脱网告警派生单元5101,用于获取脱网设备的上联设备的ping状态,如果所述上联设备ping通,进一步判断上联设备的所有端口流量状态;
如果所有上联设备的端口都有流量,判定业务路径正常;
如果存在至少一个端口无流量,派生业务脱网告警。
端口down告警接收单元5102,用于通过PON网管接收交换机端口down告警和/或BAS端口down告警;
端口down告警整合单元5103,用于通过查询二层拓扑关系,获取对端设备类型,并根据对端设备类型,生成端口到对端设备的down告警;
筛选单元5104,用于筛选出端口到OLT设备的down告警;
端口down告警派单单元5105,用于在down的端口是纯物理口的情况下,进一步判断是否已有OLT业务脱网告警,如果已有,则不重复派单,如果没有,则产生新的OLT业务脱网告警;
在down的端口是捆绑口的情况下,查看所述捆绑口对应的所有物理口是否都是down状态;
如果都是down状态,则判定为OLT业务脱网告警,进一步判断是否已有
OLT业务脱网告警,如果已有,则不重复派单,如果没有,则产生新的OLT业务脱网告警;
如果不都是down状态,则继续按所述端口到OLT设备的down告警进行派单。
结合图7所示,为本发明另一实施例的OLT设备脱网智能诊断系统架构示意图,如图7所示,该系统还包括:
恢复诊断模块530,用于在得到故障原因后,对OLT业务脱网进行恢复诊断;
如果网管脱网告警恢复,将网管脱网告警在PON网管的告警表清除到历史表时,并增加触发器进行检查,如果同时有对应OLT业务脱网告警,修改OLT业务脱网告警的恢复时间为网管脱网告警的恢复时间,修改业务脱网告警的掉电原因为网管脱网告警的掉电原因,OLT业务脱网告警不再进行掉电诊断;
如果上联端口down告警恢复,记录端口down告警与派生OLT业务脱网告警的告警ID对应关系,当上联端口down告警恢复时,在IP网管上增加触发器,将IP网管上联端口down告警恢复时间同步到PON网管对应OLT业务脱网告警的恢复时间,在OLT业务脱网告警到恢复时间后,进行掉电诊断。
应当注意,尽管在上文详细描述中提及了OLT设备脱网智能诊断系统的若干模块、单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块、单元的特征和功能可以在一个模块、单元中具体化。反之,上文描述的一个模块、单元的特征和功能可以进一步划分为由多个模块、单元来具体化。
本发明提出的OLT设备脱网智能诊断方法及系统实现了对OLT设备的脱网告警进行分析,通过判断端口流量、告警恢复时间、进行上层交换机掉电诊断等方式,进行智能化的故障定位,整个过程耗时短、定位准确;同时,该方法及系统还可以在收到BAS或交换机设备端口down告警时,通过查询二层拓扑网络关系,找到对应的OLT设备,并根据端口类型做进一步的细化分析,在影响OLT上的业务时派生OLT的业务告警,以便及时对故障产生原因进行诊断,保证底层光网络设备的正常工作,使上网客户有较佳的上网体验。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (16)

1.一种OLT设备脱网智能诊断方法,其特征在于,该方法包括:
获取OLT脱网告警;其中,包括:
获取脱网设备的上联设备的ping状态,如果所述上联设备ping通,进一步判断上联设备的所有端口流量状态;
如果所有上联设备的端口都有流量,判定业务路径正常;
如果存在至少一个端口无流量,派生业务脱网告警;
利用PON网管接收交换机端口down告警和/或BAS端口down告警;
通过查询二层拓扑关系,获取对端设备类型,并根据对端设备类型,生成端口到对端设备的down告警;
筛选出端口到OLT设备的down告警;
如果down的端口是纯物理口,进一步判断是否已有OLT业务脱网告警,如果已有,则不重复派单,如果没有,则产生新的OLT业务脱网告警;
如果down的端口是捆绑口,查看所述捆绑口对应的所有物理口是否都是down状态;
如果都是down状态,则判定为OLT业务脱网告警,进一步判断是否已有OLT业务脱网告警,如果已有,则不重复派单,如果没有,则产生新的OLT业务脱网告警;
如果不都是down状态,则继续按所述端口到OLT设备的down告警进行派单;
其中,如果生成的是新的OLT业务脱网告警,则所述端口到OLT设备的down告警不出或改为衍生告警出;
根据OLT脱网告警,判断OLT设备的上联设备的ping状态;
如果所述上联设备ping通,判断所述上联设备的所有端口流量状态;
如果全部端口的流量状态为有流量,判定业务路径正常;
如果存在一定数量的零流量端口,判断所述一定数量的零流量端口的状态,如果状态一致,判定故障原因为传输断,如果状态不一致,判定故障原因为光缆断或传输断;
如果所述上联设备ping不通,判断所述上联设备的类型;
如果所述上联设备为BAS,判定故障原因为BAS ping不通;
如果所述上联设备为交换机,根据二层拓扑路径模型,获取所述OLT设备所属的所有BAS端口,并判断BAS下联口的流量,如果业务路径上都有流量,判定业务路径正常,如果任意一条业务路径无流量,判定故障原因为上层设备的光缆断、传输断或上层设备掉电。
2.根据权利要求1所述的OLT设备脱网智能诊断方法,其特征在于,该方法还包括:
在得到故障原因后,对OLT业务脱网进行恢复诊断;
如果网管脱网告警恢复,将网管脱网告警在PON网管的告警表清除到历史表时,并增加触发器进行检查,如果同时有对应OLT业务脱网告警,修改OLT业务脱网告警的恢复时间为网管脱网告警的恢复时间,修改业务脱网告警的掉电原因为网管脱网告警的掉电原因,OLT业务脱网告警不再进行掉电诊断;
如果上联端口down告警恢复,记录端口down告警与派生OLT业务脱网告警的告警ID对应关系,当上联端口down告警恢复时,在IP网管上增加触发器,将IP网管上联端口down告警恢复时间同步到PON网管对应OLT业务脱网告警的恢复时间,在OLT业务脱网告警到恢复时间后,进行掉电诊断。
3.根据权利要求1所述的OLT设备脱网智能诊断方法,其特征在于,在判断所述上联设备的所有端口流量状态时,还包括:
如果存在一定数量的零流量端口,通过反查BAS在线用户,判断是否有相关用户信息;
如果查询到相关用户信息,认定用户在线,判定业务路径正常;
如果未查询到相关用户信息,判断所述一定数量的零流量端口的状态,如果状态一致,判定故障原因为传输断,如果状态不一致,判定故障原因为光缆断或传输断。
4.根据权利要求3所述的OLT设备脱网智能诊断方法,其特征在于,在判断是否有相关用户信息时,还包括:
抽取脱网OLT设备上的一定数量的用户,在对应的BAS上进行在线情况检查,判断是否有相关用户信息。
5.根据权利要求1所述的OLT设备脱网智能诊断方法,其特征在于,在判断所述一定数量的零流量端口的状态时,如果零流量端口包含捆绑口,按照捆绑口的状态进行判断。
6.根据权利要求1所述的OLT设备脱网智能诊断方法,其特征在于,所述二层拓扑路径模型为OLT-交换机-BAS路径模型。
7.根据权利要求6所述的OLT设备脱网智能诊断方法,其特征在于,在判断所述上联设备的类型时,还包括:
如果所述上联设备为交换机,根据二层拓扑OLT-交换机-BAS路径模型,获取所述OLT所属的所有BAS端口;根据脱网的OLT设备到上联交换机透传的VLAN,其中,选择范围不同的两个VLAN,根据所述两个VLAN选择业务路径;
判断两条业务路径上,BAS下联口的流量;
如果业务路径上都有流量,判定业务路径正常;
如果任意一条业务路径无流量,进一步反查BAS在线用户,如果查询到相关用户信息,认定用户在线,判定业务路径正常,如果未查询到相关用户信息,判定故障原因为上层设备的光缆断、传输断或上层设备掉电。
8.根据权利要求1所述的OLT设备脱网智能诊断方法,其特征在于,通过查询二层拓扑关系,获取对端设备类型,并根据对端设备类型,生成多种端口到对端设备的down告警,包括:
根据交换机端口down告警,查询二层拓扑关系,并根据包括BAS、交换机、OLT设备及DSLAM在内的对端设备类型进行划分,得到四种告警类型:端口到BAS的down告警、端口到交换机的down告警、端口到OLT设备的down告警及端口到DSLAM的down告警;其中,其它类型或无法识别对端设备的down告警不生成;
针对BAS端口down告警,查询二层拓扑关系,根据包括交换机和OLT设备在内的对端设备类型进行划分,得到两种告警类型:端口到交换机的down告警及端口到OLT设备的down告警;其中,其它类型或无法识别对端设备的down告警不生成。
9.根据权利要求1所述的OLT设备脱网智能诊断方法,其特征在于,在获取OLT脱网告警之后,还包括:
在OLT业务脱网告警生成后,立即进行故障原因诊断;
在OLT设备脱网告警生成后,判断第一设定时间内是否有OLT业务脱网告警,如果有则OLT设备脱网告警为衍生告警,超过第一设定时间没有OLT业务脱网告警,则对OLT设备脱网告警进行故障原因诊断。
10.根据权利要求1所述的OLT设备脱网智能诊断方法,其特征在于,在获取OLT脱网告警之后,还包括:
在OLT设备脱网告警与OLT业务脱网告警生成后,经过第二设定时间之后转发。
11.根据权利要求1所述的OLT设备脱网智能诊断方法,其特征在于,在获取OLT脱网告警之后,还包括:
根据OLT设备脱网告警以及OLT业务脱网告警,对OLT脱网告警的故障原因进行诊断,并单独新建一个独立于掉电故障原因的字段保存。
12.根据权利要求11所述的OLT设备脱网智能诊断方法,其特征在于,该方法还包括:
设置掉电恢复时间,进行掉电诊断,判断在所述掉电恢复时间内恢复的OLT网管脱网告警以及OLT业务脱网告警,记录故障原因为掉电恢复时间内恢复。
13.根据权利要求1所述的OLT设备脱网智能诊断方法,其特征在于,该方法还包括:
对于故障原因为上层设备的光缆断、传输断或上层设备掉电的故障,如果收到恢复告警,增加调用上联交换机掉电诊断逻辑,选取上联的业务路径,所述业务路径根据范围不同的两个VLAN选取;将上联的业务路径上涉及的所有交换机进行掉电诊断,诊断出有交换机掉电的则故障原因为汇聚交换机掉电,否则故障原因为上层设备光缆断或传输断。
14.根据权利要求1所述的OLT设备脱网智能诊断方法,其特征在于,该方法还包括:
对于故障原因为传输断、光缆断、上层设备光缆断或传输断的故障,如果收到恢复告警,判断故障是否是在第三设定时间内恢复,如果是,则故障原因修改为线路割接,否则保留原有故障原因。
15.一种OLT设备脱网智能诊断系统,其特征在于,该系统包括:
告警获取模块,用于获取OLT脱网告警;
故障诊断模块,用于根据OLT脱网告警,判断OLT设备的上联设备的ping状态;
如果所述上联设备ping通,判断所述上联设备的所有端口流量状态;
如果全部端口的流量状态为有流量,判定业务路径正常;
如果存在一定数量的零流量端口,判断所述一定数量的零流量端口的状态,如果状态一致,判定故障原因为传输断,如果状态不一致,判定故障原因为光缆断或传输断;
如果所述上联设备ping不通,判断所述上联设备的类型;
如果所述上联设备为BAS,判定故障原因为BAS ping不通;
如果所述上联设备为交换机,根据二层拓扑路径模型,获取所述OLT设备所属的所有BAS端口,并判断BAS下联口的流量,如果业务路径上都有流量,判定业务路径正常,如果任意一条业务路径无流量,判定故障原因为上层设备的光缆断、传输断或上层设备掉电;
其中,所述告警获取模块包括:
业务脱网告警派生单元,用于获取脱网设备的上联设备的ping状态,如果所述上联设备ping通,进一步判断上联设备的所有端口流量状态;
如果所有上联设备的端口都有流量,判定业务路径正常;
如果存在至少一个端口无流量,派生业务脱网告警;
端口down告警接收单元,用于通过PON网管接收交换机端口down告警和/或BAS端口down告警;
端口down告警整合单元,用于通过查询二层拓扑关系,获取对端设备类型,并根据对端设备类型,生成端口到对端设备的down告警;
筛选单元,用于筛选出端口到OLT设备的down告警;
端口down告警派单单元,用于在down的端口是纯物理口的情况下,进一步判断是否已有OLT业务脱网告警,如果已有,则不重复派单,如果没有,则产生新的OLT业务脱网告警;
在down的端口是捆绑口的情况下,查看所述捆绑口对应的所有物理口是否都是down状态;
如果都是down状态,则判定为OLT业务脱网告警,进一步判断是否已有OLT业务脱网告警,如果已有,则不重复派单,如果没有,则产生新的OLT业务脱网告警;
如果不都是down状态,则继续按所述端口到OLT设备的down告警进行派单。
16.根据权利要求15所述的OLT设备脱网智能诊断系统,其特征在于,该系统还包括:
恢复诊断模块,用于在得到故障原因后,对OLT业务脱网进行恢复诊断;
如果网管脱网告警恢复,将网管脱网告警在PON网管的告警表清除到历史表时,并增加触发器进行检查,如果同时有对应OLT业务脱网告警,修改OLT业务脱网告警的恢复时间为网管脱网告警的恢复时间,修改业务脱网告警的掉电原因为网管脱网告警的掉电原因,OLT业务脱网告警不再进行掉电诊断;
如果上联端口down告警恢复,记录端口down告警与派生OLT业务脱网告警的告警ID对应关系,当上联端口down告警恢复时,在IP网管上增加触发器,将IP网管上联端口down告警恢复时间同步到PON网管对应OLT业务脱网告警的恢复时间,在OLT业务脱网告警到恢复时间后,进行掉电诊断。
CN201910952524.3A 2019-10-09 2019-10-09 Olt设备脱网智能诊断方法及系统 Active CN112636944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910952524.3A CN112636944B (zh) 2019-10-09 2019-10-09 Olt设备脱网智能诊断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910952524.3A CN112636944B (zh) 2019-10-09 2019-10-09 Olt设备脱网智能诊断方法及系统

Publications (2)

Publication Number Publication Date
CN112636944A CN112636944A (zh) 2021-04-09
CN112636944B true CN112636944B (zh) 2022-11-15

Family

ID=75283509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910952524.3A Active CN112636944B (zh) 2019-10-09 2019-10-09 Olt设备脱网智能诊断方法及系统

Country Status (1)

Country Link
CN (1) CN112636944B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101917288A (zh) * 2010-08-04 2010-12-15 中兴通讯股份有限公司 告警处理方法及网管系统
CN102281167A (zh) * 2010-06-13 2011-12-14 北京润光泰力科技发展有限公司 网络设备掉电的检测方法和系统
CN102340392A (zh) * 2010-07-26 2012-02-01 杭州华三通信技术有限公司 一种提高无源光网络系统中业务可靠性的方法和系统
CN102970197A (zh) * 2012-11-13 2013-03-13 浙江宇视科技有限公司 一种混合组网业务保护方法及装置
CN103378980A (zh) * 2012-04-16 2013-10-30 中兴通讯股份有限公司 一种层网络告警与业务相关性分析方法和装置
WO2015180542A1 (zh) * 2014-05-27 2015-12-03 中兴通讯股份有限公司 长发光光网络单元的检测方法、装置及网管设备
CN105703934A (zh) * 2014-11-28 2016-06-22 亿阳信通股份有限公司 一种面向家庭宽带业务的pon网络故障诊断方法和装置
CN106161070A (zh) * 2015-04-17 2016-11-23 中兴通讯股份有限公司 一种xPON组播业务监控方法、装置以及OLT设备
CN109450527A (zh) * 2018-10-24 2019-03-08 中国电信股份有限公司广东传送网络运营中心 故障的确定方法、装置、计算机设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281167A (zh) * 2010-06-13 2011-12-14 北京润光泰力科技发展有限公司 网络设备掉电的检测方法和系统
CN102340392A (zh) * 2010-07-26 2012-02-01 杭州华三通信技术有限公司 一种提高无源光网络系统中业务可靠性的方法和系统
CN101917288A (zh) * 2010-08-04 2010-12-15 中兴通讯股份有限公司 告警处理方法及网管系统
CN103378980A (zh) * 2012-04-16 2013-10-30 中兴通讯股份有限公司 一种层网络告警与业务相关性分析方法和装置
CN102970197A (zh) * 2012-11-13 2013-03-13 浙江宇视科技有限公司 一种混合组网业务保护方法及装置
WO2015180542A1 (zh) * 2014-05-27 2015-12-03 中兴通讯股份有限公司 长发光光网络单元的检测方法、装置及网管设备
CN105703934A (zh) * 2014-11-28 2016-06-22 亿阳信通股份有限公司 一种面向家庭宽带业务的pon网络故障诊断方法和装置
CN106161070A (zh) * 2015-04-17 2016-11-23 中兴通讯股份有限公司 一种xPON组播业务监控方法、装置以及OLT设备
CN109450527A (zh) * 2018-10-24 2019-03-08 中国电信股份有限公司广东传送网络运营中心 故障的确定方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
光接入网故障定位系统设计及应用;迟景升等;《电信科学》;20171220;全文 *

Also Published As

Publication number Publication date
CN112636944A (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
US10498588B2 (en) Systems and methods for managing network health
US7898971B2 (en) Method and apparatus for automating hub and spoke Internet Protocol Virtual Private Network trouble diagnostics
US8245079B2 (en) Correlation of network alarm messages based on alarm time
CN105391588B (zh) 一种网络故障的诊断方法及装置
CN113179182B (zh) 网络监管方法、装置、设备及存储介质
CN111010298B (zh) Pon网络故障监控方法及装置
CN108306747B (zh) 一种云安全检测方法、装置和电子设备
EP0754382B1 (en) A method and a system for distributed supervision of hardware
JP2007208633A (ja) ネットワーク設計装置、ネットワーク設計方法およびネットワーク設計プログラム
CN111200544B (zh) 一种网络端口流量测试方法和装置
CN110620693A (zh) 一种基于物联网的铁路沿线车站路由远程重启控制系统及方法
CN111835595B (zh) 流量数据的监控方法、装置、设备及计算机存储介质
CN112636944B (zh) Olt设备脱网智能诊断方法及系统
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
KR20050002263A (ko) 망 관리에서의 장애 관리 시스템 및 그 방법
US10432451B2 (en) Systems and methods for managing network health
JP4485344B2 (ja) サーバ装置、障害経路診断方法、および障害経路診断プログラム
JP4437416B2 (ja) ネットワーク保守システム
CN114124675B (zh) 一种基于城域网的家宽业务故障诊断方法及装置
KR100236980B1 (ko) 통신관리망 환경에서 교환기의 보드 탈장/실장 경보 처리 방법
KR20090038123A (ko) 네트워크 관리 시스템, 방법 및 방법 프로그램을 기록한저장매체
KR100645369B1 (ko) Atm신호방식의 메세지 추적 알고리즘에 따른 가입자 및네트워크 상태 관리 방법
CN117560270A (zh) 网络故障的定位方法、装置、介质及电子设备
KR920003344B1 (ko) 전전자 교환기의 유지보수 방법 및 장치
CN115834330A (zh) 群障检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: Room 702-2, No. 4811, Cao'an Highway, Jiading District, Shanghai

Patentee after: CHINA UNITECHS

Address before: 100872 5th floor, Renmin culture building, 59 Zhongguancun Street, Haidian District, Beijing

Patentee before: CHINA UNITECHS