CN111277805B - 一种针对olt上联链路crc错误的处理方法及装置 - Google Patents

一种针对olt上联链路crc错误的处理方法及装置 Download PDF

Info

Publication number
CN111277805B
CN111277805B CN201811473235.7A CN201811473235A CN111277805B CN 111277805 B CN111277805 B CN 111277805B CN 201811473235 A CN201811473235 A CN 201811473235A CN 111277805 B CN111277805 B CN 111277805B
Authority
CN
China
Prior art keywords
link
olt
crc
information
information table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811473235.7A
Other languages
English (en)
Other versions
CN111277805A (zh
Inventor
黄立伟
廖楚林
潘广津
杨彬
班颖
王妍
招土林
林文智
何毅华
朱家胡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Guangdong Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811473235.7A priority Critical patent/CN111277805B/zh
Publication of CN111277805A publication Critical patent/CN111277805A/zh
Application granted granted Critical
Publication of CN111277805B publication Critical patent/CN111277805B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/22Adaptations for optical transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/03Arrangements for fault recovery
    • H04B10/038Arrangements for fault recovery using bypasses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/077Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using a supervisory or additional signal
    • H04B10/0775Performance monitoring and measurement of transmission parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/079Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using measurements of the data signal
    • H04B10/0795Performance monitoring; Measurement of transmission parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0061Error detection codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/4425Monitoring of client processing errors or hardware failure

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明实施例提供一种针对OLT上联链路CRC错误的处理方法及装置,该方法包括:采集监控数据,根据监控数据获取存在CRC错误的OLT上联端口信息,基于CRC增长速度对上联端口信息进行分级,得到分级信息表;对分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间;根据峰值流量信息决策抢修行为,抢修行为包括链路级自动倒换和设备级自动割接;根据峰值流量产生时间确定抢修时间,根据抢修时间获取处理时限并同步到告警工单。本发明实施例提供的针对OLT上联链路CRC错误的处理方法及装置,在OLT上联口CRC错误发生时,无需判断抢通故障业务行为,也无需手动完成链路倒换或业务割接,即可实现业务承载能力的快速评估和抢通行为的决策。

Description

一种针对OLT上联链路CRC错误的处理方法及装置
技术领域
本发明涉及数据通信网络技术领域,尤其涉及一种针对OLT上联链路CRC错误的处理方法及装置。
背景技术
循环冗余校验(Cyclic Redundancy Check,以下简称CRC)是一种在数据传输过程中提供差错校验的方法,主要确保接收方接收数据之前,确认数据的正确性后才完成接收。
随着运营商互联网电视业务的快速发展,网络维护和保障的压力不断上升,由于电视业务相比宽带上网业务比较敏感,尤其对CRC错误更为敏感,CRC错误导致的花屏投诉时有增加。
当前针对客户投诉花屏故障处理,通常是业务部门先做末端测试,排除末端原因后再通知上层GPON/城域网专业进一步排查上层网络原因。经处理发现,大部分电视花屏投诉原因均集中在光线路终端(Optical Line Terminal,以下简称OLT)上联口存在CRC错误包导致,GPON专业核实后,会根据具体问题完成链路倒换或是业务割接,并通知传输专业到现场检查光模块及尾纤,更换处理后故障消除。
现有方案对电视业务比较敏感的OLT上联口CRC错误并没有形成一个智能的分析处理机制,通常是在客户投诉后,需要人工核查OLT上联口是否存在CRC错误,如果存在则需要运维人员第一时间手动完成链路倒换或是业务割接,效率低下,且对其他链路的业务承载能力并没有快速、准确的评估方法,有可能会导致链路切换后同样由于流量过大导致链路拥塞,引起业务质量投诉,同时,在业务恢复后也不能第一时间快速的触发业务自动回割操作,随着电视业务的快速发展,同时由于电视业务的敏感特性,以上问题都亟待解决。
发明内容
本发明实施例为克服上述技术缺陷,提供一种针对OLT上联链路CRC错误的处理方法及装置。
第一方面,本发明实施例提供一种针对OLT上联链路CRC错误的处理方法,包括:
采集监控数据,根据所述监控数据获取存在CRC错误的OLT上联端口信息,基于CRC增长速度对所述上联端口信息进行分级,得到分级信息表;
对所述分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间;
根据所述峰值流量信息决策抢修行为,所述抢修行为包括链路级自动倒换和设备级自动割接。
根据所述峰值流量产生时间确定抢修时间,根据所述抢修时间获取处理时限并同步到告警工单。
第二方面,本发明实施例提供一种针对OLT上联链路CRC错误的处理装置,包括:
监控评估单元,用于采集监控数据,根据所述监控数据获取存在CRC错误的OLT上联端口信息,基于CRC增长速度对所述上联端口信息进行分级,得到分级信息表;
计算单元,用于对所述分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间;
决策单元,用于根据所述峰值流量信息决策抢修行为,所述抢修行为包括链路级自动倒换和设备级自动割接;
同步单元,用于根据所述峰值流量产生时间确定抢修时间,根据所述抢修时间获取处理时限并同步到告警工单。
第三方面,本发明实施例提供一种电子设备,包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如第一方面所述的一种针对OLT上联链路CRC错误的处理方法。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述的一种针对OLT上联链路CRC错误的处理方法。
本发明实施例提供的一种针对OLT上联链路CRC错误的处理方法及装置,对电视业务比较敏感的OLT上联口CRC错误形成了一个智能化、自动化的分析处理机制,在故障发生时,不再需要运维人员去判断抢通故障业务的行为,也不需要手动完成链路倒换或是业务割接,就可以实现业务承载能力的快速评估和抢通行为的智能决策,形成了CRC错误导致电视花屏的快速、高效抢通能力,具备很高的实用性。
附图说明
图1为本发明实施例提供的一种针对OLT上联链路CRC错误的处理方法的流程示意图;
图2为本发明又一实施例提供的一种针对OLT上联链路CRC错误的处理方法的流程示意图;
图3为本发明实施例提供的一种针对OLT上联链路CRC错误的处理装置的结构示意图;
图4为本发明实施例提供的一种电子设备的实体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种针对OLT上联链路CRC错误的处理方法的流程示意图,如图1所示,包括:
步骤11,采集监控数据,根据所述监控数据获取存在CRC错误的OLT上联端口信息,基于CRC增长速度对所述上联端口信息进行分级,得到分级信息表;
步骤12,对所述分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间;
步骤13,根据所述峰值流量信息决策抢修行为,所述抢修行为包括链路级自动倒换和设备级自动割接;
步骤14,根据所述峰值流量产生时间确定抢修时间,根据所述抢修时间获取处理时限并同步到告警工单。
本发明实施例提供的针对OLT上联链路CRC错误的处理方法,从OLT上联口的CRC数据采集开始,然后识别链路配对信息,尤其是配对链路的峰值利用率信息,并根据这个数据完成倒换前的科学评估,最后智能决策是否要执行倒换指令,将指令下发配置到设备,实现在投诉前的快速倒换处理。
具体的,首先采集监控数据,定位存在CRC错误的所有OLT上联口信息并存储记录,根据监控数据,可以获取OLT上联口CRC错误码数和增长率。所述监控数据的采集方式包括周期性轮询方式和投诉触发特定查询方式。
利用监控单元周期性轮询,主动获取所有OLT上联口的CRC错误码数和错误增长率,监控数据不限于通过OLT网管获取或是主动轮询所有OLT设备上联端口,时间可根据服务器性能和轮询时间长度等因素共同设定。
投诉触发特定查询,利用投诉系统的投诉数据,关联上联OLT设备,通过监控每个OLT花屏投诉用户量,当用户量投诉超过10个,则触发监控单元立即核查该OLT上联口CRC错误码数和增长率,如CRC误码不为0则记录该端口。
根据获取的每一条记录的OLT名称,获取所有上联端口信息,包括存在CRC错误链路的配对端口链路信息,为后续的链路利用率评估以及业务自动倒换做好准备。
根据OLT上联口CRC错误码数和增长率,可以获取CRC增长速度,根据CRC增长速度做分级确认,得到分级信息表,例如,如果CRC增长速度很快,如1分钟超过10个,则定位为A级,需要立即评估处理,将端口信息加入A级信息表。如果CRC增长速度不快,但持续增长,如CRC错误包数>0且增长速度1小时<=2个,则定位为B级,处理优先级次于A级加入B级信息表。
获取的存在CRC错误码的OLT名称、上联及配对端口和分级信息表,做倒换前或业务割接前的数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间,包括当前误码链路的峰值流量信息和峰值流量产生时间,备份链路的峰值流量信息和峰值流量产生时间。
根据数据计算结果决策抢修行为,抢修行为包括链路级自动倒换和设备级自动割接。
触发链路级自动倒换决策,如果备份链路端口存在且没有误码,备份链路可用,决策结果将执行关闭port1端口,即业务全部自动切换到备份链路承载。
触发设备级自动割接决策,如果备份链路端口不存在或是也存在CRC误码需要处理时,或是备份链路不可用,决策结果触发业务自动割接流程,将业务割接到配对设备上实现业务抢通,即业务全部自动切换到备边设备承载。
在完成抢修行为决策后,将峰值流量产生时间t作为故障处理时限的参考依据确定抢修时间。在确定抢修时间后,根据时限计算故障处理时间同步到告警工单中。
本发明实施例综合考虑业务可能影响和考核时限,以及链路峰值流量,假设当前时间为t0,计算抢修时间,确保链路峰值发生前完成业务抢修。
如果t>t0且t-t0<=4,则故障处理时限为4小时内完成故障抢通;
如果t>t0且8>t-t0>4,则故障处理时限为峰值流量可能产生前半小时完成故障抢通;
如果t>t0且t-t0>=8,则故障处理时限为8小时完成故障抢通;
如果t<=t0且12-t0+t<=4,则故障处理时限为4小时内完成故障抢通;
如果t<=t0且8>12-t0+t>4,则故障处理时限为峰值流量可能产生前半小时完成故障抢通;
如果t<=t0且12-t0+t>=8,则故障处理时限为8小时内完成故障抢通。
本发明实施例提供的一种针对OLT上联链路CRC错误的处理方法,对电视业务比较敏感的OLT上联口CRC错误形成了一个智能化、自动化的分析处理机制,在故障发生时,不再需要运维人员去判断抢通故障业务的行为,也不需要手动完成链路倒换或是业务割接,就可以实现业务承载能力的快速评估和抢通行为的智能决策,形成了CRC错误导致电视花屏的快速、高效抢通能力,具备很高的实用性。
在上述实施例的基础上,所述基于CRC增长速度对所述上联端口信息进行分级,得到分级信息表,具体包括:
若在第一预设时间段内CRC错误码增加超过预设值,将对应的OLT上联端口信息加入A级信息表;
若在第一预设时间段内CRC错误码持续增加,且增加量未超过预设值,将对应的OLT上联端口信息加入B级信息表;
若在第一预设时间段内CRC错误码未增加,则对应的OLT上联端口信息不进行处理;
所述A级信息表和所述B级信息表组成所述分级信息表,用于数据计算时确定处理次序。
所述对所述分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间,具体包括:
对于所述分级信息表中的每一OLT上联端口信息,获取误码链路在第二预设时间段内的误码链路峰值流量信息和误码链路峰值流量产生时间,获取备份链路在第二预设时间段内的备份链路峰值流量信息和备份链路峰值流量产生时间;
根据所述备份链路的链路带宽、所述误码链路峰值流量信息和所述备份链路峰值流量信息,获取备份链路最大峰值利用率;
根据所述误码链路峰值流量产生时间和备份链路峰值流量产生时间,获取峰值流量预计产生时间;
其中,数据计算时,所述A级信息表中的OLT上联端口信息的处理优先级高于所述B级信息表中的OLT上联端口信息。
所述根据所述峰值流量信息决策抢修行为,具体包括:
若备份链路端口没有误码,且所述备份链路最大峰值利用率小于等于预设阈值,关闭误码链路端口,业务自动切换至备份链路承载;
若备份链路端口存在误码,或所述备份链路最大峰值利用率大于所述预设阈值,关闭误码链路端口,触发业务自动割接流程,业务自动切换至备边设备承载。
基于CRC增长速度对上联端口信息进行分级,得到分级信息表,是为了确定数据计算的优先级,对于CRC增长较快的链路,说明CRC错误较多且增长较快,需要优先处理,而对于CRC增长较慢的链路,可以放在后面处理,同时对于CRC存在错误码,但是没有增长记录的则可以暂时不进行处理。本发明实施例首先设置第一预设时间段,计算第一预设时间段内CRC增长数量,即可得到CRC增长速度。第一预设时间段可以根据实际需要设置,此处不做具体限制。得到CRC增长数量后,将其与预设值进行比较,如果超过预设值,将对应的OLT上联端口信息加入A级信息表,如果未超过预设值,将对应的OLT上联端口信息加入B级信息表,如果在第一预设时间段内CRC错误码未增加,则对应的OLT上联端口信息不进行处理。下一步进行数据计算时,优先处理A级信息表,再处理B级信息表。
得到分级信息表后,需要对分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间,具体的,对于分级信息表中的每一OLT上联端口信息,处理方法如下:
获取误码链路在第二预设时间段内的误码链路峰值流量信息和误码链路峰值流量产生时间;
获取备份链路在第二预设时间段内的备份链路峰值流量信息和备份链路峰值流量产生时间;
根据备份链路的链路带宽、误码链路峰值流量信息和备份链路峰值流量信息,获取备份链路最大峰值利用率;
根据误码链路峰值流量产生时间和备份链路峰值流量产生时间,获取峰值流量预计产生时间。
以第二预设时间段为一周为例:
获取误码链路一周内的峰值流量信息f1,峰值流量产生时间t1;
获取备份链路一周内的峰值流量信息f2,峰值流量产生时间t2;
获取备份链路的链路带宽B,计算(f1+f2)/B的值,并记录峰值流量可能产生时间t=min(t1,t2)。
以OLT上联只有两条链路,一主一备的情况为例,实际情况不限于此,形成的A级信息表如下例所示:
Figure BDA0001891526480000081
B级信息表字段值一样,只是分级不同。
数据计算后,根据峰值流量信息决策抢修行为,本发明实施例中的抢修行为包括链路级自动倒换和设备级自动割接。
触发链路级自动倒换决策,如果备链路端口存在且没有误码,且备份链路最大峰值利用率小于等于预设阈值,以预设阈值为70%为例,例如A级信息表OLT1上联端口port1和port2所示,同时(f1+f2)/B<=70%,决策结果将执行关闭port1端口,即业务全部自动切换到备链路承载。
触发设备级自动割接决策,如果备链路端口不存在或是也存在CRC误码需要处理时,或是备份链路最大峰值利用率大于所述预设阈值,即(f1+f2)/B>70%,决策结果触发业务自动割接流程,将业务割接到配对设备上实现业务抢通,即业务全部自动切换到备边设备承载。
本发明实施例提供的一种针对OLT上联链路CRC错误的处理方法,对电视业务比较敏感的OLT上联口CRC错误形成了一个智能化、自动化的分析处理机制,在故障发生时,不再需要运维人员去判断抢通故障业务的行为,也不需要手动完成链路倒换或是业务割接,就可以实现业务承载能力的快速评估和抢通行为的智能决策,形成了CRC错误导致电视花屏的快速、高效抢通能力,具备很高的实用性。
在上述实施例的基础上,在所述根据所述峰值流量信息决策抢修行为之后,所述方法还包括:
进行第一重安全确认,根据及时查询指令判断所述误码链路端口是否存在CRC错误,若存在,则所述第一重安全确认通过;
进行第二重安全确认,根据所述及时查询指令查询所述备份链路或所述备边设备是否可倒换,若可倒换,则所述第二重安全确认通过;
进行第三重安全确认,判断所述误码链路端口是否为将要执行关闭的端口,若是,则所述第三重安全确认通过。
所述方法还包括:
若所述第一重安全确认、所述第二重安全确认和所述第三重安全确认均通过,根据所述抢修行为下发任务。
在完成抢修行为决策和完成抢修时限适配后,将下发配置任务,下发前需完成操作端口的进一步确认,确认无误后通过网管下发到设备。
对执行自动配置任务端口进行三重安全确认,无论是哪种决策结果,都需要在端口侧执行相应的指令,尤其是触发链路级自动倒换决策关闭端口的指令由于误操作可能影响业务,危险系数比较大,所以执行前需进一步确认。
第一重安全确认,确认要执行操作的OLT端口确实存在CRC错误,可用及时查询指令确认。
第二重安全确认,确认备份链路无异常可倒换,可用及时查询指令查询是否存在误码,是否有光功率异常。
第三重安全确认,确认对端链路信息准确无误,通过OLT的连接对端端口描述信息确认该端口即为要执行关闭的端口。
如果三重确认都没有问题,而且决策抢修行为为触发链路级自动倒换,则由系统通过网管网连接指令平台下发关闭CRC错误链路指令给OLT设备,执行决策结果后,将在OLT设备上将存在CRC错误的链路端口关闭,业务将自动倒换到备边链路承载,倒换后业务质量将不受影响。
如果三重确认都没有问题,而且决策抢修行为为触发设备级自动割接决策,则将该OLT的上联配对设备信息同步,并触发业务割接抢通流程,同时关闭误码链路端口。
反之如果三重确认中任一重存在问题,则弹出无法倒换的异常告警,并根据异常给出进一步的提示。
如果已完成故障处理时限同步且OLT上联口CRC错误的告警工单流程处理结束确认后,则触发业务恢复自动倒回或是业务回割行为决策,根据决策行为下发倒回配置任务。
图2为本发明又一实施例提供的一种针对OLT上联链路CRC错误的处理方法的流程示意图,如图2所示,包括:
步骤201,定位存在CRC错误的上联端口;
步骤202,进行分级确认,根据CRC增长速度将上联端口信息分为AB两级,得到分级信息表;
步骤203,根据分级信息表确认处理次序,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间;
步骤204,决策抢修行为,抢修行为包括链路级自动倒换和设备级自动割接;
步骤205,判断备份链路端口是否没有误码,且备份链路最大峰值利用率小于等于预设阈值如70%,若是,执行步骤206,若否,执行步骤207;
步骤206,关闭误码链路端口,业务自动切换至备份链路承载,执行步骤208;
步骤207,触发业务自动割接流程,业务自动切换至备边设备承载,执行步骤208;
步骤208,根据不同的决策结果同步故障处理时限到告警工单;
步骤209,判断三重安全确认是否通过,若通过,执行步骤210,若不通过,执行步骤211;
步骤210,触发下发配置任务并验证业务状态;
步骤211,弹出无法倒换告警的异常提示。
本发明实施例提供的一种针对OLT上联链路CRC错误的处理方法,对电视业务比较敏感的OLT上联口CRC错误形成了一个智能化、自动化的分析处理机制,在故障发生时,不再需要运维人员去判断抢通故障业务的行为,也不需要手动完成链路倒换或是业务割接,就可以实现业务承载能力的快速评估和抢通行为的智能决策,形成了CRC错误导致电视花屏的快速、高效抢通能力,具备很高的实用性。
图3为本发明实施例提供的一种针对OLT上联链路CRC错误的处理装置的结构示意图,如图3所示,包括监控评估单元31、计算单元32、决策单元33和同步单元34,其中:
监控评估单元31用于采集监控数据,根据所述监控数据获取存在CRC错误的OLT上联端口信息,基于CRC增长速度对所述上联端口信息进行分级,得到分级信息表;
计算单元32用于对所述分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间;
决策单元33用于根据所述峰值流量信息决策抢修行为,所述抢修行为包括链路级自动倒换和设备级自动割接;
同步单元34用于根据所述峰值流量产生时间确定抢修时间,根据所述抢修时间获取处理时限并同步到告警工单。
首先监控评估单元31采集监控数据,定位存在CRC错误的所有OLT上联口信息并存储记录,根据监控数据,可以获取OLT上联口CRC错误码数和增长率。所述监控数据的采集方式包括周期性轮询方式和投诉触发特定查询方式。
利用监控单元周期性轮询,监控评估单元31主动获取所有OLT上联口的CRC错误码数和错误增长率,监控数据不限于通过OLT网管获取或是主动轮询所有OLT设备上联端口,时间可根据服务器性能和轮询时间长度等因素共同设定。
投诉触发特定查询,监控评估单元31利用投诉系统的投诉数据,关联上联OLT设备,通过监控每个OLT花屏投诉用户量,当用户量投诉超过10个,则触发监控单元立即核查该OLT上联口CRC错误码数和增长率,如CRC误码不为0则记录该端口。
根据获取的每一条记录的OLT名称,获取所有上联端口信息,包括存在CRC错误链路的配对端口链路信息,为后续的链路利用率评估以及业务自动倒换做好准备。
监控评估单元31根据OLT上联口CRC错误码数和增长率,可以获取CRC增长速度,根据CRC增长速度做分级确认,得到分级信息表,例如,如果CRC增长速度很快,如1分钟超过10个,则定位为A级,需要立即评估处理,将端口信息加入A级信息表。如果CRC增长速度不快,但持续增长,如CRC错误包数>0且增长速度1小时<=2个,则定位为B级,处理优先级次于A级加入B级信息表。
获取的存在CRC错误码的OLT名称、上联及配对端口和分级信息表,计算单元32做倒换前或业务割接前的数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间,包括当前误码链路的峰值流量信息和峰值流量产生时间,备份链路的峰值流量信息和峰值流量产生时间。
决策单元33根据数据计算结果决策抢修行为,抢修行为包括链路级自动倒换和设备级自动割接。
触发链路级自动倒换决策,如果备份链路端口存在且没有误码,备份链路可用,决策结果将执行关闭port1端口,即业务全部自动切换到备份链路承载。
触发设备级自动割接决策,如果备份链路端口不存在或是也存在CRC误码需要处理时,或是备份链路不可用,决策结果触发业务自动割接流程,将业务割接到配对设备上实现业务抢通,即业务全部自动切换到备边设备承载。
在完成抢修行为决策后,同步单元34将峰值流量产生时间作为故障处理时限的参考依据确定抢修时间。在确定抢修时间后,根据时限计算故障处理时间同步到告警工单中。
本发明实施例综合考虑业务可能影响和考核时限,以及链路峰值流量,计算抢修时间,确保链路峰值发生前完成业务抢修。
本发明实施例提供的装置是用于执行上述各方法实施例的,具体的流程和详细介绍请参见上述各方法实施例,此处不再赘述。
本发明实施例提供的一种针对OLT上联链路CRC错误的处理装置,对电视业务比较敏感的OLT上联口CRC错误形成了一个智能化、自动化的分析处理机制,在故障发生时,不再需要运维人员去判断抢通故障业务的行为,也不需要手动完成链路倒换或是业务割接,就可以实现业务承载能力的快速评估和抢通行为的智能决策,形成了CRC错误导致电视花屏的快速、高效抢通能力,具备很高的实用性。
图4为本发明实施例提供的一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和总线440,其中,处理器410,通信接口420,存储器430通过总线440完成相互间的通信。总线440可以用于电子设备与传感器之间的信息传输。处理器410可以调用存储器430中的逻辑指令,以执行如下方法:采集监控数据,根据所述监控数据获取存在CRC错误的OLT上联端口信息,基于CRC增长速度对所述上联端口信息进行分级,得到分级信息表;对所述分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间;根据所述峰值流量信息决策抢修行为,所述抢修行为包括链路级自动倒换和设备级自动割接;根据所述峰值流量产生时间确定抢修时间,根据所述抢修时间获取处理时限并同步到告警工单。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令使计算机执行上述实施例所提供的一种针对OLT上联链路CRC错误的处理方法,例如包括:采集监控数据,根据所述监控数据获取存在CRC错误的OLT上联端口信息,基于CRC增长速度对所述上联端口信息进行分级,得到分级信息表;对所述分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间;根据所述峰值流量信息决策抢修行为,所述抢修行为包括链路级自动倒换和设备级自动割接;根据所述峰值流量产生时间确定抢修时间,根据所述抢修时间获取处理时限并同步到告警工单。
以上所述仅为本发明的优选实施例,并不用于限制本发明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充,但并不会偏离本发明的精神或者超越所附权利要求书定义的范围。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种针对OLT上联链路CRC错误的处理方法,其特征在于,包括:
采集监控数据,根据所述监控数据获取存在CRC错误的OLT上联端口信息,基于CRC增长速度对所述上联端口信息进行分级,得到分级信息表;
对所述分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间;
根据所述峰值流量信息决策抢修行为,所述抢修行为包括链路级自动倒换和设备级自动割接;
根据所述峰值流量产生时间确定抢修时间,根据所述抢修时间获取处理时限并同步到告警工单;
所述基于CRC增长速度对所述上联端口信息进行分级,得到分级信息表,具体包括:
若在第一预设时间段内CRC错误码增加超过预设值,将对应的OLT上联端口信息加入A级信息表;
若在第一预设时间段内CRC错误码持续增加,且增加量未超过预设值,将对应的OLT上联端口信息加入B级信息表;
若在第一预设时间段内CRC错误码未增加,则对应的OLT上联端口信息不进行处理;
所述A级信息表和所述B级信息表组成所述分级信息表,用于数据计算时确定处理次序。
2.根据权利要求1所述的方法,其特征在于,所述监控数据的采集方式包括周期性轮询方式和投诉触发特定查询方式。
3.根据权利要求1所述的方法,其特征在于,所述对所述分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间,具体包括:
对于所述分级信息表中的每一OLT上联端口信息,获取误码链路在第二预设时间段内的误码链路峰值流量信息和误码链路峰值流量产生时间,获取备份链路在第二预设时间段内的备份链路峰值流量信息和备份链路峰值流量产生时间;
根据所述备份链路的链路带宽、所述误码链路峰值流量信息和所述备份链路峰值流量信息,获取备份链路最大峰值利用率;
根据所述误码链路峰值流量产生时间和备份链路峰值流量产生时间,获取峰值流量预计产生时间;
其中,数据计算时,所述A级信息表中的OLT上联端口信息的处理优先级高于所述B级信息表中的OLT上联端口信息。
4.根据权利要求3所述的方法,其特征在于,所述根据所述峰值流量信息决策抢修行为,具体包括:
若备份链路端口没有误码,且所述备份链路最大峰值利用率小于等于预设阈值,关闭误码链路端口,业务自动切换至备份链路承载;
若备份链路端口存在误码,或所述备份链路最大峰值利用率大于所述预设阈值,关闭误码链路端口,触发业务自动割接流程,业务自动切换至备边设备承载。
5.根据权利要求4所述的方法,其特征在于,在所述根据所述峰值流量信息决策抢修行为之后,所述方法还包括:
进行第一重安全确认,根据及时查询指令判断所述误码链路端口是否存在CRC错误,若存在,则所述第一重安全确认通过;
进行第二重安全确认,根据所述及时查询指令查询所述备份链路或所述备边设备是否可倒换,若可倒换,则所述第二重安全确认通过;
进行第三重安全确认,判断所述误码链路端口是否为将要执行关闭的端口,若是,则所述第三重安全确认通过。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述第一重安全确认、所述第二重安全确认和所述第三重安全确认均通过,根据所述抢修行为下发任务。
7.一种针对OLT上联链路CRC错误的处理装置,其特征在于,包括:
监控评估单元,用于采集监控数据,根据所述监控数据获取存在CRC错误的OLT上联端口信息,基于CRC增长速度对所述上联端口信息进行分级,得到分级信息表;
计算单元,用于对所述分级信息表进行数据计算,得到OLT上联各个链路的峰值流量信息和峰值流量产生时间;
决策单元,用于根据所述峰值流量信息决策抢修行为,所述抢修行为包括链路级自动倒换和设备级自动割接;
同步单元,用于根据所述峰值流量产生时间确定抢修时间,根据所述抢修时间获取处理时限并同步到告警工单;
监控评估单元,还用于若在第一预设时间段内CRC错误码增加超过预设值,将对应的OLT上联端口信息加入A级信息表;
若在第一预设时间段内CRC错误码持续增加,且增加量未超过预设值,将对应的OLT上联端口信息加入B级信息表;
若在第一预设时间段内CRC错误码未增加,则对应的OLT上联端口信息不进行处理;
所述A级信息表和所述B级信息表组成所述分级信息表,用于数据计算时确定处理次序。
8.一种电子设备,其特征在于,包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至6任一所述的一种针对OLT上联链路CRC错误的处理方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述的一种针对OLT上联链路CRC错误的处理方法。
CN201811473235.7A 2018-12-04 2018-12-04 一种针对olt上联链路crc错误的处理方法及装置 Active CN111277805B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811473235.7A CN111277805B (zh) 2018-12-04 2018-12-04 一种针对olt上联链路crc错误的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811473235.7A CN111277805B (zh) 2018-12-04 2018-12-04 一种针对olt上联链路crc错误的处理方法及装置

Publications (2)

Publication Number Publication Date
CN111277805A CN111277805A (zh) 2020-06-12
CN111277805B true CN111277805B (zh) 2021-07-16

Family

ID=70998499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811473235.7A Active CN111277805B (zh) 2018-12-04 2018-12-04 一种针对olt上联链路crc错误的处理方法及装置

Country Status (1)

Country Link
CN (1) CN111277805B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101170432A (zh) * 2006-10-27 2008-04-30 中兴通讯股份有限公司 一种实现组播业务保护倒换和负载均衡的方法
CN101557313A (zh) * 2009-04-21 2009-10-14 烽火通信科技股份有限公司 一种电信级宽带接入设备上联板卡保护的方法
US8782485B2 (en) * 2012-01-19 2014-07-15 International Business Machines Corporation Hierarchical channel marking in a memory system
CN106301837A (zh) * 2015-05-25 2017-01-04 中兴通讯股份有限公司 无源光网络告警检测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101170432A (zh) * 2006-10-27 2008-04-30 中兴通讯股份有限公司 一种实现组播业务保护倒换和负载均衡的方法
CN101557313A (zh) * 2009-04-21 2009-10-14 烽火通信科技股份有限公司 一种电信级宽带接入设备上联板卡保护的方法
US8782485B2 (en) * 2012-01-19 2014-07-15 International Business Machines Corporation Hierarchical channel marking in a memory system
CN106301837A (zh) * 2015-05-25 2017-01-04 中兴通讯股份有限公司 无源光网络告警检测方法及装置

Also Published As

Publication number Publication date
CN111277805A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
US8977886B2 (en) Method and apparatus for rapid disaster recovery preparation in a cloud network
KR102418969B1 (ko) 딥러닝 기반 통신망 장비의 장애 예측 시스템 및 방법
US9680722B2 (en) Method for determining a severity of a network incident
CN111176879A (zh) 设备的故障修复方法及装置
CN108989368B (zh) 一种链路质量的控制方法及监控设备
US10708155B2 (en) Systems and methods for managing network operations
CN110650060A (zh) 流量告警的处理方法、设备及存储介质
CN112350854B (zh) 一种流量故障定位方法、装置、设备及存储介质
CN111192130A (zh) 交易监控中确定故障根源的方法、系统、装置及存储介质
CN113852506A (zh) 一种故障处理方法、装置及电子设备和存储介质
CN106533770B (zh) 一种n-x检修模式下的风险评估方法及装置
CN111262624B (zh) 光缆故障的监控方法和装置
CN111601329B (zh) 一种端口中断告警的处理方法及装置
CN107979495B (zh) 一种网管系统中告警风暴的梯度处理方法
EP2899918A1 (en) Method, apparatus and system for detecting network element load imbalance
CN109818764B (zh) Iptv网络设备故障检测方法和装置
CN111277805B (zh) 一种针对olt上联链路crc错误的处理方法及装置
KR20190104759A (ko) 지능형 장비 이상 증상 사전 탐지 시스템 및 방법
CN113760634A (zh) 一种数据处理方法和装置
CN114138750B (zh) 一种基于ai咨询数据库集群搭建方法和系统
CN108989137B (zh) 端到端通信的时延测量方法及装置、计算机可读存储介质
CN115842760A (zh) 故障检测方法、装置、电子设备及存储介质
CN106488480B (zh) 一种工单引擎实现方法及装置
CN112711510A (zh) 一种业务连续性运行监测自动适配方法及系统
CN114244737A (zh) 网络质量的评估方法、装置和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant