CN114448504A - 光模块故障处理方法及电子设备、计算机可读存储介质 - Google Patents

光模块故障处理方法及电子设备、计算机可读存储介质 Download PDF

Info

Publication number
CN114448504A
CN114448504A CN202111532380.XA CN202111532380A CN114448504A CN 114448504 A CN114448504 A CN 114448504A CN 202111532380 A CN202111532380 A CN 202111532380A CN 114448504 A CN114448504 A CN 114448504A
Authority
CN
China
Prior art keywords
optical module
fault
target
optical
light receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111532380.XA
Other languages
English (en)
Inventor
肖传运
管永刚
杨洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sina Technology China Co Ltd
Original Assignee
Sina Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sina Technology China Co Ltd filed Critical Sina Technology China Co Ltd
Priority to CN202111532380.XA priority Critical patent/CN114448504A/zh
Publication of CN114448504A publication Critical patent/CN114448504A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/079Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using measurements of the data signal
    • H04B10/0791Fault location on the transmission path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/079Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using measurements of the data signal
    • H04B10/0795Performance monitoring; Measurement of transmission parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/079Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using measurements of the data signal
    • H04B10/0795Performance monitoring; Measurement of transmission parameters
    • H04B10/07955Monitoring or measuring power

Landscapes

  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Optical Communication System (AREA)

Abstract

本申请公开了一种光模块故障处理方法及电子设备、计算机可读存储介质,本申请提供的方案包括:根据网络设备中各光模块的历史故障数据,确定用于判定光模块出现故障时的收光功率阈值,其中,所述历史故障数据包括历史误码信息和收光功率;监测目标光模块的收光功率;如果所述目标光模块的收光功率达到所述收光功率阈值,则确定所述目标光模块出现故障。

Description

光模块故障处理方法及电子设备、计算机可读存储介质
技术领域
本申请涉及网络通信技术领域,尤其涉及一种光模块故障处理方法及电子设备、计算机可读存储介质。
背景技术
目前,数据中心网络中,例如交换机、防火墙、路由器等网络设备的光模块如果出现故障,通常是在对光模块故障后由业务方通知运维人员业务受影响。在运维人员得知光模块故障的前提下,由人工手动对故障光模块链路进行隔离,但此时故障光模块已经对此光模块链路上的业务产生影响。
如何提前预知故障光模块,减少光模块故障后对链路上的业务产生影响,是目前需要解决的问题。
发明内容
本申请实施例的目的是提供一种光模块故障处理方法及电子设备、计算机可读存储介质,用以解决现有光模块故障无法提前预知的问题。
为了解决上述技术问题,本说明书是这样实现的:
第一方面,提供了一种光模块故障处理方法,包括:根据网络设备中各样本光模块的历史故障数据,确定用于判定光模块出现故障时的收光功率阈值,其中,所述历史故障数据包括历史误码信息和收光功率;监测目标光模块的收光功率;如果所述目标光模块的收光功率达到所述收光功率阈值,则确定所述目标光模块出现故障。
可选的,根据网络设备中各光模块的历史故障数据,确定用于判定光模块出现故障时的收光功率阈值,包括:
获取网络设备中各样本光模块的历史误码信息及对应的收光功率;
根据历史误码信息分别获取样本光模块中出现故障的各故障光模块的收光功率;
根据各故障光模块的收光功率确定所述收光功率阈值。
可选的,根据历史误码信息分别获取样本光模块中出现故障的各故障光模块的收光功率,包括:
根据历史误码信息,分别获取各故障光模块在出现故障的时刻各通道的收光功率。
可选的,根据各故障光模块的收光功率确定所述收光功率阈值,包括:
确定每个故障光模块在出现故障的时刻各通道的最大收光功率与最小收光功率的光功率差值;
计算各故障光模块对应的光功率差值的平均值,得到故障光模块的平均光功率差值;
根据故障光模块各通道的收光功率之间的关系和所述平均光功率差值,确定故障光模块各通道对应的收光功率的方差;
根据所述方差确定所述收光功率阈值。
可选的,在确定所述目标光模块存在故障之后,还包括:
获取所述目标光模块所在网络设备的连接关系;
根据所述网络设备的连接关系,如果确定所述网络设备上的光模块数量为多个,则从所述网络设备上关断所述目标光模块。
可选的,在确定所述目标光模块存在故障之后,还包括:
获取所述目标光模块所在网络设备的连接关系和端口流量信息;
根据所述网络设备的连接关系,如果确定所述网络设备上的光模块数量为多个,则根据所述网络设备的端口流量信息,确定所述网络设备上除所述目标光模块之外的各光模块的最高峰流量;
如果各光模块的最高峰流量均不超出预设风险阈值,则从所述网络设备上关断所述目标光模块。
可选的,在确定所述目标光模块存在故障之后,还包括:
确定所述目标光模块的端口类型;
如果所述目标光模块的端口类型不属于预设的专用端口类型,则从所述网络设备上关断所述目标光模块。
可选的,在从所述网络设备上关断所述目标光模块之后,还包括:
将所述目标光模块的关断信息进行存储,其中,所述关断信息包括所述目标光模块的物理位置;
基于维修或更换所述目标光模块的操作,获取存储的所述目标光模块的关断信息,根据获取的所述关断信息确定所述目标光模块的物理位置。
第二方面,提供了一种电子设备,包括存储器和与所述存储器电连接的处理器,所述存储器存储有可在所述处理器运行的计算机程序,该计算机程序被该处理器执行时实现如第一方面所述的方法的步骤。
第三方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现如第一方面所述的方法的步骤。
在本申请实施例中,通过根据网络设备中各光模块的历史故障数据,确定用于判定光模块出现故障时的收光功率阈值,并在监测目标光模块的收光功率达到所述收光功率阈值时确定目标光模块出现故障,从而可以提前预知光模块故障,减少故障后续对业务的影响。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例的光模块故障处理方法的流程示意图。
图2是本申请实施例的光模块故障预测信息示例的示意图。
图3是本申请第一实施例的故障光模块处理信息示例的示意图。
图4是本申请第二实施例的故障光模块处理信息示例的示意图。
图5是本申请实施例的光模块故障处理方法的应用架构示意图。
图6是本申请实施例的电子设备的结构方框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请中附图编号仅用于区分方案中的各个步骤,不用于限定各个步骤的执行顺序,具体执行顺序以说明书中描述为准。
为了解决现有技术中存在的问题,本申请实施例提供一种光模块故障处理方法,图1是本申请实施例的光模块故障处理方法的流程示意图。
如图1所示,包括以下步骤:
步骤102,根据网络设备中各样本光模块的历史故障数据,确定用于判定光模块出现故障时的收光功率阈值,其中,所述历史故障数据包括历史误码信息和收光功率。
误码信息是用于表示光模块是否出现故障的信息,样本光模块的历史故障数据是将曾出现过故障的光模块作为样本,获取其对应的历史故障数据作为样本数据,确定用来预测光模块是否会出现故障的阈值标准。
如果光模块未出现故障,对应的误码数值保持一个值,例如0;当目标光模块出现故障后,对应的误码数值会变化为指示该光模块出现故障的数值,例如1。
在光模块为单通道类型的情况下,收光功率即为目标光模块的单通道的收光功率;在光模块为多通道类型的情况下,收光功率即为目标光模块的多个通道各自对应的收光功率。
基于上述实施例提供的方案,可选的,根据网络设备中各光模块的历史故障数据,确定用于判定光模块出现故障时的收光功率阈值,包括:获取网络设备中各样本光模块的历史误码信息及对应的收光功率;根据历史误码信息分别获取样本光模块中出现故障的各故障光模块的收光功率;根据各故障光模块的收光功率确定所述收光功率阈值。
这里,网络设备中各光模块为相同类型的光模块,例如均为单通道模块,或者,均多通道光模块且多通道光模块包括的通道数量相同。
获取的各样本光模块的历史误码信息及对应的收光功率是指,对于同一个光模块,持续获取其在不同时刻的历史误码信息和对应的收光功率,一个时间点对应获取一组历史误码信号和收光功率。由此,可以获取得到多个不同光模块在不同时刻的历史误码信息和对应的收光功率。
在一个实施例中,可以通过简单网络管理协议(SNMP)采集误码信息及收光功率,或者通过Telemetry采集收光功率,通过SNMP采集误码信息。SNMP采集数据的时间间隔例如为30s,Telemetry采集数据的时间间隔例如为2s。
可选的,根据历史误码信息分别获取样本光模块中出现故障的各故障光模块的收光功率,包括:根据历史误码信息,分别获取各故障光模块在出现故障的时刻各通道的收光功率。
具体地,根据目标样本光模块的误码信息,确定目标样本光模块出现故障的时刻;根据所述时刻,获取所述目标样本光模块的各通道的收光功率。
如上文所述,根据历史误码信息可以确定目标样本光模块是否出现故障,从而可以确定目标样本光模块出现故障的时刻。根据故障时刻,可以获取该故障时刻目标样本光模块对应通道的收光功率,或者获取该故障时刻的前一时刻的目标样本光模块对应通道的收光功率,或者获取该故障时刻的后一时刻的目标样本光模块对应通道的收光功率。
在本申请实施例中,以多通道光模块为例,这里获取目标时刻目标样本光模块的各通道的收光功率,得到最大收光功率与最小收光功率,以确定的光功率差值。例如,对于4通道光模块,存在一个通道光功率最大,一个通道光功率最小,其余两个通道光功率相等且接近最大光功率。
这里,最大收光功率与最小收光功率的光功率差值,可以是根据故障时刻的通道的收光功率确定,也可以根据故障时刻前一时刻的通道的收光功率确定,或者可以根据故障时刻的后一时刻的通道的收光功率确定,或者还可以根据这些时刻的平均收光功率确定。
如此,可以分别得到各光模块在出现故障时的光功率差值。正常的光模块,最大通道与最小通道收光功率相近,故障之前与故障之后光模块的最大通道收光功率保持不变,最小通道收光功率持续降低,直至降低至无收光。
光模块出现故障前后,对应的最小收光功率会发生变化。相应地,最大收光功率与最小收光功率光功率差值也会发生变化。
可选的,根据各故障光模块的收光功率确定所述收光功率阈值,包括:确定每个故障光模块在出现故障的时刻各通道的最大收光功率与最小收光功率的光功率差值;计算各故障光模块对应的光功率差值的平均值,得到故障光模块的平均光功率差值;根据故障光模块各通道的收光功率之间的关系和所述平均光功率差值,确定故障光模块各通道对应的收光功率的方差;根据所述方差确定所述收光功率阈值。
根据大量出现故障的光模块的光功率差值作为数据样本,可以求得出现故障时光模块对应通道的最大收光功率和最小收光功率之间的差值结果。
以4通道光模块为例,当目标光模块刚出现故障时,计算此时目标光模块4通道的收光功率最大值与最小值的差值。如此,可以计算得到大量光模块刚出现误码时的最大收光功率与最小收光功率的差值,对这些大量光功率差值数据求平均,得到故障光模块的平均光功率差值,即可以得到通常光模块出现故障时的光功率差值。
为提高光功率差值计算的精度,可以对上述光模块总量对应的光功率差值数据进行预处理,例如去掉部分比例总量的最大光功率差值,去掉部分比例总量的最小光功率差值,然后对剩余数量的光功率差值数据计算平均值。
例如,以去掉总量
Figure BDA0003411844960000071
的最大光功率差值和去掉总量
Figure BDA0003411844960000072
的最小光功率差值,然后计算剩余
Figure BDA0003411844960000073
的光功率差值数据的平均值,计算公式如下:
Figure BDA0003411844960000074
最终,可得到光功率差值的平均值为8,其中,n为光功率差值数据的个数,a为剩余部分4通道最大收光功率与最小收光功率的差值。
在得到光模块通常出现故障时的光功率差值之后,可以根据该差值来确定通常出现故障的光模块的各通道对应的收光功率的均值,根据均值来确定对应的方差。
在本实施例中,目标故障光模块即假设为出现故障的任意光模块,这里可以不知道该故障光模块各通道的收光功率。但是该故障光模块各通道的收光功率之间的关系是已知的。
例如,对于上文所述的4通道光模块,已知一个通道光功率最大,一个通道光功率最小,其余两个通道光功率相等且接近最大光功率。并且,根据上述获取的网络设备中各光模块的历史故障数据,确定光模块通常出现故障时的光功率差值为8。
若假设出现故障时第一通道channel1为最大通道,收光功率为x;第二通道channel2为最小通道,收光功率为x-8;第三通道和第四通道的光功率相等且接近第一通道channel1的收光功率x,即channel3=channel4=x。
则4个通道对应的收光光率的平均值为:
Figure BDA0003411844960000075
则4个通道对应的收光光率的方差为:
Figure BDA0003411844960000081
其中,N表示光模块的通道的数量。
由此可知,当4通道光模块的收光功率方差大于12时,光模块处于亚健康状态,该光模块将要出现故障。根据上述方差确定光模块出现故障时的收光功率阈值,以用于故障光模块的预测。
如此,可以通过获得大量已知故障的光模块的误码和对应的收光功率情况,预先得到光模块临近故障时的报警阈值。
需要指出是的,本申请不局限于上述4通道故障光模块的实施例,使用本申请的上述步骤,可以确定任意通道数量的光模块故障时的收光功率阈值,并用于光模块的故障预测。
步骤104,监测目标光模块的收光功率。
在该步骤中,可以通过实时采集各光模块的收光功率,并根据采集的收光功率可实时计算出各光模块对应的收光功率方差。
例如,当某时刻采集的4通道目标光模块的channel1的收光功率为-14.77dMb,channel2的收光功率为-0.82dMb,channel3的收光功率为-0.86dMb,channel4的收光功率为-0.82dMb。此时收光功率最大值和最小值相差13.95dMb,各通道对应的收光功率平均值为:
Figure BDA0003411844960000082
方差为:
Figure BDA0003411844960000083
步骤106,如果所述目标光模块的收光功率达到所述收光功率阈值,则确定所述目标光模块出现故障。
例如,通过将上述目标光模块的收光功率方差36.42与收光功率阈值12进行比对,由方差36.42>12,可知此光模块处于亚健康状态,即将出现故障。
通过实时监测各光模块的收光功率情况并和收光功率阈值进行比对,可及时预测得到各光模块中临近故障的光模块。
进一步地,可以将上述过滤出的即将出现故障的光模块的相关数据上报给对应的运维人员,以便于运维人员清楚了解故障光模块的情况并采取相应处理。
预测出的故障光模块的上报信息可以如图2所示,包括预测光模块故障的阈值“12”、该光模块的收光功率方差当前值“12.13”,以及光模块所在的网络设备的名称、盘点号、IP、端口、端口号、机房位置,等等。
在本申请实施例中,通过根据网络设备中各光模块的历史故障数据,确定光模块故障时的收光功率阈值,并在监测目标光模块的收光功率达到所述收光功率阈值时确定所述目标光模块存在故障,从而可以提前预知光模块故障,减少故障后续对业务的影响。
在预测出即将故障的目标光模块之后,可以结合该光模块的设备连接关系、端口流量和端口类型中的一种或多种的组合,对即将出现故障的光模块自动进行隔离关断处理,以避免光模块实际故障后,对后续的业务运行产生影响。
光模块的设备连接关系和端口流量对应数据,可以通过Telemetry或SNMP采集得到,端口类型可以通过查询预设数据库获取。
可选的,在一个实施例中,在确定所述目标光模块存在故障之后,还包括:获取所述目标光模块所在网络设备的连接关系;根据所述网络设备的连接关系,如果确定所述网络设备上的光模块数量为多个,则从所述网络设备上关断所述目标光模块。
设备连接关系定义了目标故障光模块所在的网络设备对应的端口的光模块,通过设备连接关系可以知道该网络设备上端口连接的光模块数量。如果故障光模块所在的网络设备当前连接的光模块数量大于1,即该网络设备上除了当前预测出即将故障的光模块之外,还存在其他正常的光模块,则可以将该故障光模块进行隔离关断,停止预测即将发生故障光模块的工作。
如此,在存在其他正常工作的光模块的情况下,关断即将出现故障的目标光模块,可以避免直接关断目标故障光模块所导致的业务中断的问题。如果当前网络设备不存在其他正常工作的光模块,则可以不关断该目标故障光模块,继续工作为业务方提供服务。
可选的,在一个实施例中,在确定所述目标光模块存在故障之后,还包括:获取所述目标光模块所在网络设备的连接关系和端口流量信息;根据所述网络设备的连接关系,如果确定所述网络设备上的光模块数量为多个,则根据所述网络设备的端口流量信息,确定所述网络设备上除所述目标光模块之外的各光模块的最高峰流量;如果各光模块的最高峰流量均不超出预设风险阈值,则从所述网络设备上关断所述目标光模块。
在该实施例中,除了考虑故障光模块所在的网络设备当前存在其他正常的光模块之外,还考虑了正常光模块的流量情况。如果存在至少一个正常光模块的最高峰流量超出预设流量百分比,例如带宽流量的70-80%,则表示目标正常光模块不能再承载其他光模块的流量。如果在预测出故障光模块之后,直接执行关断处理,则关断的故障光模块的流量分流,会超出目标正常光模块的流量承载能力,对该正常光模块的正常运行造成影响。
因此,需要在网络设备上其他正常光模块的最高峰流量均不超出预设风险阈值的情况下,从所述网络设备上关断所述目标光模块。避免直接关断超出目标正常光模块的流量承载能力,而对该正常光模块的正常运行造成影响,进而影响业务的正常运行。
可选的,在一个实施例中,在确定所述目标光模块存在故障之后,还包括:确定所述目标光模块的端口类型;如果所述目标光模块的端口类型不属于预设的专用端口类型,则从所述网络设备上关断所述目标光模块。
端口类型包括专线端口和非专线端口,专线端口是对应很重要的链路的端口,例如数据通信网络的数据中心内部互连链路。端口类型可以是通过手工录入保存到预设数据库中的数据。在判断预测的故障光模块的端口类型时,可以从对应数据库中获取查询。
如果不是专用端口类型,表示该故障光模块对应的链路不是重要链路,则可以从网络设备上自动关断该故障光模块。避免直接关断对重要链路业务的运行影响。如果是专用端口类型,表示该故障光模块对应的链路是重要链路,则不能从网络设备上自动关断该故障光模块,需要人为介入处理。
对应上述几种实施例,在实际执行故障光模块关断操作时,可以将符合条件的数据添加一个字段True,否则添加字段False。将这些数据全部传递至目标网络控制系统,数据中包含故障光模块所在的网络设备IP,网络设备的报警端口以及添加的是否符合条件的字段。
目标网络控制系统可以为通过网络配置协议(NETCONF)开发的对网络设备进行一些简单命令配置的系统。当目标网络控制系统接收到数据后,对存在True字段的数据通过NETCONF协议对目标网络设备进行相应端口的隔离关断。
通过自动关断已预测到的亚健康故障光模块链路,可避免运维人员在业务受影响后无法排查故障所在的问题。
可选的,在从所述网络设备上关断所述目标光模块之后,还包括:
将所述目标光模块的关断信息进行存储,其中,所述关断信息包括所述目标光模块的物理位置;基于维修或更换所述目标光模块的操作,获取存储的所述目标光模块的关断信息,根据获取的所述关断信息确定所述目标光模块的物理位置。
对于可以直接关断的故障光模块,可以把关断的目标光模块信息写入数据库进行存储,并且可告知运维人员处理状态为已处理。已处理的故障光模块的相关信息如图3所示,其中已处理的故障光模块所在的网络设备,即报警设备可以是上联设备或下联设备,上联设备与下联设备互为对端连接的设备。这里,图3所示的报警设备为上联设备。
如图3所示,上联设备的信息包括设备的名称、盘点号、机架位、IP、端口;下联设备的信息包括预测光模块故障的阈值“12”、该故障光模块的收光功率方差当前值“12.13”,以及下联设备的名称、盘点号、机架位、IP、端口、机房位置,等等,其中,处理状态为“已处理”。下联设备的机架位和机房位置表示故障光模块所在的物理位置。
对于可以不可以直接关断的故障光模块,同样可以把目标故障光模块信息写入数据库进行存储,并且可告知运维人员处理状态为未处理。未处理的故障光模块的相关信息如图4所示,其中未处理的故障光模块所在的网络设备即为报警设备,上联设备与下联设备互为对端连接的设备。这里,图4所示的报警设备为上联设备。
如图4所示,上联设备的信息包括设备的名称、盘点号、机架位、IP、端口;下联设备的信息包括预测光模块故障的阈值“12”、该故障光模块的收光功率方差当前值“12.23”,以及下联设备的名称、盘点号、机架位、IP、端口、机房位置,等等,其中,处理状态为“未处理”。下联设备的机架位和机房位置表示故障光模块所在的物理位置。
当运维人员对故障光模块进行维修时,则可以通过读取数据库的关断信息得知故障光模块的物理位置,例如从机房位置定位故障光模块所在的小区,从机架位置定位故障光模块所在的楼栋,从而对故障光模块的更换或维修可准确定位,有迹可循。
参考图5,为本申请实施例的光模块故障处理方法的应用架构示意图。
如图5所示,通过SNMP或Telemetry采集各网络设备10的光模块误码信息、收光功率、设备连接关系和端口流量,并将采集的数据存储到数据库20中。数据分析集群30包括多台服务器,用于根据采集的误码信息和收光功率确定光模块故障时的收光功率阈值,建立故障预测模型,并发送给监控节点40。监控节点40根据预测模型预测目标光模块是否即将出现故障,并结合采集数据中的设备连接关系、端口流量和数据库存储的端口类型中一个或多个的组合等,进一步过滤需要进行关断的故障光模块。
将过滤出来需要关断的故障光模块的数据添加字段True和不需要关断的故障光模块添加字段False后,发送给网络控制系统50。由网络控制系统50根据字段识别需关断的光模块,并使用NETCONF协议进行对应光模块的链路关断。监控节点40和网络控制系统50将对应光模块故障预测信息和关断信息存储到数据库,并上报给运维人员。运维人员读取数据库中的光模块关断信息,定位需要维修或更换的目标光模块的物理位置。
由此,完成光模块的故障预测、关断及维修或更换等处理操作。
可选的,本申请实施例还提供一种电子设备,如图6所示,电子设备2000包括存储器2200和与所述存储器2200电连接的处理器2400,所述存储器2200存储有可在所述处理器2400运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任意一种光模块故障处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任意一种光模块故障处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (10)

1.一种光模块故障处理方法,其特征在于,包括:
根据网络设备中各样本光模块的历史故障数据,确定用于判定光模块出现故障时的收光功率阈值,其中,所述历史故障数据包括历史误码信息和收光功率;
监测目标光模块的收光功率;
如果所述目标光模块的收光功率达到所述收光功率阈值,则确定所述目标光模块出现故障。
2.如权利要求1所述的方法,其特征在于,根据网络设备中各样本光模块的历史故障数据,确定用于判定光模块出现故障时的收光功率阈值,包括:
获取网络设备中各样本光模块的历史误码信息及对应的收光功率;
根据历史误码信息分别获取样本光模块中出现故障的各故障光模块的收光功率;
根据各故障光模块的收光功率确定所述收光功率阈值。
3.如权利要求2所述的方法,其特征在于,根据历史误码信息分别获取样本光模块中出现故障的各故障光模块的收光功率,包括:
根据历史误码信息,分别获取各故障光模块在出现故障的时刻各通道的收光功率。
4.如权利要求3所述的方法,其特征在于,根据各故障光模块的收光功率确定所述收光功率阈值,包括:
确定每个故障光模块在出现故障的时刻各通道的最大收光功率与最小收光功率的光功率差值;
计算各故障光模块对应的光功率差值的平均值,得到故障光模块的平均光功率差值;
根据故障光模块各通道的收光功率之间的关系和所述平均光功率差值,确定故障光模块各通道对应的收光功率的方差;
根据所述方差确定所述收光功率阈值。
5.如权利要求1所述的方法,其特征在于,在确定所述目标光模块存在故障之后,还包括:
获取所述目标光模块所在网络设备的连接关系;
根据所述网络设备的连接关系,如果确定所述网络设备上的光模块数量为多个,则从所述网络设备上关断所述目标光模块。
6.如权利要求1所述的方法,其特征在于,在确定所述目标光模块存在故障之后,还包括:
获取所述目标光模块所在网络设备的连接关系和端口流量信息;
根据所述网络设备的连接关系,如果确定所述网络设备上的光模块数量为多个,则根据所述网络设备的端口流量信息,确定所述网络设备上除所述目标光模块之外的各光模块的最高峰流量;
如果各光模块的最高峰流量均不超出预设风险阈值,则从所述网络设备上关断所述目标光模块。
7.如权利要求1所述的方法,其特征在于,在确定所述目标光模块存在故障之后,还包括:
确定所述目标光模块的端口类型;
如果所述目标光模块的端口类型不属于预设的专用端口类型,则从所述网络设备上关断所述目标光模块。
8.如权利要求5至7中任一项所述的方法,其特征在于,在从所述网络设备上关断所述目标光模块之后,还包括:
将所述目标光模块的关断信息进行存储,其中,所述关断信息包括所述目标光模块的物理位置;
基于维修或更换所述目标光模块的操作,获取存储的所述目标光模块的关断信息,根据获取的所述关断信息确定所述目标光模块的物理位置。
9.一种电子设备,其特征在于,包括:存储器和与所述存储器电连接的处理器,所述存储器存储有可在所述处理器运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的方法的步骤。
CN202111532380.XA 2021-12-15 2021-12-15 光模块故障处理方法及电子设备、计算机可读存储介质 Pending CN114448504A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111532380.XA CN114448504A (zh) 2021-12-15 2021-12-15 光模块故障处理方法及电子设备、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111532380.XA CN114448504A (zh) 2021-12-15 2021-12-15 光模块故障处理方法及电子设备、计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN114448504A true CN114448504A (zh) 2022-05-06

Family

ID=81363172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111532380.XA Pending CN114448504A (zh) 2021-12-15 2021-12-15 光模块故障处理方法及电子设备、计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114448504A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117081666A (zh) * 2023-09-25 2023-11-17 腾讯科技(深圳)有限公司 故障预测方法、装置、电子设备、存储介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080304824A1 (en) * 2007-06-05 2008-12-11 Alessandro Barbieri Optical link quality monitoring in a computer network
CN110838872A (zh) * 2018-08-16 2020-02-25 华为技术有限公司 一种实现光链路故障识别的方法、装置及系统
CN111507363A (zh) * 2019-01-30 2020-08-07 华为技术有限公司 预测光模块故障的方法、装置和设备
CN112311454A (zh) * 2020-11-04 2021-02-02 中国联合网络通信集团有限公司 光模块的状态确定方法、装置及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080304824A1 (en) * 2007-06-05 2008-12-11 Alessandro Barbieri Optical link quality monitoring in a computer network
CN110838872A (zh) * 2018-08-16 2020-02-25 华为技术有限公司 一种实现光链路故障识别的方法、装置及系统
CN111507363A (zh) * 2019-01-30 2020-08-07 华为技术有限公司 预测光模块故障的方法、装置和设备
CN112311454A (zh) * 2020-11-04 2021-02-02 中国联合网络通信集团有限公司 光模块的状态确定方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117081666A (zh) * 2023-09-25 2023-11-17 腾讯科技(深圳)有限公司 故障预测方法、装置、电子设备、存储介质及程序产品
CN117081666B (zh) * 2023-09-25 2024-01-09 腾讯科技(深圳)有限公司 故障预测方法、装置、电子设备、存储介质及程序产品

Similar Documents

Publication Publication Date Title
KR100416872B1 (ko) 라디오테스트유닛을사용하지않고기지국에서라디오를테스트하기위한방법및장치
CN110501956B (zh) 生产测试报警系统、服务器及报警信息采集设备
CN114448504A (zh) 光模块故障处理方法及电子设备、计算机可读存储介质
CN107979495B (zh) 一种网管系统中告警风暴的梯度处理方法
KR102418594B1 (ko) Ict 장비 관리 시스템 및 방법
AU2019293863B2 (en) Automated network monitoring and control
FI129815B (en) Automatic network monitoring and control
CN112188482B (zh) 标识id配置方法及装置、标识id获取方法及装置
US8392755B2 (en) Providing protection switching via failure prediction
CN113285871B (zh) 链路保护方法、sdn控制器和通信网络系统
CN111865822A (zh) 一种基于智能变电站交换机的业务流告警方法及装置
CN114079322A (zh) 断路器数据管理方法及智能电网系统
EP2255564A1 (en) Alarm and event coordination between telecom nodes
EP3815303B1 (en) Automated network monitoring and control
CN113542048B (zh) 哑资源监测方法、装置、电子设备和计算机可读存储介质
CN115334020A (zh) 一种带有网络数据负载均衡的网络交换系统
CN117336786A (zh) 一种异常终端识别方法、装置及可读存储介质
CN114374598A (zh) 一种解决以太网网络端口被占用的方法及系统
CN114069841A (zh) 基于soe信息识别的fa逻辑判断方法、装置及设备
CN114257660A (zh) Sv和goose报文处理方法、装置、设备及存储介质
CN117336155A (zh) 故障处理方法、装置、设备及存储介质
CN111132205A (zh) 一种基于网络性能的室分系统预警方法与装置
KR100610866B1 (ko) 이동전화 교환기의 성능 감시 방법 및 시스템
CN112835737A (zh) 系统异常处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230320

Address after: Room 501-502, 5/F, Sina Headquarters Scientific Research Building, Block N-1 and N-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193

Applicant after: Sina Technology (China) Co.,Ltd.

Address before: 100080 7th floor, Sina headquarters scientific research building, plot n-1 and n-2, Zhongguancun Software Park Phase II (West Expansion), Dongbeiwang West Road, Haidian District, Beijing

Applicant before: Sina.com Technology (China) Co.,Ltd.

TA01 Transfer of patent application right