CN117811898A - 一种fttr设备故障修复方法及装置 - Google Patents

一种fttr设备故障修复方法及装置 Download PDF

Info

Publication number
CN117811898A
CN117811898A CN202410235513.4A CN202410235513A CN117811898A CN 117811898 A CN117811898 A CN 117811898A CN 202410235513 A CN202410235513 A CN 202410235513A CN 117811898 A CN117811898 A CN 117811898A
Authority
CN
China
Prior art keywords
fault
level
data
fttr
repair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410235513.4A
Other languages
English (en)
Other versions
CN117811898B (zh
Inventor
卢小张
刘俊峰
王鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN202410235513.4A priority Critical patent/CN117811898B/zh
Priority claimed from CN202410235513.4A external-priority patent/CN117811898B/zh
Publication of CN117811898A publication Critical patent/CN117811898A/zh
Application granted granted Critical
Publication of CN117811898B publication Critical patent/CN117811898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Small-Scale Networks (AREA)

Abstract

本发明实施例提供了一种FTTR设备故障修复方法及装置。该方法包括:获取光纤到户FTTR设备的感知数据,其中,感知数据的级别至少包括以下之一:网管云端级、设备级、业务模块级;根据感知数据所属的级别,以对应于该级别的故障诊断修复策略进行故障修复。通过本发明实施例,可以解决相关技术中接入网络的故障修复存在着耗时长、效率低的问题,达到了提高故障修复效率和用户体验度的效果。

Description

一种FTTR设备故障修复方法及装置
技术领域
本发明实施例涉及通信设备运维领域,具体而言,涉及一种光纤到户(Fiber tothe Room,FTTR)设备故障修复方法及装置。
背景技术
接入网络由网管云平台通过获取FTTR设备数据来监控宽带业务的运行,并提供运维保障。目前网络系统中FTTR设备多,产生的故障事件消息条目庞大,信息多样混杂,给网管云平台的消息处理性能带来挑战,同时还需要运维人员参与分析,消耗了大量的人力,增加了故障定位和修复时间。
当接入网络遭受故障时,宽带业务特性无法准确地在网管云平台上实现识别感知和修复,并且在终端与云端断链时,无法进行远程操作,需依赖运维人员上门解决,如此,耗时长效率低,宽带业务可用率难以得到高效保障,降低了用户的体验度。
发明内容
本发明实施例提供了一种FTTR设备故障修复方法及装置,以至少解决相关技术中接入网络的故障修复存在着耗时长、效率低的问题。
根据本发明的一个实施例,提供了一种FTTR设备故障修复方法,包括:获取光纤到户FTTR设备的感知数据,其中,所述感知数据的级别至少包括以下之一:网管云端级、设备级、业务模块级;根据所述感知数据所属的级别,以对应于该级别的故障诊断修复策略进行故障修复。
根据本发明的另一个实施例,提供了一种FTTR设备故障修复装置,包括:获取模块,用于获取光纤到户FTTR设备的感知数据,其中,所述感知数据的级别至少包括以下之一:网管云端级、设备级、业务模块级;修复模块,用于根据所述感知数据所属的级别,以对应于该级别的故障诊断修复策略进行故障修复。
根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明上述实施例,基于不同层级的光纤到户FTTR设备感知数据,进行多层级的故障修复,可将数目庞大的故障事件消息分级处理,提高故障修复效率,同时,也降低了对网管云端的性能和资源要求。因此,可以解决相关技术中接入网络的故障修复存在着耗时长、效率低的问题,从而达到提高故障修复效率和用户体验度的效果。
附图说明
图1是根据本发明实施例的运行FTTR设备故障修复方法的计算机终端的硬件结构框图;
图2是根据本发明实施例的 FTTR设备故障修复系统的结构框图;
图3是根据本发明实施例的FTTR设备故障感知修复系统的架构图;
图4是根据本发明实施例的FTTR设备故障修复方法的流程图;
图5是根据本发明实施例的FTTR设备故障修复装置的结构框图;
图6是根据本发明场景实施例的云端协同级闭环故障修复的方法流程图;
图7是根据本发明场景实施例的终端设备级闭环故障修复的方法流程图;
图8是根据本发明场景实施例的业务模块级闭环故障修复的方法流程图;
图9是根据本发明场景实施例的终端设备级故障修复实例的方法流程图;
图10是根据本发明场景实施例的云端协同级故障修复实例的方法流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
随着FTTR接入网技术的发展和宽带业务丰富度地不断提升,越来越多的用户关注网络业务的体验保障,有效的提升宽带业务的可用率是提高用户体验的重要指标。同时,实现网络感知灵活、安全可控、高效保障必将是以后的发展趋势。本发明实施例提出了一种解决FTTR故障感知识别和修复的方法及系统,对FTTR设备的故障的感知识别和闭环修复调优提出了解决方案。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的运行FTTR设备故障修复方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器或可编程逻辑器件等的处理装置)和用于存储数据的存储器104,其中,上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的FTTR设备故障修复方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
本申请实施例还运行于FTTR故障感知修复系统上,如图2所示,该FTTR故障感知修复系统包括:感知采样单元21、识别定障单元22、修复优化单元23。
感知采样单元21,位于FTTR设备上,包括FTTR设备及其组成的网络信息,用于进行网络设备感知数据的采集和监测,其中,网络设备感知数据包括FTTR设备的网络信息数据,并将感知数据进行多维度的原子化分割,表达网络设备数据属性;其中,所采集的感知数据包括以下三种级别:网管云端级、设备级、业务模块级;数据属性由若干个原子字段按照功能参数、配置、状态、事件等组合而成,原子字段是一种不可分割且具备可操作的字段,具体地:
1)系统资源信息原子化包括但不限于以下字段: RAM大小(RamSize)、Flash大小(FlashSize),中央处理器(Central Processing Unit,CPU)核的个数(CpuCoreNumber)、CPU运行的最大频率(CpuFrequency)、CPU占有率(CPUUsage)、内存占有率(MemUsage);
2)无源光纤网络(Passive Optical Network,PON)口信息原子化包括但不限于以下字段:光口索引(PortIndex:)、光口发射光功率(TXPower)、光口接收光功率(RXPower)、光模块温度(Temperature)、光模块供电电压(Vottage)、光模块供电电流(Current);
3)无线服务集标识(Service Set Identifier,SSID)信息原子化包括但不限于以下字段: SSID索引(SSIDIndex)、接口媒体访问控制(Media Access Control,MAC)地址(SSIDMAC)、SSID是否使能(SSIDEnable)、WiFi频段(Band)、SSID标准(SSIDStandard)、加密模式(SSIDEncryptionMode)、SSID名称(SSIDName)。
感知采样单元21,还用于对网络感知指标进行抽取、规范化转换处理,其中,网络感知指标包括以下至少一个维度:FTTR设备系统信息、PON有线和WIFI无线网络端口的状态和流量统计数据、性能事件和告警事件信息。
其中,网络感知指标具体可以包括:
1)指标事件:为通过FTTR网关设备应用程序编程接口(Application ProgrammingInterface,API)接口模型所采集的如下信息数据,包括:FTTR设备系统信息、PON有线和WIFI无线网络端口的状态和流量统计数据等,
在本实施例中,还可对FTTR网关指标信息实现分钟级采集。
2)告警事件:为通过FTTR网关API接口模型采集的如下信息数据:FTTR设备上下线、连接离线、漫游失败等事件。
在本实施例中,通过MAC参数标识告警事件来源,告警事件产生自动上报。
在一个实施例中,指标事件和告警事件所对应信息数据至少包括:JSON数据格式。
3)性能事件:为通过FTTR网关API接口模型采集如下信息数据包括FTTR下挂设备上/下行流量、收发报文数等性能统计事件;其中,性能事件至少包括GPB数据格式;
在本实施例中,通过MAC参数标识性能事件来源,性能事件周期性自动上报。
在本实施例中,如表1所示,FTTR设备感知接口可以划分为以下不同子类:
表1
在本实施例中,感知采样单元21,包括修复API接口;
修复API接口:采用FTTR主从网关的接口分发模型,如JSON、GPB数据格式,用于配置调整FTTR主从网关WIFI无线和PON有线业务参数,依据修复策略执行修复动作消除告警,以使设备从异常中恢复出来。
如表2所示,修复API接口按照修复操作层次可分为:系统级和业务级;每个类别的修复操作中有不同的修复方法,通过对FTTR设备的业务配置修改、参数调优,实现FTTR网络恢复业务顺畅。
表2
识别定障单元22,位于FTTR设备或网管云端上, 用于实现复杂故障场景(即复杂事件)识别诊断;
具体地,识别诊断包括:根据复杂故障场景识别诊断任务,并基于感知采样单元21所采集的感知数据,对由原子字段组成的API接口形成的事件流,进行复杂事件识别诊断任务。
复杂故障场景识别诊断任务是基于原子事件流查询并检测复杂场景事件的发生情况,包括干扰、覆盖、连接、设备、配置等维度查询检测。
在复杂故障场景识别诊断时,完整流程包括:
启动复杂故障场景识别诊断任务,根据预设的识别诊断规则获取诊断规则配置数据;
将诊断规则配置数据解析为包括原子字段的设定的阈值范围(如:WIFI干扰占空比超过80%)、配置状态(自动信道选择未开启)、集合包含等匹配规则。
由FTTR设备依据复杂故障场景识别诊断匹配规则进行查询与检测,包括干扰、覆盖、连接、设备、配置等维度查询检测,查询检测的进度直到全部完成,并获得的检测结果。
依据检测的疑似根因结果与修复优化规则匹配,并给出修复策略或优化修复建议。
修复优化单元23,位于FTTR设备或网管云端上,用于基于感知数据所属级别以及故障疑似根因结果对应的修复规则,并根据该修复规则对应的修复策略(即故障诊断修复策略)触发修复,并将故障疑似根因结果对应的修复API指令下发给FTTR设备。
其中,修复策略是从异常状态恢复到正常态的修复优化操作策略,例如:实时修复、定时周期修复、远程修复,依据所述的策略决策触发修复;
修复API指令包括:WIFI信道调整、启动漫游功能、系统复位等下发给FTTR设备,根据修复API指令可实现常见的WIFI覆盖弱和干扰大、PON设备离线、系统CPU和内存资源占用高的故障修复,实现了用户网络故障的修复。
图3是根据本发明实施例的FTTR故障感知修复系统的架构图,如图3所示,在FTTR故障感知修复架构中,主要包括:网管云端、FTTR设备;其中,FTTR设备中包括感知数据采集流程、终端设备级闭环感知修复流程、业务模块级闭环感知修复流程;网管云端中包括网管云端级闭环感知修复流程,即图3中网管云端故障识别诊断。
其中,感知数据采集流程由上述感知采样单元21实现,包括感知API、修复API,所采集的感知数据分为:告警事件、性能事件以及指标事件。通过感知数据采集流程获取的感知数据将用于后续各级别的故障识别及修复。
终端设备级闭环感知修复流程针对FTTR设备自身发生故障,对应FTTR设备内识别单一或少量的简单事件场景,基于感知采样单元21 采集的感知数据,再由上述识别定障单元22和修复优化单元23进行故障识别及修复,可实时、可控、可靠地修复故障,实现FTTR设备内的故障自修复,保障网络的高可用率,是对云端协同闭环感知修复的补充和备用,即当FTTR设备与云端断链时,仍然可对FTTR设备级的故障进行识别及修复。
在本实施例中,当FTTR设备内发生故障,可快速识别发现以及精准修复,减少业务阻断时间,同时,在精准修复后进行故障记录以便审计和追溯故障原因。具体地,在终端设备级(即设备级)闭环感知修复流程中包括以下单元:
感知识别单元(即感知采样单元):用于通过统一接口进行故障指标监测条目注册,识别监测业务自身所需的系统资源(如CPU),识别CPU占用、内存占用指标劣化、业务进程异常退出、业务离线中断等故障异常;
干预修复单元(包括识别定障单元22和修复优化单元23):用于在识别诊断到发生故障时,依据故障修复策略和规则实时的进行干预修复,如重启业务进程、降功耗、使能端口等操作;
故障记录单元:为便于审计和追溯故障根因,用于将故障识别单元识别监测到的故障信息,以及干预修复单元的干预修复操作程完整记录到日志文件、黑匣子中。
业务模块级闭环感知修复流程是针对FTTR设备业务模块发生的故障,业务模块基于感知采样单元21 采集的感知数据,识别到业务模块内的变量或寄存器值异常导致业务故障,再由上述识别定障单元22和修复优化单元23进行故障识别及修复,可实时、可控、可靠的修复优化,如修正变量值或寄存器值、业务模块复位等,实现业务模块内的故障自修复,同时,也是对云端协同闭环感知修复的补充和备用,即当FTTR设备与云端断链时,仍然可对业务模块的故障进行识别及修复。
具体地,业务模块级闭环感知修复流程包括以下单元:
业务感知识别单元(即感知采样单元):用于定期或基于条件触发地识别监测业务自身变量或寄存器值等异常;
业务干预修复单元(包括识别定障单元22和修复优化单元23):用于在业务模块内识别变量或寄存器值发生异常时,对异常进行干预修复,如修正变量值或寄存器值、业务模块复位等操作;
业务故障记录单元:为便于审计和追溯故障根因,用于将业务感知识别单元识别监测到的异常信息,以及业务干预修复单元的干预修复操作程完整记录到日志文件、黑匣子中。
网管云端级闭环感知修复流程是针对FTTR设备多事件源联合分析,可识别多雷达复杂事件的场景,进行定时、可靠、远程的具有复杂规则策略修复优化,实现复杂事件的故障感知和修复优化,保障网络的高可用率。
网管云端级闭环感知修复流程包括如下单元:
(1)FTTR设备端感知单元(即感知采样单元21):由FTTR设备以及有其组成的网络信息进行感知数据采集和监测,还用于对网络感知指标进行抽取、清洗和转换,得到数据源采集阶段的感知数据。
(2)云端协同识别诊断单元:对接收到的网络感知事件进行数据信息存储和识别诊断,并输出检测结果或疑似根因分析给出优化修复建议。
在本实施例中,云端协同识别诊断单元可进行复杂场景事件识别诊断以及故障异常智能识别。
在本实施例中,云端协同识别诊断单元还用于向FTTR设备下发诊断规则配置数据,其中,所述诊断规则配置数据至少包括以下之一:原子字段的预设阈值范围(例如:WIFI干扰占空比的阈值为80%)、FTTR(设备)配置状态。
在本实施例中,云端协同识别诊断单元还用于定期向FTTR设备下发故障查询任务;或基于接收到的网络感知事件下发故障查询任务,其中, 网络感知事件包括:指标事件、所述性能事件或所述告警事件。
(3)云端协同修复优化单元:基于复杂故障场景检测结果或故障疑似根因对应的修复策略,依据所述的规则策略决策触发修复,并将修复API的修复指令下发给FTTR设备,根据指令实现常见的故障修复,实现了用户网络故障的修复。
通过上述FTTR设备故障感知识别修复系统,可采集接入各个FTTR设备的WIFI无线、PON有线和设备信息数据,并对信息数据按照业务特性维度原子化分割成原子字段,配置原子字段组成查询和检测规则,对复杂事件识别诊断疑似根因,匹配修复策略和规则,可以远程或实时修复优化。实现网管云端级、终端设备级和业务模块级三级层次故障感知修复,可将数目庞大的故障事件消息分级处理,降低对网管云端的性能资源要求,终端与云端断链时,终端设备级与业务模块级可发挥作用。本发明实施例中根据业务特性对感知的设备信息数据原子化分割为原子字段,并配置原子字段组成查询和检测规则,以及多层级感知修复,可达到快速响应,提升故障处理效率目的。
本发明实施例中还提供了一种运行于上述FTTR故障感知修复系统上的FTTR故障感知修复方法,图4是根据本发明实施例的FTTR设备故障修复方法的流程图,如图4所示,该流程包括如下步骤:
步骤S402,获取光纤到户FTTR设备的感知数据,其中,感知数据的级别至少包括以下之一:网管云端级、设备级、业务模块级;
在本实施例中,获取不同级别的感知数据,将数目庞大的故障事件消息分级处理,降低了对网管云端的性能和资源要求。
在本实施例的步骤S402中,在感知数据的级别为网管云端级的情况下,获取FTTR设备的感知数据,包括:感知并采集FTTR设备的网络信息数据;基于不同数据维度,将网络信息数据原子化分割成多个原子字段数据;根据预设的网络感知指标对多个原子字段数据进行抽取和规范化转换处理,得到网管云端级的感知数据。
在本实施例中,将FTTR设备感知数据原子化分割成原子字段采样,便于通过复杂事件场景处理技术进行多事件的关联分析,发现网络当中的隐患和异常从而达到网络趋势感知,提醒用户可能发生的异常主动式给出修复优化建议。
在一个实施例中,网络信息数据包括以下至少之一:FTTR设备系统信息、PON有线网络端口的状态信息、WIFI无线网络端口的状态信息、流量统计数据信息。
在一个实施例中,得到网管云端级的感知数据之后,方法还包括:将感知数据以指标事件、性能事件或告警事件的形式上报于网管云平台。
在本实施例中,网管云平台对复杂事件进行查询,并且检测规则数据的可配置性,灵活的修改配置规则,实现不同场景下复杂事件查询和检测,减少FTTR设备更换版本修改配置数据的次数,进一步缩短了运维人员故障处理时长。
步骤S404,根据感知数据所属的级别,以对应于该级别的故障诊断修复策略进行故障修复。
在本实施例的步骤S404中,在感知数据的级别为所述网管云端级的情况下,故障诊断修复策略包括:根据网管云平台下发的诊断规则配置数据,执行故障查询任务;将根据故障查询任务得到的疑似根因结果返回至网管云平台,以使网管云平台根据疑似根因结果匹配对应的故障修复策略。
在一个实施例中,网管云端级的故障诊断修复策略中,故障查询任务为网管云平台定期下发的;或,网管云平台基于指标事件、性能事件或告警事件而下发的。
在一个实施例中,诊断规则配置数据至少包括以下之一:原字段的预设阈值范围、FTTR配置状态。
在一个实施例中,将根据故障查询任务得到的疑似根因结果返回至网管云平台之后,方法还包括:根据网管云平台下发的修复指令,进行故障修复。
在一个实施例中,在感知数据的级别为设备级的情况下,故障诊断修复策略包括:通过统一接口进行故障指标监测条目注册;根据已注册的故障指标监测条目,定期识别监测各故障指标监测条目所对应的监测项,并获得对应的监测数据;根据监测数据确定对应的故障修复策略,并根据故障修复策略进行故障修复。
在一个实施例中,监测项包括以下至少之一:CPU占用、内存占用、业务进程是否异常退出、业务是否离线、PON是否离线、WIFI覆盖强度、WIFI干扰情况。
在一个实施例中,FTTR故障感知修复方法还包括:将监测数据和故障修复的操作过程数据,以日志文件的形式存储至黑匣子中,其中,监测数据至少包括:识别出的故障信息。
在一个实施例中,在感知数据的级别为业务模块级的情况下,故障诊断修复策略包括:定期或基于条件触发地监测业务自身变量或寄存器值;在业务自身变量或寄存器值异常的情况下,进行是故障修复,并将识别出的故障信息和故障修复的操作过程数据,以日志文件的形式存储至黑匣子中。
通过上述步骤,基于不同层级的光纤到户FTTR设备感知数据,进行多层级的故障修复,可将数目庞大的故障事件消息分级处理,提高故障修复效率,同时,也降低了对网管云端的性能和资源要求。因此,可以解决相关技术中接入网络的故障修复存在着耗时长、效率低的问题,提高了故障修复效率和用户体验度的效果。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种FTTR设备故障修复装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图5是根据本发明实施例的FTTR设备故障修复装置的结构框图,如图5所示,该FTTR设备故障修复装置500包括:获取模块510和修复模块520。
获取模块510,用于获取光纤到户FTTR设备的感知数据,其中,所述感知数据的级别至少包括以下之一:网管云端级、设备级、业务模块级;
修复模块520,用于根据所述感知数据所属的级别,以对应于该级别的故障诊断修复策略进行故障修复。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。在实际实施过程中,上述FTTR设备故障修复装置中的模块命名和功能划分可以根据实际情况进行调整,只要能够实现上述实施例中FTTR设备故障修复方法的步骤即可,这里不再赘述。
为使得本领域的技术人员更好地理解本发明的技术方案,下面将结合具体场景的实施例进行详细的阐述。
场景实施例一
本发明实施例中的FTTR设备故障修复方法的分为网关云端级闭环感知修复、终端设备级闭环感知修复和业务模块级闭环感知修复,其感知场景、修复场景和适用场景如表3所示:
表3
云端协同级闭环感知修复适用于多雷达复杂事件场景进行定时、可靠、远程的修复优化场景,例如多事件源联合分析、网络业务质差定位等场景;
终端设备级闭环感知修复适用于设备自身单一或少量简单事件场景进行实时、可控、可靠的修复优化;
业务模块级闭环感知修复适用于业务模块内变量或寄存器值异常进行业务模块内实时、可控、可靠的异常修复场景。
通过三层级的故障感知修复可将数据复杂的故障事件消息进行分级处理,从而降低了对网管云端性能和资源的要求。同时,当FTTR设备与网管云端断链时,终端设备级与业务模块级可发挥作用,作为对云端协同级的补充和备用,提升系统安全性和可靠性,提升用户体验感。
场景实施例二
在本发明场景实施例二中,针对场景实施例一中的三层级闭环感知修复涉及的具体方法流程进行详细介绍。
图6是根据本发明场景实施例的云端协同级闭环故障修复方法的流程图,如图6所示,云端协同级闭环故障修复方法包括如下步骤:
步骤S601,网管云平台配置复杂事件规则,并获取诊断规则配置数据;
其中,诊断规则配置数据解析为包括原子字段的设定的阈值范围、配置状态等匹配规则,例如:WIFI干扰占空比超过80%、自动信道选择未开启、启动下发复杂事件查询和检测任务给FTTR设备。
步骤S602,FTTR设备执行复杂事件查询和检测任务;
例如对干扰、覆盖、连接、设备、配置等维度进行查询和检测,直到全部完成,并返回检测的疑似根因结果。
步骤S603,网管云平台获取疑似根因结果,匹配对应的修复优化策略和规则;
其中,修复策略是从异常状态恢复到正常态的修复优化操作策略如实时修复、定时周期修复、远程修复,依据所述的策略决策触发修复,与故障疑似根因匹配对应的修复规则,将修复API指令如WIFI信道调整、启动漫游功能、系统复位等下发给FTTR设备。
步骤S604,FTTR设备根据指令执行故障修复操作,实现用户网络故障的修复。
图7是根据本发明场景实施例的终端设备级闭环故障修复方法的流程图,如图7所示,终端设备级闭环故障修复方法可以包括如下步骤:
步骤S701,FTTR设备内业务模块注册内部感知识别的劣化指标;
其中,通过提供的统一接口进行注册,识别监测业务自身所需的系统资源如CPU、内存占用指标劣化、PON离线、WIFI覆盖弱、WIFI干扰大等故障异常。
步骤S702,当FTTR设备内识别故障记录到黑匣子、日志文件;
为便于审计和追溯故障根因,将故障识别监测到的故障信息,以及干预修复操作过程完整记录到日志文件、黑匣子中。
步骤S703,根据故障规则策略执行故障修复操作;
其中,修复操作例如业务进程复位、缓存释放、端口使能开关等,当业务模块识别发生故障,则依据故障修复策略和规则实时的进行干预修复如业务进程复位、缓存释放等。
图8是根据本发明场景实施例的业务模块级闭环故障修复方法的流程图,如图8所示,业务模块级闭环故障修复方法可以包括如下步骤:
步骤S801,FTTR设备内业务模块识别监测业务自身变量或寄存器值等异常;
例如业务模块识别监测业务自身如XMAC Link寄存器值等故障异常。
步骤S802,业务模块内识别故障记录到黑匣子、日志文件;
为便于审计和追溯故障根因,将故障识别监测到的故障信息,以及干预修复操作过程完整记录到日志文件、黑匣子中。
步骤S803,当业务模块内识别变量或寄存器值发生变化异常,则修正优化变量值或寄存器值、业务模块复位。
场景实施例三
在本发明场景实施例三中,针对场景实施例二中终端设备级闭环故障修复的实例化介绍。
图9是根据本发明场景实施例的芯片温度过高故障修复的流程图,如图9所示,具体包括如下步骤:
步骤S901,注册芯片温度检测函数,定时遍历注册的函数条目;
其中,遍历注册的函数条目为周期性的遍历。
步骤S902,当遍历到温度检测函数条目时,检测CPU芯片、WIFI芯片和PON芯片的温度是否有至少一个超过设定的阈值Temp1;
当遍历到芯片温度检测函数条目时,开始读取CPU芯片、WIFI芯片和PON芯片的温度,检测三类芯片温度是否有至少一个超过设定的阈值Temp1,等待一段时间,若在该等待时间内读取的芯片温度仍然超过阈值Temp1,将记录到日志并启动干预修复操作。
步骤S903,将检测到的芯片温度故障记录到黑匣子、日志文件;
为便于故障原因追溯,将检测到的芯片温度故障隐患记录至黑匣子日志。
步骤S904,FTTR设备启动降功耗的干预修复操作;
FTTR设备内启动降功耗的干预修复操作,根据芯片温度过高的干预修复规则策略,当芯片温度超过设定的阈值Temp1时,CPU多核情况下执行关闭一半CPU核数的操作,否则进行系统复位操作。
步骤S905,若步骤S902中的芯片温度没有满足“三类芯片温度是否有至少一个超过设定的阈值Temp1”,则温度检测函数条目结束。
其中,在温度检测函数条目结束之后,开始下一个注册条目的遍历。
场景实施例四
在本发明场景实施例四中,针对场景实施例二中网管云端级闭环故障修复的实例化介绍。
图10是根据本发明场景实施例的WIFI干扰大调优故障修复的流程图,如图10所示,具体包括如下步骤:
步骤S1001,网管云平台上配置WIFI干扰检测规则,下发启动FTTR设备的WIFI干扰查询和检测任务;
步骤S1002,FTTR设备执行WIFI干扰查询和检测场景;
例如,检测FTTR设备的WIFI的2.4G或5G频道邻居数量、干扰占空比、自动信道开启状态等,依据配置规则数据进行结果判断,确定疑似根因如WIFI的2.4G干扰大,5G干扰小,但未使用5G,返回结果给网管云平台。
步骤S1003,网管云平台对WIFI覆盖干扰的疑似根因匹配修复优化策略和规则,生成修复优化条目;
其中,生成修复优化条目例如启用FTTR设备的2.4G或5G漫游功能。
步骤S1004,FTTR设备启动降低功耗的敢于修复操作。
具体地,判断系统是否实时修复,若系统实时修复,那么网管云平台下发启用2.4G/5G漫游功能的指令至对应的FTTR设备,FTTR设备执行该指令;若系统未实时修复,那么显示修复建议,通过人工远程操作进行故障修复。
通过本发明上述实施例,能够根据业务特性感知数据原子化分割原子字段,实现根据配置规则进行事件的查询和检测,以及多层级故障感知修复,并且当FTTR设备与网管云平台发生断链故障不能协同时,终端设备级和业务模块级的闭环感知修复发挥作用,对云端协同感知修复进行补充和备用,提升了系统的安全性和可靠性,达到快速响应,提升故障处理效率目的。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种FTTR设备故障修复方法,其特征在于,包括:
获取光纤到户FTTR设备的感知数据,其中,所述感知数据的级别至少包括以下之一:网管云端级、设备级、业务模块级;
根据所述感知数据所属的级别,以对应于该级别的故障诊断修复策略进行故障修复。
2.根据权利要求1所述的方法,其特征在于,在所述感知数据的级别为所述网管云端级的情况下,获取FTTR设备的感知数据,包括:
感知并采集所述FTTR设备的网络信息数据;
基于不同数据维度,将所述网络信息数据原子化分割成多个原子字段数据;
根据预设的网络感知指标对多个原子字段数据进行抽取和规范化转换处理,得到所述网管云端级的感知数据。
3.根据权利要求2所述的方法,其特征在于,其中,所述网络信息数据包括以下至少之一:FTTR设备系统信息、无源光纤网络PON有线网络端口的状态信息、WIFI无线网络端口的状态信息、流量统计数据信息。
4.根据权利要求2所述的方法,其特征在于,得到所述网管云端级的感知数据之后,所述方法还包括:
将所述网管云端级的感知数据以指标事件、性能事件或告警事件的形式上报于网管云平台。
5.根据权利要求4所述的方法,其特征在于,其中,在所述感知数据的级别为所述网管云端级的情况下,所述故障诊断修复策略包括:
根据所述网管云平台下发的诊断规则配置数据,执行故障查询任务;
将根据所述故障查询任务得到的疑似根因结果返回至所述网管云平台,以使所述网管云平台根据所述疑似根因结果匹配对应的故障修复策略。
6.根据权利要求5所述的方法,其特征在于,其中,所述故障查询任务为所述网管云平台定期下发的;或,所述网管云平台基于所述指标事件、所述性能事件或所述告警事件而下发的。
7.根据权利要求5所述的方法,其特征在于,其中,所述诊断规则配置数据至少包括以下之一:原子字段的预设阈值范围、FTTR配置状态。
8.根据权利要求5所述的方法,其特征在于,将根据所述故障查询任务得到的疑似根因结果返回至所述网管云平台之后,所述方法还包括:
根据所述网管云平台下发的修复指令,进行所述故障修复。
9.根据权利要求1所述的方法,其特征在于,在所述感知数据的级别为所述设备级的情况下,所述故障诊断修复策略包括:
通过统一接口进行故障指标监测条目注册;
根据已注册的故障指标监测条目,定期识别监测各故障指标监测条目所对应的监测项,并获得对应的监测数据;
根据所述监测数据确定对应的故障修复策略,并根据所述故障修复策略进行所述故障修复。
10.根据权利要求9所述的方法,其特征在于,其中,所述监测项包括以下至少之一:中央处理器CPU占用、内存占用、业务进程是否异常退出、业务是否离线、PON是否离线、WIFI覆盖强度、WIFI干扰情况。
11.根据权利要求9所述的方法,其特征在于,所述方法还包括:
将所述监测数据和故障修复的操作过程数据,以日志文件的形式存储至黑匣子中,其中,所述监测数据至少包括:识别出的故障信息。
12.根据权利要求1所述的方法,其特征在于,在所述感知数据的级别为所述业务模块级的情况下,所述故障诊断修复策略包括:
定期或基于条件触发地监测业务自身变量或寄存器值;
在所述业务自身变量或所述寄存器值异常的情况下,进行是故障修复,并将识别出的故障信息和故障修复的操作过程数据,以日志文件的形式存储至黑匣子中。
13.一种FTTR设备故障修复装置,其特征在于,包括:
获取模块,用于获取光纤到户FTTR设备的感知数据,其中,所述感知数据的级别至少包括以下之一:网管云端级、设备级、业务模块级;
修复模块,用于根据所述感知数据所属的级别,以对应于该级别的故障诊断修复策略进行故障修复。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至12任一项中所述的方法的步骤。
15.一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至12任一项中所述的方法的步骤。
CN202410235513.4A 2024-03-01 一种fttr设备故障修复方法及装置 Active CN117811898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410235513.4A CN117811898B (zh) 2024-03-01 一种fttr设备故障修复方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410235513.4A CN117811898B (zh) 2024-03-01 一种fttr设备故障修复方法及装置

Publications (2)

Publication Number Publication Date
CN117811898A true CN117811898A (zh) 2024-04-02
CN117811898B CN117811898B (zh) 2024-07-16

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117835099A (zh) * 2024-03-05 2024-04-05 四川天邑康和通信股份有限公司 基于fttr的故障自诊断与自修复方法、装置、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB684889A (en) * 1951-02-08 1952-12-24 Standard Telephones Cables Ltd Improvements in or relating to failure alarm arrangements for communication systems
CN110493042A (zh) * 2019-08-16 2019-11-22 中国联合网络通信集团有限公司 故障诊断方法、装置及服务器
CN113568743A (zh) * 2021-07-23 2021-10-29 腾讯科技(深圳)有限公司 物联网设备的管理方法、装置、介质及电子设备
CN113973121A (zh) * 2020-07-06 2022-01-25 腾讯科技(深圳)有限公司 物联网数据处理方法、装置、电子设备及存储介质
CN114338367A (zh) * 2021-12-27 2022-04-12 中国联合网络通信集团有限公司 故障定位方法、装置及计算机存储介质
CN115174353A (zh) * 2022-07-14 2022-10-11 中国工商银行股份有限公司 故障根因确定方法、装置、设备及介质
WO2022218401A1 (zh) * 2021-04-16 2022-10-20 华为技术有限公司 车辆故障诊断方法、车载诊断装置
CN115632939A (zh) * 2022-12-23 2023-01-20 浩鲸云计算科技股份有限公司 一种实现算力网络多目标达成的自动选网选路的方法
CN117176249A (zh) * 2023-11-01 2023-12-05 深圳市光网世纪科技有限公司 一种光纤网络用智能监测系统
CN117439864A (zh) * 2023-11-15 2024-01-23 成都长虹网络科技有限责任公司 一种fttr网络设备的故障检测与恢复方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB684889A (en) * 1951-02-08 1952-12-24 Standard Telephones Cables Ltd Improvements in or relating to failure alarm arrangements for communication systems
CN110493042A (zh) * 2019-08-16 2019-11-22 中国联合网络通信集团有限公司 故障诊断方法、装置及服务器
CN113973121A (zh) * 2020-07-06 2022-01-25 腾讯科技(深圳)有限公司 物联网数据处理方法、装置、电子设备及存储介质
WO2022218401A1 (zh) * 2021-04-16 2022-10-20 华为技术有限公司 车辆故障诊断方法、车载诊断装置
CN113568743A (zh) * 2021-07-23 2021-10-29 腾讯科技(深圳)有限公司 物联网设备的管理方法、装置、介质及电子设备
CN114338367A (zh) * 2021-12-27 2022-04-12 中国联合网络通信集团有限公司 故障定位方法、装置及计算机存储介质
CN115174353A (zh) * 2022-07-14 2022-10-11 中国工商银行股份有限公司 故障根因确定方法、装置、设备及介质
CN115632939A (zh) * 2022-12-23 2023-01-20 浩鲸云计算科技股份有限公司 一种实现算力网络多目标达成的自动选网选路的方法
CN117176249A (zh) * 2023-11-01 2023-12-05 深圳市光网世纪科技有限公司 一种光纤网络用智能监测系统
CN117439864A (zh) * 2023-11-15 2024-01-23 成都长虹网络科技有限责任公司 一种fttr网络设备的故障检测与恢复方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117835099A (zh) * 2024-03-05 2024-04-05 四川天邑康和通信股份有限公司 基于fttr的故障自诊断与自修复方法、装置、设备及介质
CN117835099B (zh) * 2024-03-05 2024-05-24 四川天邑康和通信股份有限公司 基于fttr的故障自诊断与自修复方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN107302466B (zh) 一种动环监控系统大数据分析平台及方法
WO2019169743A1 (zh) 一种服务器故障的检测方法及系统
CN103296755B (zh) 一种变电站网络在线监测系统
WO2020172778A1 (zh) 一种拓扑处理方法和装置以及系统
CN110247800B (zh) 一种智能变电站交换机在线监测系统
CN112114986B (zh) 数据异常识别方法、装置、服务器和存储介质
CN103532795A (zh) 一种检测web业务系统可用性的监控系统及方法
CN112506167B (zh) 一种工业网络设备的异常的处理方法以及系统
CN110929896A (zh) 一种系统设备的安全分析方法及装置
Yu et al. Self‐Organized Cell Outage Detection Architecture and Approach for 5G H‐CRAN
CN117811898B (zh) 一种fttr设备故障修复方法及装置
CN110647086B (zh) 一种基于运行大数据分析的智能运维监控系统
CN117914511A (zh) 一种基于数据交换、日志分析的安全审计系统
CN103166779A (zh) 一种基于移动终端的告警确认和处理方法及装置
CN117811898A (zh) 一种fttr设备故障修复方法及装置
CN115378841B (zh) 设备接入云平台状态的检测方法及装置、存储介质、终端
CN116089212A (zh) 数据库运行监控方法、系统、装置及存储介质
CN116302795A (zh) 一种基于人工智能的终端运维系统及方法
CN110851486A (zh) 数据存储方法及装置
CN109035746A (zh) 一种集抄终端的机能判断方法和系统
Muñoz et al. A method for identifying faulty cells using a classification tree-based UE diagnosis in LTE
CN107566187B (zh) 一种sla违例监测方法、装置和系统
CN107317692B (zh) 故障上报方法及装置
CN104484759A (zh) 一种基于客户/服务器体系结构的台区数据智能管理系统及其管理方法
CN115914039B (zh) 一种网络性能监测装置及其监测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant