CN114095808B - 网络故障检测方法、装置、设备及计算机可读存储介质 - Google Patents

网络故障检测方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN114095808B
CN114095808B CN202010858980.4A CN202010858980A CN114095808B CN 114095808 B CN114095808 B CN 114095808B CN 202010858980 A CN202010858980 A CN 202010858980A CN 114095808 B CN114095808 B CN 114095808B
Authority
CN
China
Prior art keywords
abnormal
network
packet
fault
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010858980.4A
Other languages
English (en)
Other versions
CN114095808A (zh
Inventor
张可力
万星
周敏
高山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202010858980.4A priority Critical patent/CN114095808B/zh
Publication of CN114095808A publication Critical patent/CN114095808A/zh
Application granted granted Critical
Publication of CN114095808B publication Critical patent/CN114095808B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q11/0067Provisions for optical access or distribution networks, e.g. Gigabit Ethernet Passive Optical Network (GE-PON), ATM-based Passive Optical Network (A-PON), PON-Ring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/077Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using a supervisory or additional signal
    • H04B10/0771Fault location on the transmission path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/077Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using a supervisory or additional signal
    • H04B10/0775Performance monitoring and measurement of transmission parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供网络故障检测方法,包括:根据网络中设备运行的状态信息确定网络中的异常设备;基于异常设备之间的运行状态特征的相似性,对异常设备进行分组聚合,得到异常分组集合;其中,异常分组集合中的每个异常分组聚合了至少一个异常设备;聚合的至少两个异常设备之间的相似性大于或等于相似度阈值,且至少两个异常设备所属在网络中同一个一级网络设备的端口下;根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果;分组检测集合为异常分组集合的子集;分组检测集合中每个异常分组的异常设备所属在网络中同一个一级网络设备的端口下。通过实施本申请,能够快速检测或定界出设备出现异常的故障点位置。

Description

网络故障检测方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及计算机通信技术领域,尤其涉及一种网络故障检测方法、一种网络故障检测装置、一种网络故障检测设备以及一种计算机可读存储介质。
背景技术
无源光网络(Passive Optical Network,PON)是当前广泛使用的家庭宽带接入方式。如图1所示的PON光接入的组网结构的示意图,为一个典型的PON光接入网。PON光接入网主要由光线路终端(Optical Line Terminal,OLT)、光网络终端(Optical NetworkTerminal,ONT)和无源光分光器(Passive Optical Splitter,POS)等几类设备构成。其中,ONT也可以替换为光网络单元(Optical Network Unit,ONU)。ONT一般应用于最终的用户,例如对应于用户的光猫,一般放置在用户家中。ONU的功能与形态与ONT类似,但它与最终用户之间可能还有其他网络;ONU可能放置在楼道中,各个用户的光猫通过交换机等设备与其相连。
光接入设备(ONT或ONU)会出现质差(即运行异常)容易导致上网慢、视频卡顿等问题,从而引发用户投诉。为了保障用户上网体验,运营商需要及时对质差设备进行整治,找出引发质差的故障点位置。光接入设备出现质差,其故障点位置既可能出现在ONT/ONU设备本身或尾纤段,也有可能出现在上层分光器或上层光纤段。以图1的组网结构包括两层POS为例,引发ONT/ONU出现质差的故障可大致划分为如下三类:主干光纤故障(对应上图中的主干光纤),二级分光故障(对应上图中的二级分光器主干光纤),设备及尾纤类故障(对应上图中的支路光纤)。
针对PON光接入网或类似组网特点的网络,如何快速检测或定界出引发ONT/ONU出现质差的故障点位置,是技术人员一直研究的技术问题。
发明内容
本申请实施例公开了一种网络故障检测方法、网络故障检测装置、网络故障检测设备以及计算机可读存储介质,能够快速检测或定界出设备出现异常的故障点位置。
第一方面,本申请实施例提供一种网络故障检测方法,该方法可以包括:
网络故障检测设备根据网络中设备运行的状态信息确定所述网络中的异常设备;
基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合;其中,所述异常分组集合中的每个异常分组聚合了至少一个异常设备;聚合的至少两个异常设备之间的所述相似性大于或等于相似度阈值,且所述至少两个异常设备所属在所述网络中同一个一级网络设备的端口下;
根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果;所述分组检测集合为所述异常分组集合的子集;所述分组检测集合中每个异常分组的异常设备所属在所述网络中同一个一级网络设备的端口下;所述故障检测结果用于指示网络故障的网络位置。
本申请实施例根据网络中设备运行的状态信息可以确认出网络中所有出现质差的异常设备,并且基于异常设备之间的运行状态特征的相似性对异常设备进行分组聚合,构建得到异常分组集合,然后根据分组检测集合所对应的设备分布信息进行网络故障检测,实现了从全量出现质差的异常设备出发,进行的整体分析,解决了现有技术中基于单用户、单节点(单异常设备)的逻辑判断检测导致缺乏关联度、无法快速识别群障的问题,增强了群障的识别检测能力,可高效低成本地完成网络故障定界。
另外,根据异常设备的运行状态特征构建的该异常分组集合中异常分组聚合的至少两个异常设备所属在所述网络中同一个一级网络设备的端口下,因此在根据分组检测集合所对应的设备分布信息进行网络故障检测时,既可以根据网络中二级网络设备在异常分组中的网络拓扑信息(即分布情况),也可以根据异常分组中异常设备本身的分布形态来定界故障点位置,从而可有效减少对网络拓扑信息的依赖,解决了现有技术中高度依赖网络拓扑信息来进行故障定界时,一旦网络拓扑信息不全,则无法进行故障诊断或定界,可实施性不强的技术问题。
在一种可能的实现方式中,所述设备运行的状态信息包括设备运行的关键性能指标(Key Performance Indicator,KPI)信息和/或设备运行产生的告警信息。
本申请实施例可以通过获取到设备上报的KPI信息来进行判定,若KPI劣化符合判定依据,可确定对应的设备为异常设备;或者可以通过设备直接上报的告警信息来确定为异常设备。从而能够高效准确地确认出网络中所有出现质差的异常设备。
在一种可能的实现方式中,所述基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合,包括:
将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,得到归类分组集合;所述归类分组集合包括至少一个归类分组;
选取所述归类分组集合中的一个归类分组;
分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,直到所述归类分组中所述相似性最高的两个异常设备的相似性小于所述相似度阈值后或迭代次数达到第一阈值后,所述归类分组中每个异常设备作为一个异常分组,组成异常分组集合;
继续执行所述选取所述归类分组集合中的一个归类分组的步骤,直到选取完毕所述归类分组集合中的归类分组。
本申请实施例先将同一个一级网络设备的端口下的异常设备归类到同一分组,完成第一层分组,得到归类分组,然后再对归类分组中的异常设备相互之间的运行状态特征的相似性进行分析,把运行状态特征相似的异常设备进行分组聚合,完成第二层分组,得到异常分组。从而可快速准确地根据异常设备的运行状态特征构建异常分组集合。
在一种可能的实现方式中,所述网络中的异常设备的标识码包括一级网络设备的端口标识;所述将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,可以包括:按照所述一级网络设备的端口标识对异常设备进行分组,将所述一级网络设备的端口标识相同的异常设备归类到同一分组。
所述网络中的异常设备的标识码的前缀往往包括一级网络设备的端口标识,本申请实施例通过根据异常设备的标识码的前缀(即该一级网络设备的端口标识)判断其所属的一级网络设备的端口,即可很快速高效地完成第一层分组,得到归类分组。
在一种可能的实现方式中,所述分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,包括:
生成所述归类分组中每个异常设备对应的运行状态特征;其中,生成的所述运行状态特征组成特征集合;
设置特征个数N为当前特征集合中包含的运行状态特征的个数;
将相似性最高且大于或等于所述相似度阈值的两个运行状态特征合并成一个运行状态特征,并添加到所述特征集合中,删除所述特征集合中的所述两个运行状态特征;将所述两个运行状态特征分别对应的异常设备分组聚合;
判断当前特征集合中包含的运行状态特征的个数是否小于所述N;
若判断小于所述N,则统计迭代次数是否达到第一阈值;若没有达到所述第一阈值,则迭代执行所述设置特征个数N为当前特征集合中包含的运行状态特征的个数的步骤;若达到所述第一阈值,则迭代完毕;
若判断不小于所述N,则迭代完毕。
本申请实施例在对每个归类分组中的异常设备进行分组聚合的过程中,通过上述技术手段进行迭代处理,可快速高效地完成第二层分组,以输出异常分组集合,进而更加有利于解决了现有技术中基于单用户、单节点(单异常设备)的逻辑判断检测导致缺乏关联度、无法快速识别群障的问题,增强了群障的识别检测能力,可高效低成本地完成网络故障定界。
在一种可能的实现方式中,所述生成所述归类分组中每个异常设备对应的运行状态特征,可以包括:
统计每个异常设备在历史时长内的状态变化信息,例如KPI的变化信息,将所述状态变化信息进行编码,得到特征向量。该每个异常设备的特征向量即为其对应的运行状态特征。
本申请实施例对每个异常设备在历史时长内的状态变化信息进行编码得到特征向量,那么通过向量相似性度量的方式来分析异常设备之间的运行状态特征的相似性,相似性度量函数可以为欧式距离、余弦相似度、皮尔森Pearson相关系数、或杰卡德Jaccard相似系数等等。从而可快速准确地分析异常设备之间的运行状态特征的相似性。
在一种可能的实现方式中,所述设备分布信息包括所述网络的二级网络设备的网络拓扑信息;所述根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果,包括:
根据所述网络的二级网络设备的网络拓扑信息,判断分组检测集合中是否存在第一类异常分组;其中,所述第一类异常分组所聚合的异常设备对应的二级网络设备的数量大于或等于第二阈值;
若判断存在,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
本申请实施例网络故障检测设备在获得或存储有网络的二级网络设备的网络拓扑信息时,例如PON网络中分光器的分布情况,那么可以利用该网络拓扑信息来对分组检测集合中的异常设备进行故障定界,从而解决现有技术中基于单用户、单节点(单异常设备)的逻辑判断检测导致缺乏关联度、无法快速识别群障的问题,增强了群障的识别检测能力,可高效低成本地完成网络故障定界。
在一种可能的实现方式中,若判断不存在,则从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备;
根据选取的所述二级网络设备下的异常设备在分组检测集合中的分布情况,分析是否存在第二类异常分组;其中,所述第二类异常分组所聚合的异常设备在选取的所述二级网络设备之下,所述第二类异常分组所聚合的异常设备的数量大于或等于第三阈值;
若分析存在,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
若分析不存在,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
继续执行所述从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备的步骤,直到选取完毕所述分组检测集合的异常设备所属的二级网络设备。
本申请实施例在判断分组检测集合中不存在第一类异常分组时,即获知故障定界不为主干传输线路故障后,进一步根据二级网络设备下的异常设备在分组检测集合中的分布情况,通过判断每个二级网络设备下异常分组所聚合的异常设备的数量,来进行故障定界,若存在所聚合的异常设备的数量大于或等于第三阈值,则故障定界为二级传输线路故障;若各个异常分组所聚合的异常设备的数量都小于第三阈值,则故障定界为三级传输线路故障或异常设备本身故障。从而可快速准确地完成网络故障定界。
在一种可能的实现方式中,所述根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果,包括:
判断分组检测集合中异常分组的数量是否等于1;
若判断等于,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
本申请实施例网络故障检测设备在没有获得或没有存储有网络的二级网络设备的网络拓扑信息时,可以根据分组检测集合中异常分组的数量来判断,即可以根据异常分组中异常设备本身的分布形态来定界故障点位置,从而可有效减少对网络拓扑信息的依赖,解决了现有技术中高度依赖网络拓扑信息来进行故障定界时,一旦网络拓扑信息不全,则无法进行故障诊断或定界,可实施性不强的技术问题。
在一种可能的实现方式中,若判断不等于,则从所述分组检测集合的异常分组中选取一个异常分组;
分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值;
若分析出大于或等于所述第四阈值,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
若分析出小于所述第四阈值,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
继续执行所述从所述分组检测集合的异常分组中选取一个异常分组的步骤,直到选取完毕所述分组检测集合的异常分组。
本申请实施例判断出分组检测集合中异常分组的数量不等于1时,即获知故障定界不为主干传输线路故障后,进一步通过分组检测集合中各个异常分组所聚合的异常设备的数量,来进行故障定界,若存在所聚合的异常设备的数量大于或等于第四阈值则故障定界为二级传输线路故障;若各个异常分组所聚合的异常设备的数量都小于第四阈值,则故障定界为三级传输线路故障或异常设备本身故障。从而可快速准确地完成网络故障定界。
第二方面,本申请实施例提供网络故障检测装置,其特征在于,包括:
确定单元,用于根据网络中设备运行的状态信息确定所述网络中的异常设备;
分组单元,用于基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合;其中,所述异常分组集合中的每个异常分组聚合了至少一个异常设备;聚合的至少两个异常设备之间的所述相似性大于或等于相似度阈值,且所述至少两个异常设备所属在所述网络中同一个一级网络设备的端口下;
结果生成单元,用于根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果;所述分组检测集合为所述异常分组集合的子集;所述分组检测集合中每个异常分组的异常设备所属在所述网络中同一个一级网络设备的端口下;所述故障检测结果用于指示网络故障的网络位置。
在一种可能的实现方式中,所述分组单元包括:
归类单元,用于将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,得到归类分组集合;所述归类分组集合包括至少一个归类分组;
第一选取单元,用于选取所述归类分组集合中的一个归类分组;
分析聚合单元,用于分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,直到所述归类分组中所述相似性最高的两个异常设备的相似性小于所述相似度阈值后或迭代次数达到第一阈值后,所述归类分组中每个异常设备作为一个异常分组,组成异常分组集合;
针对选取的异常分组组成异常分组集合后,所述第一选取单元继续执行所述选取所述归类分组集合中的一个归类分组的步骤,直到选取完毕所述归类分组集合中的归类分组。
在一种可能的实现方式中,所述分析聚合单元包括:
特征生成单元,用于生成所述归类分组中每个异常设备对应的运行状态特征;其中,生成的所述运行状态特征组成特征集合;
设置单元,用于设置特征个数N为当前特征集合中包含的运行状态特征的个数;
合并单元,用于将相似性最高且大于或等于所述相似度阈值的两个运行状态特征合并成一个运行状态特征,并添加到所述特征集合中,删除所述特征集合中的所述两个运行状态特征;将所述两个运行状态特征分别对应的异常设备分组聚合;
第一判断单元,用于判断当前特征集合中包含的运行状态特征的个数是否小于所述N;
统计迭代单元,用于若判断小于所述N,则统计迭代次数是否达到第一阈值;若没有达到所述第一阈值,则迭代执行所述设置特征个数N为当前特征集合中包含的运行状态特征的个数的步骤;若达到所述第一阈值,则迭代完毕;若判断不小于所述N,则迭代完毕。
在一种可能的实现方式中,所述设备分布信息包括所述网络的二级网络设备的网络拓扑信息;所述结果生成单元包括:
第二判断单元,用于根据所述网络的二级网络设备的网络拓扑信息,判断分组检测集合中是否存在第一类异常分组;其中,所述第一类异常分组所聚合的异常设备对应的二级网络设备的数量大于或等于第二阈值;
第一生成单元,用于若所述第二判断单元判断存在,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
在一种可能的实现方式中,所述结果生成单元还包括:
第二选取单元,用于若所述第二判断单元判断不存在,则从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备;
第一分析单元,用于根据选取的所述二级网络设备下的异常设备在分组检测集合中的分布情况,分析是否存在第二类异常分组;其中,所述第二类异常分组所聚合的异常设备在选取的所述二级网络设备之下,所述第二类异常分组所聚合的异常设备的数量大于或等于第三阈值;
第二生成单元,用于若所述第一分析单元分析存在,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
第三生成单元,用于若所述第一分析单元分析不存在,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
其中,所述第一分析单元分析是否存在第二类异常分组后,所述第二选取单元继续执行所述从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备的步骤,直到选取完毕所述分组检测集合的异常设备所属的二级网络设备。
在一种可能的实现方式中,所述结果生成单元包括:
第三判断单元,用于判断分组检测集合中异常分组的数量是否等于1;
第四生成单元,用于若所述第三判断单元判断等于,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
在一种可能的实现方式中,所述结果生成单元还包括:
第三选取单元,用于若所述第三判断单元判断不等于,则从所述分组检测集合的异常分组中选取一个异常分组;
第二分析单元,用于分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值;
第五生成单元,用于若所述第二分析单元分析出大于或等于所述第四阈值,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
第六生成单元,用于若所述第二分析单元分析出小于所述第四阈值,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
其中,所述第二分析单元分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值后,所述第三选取单元继续执行所述从所述分组检测集合的异常分组中选取一个异常分组的步骤,直到选取完毕所述分组检测集合的异常分组。
第三方面,本申请实施例提供一种网络故障检测设备,包括处理器和存储器;所述存储器,用于存储程序;所述处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行本申请实施例第一方面或第一方面的任意一种实现方式。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储了程序,其中,所述程序包括用于执行第一方面或第一方面的任意一种方法的部分或全部步骤的指令。
第五方面,本申请实施例提供一种芯片,包括至少一个处理器和接口电路,所述处理器用于通过所述接口电路输入第一访问请求报文后,执行存储器中存储的计算机程序以执行第一方面或第一方面的任意一种方法的部分或全部步骤。
第六方面,本申请实施例提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面或第一方面的任意一种方法的部分或全部步骤。
应当理解的是,本申请的第二至第六方面与本申请的第一方面的技术方案一致,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
附图说明
下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1是本申请实施例提供的PON光接入的组网结构的示意图;
图2是本申请实施例提供的网络故障检测方法的应用场景示意图;
图3是本申请实施例提供的网络故障检测方法的流程示意图;
图4是本申请实施例提供的设备接收光功率的采集示意图;
图5是本申请提供的网络故障检测方法的另一实施例的流程示意图;
图6是本申请实施例提供的运行状态特征的生成原理示意图;
图7是本申请提供的网络故障检测方法的另一实施例的流程示意图;
图8是本申请提供的网络故障检测方法的另一实施例的流程示意图;
图9是本申请实施例提供的网络故障检测装置的结构示意图;
图10是本申请实施例提供的网络故障检测设备的结构示意图;
图11是本申请实施例提供的芯片的结构示意图。
具体实施方式
下面结合本申请实施例中的附图对本申请实施例进行描述。
图2为本申请实施例提供的网络故障检测方法的应用场景示意图。数据收集云平台(或数据收集平台)收集到待检测网络的上报数据,然后将该上报数据发送给数据监控云平台(或数据监控平台)。数据监控云平台将接收到的上报数据进行处理,例如将该上报数据组织成结构化的数据,然后基于处理后的上报数据确定该待检测网络中某一时刻或某时段的异常设备,然后检测或定界出这些异常设备的故障点位置。最后该数据监控平台创建包含了异常设备和故障定界信息的问题单,即生成故障检测结果或故障定界结果,并将该问题单派发给运维工程师,运维工程师即可基于该问题单中的信息去检查对应的设备或线路,由于问题单直接包含了故障位置信息,所以可以很大程度上减少重复上站,提升故障处理效率,改善了用户体验。
在一种可能的实现方式中,图2中的数据收集云平台执行的操作也可以划分到数据监控云平台中进行,即数据监控云平台可包含该数据收集云平台,具有数据收集的功能。
实施本申请提供的网络故障检测方法的网络故障检测设备或网络故障检测装置可以为上述图2中的数据监控云平台,或数据监控平台中的一个或多个功能模块或单元组成的设备。该网络故障检测设备可以部署在一台服务器或一个统一的服务器集群中。本申请实施例中的服务器一般是指安装了主流操作系统(类unix,windows等)的通用计算机系统。
在一种可能的实现方式中,图2中的待检测网络可以为PON网络(或PON光接入网),或其它与PON网络类似组网特点的网络。
下面以PON网络为例来说明本申请实施例提供的网络故障检测方法。如图3示出的本申请实施例提供的网络故障检测方法的流程示意图,可以包括以下步骤:
步骤S300:网络故障检测设备根据网络中设备运行的状态信息确定所述网络中的异常设备;
具体地,本申请实施例中所述设备运行的状态信息可以包括设备运行的KPI信息和/或设备运行产生的告警信息。
以ONT设备为例,该设备运行的KPI信息可以包括但不限于ONT设备的接收功率、发送功率、温度、电压、电流等等。PON网络中的ONT设备可以定时(例如每15分钟上报一次)上报自身的KPI信息给统一的收集平台,以便运维工程师分析所使用。
该设备运行产生的告警信息可以为设备在运行过程中发现异常或产生告警时,自行触发上报的告警信息。
本申请实施例,网络故障检测设备在根据网络中设备运行的状态信息确定所述网络中的异常设备时,异常设备确定规则或判定规则可以根据需求来预先制定。例如,在根据设备运行的KPI信息确定所述网络中的异常设备时,具体可根据设备接收光功率弱光作为异常设备确定规则。以ONT设备为例,若一个ONT设备的接收功率预设时长内(例如一天)大部分超弱光阈值,则可确定其为异常设备。如图4示出的本申请实施例提供的设备接收光功率的采集示意图,当天有效采集的90次接收光功率中,出现了89次接收光功率的功率超弱光阈值,1次接收光功率陡降(超2dB),那么符合接收功率预设时长内(例如一天)大部分超弱光阈值的条件,可确定该设备为异常设备。
又如,可根据设备运行产生的告警信息,直接确定出该设备为异常设备。或者,可同时根据设备运行的KPI信息和设备运行产生的告警信息来确定该设备是否为异常设备,例如先判断是否接收到设备运行产生的告警信息,若接收到可直接确定出该设备为异常设备,若没有接收到再根据设备运行的KPI信息来确定该设备是否为异常设备。
步骤S300之后,网络故障检测基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合,具体可以通过步骤S302至步骤S308来实现。
步骤S302:将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,得到归类分组集合;
在一种可能的实现方式中,所述网络中的异常设备的标识码可以包括一级网络设备的端口标识。那么步骤S302将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,可以包括:按照所述一级网络设备的端口标识对异常设备进行分组,将所述一级网络设备的端口标识相同的异常设备归类到同一分组。
具体地,本申请实施例中的一级网络设备具体为一点到多点的网络的局端设备,例如PON网络中的OLT,是网络的核心功能设备,其可经过分光器将传输线路分配到多条线路中。网络中的异常设备的标识码的前缀往往可以包括一级网络设备(OLT)的端口标识,再加上自身的设备编号。例如,异常设备为ONT设备,那么其标识码(ONTID)可以为OLT端口ID+ONT编号,如7342808|0|7|8|004,其中7342808|0|7|8|为OLT端口ID,004为ONT编号。通过异常设备的标识码中一级网络设备的端口标识,即可将一级网络设备的端口标识相同的异常设备归类到同一分组,从而得到归类分组集合。
步骤S304:选取所述归类分组集合中的一个归类分组;
具体地,可以随机选取或按照预设选取规则来选取归类分组集合中的其中一个归类分组。每次选取一个后执行步骤S306至步骤S308;直到选取完毕所有的归类分组。
步骤S306:分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;
具体地,在分析完归类分组中异常设备相互之间的运行状态特征的相似性后,将相似性最高,且最高的相似性大于或等于相似度阈值的两个异常设备分成一组,聚合在一起。其中,分组聚合内的异常设备作为该归类分组中的一个异常设备。也就是说,无论最终分组聚合到一起的异常设备有多少个,该分组聚合内的异常设备都只作为该归类分组中的一个异常设备。例如可以从该分组聚合内的多个异常设备中选择随机其中一个,或按某规则选取一个,或按一定合并规则将分组聚合内的多个异常设备合并成一个,作为该归类分组中的一个异常设备。
步骤S308:迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,直到所述归类分组中所述相似性最高的两个异常设备的相似性小于所述相似度阈值后或迭代次数达到第一阈值后,所述归类分组中每个异常设备作为一个异常分组,组成异常分组集合;
具体地,因为每完成一次将相似性最高,且最高的相似性大于或等于相似度阈值的两个异常设备分组聚合,分组聚合内的异常设备作为该归类分组中的一个异常设备,因此,相当于最新的归类分组中包含的异常设备的数量将减少一个。本申请在每完成一次将相似性最高,且最高的相似性大于或等于相似度阈值的两个异常设备分组聚合后,再按照最新的归类分组中包含的异常设备,来迭代执行分析所述归类分组中异常设备相互之间的运行状态特征的相似性的步骤。
直到归类分组中相似性最高的两个异常设备的相似性小于该相似度阈值,也就是说,直到没有异常设备进行分组聚合了,迭代结束,得到异常分组集合。或者直到迭代次数达到第一阈值,迭代结束,得到异常分组集合。该归类分组中每个异常设备作为异常分组集合中的一个异常分组。
其中,步骤S308之后,继续执行步骤S304,即继续选取所述归类分组集合中的一个归类分组的步骤,直到选取完毕所述归类分组集合中的归类分组,然后执行步骤S310。
步骤S310:根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果。
具体地,该分组检测集合为该异常分组集合的子集;该分组检测集合中每个异常分组的异常设备所属在所述网络中同一个一级网络设备的端口下。该分组检测集合所对应的设备分布信息可以包括网络中二级网络设备在异常分组中的网络拓扑信息、或异常分组中异常设备本身的分布形态,等等。该二级网络设备可以具体为一点到多点的网络中从局端设备到用户侧终端之间的将传输线路进行分路的设备,例如PON网络中的POS可将传输线路分配到多条线路中。一点到多点的网络中可包括多层级的分路的设备。
也就是说,步骤S310的每次执行是针对异常分组集合中所属同一个一级网络设备的端口下的异常设备,在根据分组检测集合所对应的设备分布信息进行网络故障检测时,具体可以根据网络中二级网络设备在异常分组中的网络拓扑信息(即分布情况),也可以根据异常分组中异常设备本身的分布形态来定界故障点位置,生成的故障检测结果用于指示网络故障的网络位置。从而可有效减少对网络拓扑信息的依赖,解决了现有技术中高度依赖网络拓扑信息来进行故障定界时,一旦网络拓扑信息不全,则无法进行故障诊断或定界,可实施性不强的技术问题。
在一种可能的实现方式中,步骤S306至步骤S308具体可以通过图5示出的本申请提供的网络故障检测方法的另一实施例的流程示意图来实现,可以包括如下步骤:
步骤S500:生成所述归类分组中每个异常设备对应的运行状态特征;
具体地,可以通过统计每个异常设备在历史时长内的状态变化信息,例如KPI的变化信息,将所述状态变化信息进行编码,得到特征向量。该每个异常设备的特征向量即为其对应的运行状态特征。其中,生成的所述运行状态特征可组成特征集合。相当于将该上报的告警和KPI信息组织成结构化数据,后续可基于这些结构化的告警和KPI信息检测出网络中某一时刻或时间段的质差ONT设备,最终定界出这些质差ONT的故障点位置。
然后,可以通过向量相似性度量的方式来分析异常设备之间的运行状态特征的相似性,相似性度量函数可以为欧式距离、余弦相似度、皮尔森Pearson相关系数、或杰卡德Jaccard相似系数等等。从而可快速准确地分析异常设备之间的运行状态特征的相似性。
例如,可以将每个异常设备在7天内某个KPI(如接收功率)的变化编码成一个类似[-1,1,1,0,…]的向量,即得到特征向量,如图6所示。其中,0可以代表当前时刻KPI值与上一时刻KPI值相同,1可以代表当前时刻KPI值大于上一时刻KPI值,-1可以代表当前时刻KPI值小于上一时刻KPI值。
以余弦相似性为例,通过如下公式,即可计算异常设备之间的运行状态特征的相似性:
Figure BDA0002647481850000101
其中,X=[x1,x2,...,xn],Y=[y1,y2,...,yn]。X,Y即为两个不同的特征向量。
步骤S502:设置特征个数N为当前特征集合中包含的运行状态特征的个数;
具体地,例如步骤S500后,由生成的100个运行状态特征组成特征集合,那么当前特征集合中包含的运行状态特征的个数即为100,设置的特征个数N即为100。若后续经过步骤S504后,当前特征集合中包含的运行状态特征的个数有变化,那么再执行步骤S502时,即重新再设置所述N为将当前特征集合中包含的运行状态特征的个数。
步骤S504:将相似性最高且大于或等于所述相似度阈值的两个运行状态特征合并成一个运行状态特征,并添加到所述特征集合中,删除所述特征集合中的所述两个运行状态特征;将所述两个运行状态特征分别对应的异常设备分组聚合;
具体地,若相似度最高的两个运行状态特征,其相似度大于或等于相似度阈值,那么在合并了这两个运行状态特征,作为一个新的运行状态特征添加到特征集合中,同时删除该特征集合中上述合并的两个运行状态特征。也就是说,特征集合中的运行状态特征的个数减少了1个。若相似度最高的两个运行状态特征,其相似度没有大于或等于相似度阈值,则表明特征集合中没有可以合并的运行状态特征,那么即直接执行步骤S506。
其中,合并两个运行状态特征,可以具体从这两个运行状态特征中选择随机其中一个,或按某规则选取一个,作为合并后的运行状态特征;也可以按一定合并规则将这两个运行状态特征合并成一个,作为合并后的运行状态特征。
步骤S506:判断当前特征集合中包含的运行状态特征的个数是否小于所述N;
具体地,若判断小于所述N,也就是说步骤S504中存在相似度最高的两个运行状态特征,其相似度大于或等于相似度阈值,则执行步骤S508;若判断不小于所述N,也就是说步骤S504中存在相似度最高的两个运行状态特征,其相似度不大于或不等于相似度阈值,则执行步骤S510。
步骤S508:统计迭代次数是否达到第一阈值;
具体地,若没有达到所述第一阈值,则迭代执行步骤S502设置特征个数N为当前特征集合中包含的运行状态特征的个数;若达到所述第一阈值,则迭代完毕,执行步骤S510。
该第一阈值可以设置为M-1或M-2,该M为步骤S500后,执行第一次步骤S502时当前特征集合中包含的运行状态特征的个数。该第一阈值也可以根据需求进行设置,本申请实施例不做限制。
可理解的是,本申请实施例通过步骤S506和S508结合了判断归类分组中相似性最高的两个异常设备的相似性是否小于该相似度阈值,以及判断迭代次数是否达到第一阈值,来进行迭代。
步骤S510:输出异常分组集合。
具体地,每针对一个归类分组,进行上述迭代,可得到至少一个异常分组。针对所有归类分组得到的所有异常分组,即组成了输出的异常分组集合。
其中,本申请实施例中的分组检测集合为该异常分组集合的子集。具体地,分组检测集合中每个异常分组的异常设备所属在所述网络中同一个一级网络设备的端口下。也就是说,异常分组集合中,所属在所述网络中同一个一级网络设备的端口下的异常设备,组成一个分组检测集合。后续即针对每个分组检测集合来进行网络故障检测。
下面结合图7和图8两个实施例,来举例说明如何实施步骤S310根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果:
实施例一:在分组检测集合所对应的设备分布信息包括了所述网络的二级网络设备的网络拓扑信息的情况下。也就是说,本申请实施例能够获知到网路的二级网络设备的网络拓扑信息,比如PON网路中分光器的网络拓扑信息。那么,如图7示出的本申请提供的网络故障检测方法的另一实施例的流程示意图,可以包括如下步骤:
步骤S700:根据所述网络的二级网络设备的网络拓扑信息,判断分组检测集合中是否存在第一类异常分组;
具体地,该第一类异常分组所聚合的异常设备对应的二级网络设备的数量大于或等于第二阈值。该第二阈值可以为2或3。
分组检测集合中的所有异常分组中,可能有些是经过了分组聚合的异常分组,即该异常分组实际对应两个或以上的异常设备;或可能有些是没有经过分组聚合的异常分组,即该异常分组实际对应一个异常设备。其中,对应一个异常设备的异常分组,因为一个异常设备最多只可能对应一个二级网络设备,因此其对应的二级网络设备的数量肯定不大于或不等于第二阈值。对应两个或以上的异常设备的异常分组,其对应的二级网络设备的数量才有可能大于或等于第二阈值。
若分组检测集合中存在第一类异常分组,则表明在不同的二级网络设备(例如二级分光器)下,出现了相同或类似故障,则执行步骤S702。若分组检测集合中不存在第一类异常分组,则表明没有在不同的二级网络设备中出现相同或类似故障,则执行步骤S704。
步骤S702:生成第一类故障检测结果;
具体地,该第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。由于在不同的二级网络设备(例如二级分光器)下,出现了相同或类似故障,因此可将异常设备的故障定界为主干传输线路故障,即相当于OLT设备的故障或该OLT设备到一级分光器之间的线路故障(即主干光纤故障)。
步骤S704:从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备;
具体地,假设网络中该分组检测集合的异常设备所属的二级网络设备有20个,那么从该20个中选取其中一个,然后执行步骤S706。后续重复执行该步骤S704,直到选取完毕这20个二级网络设备。
步骤S706:根据选取的所述二级网络设备下的异常设备在分组检测集合中的分布情况,分析是否存在第二类异常分组;
具体地,根据分布情况,分析该分组检测集合中处于当前二级网络设备之下的异常分组是否存在第二类异常分组。该第二类异常分组是指异常分组中分组聚合的异常设备大于或等于第三阈值的分组。该第三阈值可以为2或3。
若分析存在,则表明同一个二级网络设备下有两个或两个以上的异常设备出现了相同或类似故障,则执行步骤S708。若分析不存在,则表明同一个二级网络设备下没有两个或两个以上的异常设备出现了相同或类似故障,则执行步骤S710。
步骤S708:生成第二类故障检测结果;
具体地,该第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障。也就是说,由于同一个二级网络设备下有两个或两个以上的异常设备出现了相同或类似故障,因此可将异常设备的故障定界为二级传输线路故障,即相当于分光器或分光器之间的线路故障(即二级分光器主干光纤故障)。
步骤S710:生成第三类故障检测结果;
具体地,该第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障。也就是说,由于同一个二级网络设备下没有两个或两个以上的异常设备出现了相同或类似故障,因此可将异常设备的故障定界为三级传输线路故障或异常设备本身故障,即相当于分光器到ONU或ONT之间的线路故障,或ONU或ONT的故障(即支路光纤故障)。
步骤S708或步骤S710后可以继续执行步骤S704从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备的步骤,直到选取完毕所述分组检测集合的异常设备所属的二级网络设备。
实施例二:在分组检测集合所对应的设备分布信息没有包括所述网络的二级网络设备的网络拓扑信息的情况下。也就是说,本申请实施例没有获知到网路的二级网络设备的网络拓扑信息,比如PON网路中分光器的网络拓扑信息。那么,如图8示出的本申请提供的网络故障检测方法的另一实施例的流程示意图,可以包括如下步骤:
步骤S800:判断分组检测集合中异常分组的数量是否等于1;
具体地,若判断分组检测集合中异常分组的数量等于1,很可能表明异常设备经过了上述步骤S306的分组聚合后,最终合并成了一个异常设备。也就是说,很可能该分组检测集合中这一个异常分组实际对应两个或以上的异常设备,这两个或以上的异常设备出现了相同或类似故障,则执行步骤S802。若判断分组检测集合中异常分组的数量不等于1,即大于1,则执行步骤S804。
步骤S802:生成第一类故障检测结果;
具体地,该第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。由于两个或以上的异常设备出现了相同或类似故障,则大概率表明异常设备的故障为主干传输线路故障,即相当于OLT设备的故障或该OLT设备到一级分光器之间的线路故障(即主干光纤故障)。
步骤S804:从所述分组检测集合的异常分组中选取一个异常分组;
具体地,假设网络中该分组检测集合中的异常设备有10个,那么从该10个中选取其中一个,然后执行步骤S806。后续重复执行该步骤S804,直到选取完毕这10个二级网络设备。
步骤S806:分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值;
具体地,该第四阈值可以为2,那么步骤S806相当于判断选取的该异常分组是否有异常设备进行了分组聚合。若有异常设备进行了分组聚合,那么即异常分组所聚合的异常设备的数量必然大于或等于第四阈值,执行步骤S808,否则执行步骤S810。
再如,该第四阈值可以为3,那么步骤S806相当于判断选取的该异常分组是否至少分组聚合了3个异常设备。若至少分组聚合了3个异常设备,那么即异常分组所聚合的异常设备的数量必然大于或等于第四阈值,执行步骤S808,否则执行步骤S810。
步骤S808:生成第二类故障检测结果;
具体地,所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障。也就是说,由于有两个或两个以上的异常设备出现了相同或类似故障,因此大概率表明异常设备的故障为二级传输线路故障,即相当于分光器或分光器之间的线路故障(即二级分光器主干光纤故障)。
步骤S810:生成第三类故障检测结果;
具体地,所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障。也就是说,由于没有两个或两个以上的异常设备出现了相同或类似故障,因此大概率表明异常设备的故障为三级传输线路故障或异常设备本身故障,即相当于分光器到ONU或ONT之间的线路故障,或ONU或ONT的故障(即支路光纤故障)。
步骤S808或步骤S810后可以继续执行步骤S804从所述分组检测集合的异常分组中选取一个异常分组的步骤,直到选取完毕所述分组检测集合的异常分组。
本申请实施例根据网络中设备运行的状态信息可以确认出网络中所有出现质差的异常设备,并且基于异常设备之间的运行状态特征的相似性对异常设备进行分组聚合,构建得到异常分组集合,然后根据分组检测集合所对应的设备分布信息进行网络故障检测,实现了从全量出现质差的异常设备出发,进行的整体分析,解决了现有技术中基于单用户、单节点(单异常设备)的逻辑判断检测导致缺乏关联度、无法快速识别群障的问题,增强了群障的识别检测能力,可高效低成本地完成网络故障定界。
另外,根据异常设备的运行状态特征构建的该异常分组集合中异常分组聚合的至少两个异常设备所属在所述网络中同一个一级网络设备的端口下,因此在根据分组检测集合所对应的设备分布信息进行网络故障检测时,既可以根据网络中二级网络设备在异常分组中的网络拓扑信息(即分布情况),也可以根据异常分组中异常设备本身的分布形态来定界故障点位置,从而可有效减少对网络拓扑信息的依赖,解决了现有技术中高度依赖网络拓扑信息来进行故障定界时,一旦网络拓扑信息不全,则无法进行故障诊断或定界,可实施性不强的技术问题。
下面对应的,可以参见图9,图9示出了本申请实施例提供的网络故障检测装置的结构示意图,网络故障检测装置90可以包括确定单元900、分组单元902和结果生成单元904,其中,
确定单元900用于根据网络中设备运行的状态信息确定所述网络中的异常设备;
分组单元902用于基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合;其中,所述异常分组集合中的每个异常分组聚合了至少一个异常设备;聚合的至少两个异常设备之间的所述相似性大于或等于相似度阈值,且所述至少两个异常设备所属在所述网络中同一个一级网络设备的端口下;
结果生成单元904用于根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果;所述分组检测集合为所述异常分组集合的子集;所述分组检测集合中每个异常分组的异常设备所属在所述网络中同一个一级网络设备的端口下;所述故障检测结果用于指示网络故障的网络位置。
在一种可能的实现方式中,分组单元902可以包括:
归类单元,用于将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,得到归类分组集合;所述归类分组集合包括至少一个归类分组;
第一选取单元,用于选取所述归类分组集合中的一个归类分组;
分析聚合单元,用于分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,直到所述归类分组中所述相似性最高的两个异常设备的相似性小于所述相似度阈值后或迭代次数达到第一阈值后,所述归类分组中每个异常设备作为一个异常分组,组成异常分组集合;
针对选取的异常分组组成异常分组集合后,所述第一选取单元继续执行所述选取所述归类分组集合中的一个归类分组的步骤,直到选取完毕所述归类分组集合中的归类分组。
在一种可能的实现方式中,上述分析聚合单元可以包括:
特征生成单元,用于生成所述归类分组中每个异常设备对应的运行状态特征;其中,生成的所述运行状态特征组成特征集合;
设置单元,用于设置特征个数N为当前特征集合中包含的运行状态特征的个数;
合并单元,用于将相似性最高且大于或等于所述相似度阈值的两个运行状态特征合并成一个运行状态特征,并添加到所述特征集合中,删除所述特征集合中的所述两个运行状态特征;将所述两个运行状态特征分别对应的异常设备分组聚合;
第一判断单元,用于判断当前特征集合中包含的运行状态特征的个数是否小于所述N;
统计迭代单元,用于若判断小于所述N,则统计迭代次数是否达到第一阈值;若没有达到所述第一阈值,则迭代执行所述设置特征个数N为当前特征集合中包含的运行状态特征的个数的步骤;若达到所述第一阈值,则迭代完毕;若判断不小于所述N,则迭代完毕。
在一种可能的实现方式中,所述设备分布信息包括所述网络的二级网络设备的网络拓扑信息;结果生成单元904包括:
第二判断单元,用于根据所述网络的二级网络设备的网络拓扑信息,判断分组检测集合中是否存在第一类异常分组;其中,所述第一类异常分组所聚合的异常设备对应的二级网络设备的数量大于或等于第二阈值;
第一生成单元,用于若所述第二判断单元判断存在,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
在一种可能的实现方式中,结果生成单元904还可以包括:
第二选取单元,用于若所述第二判断单元判断不存在,则从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备;
第一分析单元,用于根据选取的所述二级网络设备下的异常设备在分组检测集合中的分布情况,分析是否存在第二类异常分组;其中,所述第二类异常分组所聚合的异常设备在选取的所述二级网络设备之下,所述第二类异常分组所聚合的异常设备的数量大于或等于第三阈值;
第二生成单元,用于若所述第一分析单元分析存在,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
第三生成单元,用于若所述第一分析单元分析不存在,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
其中,所述第一分析单元分析是否存在第二类异常分组后,所述第二选取单元继续执行所述从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备的步骤,直到选取完毕所述分组检测集合的异常设备所属的二级网络设备。
在一种可能的实现方式中,结果生成单元904包括:
第三判断单元,用于判断分组检测集合中异常分组的数量是否等于1;
第四生成单元,用于若所述第三判断单元判断等于,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
在一种可能的实现方式中,结果生成单元还可以包括:
第三选取单元,用于若所述第三判断单元判断不等于,则从所述分组检测集合的异常分组中选取一个异常分组;
第二分析单元,用于分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值;
第五生成单元,用于若所述第二分析单元分析出大于或等于所述第四阈值,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
第六生成单元,用于若所述第二分析单元分析出小于所述第四阈值,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
其中,所述第二分析单元分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值后,所述第三选取单元继续执行所述从所述分组检测集合的异常分组中选取一个异常分组的步骤,直到选取完毕所述分组检测集合的异常分组。
可以理解的是,网络故障检测装置90中各个单元的描述还可以对应参考网络故障检测方法的实施例,这里不再一一详述。
如图10所示,图10是本申请实施例提供的网络故障检测设备的结构示意图,该网络故障检测设备10能够执行本发明实施例提供的网络故障检测方法。网络故障检测设备10可以包括至少一个处理器100和存储器102,处理器100和存储器102相互连接,其中,
处理器100可以是通用中央处理器(CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制以上方案程序执行的集成电路。
处理器100可以包括基带处理器(baseband processor,BBP)(未示出),该基带处理器处理经数字化的收到信号以提取该信号中传达的信息或数据比特。如此,BBP通常按需或按期望实现在调制解调中的一个或多个数字信号处理器(digitalsignal processor,DSP)中或实现为分开的集成电路(integrated circuit,IC)。
存储器102可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
100还可以包括通信接口、输入模块(如鼠标、键盘灯)、输出模块(显示器)等通用部件,这里不再赘述。其中网络故障检测设备10还可以包括总线。其中,网络接口、输入模块、输出模块、存储器102等可以通过总线与处理器100连接。
上述存储器102可以用于存储执行以上方案的网络故障检测方法的程序代码,并由处理器100来控制执行。存储器102存储的代码可用于执行以上图1-图8提供的网络故障检测方法中的步骤。具体包括以下步骤:
处理器100根据网络中设备运行的状态信息确定所述网络中的异常设备;
处理器100基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合;其中,所述异常分组集合中的每个异常分组聚合了至少一个异常设备;聚合的至少两个异常设备之间的所述相似性大于或等于相似度阈值,且所述至少两个异常设备所属在所述网络中同一个一级网络设备的端口下;
处理器100根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果;所述分组检测集合为所述异常分组集合的子集;所述分组检测集合中每个异常分组的异常设备所属在所述网络中同一个一级网络设备的端口下;所述故障检测结果用于指示网络故障的网络位置。
在一种可能的实现方式中,所述设备运行的状态信息包括设备运行的关键性能指标(Key Performance Indicator,KPI)信息和/或设备运行产生的告警信息。
在一种可能的实现方式中,所述处理器100基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合,包括:
将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,得到归类分组集合;所述归类分组集合包括至少一个归类分组;
选取所述归类分组集合中的一个归类分组;
分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,直到所述归类分组中所述相似性最高的两个异常设备的相似性小于所述相似度阈值后或迭代次数达到第一阈值后,所述归类分组中每个异常设备作为一个异常分组,组成异常分组集合;
继续执行所述选取所述归类分组集合中的一个归类分组的步骤,直到选取完毕所述归类分组集合中的归类分组。
在一种可能的实现方式中,所述网络中的异常设备的标识码包括一级网络设备的端口标识;所述将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,可以包括:按照所述一级网络设备的端口标识对异常设备进行分组,将所述一级网络设备的端口标识相同的异常设备归类到同一分组。
在一种可能的实现方式中,所述分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,包括:
生成所述归类分组中每个异常设备对应的运行状态特征;其中,生成的所述运行状态特征组成特征集合;
设置特征个数N为当前特征集合中包含的运行状态特征的个数;
将相似性最高且大于或等于所述相似度阈值的两个运行状态特征合并成一个运行状态特征,并添加到所述特征集合中,删除所述特征集合中的所述两个运行状态特征;将所述两个运行状态特征分别对应的异常设备分组聚合;
判断当前特征集合中包含的运行状态特征的个数是否小于所述N;
若判断小于所述N,则统计迭代次数是否达到第一阈值;若没有达到所述第一阈值,则迭代执行所述设置特征个数N为当前特征集合中包含的运行状态特征的个数的步骤;若达到所述第一阈值,则迭代完毕;
若判断不小于所述N,则迭代完毕。
在一种可能的实现方式中,所述生成所述归类分组中每个异常设备对应的运行状态特征,可以包括:
统计每个异常设备在历史时长内的状态变化信息,例如KPI的变化信息,将所述状态变化信息进行编码,得到特征向量。该每个异常设备的特征向量即为其对应的运行状态特征。
在一种可能的实现方式中,所述设备分布信息包括所述网络的二级网络设备的网络拓扑信息;所述根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果,包括:
根据所述网络的二级网络设备的网络拓扑信息,判断分组检测集合中是否存在第一类异常分组;其中,所述第一类异常分组所聚合的异常设备对应的二级网络设备的数量大于或等于第二阈值;
若判断存在,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
在一种可能的实现方式中,若判断不存在,则从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备;
根据选取的所述二级网络设备下的异常设备在分组检测集合中的分布情况,分析是否存在第二类异常分组;其中,所述第二类异常分组所聚合的异常设备在选取的所述二级网络设备之下,所述第二类异常分组所聚合的异常设备的数量大于或等于第三阈值;
若分析存在,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
若分析不存在,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
继续执行所述从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备的步骤,直到选取完毕所述分组检测集合的异常设备所属的二级网络设备。
在一种可能的实现方式中,所述根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果,包括:
判断分组检测集合中异常分组的数量是否等于1;
若判断等于,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
在一种可能的实现方式中,若判断不等于,则从所述分组检测集合的异常分组中选取一个异常分组;
分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值;
若分析出大于或等于所述第四阈值,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
若分析出小于所述第四阈值,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
继续执行所述从所述分组检测集合的异常分组中选取一个异常分组的步骤,直到选取完毕所述分组检测集合的异常分组。
参见图11,本申请实施例还提供的一种芯片110,包括一个或多个处理器1101以及接口电路1102。可选的,上述芯片1100还可以包含总线1103。其中:
处理器1101可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1101可以是通用处理器、数字通信器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
接口电路1102可以完成数据、指令或者信息的发送或者接收,处理器1101可以利用接口电路1102接收的数据、指令或者其它信息,进行加工,可以将加工完成信息通过接口电路1102发送出去。
可选的,芯片还包括存储器,存储器可以包括只读存储器和随机存取存储器,并向处理器提供操作指令和数据。存储器的一部分还可以包括非易失性随机存取存储器(NVRAM)。
可选的,存储器存储了可执行软件模块或者数据结构,处理器1101可以通过调用存储器存储的操作指令(该操作指令可存储在操作系统中),执行以上图1-图8提供的网络故障检测方法中的步骤。具体包括以下步骤:
处理器1101根据网络中设备运行的状态信息确定所述网络中的异常设备;
处理器1101基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合;其中,所述异常分组集合中的每个异常分组聚合了至少一个异常设备;聚合的至少两个异常设备之间的所述相似性大于或等于相似度阈值,且所述至少两个异常设备所属在所述网络中同一个一级网络设备的端口下;
处理器1101根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果;所述分组检测集合为所述异常分组集合的子集;所述分组检测集合中每个异常分组的异常设备所属在所述网络中同一个一级网络设备的端口下;所述故障检测结果用于指示网络故障的网络位置。
在一种可能的实现方式中,所述设备运行的状态信息包括设备运行的关键性能指标(Key Performance Indicator,KPI)信息和/或设备运行产生的告警信息。
在一种可能的实现方式中,所述处理器1101基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合,包括:
将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,得到归类分组集合;所述归类分组集合包括至少一个归类分组;
选取所述归类分组集合中的一个归类分组;
分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,直到所述归类分组中所述相似性最高的两个异常设备的相似性小于所述相似度阈值后或迭代次数达到第一阈值后,所述归类分组中每个异常设备作为一个异常分组,组成异常分组集合;
继续执行所述选取所述归类分组集合中的一个归类分组的步骤,直到选取完毕所述归类分组集合中的归类分组。
在一种可能的实现方式中,所述网络中的异常设备的标识码包括一级网络设备的端口标识;所述将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,可以包括:按照所述一级网络设备的端口标识对异常设备进行分组,将所述一级网络设备的端口标识相同的异常设备归类到同一分组。
在一种可能的实现方式中,所述分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,包括:
生成所述归类分组中每个异常设备对应的运行状态特征;其中,生成的所述运行状态特征组成特征集合;
设置特征个数N为当前特征集合中包含的运行状态特征的个数;
将相似性最高且大于或等于所述相似度阈值的两个运行状态特征合并成一个运行状态特征,并添加到所述特征集合中,删除所述特征集合中的所述两个运行状态特征;将所述两个运行状态特征分别对应的异常设备分组聚合;
判断当前特征集合中包含的运行状态特征的个数是否小于所述N;
若判断小于所述N,则统计迭代次数是否达到第一阈值;若没有达到所述第一阈值,则迭代执行所述设置特征个数N为当前特征集合中包含的运行状态特征的个数的步骤;若达到所述第一阈值,则迭代完毕;
若判断不小于所述N,则迭代完毕。
在一种可能的实现方式中,所述生成所述归类分组中每个异常设备对应的运行状态特征,可以包括:
统计每个异常设备在历史时长内的状态变化信息,例如KPI的变化信息,将所述状态变化信息进行编码,得到特征向量。该每个异常设备的特征向量即为其对应的运行状态特征。
在一种可能的实现方式中,所述设备分布信息包括所述网络的二级网络设备的网络拓扑信息;所述根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果,包括:
根据所述网络的二级网络设备的网络拓扑信息,判断分组检测集合中是否存在第一类异常分组;其中,所述第一类异常分组所聚合的异常设备对应的二级网络设备的数量大于或等于第二阈值;
若判断存在,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
在一种可能的实现方式中,若判断不存在,则从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备;
根据选取的所述二级网络设备下的异常设备在分组检测集合中的分布情况,分析是否存在第二类异常分组;其中,所述第二类异常分组所聚合的异常设备在选取的所述二级网络设备之下,所述第二类异常分组所聚合的异常设备的数量大于或等于第三阈值;
若分析存在,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
若分析不存在,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
继续执行所述从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备的步骤,直到选取完毕所述分组检测集合的异常设备所属的二级网络设备。
在一种可能的实现方式中,所述根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果,包括:
判断分组检测集合中异常分组的数量是否等于1;
若判断等于,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
在一种可能的实现方式中,若判断不等于,则从所述分组检测集合的异常分组中选取一个异常分组;
分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值;
若分析出大于或等于所述第四阈值,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
若分析出小于所述第四阈值,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
继续执行所述从所述分组检测集合的异常分组中选取一个异常分组的步骤,直到选取完毕所述分组检测集合的异常分组。
可选的,芯片可以使用在本申请实施例涉及的电子设备或网络设备或多节点分布式系统中。可选的,接口电路1102可用于输出处理器1101的执行结果。关于本申请的一个或多个实施例提供的网络故障检测方法可参考前述各个实施例,这里不再赘述。
需要说明的,处理器1101、接口电路1102各自对应的功能既可以通过硬件设计实现,也可以通过软件设计来实现,还可以通过软硬件结合的方式来实现,这里不作限制。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机或处理器上运行时,使得计算机或处理器执行上述任一个网络故障检测方法中的一个或多个步骤。上述信号处理装置的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在所述计算机可读取存储介质中。
本申请实施例还提供一种计算机程序,该计算机程序包括指令,当该计算机程序被计算机执行时,使得计算机可以执行任意一种网络故障检测方法、或任意一种网络故障检测方法的部分或全部步骤。
本领域技术人员能够领会,结合本文公开描述的各种说明性逻辑框、模块和算法步骤所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,那么各种说明性逻辑框、模块、和步骤描述的功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本申请中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
作为实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来存储指令或数据结构的形式的所要程序代码并且可由计算机存取的任何其它媒体。并且,任何连接被恰当地称作计算机可读媒体。举例来说,如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。但是,应理解,所述计算机可读存储媒体和数据存储媒体并不包括连接、载波、信号或其它暂时媒体,而是实际上针对于非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
可通过例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中所描述的各种说明性逻辑框、模块、和步骤所描述的功能可以提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或者并入在组合编解码器中。而且,所述技术可完全实施于一或多个电路或逻辑元件中。
本申请的技术可在各种各样的装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本申请中描述各种组件、模块或单元是为了强调用于执行所揭示的技术的装置的功能方面,但未必需要由不同硬件单元实现。实际上,如上文所描述,各种单元可结合合适的软件和/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元(包含如上文所描述的一或多个处理器)来提供。
以上所述,仅为本申请示例性的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (16)

1.一种网络故障检测方法,其特征在于,包括:
根据网络中设备运行的状态信息确定所述网络中的异常设备;
基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合;其中,所述异常分组集合的每个异常分组中的异常设备所属在所述网络中同一个一级网络设备的端口下;所述异常分组集合中的每个异常分组聚合了至少一个异常设备;聚合的至少两个异常设备之间的所述相似性大于或等于相似度阈值,且所述至少两个异常设备所属在所述网络中同一个一级网络设备的端口下;
根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果;所述分组检测集合为所述异常分组集合的子集;所述分组检测集合中每个异常分组的异常设备所属在所述网络中同一个一级网络设备的端口下;所述故障检测结果用于指示网络故障的网络位置。
2.如权利要求1所述的方法,其特征在于,所述基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合,包括:
将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,得到归类分组集合;所述归类分组集合包括至少一个归类分组;
选取所述归类分组集合中的一个归类分组;
分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,直到所述归类分组中所述相似性最高的两个异常设备的相似性小于所述相似度阈值后或迭代次数达到第一阈值后,所述归类分组中每个异常设备作为一个异常分组,组成异常分组集合;
继续执行所述选取所述归类分组集合中的一个归类分组的步骤,直到选取完毕所述归类分组集合中的归类分组。
3.如权利要求2所述的方法,其特征在于,所述分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,包括:
生成所述归类分组中每个异常设备对应的运行状态特征;其中,生成的所述运行状态特征组成特征集合;
设置特征个数N为当前特征集合中包含的运行状态特征的个数;
将相似性最高且大于或等于所述相似度阈值的两个运行状态特征合并成一个运行状态特征,并添加到所述特征集合中,删除所述特征集合中的所述两个运行状态特征;将所述两个运行状态特征分别对应的异常设备分组聚合;
判断当前特征集合中包含的运行状态特征的个数是否小于所述N;
若判断小于所述N,则统计迭代次数是否达到第一阈值;若没有达到所述第一阈值,则迭代执行所述设置特征个数N为当前特征集合中包含的运行状态特征的个数的步骤;若达到所述第一阈值,则迭代完毕;
若判断不小于所述N,则迭代完毕。
4.如权利要求1-3任一项所述的方法,其特征在于,所述设备分布信息包括所述网络的二级网络设备的网络拓扑信息;所述根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果,包括:
根据所述网络的二级网络设备的网络拓扑信息,判断分组检测集合中是否存在第一类异常分组;其中,所述第一类异常分组所聚合的异常设备对应的二级网络设备的数量大于或等于第二阈值;
若判断存在,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
5.如权利要求4所述的方法,其特征在于,若判断不存在,则从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备;
根据选取的所述二级网络设备下的异常设备在分组检测集合中的分布情况,分析是否存在第二类异常分组;其中,所述第二类异常分组所聚合的异常设备在选取的所述二级网络设备之下,所述第二类异常分组所聚合的异常设备的数量大于或等于第三阈值;
若分析存在,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
若分析不存在,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
继续执行所述从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备的步骤,直到选取完毕所述分组检测集合的异常设备所属的二级网络设备。
6.如权利要求1-3任一项所述的方法,其特征在于,所述根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果,包括:
判断分组检测集合中异常分组的数量是否等于1;
若判断等于,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
7.如权利要求6所述的方法,其特征在于,若判断不等于,则从所述分组检测集合的异常分组中选取一个异常分组;
分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值;
若分析出大于或等于所述第四阈值,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的二级网络设备下的异常设备的故障定界为二级传输线路故障;
若分析出小于所述第四阈值,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
继续执行所述从所述分组检测集合的异常分组中选取一个异常分组的步骤,直到选取完毕所述分组检测集合的异常分组。
8.一种网络故障检测装置,其特征在于,包括:
确定单元,用于根据网络中设备运行的状态信息确定所述网络中的异常设备;
分组单元,用于基于所述异常设备之间的运行状态特征的相似性,对所述异常设备进行分组聚合,得到异常分组集合;其中,所述异常分组集合的每个异常分组中的异常设备所属在所述网络中同一个一级网络设备的端口下;所述异常分组集合中的每个异常分组聚合了至少一个异常设备;聚合的至少两个异常设备之间的所述相似性大于或等于相似度阈值,且所述至少两个异常设备所属在所述网络中同一个一级网络设备的端口下;
结果生成单元,用于根据分组检测集合所对应的设备分布信息进行网络故障检测,生成故障检测结果;所述分组检测集合为所述异常分组集合的子集;所述分组检测集合中每个异常分组的异常设备所属在所述网络中同一个一级网络设备的端口下;所述故障检测结果用于指示网络故障的网络位置。
9.如权利要求8所述的装置,其特征在于,所述分组单元包括:
归类单元,用于将所属在所述网络中同一个一级网络设备的端口下的异常设备归类到同一分组,得到归类分组集合;所述归类分组集合包括至少一个归类分组;
第一选取单元,用于选取所述归类分组集合中的一个归类分组;
分析聚合单元,用于分析所述归类分组中异常设备相互之间的运行状态特征的相似性,若存在所述相似性最高且大于或等于所述相似度阈值的两个异常设备,则将所述两个异常设备分组聚合;分组聚合内的异常设备作为所述归类分组中的一个异常设备,迭代执行所述分析所述归类分组中每个异常设备相互之间的运行状态特征的相似性的步骤,直到所述归类分组中所述相似性最高的两个异常设备的相似性小于所述相似度阈值后或迭代次数达到第一阈值后,所述归类分组中每个异常设备作为一个异常分组,组成异常分组集合;
针对选取的异常分组组成异常分组集合后,所述第一选取单元继续执行所述选取所述归类分组集合中的一个归类分组的步骤,直到选取完毕所述归类分组集合中的归类分组。
10.如权利要求9所述的装置,其特征在于,所述分析聚合单元包括:
特征生成单元,用于生成所述归类分组中每个异常设备对应的运行状态特征;其中,生成的所述运行状态特征组成特征集合;
设置单元,用于设置特征个数N为当前特征集合中包含的运行状态特征的个数;
合并单元,用于将相似性最高且大于或等于所述相似度阈值的两个运行状态特征合并成一个运行状态特征,并添加到所述特征集合中,删除所述特征集合中的所述两个运行状态特征;将所述两个运行状态特征分别对应的异常设备分组聚合;
第一判断单元,用于判断当前特征集合中包含的运行状态特征的个数是否小于所述N;
统计迭代单元,用于若判断小于所述N,则统计迭代次数是否达到第一阈值;若没有达到所述第一阈值,则迭代执行所述设置特征个数N为当前特征集合中包含的运行状态特征的个数的步骤;若达到所述第一阈值,则迭代完毕;若判断不小于所述N,则迭代完毕。
11.如权利要求8-10任一项所述的装置,其特征在于,所述设备分布信息包括所述网络的二级网络设备的网络拓扑信息;所述结果生成单元包括:
第二判断单元,用于根据所述网络的二级网络设备的网络拓扑信息,判断分组检测集合中是否存在第一类异常分组;其中,所述第一类异常分组所聚合的异常设备对应的二级网络设备的数量大于或等于第二阈值;
第一生成单元,用于若所述第二判断单元判断存在,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
12.如权利要求11所述的装置,其特征在于,所述结果生成单元还包括:
第二选取单元,用于若所述第二判断单元判断不存在,则从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备;
第一分析单元,用于根据选取的所述二级网络设备下的异常设备在分组检测集合中的分布情况,分析是否存在第二类异常分组;其中,所述第二类异常分组所聚合的异常设备在选取的所述二级网络设备之下,所述第二类异常分组所聚合的异常设备的数量大于或等于第三阈值;
第二生成单元,用于若所述第一分析单元分析存在,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为二级传输线路故障;
第三生成单元,用于若所述第一分析单元分析不存在,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
其中,所述第一分析单元分析是否存在第二类异常分组后,所述第二选取单元继续执行所述从所述分组检测集合的异常设备所属的二级网络设备中选取一个二级网络设备的步骤,直到选取完毕所述分组检测集合的异常设备所属的二级网络设备。
13.如权利要求8-10任一项所述的装置,其特征在于,所述结果生成单元包括:
第三判断单元,用于判断分组检测集合中异常分组的数量是否等于1;
第四生成单元,用于若所述第三判断单元判断等于,则生成第一类故障检测结果;所述第一类故障检测结果指示所述分组检测集合中异常设备的故障定界为主干传输线路故障。
14.如权利要求13所述的装置,其特征在于,所述结果生成单元还包括:
第三选取单元,用于若所述第三判断单元判断不等于,则从所述分组检测集合的异常分组中选取一个异常分组;
第二分析单元,用于分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值;
第五生成单元,用于若所述第二分析单元分析出大于或等于所述第四阈值,则生成第二类故障检测结果;所述第二类故障检测结果指示选取的二级网络设备下的异常设备的故障定界为二级传输线路故障;
第六生成单元,用于若所述第二分析单元分析出小于所述第四阈值,则生成第三类故障检测结果;所述第三类故障检测结果指示选取的所述二级网络设备下的异常设备的故障定界为三级传输线路故障或异常设备本身故障;
其中,所述第二分析单元分析选取的所述异常分组所聚合的异常设备的数量是否大于或等于第四阈值后,所述第三选取单元继续执行所述从所述分组检测集合的异常分组中选取一个异常分组的步骤,直到选取完毕所述分组检测集合的异常分组。
15.一种网络故障检测设备,其特征在于,包括处理器和存储器;所述存储器,用于存储程序;所述处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行如权利要求1至7任一项所述的方法。
16.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,所述指令在计算机或处理器上运行时,使得所述计算机或处理器执行如权利要求1至7任一项所述的方法。
CN202010858980.4A 2020-08-24 2020-08-24 网络故障检测方法、装置、设备及计算机可读存储介质 Active CN114095808B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010858980.4A CN114095808B (zh) 2020-08-24 2020-08-24 网络故障检测方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010858980.4A CN114095808B (zh) 2020-08-24 2020-08-24 网络故障检测方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN114095808A CN114095808A (zh) 2022-02-25
CN114095808B true CN114095808B (zh) 2023-04-28

Family

ID=80295575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010858980.4A Active CN114095808B (zh) 2020-08-24 2020-08-24 网络故障检测方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114095808B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115842718A (zh) * 2022-09-13 2023-03-24 广州铠源信息科技有限公司 一种宽带网络智能排障方法
CN118134208B (zh) * 2024-05-06 2024-07-23 国网山东省电力公司滨州市沾化区供电公司 输变电运检数据处理方法、系统、终端及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285475B1 (en) * 1995-12-29 2001-09-04 Mci Communications Corporation Method and system for detecting optical faults in a network fiber link
WO2012167624A1 (zh) * 2011-06-08 2012-12-13 华为技术有限公司 一种故障处理方法、汇聚节点及光网络保护系统
CN105721960A (zh) * 2014-12-18 2016-06-29 瞻博网络公司 具有分组光网络中的可预测的分析和故障避免的网络控制器
CN107835098A (zh) * 2017-11-28 2018-03-23 车智互联(北京)科技有限公司 一种网络故障检测方法及系统
CN107995030A (zh) * 2017-11-28 2018-05-04 车智互联(北京)科技有限公司 一种网络探测方法、网络故障检测方法及系统
CN109088793A (zh) * 2018-08-20 2018-12-25 北京百度网讯科技有限公司 用于检测网络故障的方法和装置
CN110247725A (zh) * 2019-06-24 2019-09-17 国网河北省电力有限公司经济技术研究院 Otn网络的线路故障排查方法、装置及终端设备
CN110380907A (zh) * 2019-07-26 2019-10-25 京信通信系统(中国)有限公司 一种网络故障诊断方法、装置、网络设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285475B1 (en) * 1995-12-29 2001-09-04 Mci Communications Corporation Method and system for detecting optical faults in a network fiber link
WO2012167624A1 (zh) * 2011-06-08 2012-12-13 华为技术有限公司 一种故障处理方法、汇聚节点及光网络保护系统
CN105721960A (zh) * 2014-12-18 2016-06-29 瞻博网络公司 具有分组光网络中的可预测的分析和故障避免的网络控制器
CN107835098A (zh) * 2017-11-28 2018-03-23 车智互联(北京)科技有限公司 一种网络故障检测方法及系统
CN107995030A (zh) * 2017-11-28 2018-05-04 车智互联(北京)科技有限公司 一种网络探测方法、网络故障检测方法及系统
CN109088793A (zh) * 2018-08-20 2018-12-25 北京百度网讯科技有限公司 用于检测网络故障的方法和装置
CN110247725A (zh) * 2019-06-24 2019-09-17 国网河北省电力有限公司经济技术研究院 Otn网络的线路故障排查方法、装置及终端设备
CN110380907A (zh) * 2019-07-26 2019-10-25 京信通信系统(中国)有限公司 一种网络故障诊断方法、装置、网络设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DPCP (Discard Past Consider Present)-a novel approach to adaptive fault detection in distributed systems;I. Sotoma;《Proceedings Eighth IEEE Workshop on Future Trends of Distributed Computing Systems. FTDCS 2001》;20010806;全文 *
基于GAN的异构无线网络故障检测与诊断算法;朱晓荣等;《通信学报》(第08期);全文 *

Also Published As

Publication number Publication date
CN114095808A (zh) 2022-02-25

Similar Documents

Publication Publication Date Title
US11792217B2 (en) Systems and methods to detect abnormal behavior in networks
CN110493042B (zh) 故障诊断方法、装置及服务器
CN109327320B (zh) 一种故障定界方法及设备
US20200021511A1 (en) Performance analysis for transport networks using frequent log sequence discovery
CN114095808B (zh) 网络故障检测方法、装置、设备及计算机可读存储介质
CN112181767B (zh) 软件系统异常的确定方法、装置和存储介质
CN112769605B (zh) 一种异构多云的运维管理方法及混合云平台
CN113315742B (zh) 攻击行为检测方法、装置及攻击检测设备
CN111309565A (zh) 告警处理方法、装置、电子设备以及计算机可读存储介质
CN109981326B (zh) 家庭宽带感知故障定位的方法及装置
CN114448774B (zh) 告警处理方法、装置和存储介质
CN114244683A (zh) 事件分类方法和装置
Pan et al. Proactive microwave link anomaly detection in cellular data networks
CN111162945B (zh) 一种告警关联关系的确定方法、装置、设备及存储介质
CN114598506A (zh) 工控网络安全风险溯源方法、装置、电子设备及存储介质
CN117376107A (zh) 一种智能化网络管理方法、系统、计算机设备及介质
CN112532467B (zh) 用于实现故障检测的方法、装置及系统
CN116599705A (zh) 一种互联网攻击预测方法、系统、设备及介质
CN113285978B (zh) 基于区块链和大数据的故障识别方法及通用计算节点
CN116170281A (zh) 告警关联规则生成方法、装置、电子设备和存储介质
CN115544202A (zh) 告警处理方法、装置及存储介质
LYU et al. Alarm-Based Root Cause Analysis Based on Weighted Fault Propagation Topology for Distributed Information Network
CN114422324B (zh) 一种告警信息的处理方法、装置、电子设备及存储介质
CN117149486B (zh) 告警和根因定位方法、模型训练方法、装置、设备及介质
CN114363194B (zh) 网络设备的隐患分析方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant