CN116708152A - 基于机器学习的无线网路设备故障根因定位方法及系统 - Google Patents

基于机器学习的无线网路设备故障根因定位方法及系统 Download PDF

Info

Publication number
CN116708152A
CN116708152A CN202310750489.3A CN202310750489A CN116708152A CN 116708152 A CN116708152 A CN 116708152A CN 202310750489 A CN202310750489 A CN 202310750489A CN 116708152 A CN116708152 A CN 116708152A
Authority
CN
China
Prior art keywords
data
alarm
root cause
equipment
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310750489.3A
Other languages
English (en)
Inventor
赵灿
王端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Communication Information System Co Ltd
Original Assignee
Inspur Communication Information System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Communication Information System Co Ltd filed Critical Inspur Communication Information System Co Ltd
Priority to CN202310750489.3A priority Critical patent/CN116708152A/zh
Publication of CN116708152A publication Critical patent/CN116708152A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/149Network analysis or design for prediction of maintenance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了基于机器学习的无线网路设备故障根因定位方法及系统,属于通信技术领域,要解决的技术问题为如何快速对无线设备进行根因分析和定位。包括如下步骤:获取对无线网络设备故障根因定位需要的设备和拓扑关系数据;对获取的设备和拓扑关系数据进行数据预处理;将获取的设备日志数据和预处理后数据存储至分布式消息队列系统中;形成告警数据层级关系,基于告警级别、告警描述和根因描述构建知识库;基于深度学习构建根因预测模型,通过训练后根因预测模型预测对新的告警描述进行根因预测,得到根因级别;基于得到的根因级别,根据根因和告警的相似度计算根因级别。

Description

基于机器学习的无线网路设备故障根因定位方法及系统
技术领域
本发明涉及通信技术领域,具体地说是基于机器学习的无线网路设备故障根因定位方法及系统。
背景技术
无线设备故障原因定位是现代通信维护工作中非常重要的一环。在现代通信网络中,无线设备故障率比有线设备要高得多,因此,无线设备的故障原因定位技术也得到了越来越多的重视和研究。
目前,主要采用的无线设备故障原因定位技术包括以下几种:
1、无线定位技术是一种基于地理位置的技术,通过定位设备所在的位置,来定位故障的原因。该技术采用GPS或基站信号强度等信息,结合数学算法和数据处理技术,来计算设备的精确位置,进而确定故障原因。
2、无线信号分析技术
无线信号分析技术是一种通过对无线信号进行分析,来确定故障原因的技术。该技术通过采集和分析无线信号的各种参数,如信号强度、信号幅度、信号频率等,来分析无线信号中存在的异常情况,从而确定故障原因。
3、网络分析技术
网络分析技术是一种基于网络分析的技术,通过对网络拓扑、网络负载和流量分析等方法,来确定故障原因。该技术主要包括网络拓扑分析、流量分析和负载分析等多个方面,通过对网络拓扑结构、数据流量和负载情况等进行分析,来确定故障原因。
目前无线设备故障原因定位存在如下问题:首先,无线设备故障原因定位技术的精度和准确性有待提高;其次,无线设备故障原因定位技术的成本较高,需要大量的人力和物力投入;此外,无线设备故障原因定位技术的实时性和可靠性也需要进一步提高。
以上问题和缺点的主要原因是无线设备故障原因定位技术的复杂性和多样性。此外,无线设备故障原因定位技术的应用场景也较为复杂,需要考虑多种因素的影响,如环境因素、设备因素和人为因素等。
如何快速对无线设备进行根因分析和定位,是需要解决的技术问题。
发明内容
本发明的技术任务是针对以上不足,提供基于机器学习的无线网络设备故障定位系统,来解决如何快速对无线设备进行根因分析和定位的技术问题。
第一方面,本发明一种基于机器学习的无线网路设备故障根因定位方法,包括如下步骤:
数据采集:获取对无线网络设备故障根因定位需要的设备和拓扑关系数据,所述设备和拓扑关系数据包括设备信息、拓扑关系信息、设备运行数据和环境数据;
数据预处理:对获取的设备和拓扑关系数据进行数据预处理,通过数据预处理去除空值、异常值以及噪声,得到预处理后数据;
数据存储:将获取的设备日志数据和预处理后数据存储至分布式消息队列系统中;
告警分析:基于时间窗口和聚类算法将存储于分布式消息队列系统中的数据按照预定时间段内告警进行聚类处理,并使用关联规则挖掘算法将具有相同根因的告警归纳为能够涵盖告警内容的泛化预警,形成告警数据层级关系;
知识库构建:对告警数据进行特征提取和聚类分析,得到告警描述,并基于告警数据、通过可视化工具定位故障的根因,基于告警级别、告警描述和根因描述构建知识库;
故障根因预测:基于告警描述和根因描述构建样本数据,基于深度学习构建根因预测模型,所述根因预测模型用于基于告警描述预测输出根因级别,基于样本数据训练根因预测模型,通过训练后根因预测模型预测对新的告警描述进行根因预测,得到根因级别;
故障根因定位:基于得到的根因级别,根据根因和告警的相似度计算根因级别。
作为优选,所述设备信息为从OMC获取的设备信息,包括设备型号、设备状态和设备配置,用于确定设备故障的类型和位置;
所述设备运行数据包括设备的运行状态、信号强度和数据传输速率,用于预测设备可能出现的故障,并提供故障诊断和定位的依据;
所述设备拓关系信息为从资源管理系统获取的信息,包括设备之间的连接关系、信号传输路径,用于确定设备故障的具体位置;
所述环境信息为从动环系统获取的机房环境数据,包括机房温度、湿度。
作为优选,对获取的设备和拓扑关系数据进行数据预处理,包括如下步骤:
去除设备和拓扑关系数据中的异常值和空缺值;
对设备和拓扑关系数据进行归一化处理;
基于聚类方法将设备和拓扑关系数据中的噪声数据剔除;
基于回归方法对设备和拓扑关系数据中的噪声数据进行预测,并将预测的噪声数据剔除。
作为优选,告警分析包括如下步骤:
按照时间窗口将存储于分布式消息队列系统中的数据划分为多个时间段的数据,每个时间段内的数据包括告警数据;
对于每个时间段内的告警数据,使用聚类算法对告警数据进行聚类处理;
通过Apriori算法发现告警数据之间的频繁项集和关联规则,将具有相同根因的告警数据归为一类,将关联规则作为泛化预警的内容,并将泛化预警作为告警数据的摘要;
采用层次聚类算法将告警数据按照不同的层次进行聚类。
作为优选,知识库构建包括如下步骤:
通过特征工程方法提取告警数据的关键特征,基于关键特征、使用聚类方法将相似的告警数据合并聚类,得到告警摘要,关键特征包括机房名称、网元名称和告警描述,所述告警摘要包括机房名称、网元名称、告警描述以及告警条数,其中,告警描述为告警的具体内容;
按照告警重要程度,将告警划分为多个级别;
基于告警数据、通过可视化工具进行故障根因定位,得到根因描述;
基于告警级别、告警描述和根因描述构建知识库。
作为优选,根因故障预测包括如下步骤:
将根因划分为多个级别,并建立根因级别之间的层级关系;
基于seq2seq模型构建根因预测模型,所述根因预测模型用于以告警摘要为输入、预测输出根因级别;
对告警摘要和根因级别进行编码,以编码后的告警摘要和根因级别为训练样本,通过训练样本对根因预测模型进行模型训练,得到训练后根因预测模型;
对新的告警摘要进行编码,将编码后的告警摘要作为输入序列输入训练后根因预测模型,通过训练后根因预测模型输出新的告警摘要对应的根因级别;
并将新的告警摘要以及预测输出的根因级别加入训练样本,对根因预测模型进行训练。
第二方面,本发明一种基于机器学习的无线网络设备故障定位系统,用于通过如第一方面任一项所述的基于机器学习的无线网路设备故障根因定位方法对无线网络设备的故障根因进行定位,所述系统包括:
数据采集模块,所述数据采集模块用于获取对无线网络设备故障根因定位需要的设备和拓扑关系数据,所述设备和拓扑关系数据包括设备信息、拓扑关系信息、设备运行数据和环境数据;
数据预处理模块,所述数据预处理模块用于对获取的设备和拓扑关系数据进行数据预处理,通过数据预处理去除空值、异常值以及噪声,得到预处理后数据;
数据存储模块,所述数据存储模块用于将获取的设备日志数据和预处理后数据存储至分布式消息队列系统中;
告警分析模块,所述告警分析模块用于基于时间窗口和聚类算法将存储于分布式消息队列系统中的数据按照预定时间段内告警进行聚类处理,并使用关联规则挖掘算法将具有相同根因的告警归纳为能够涵盖告警内容的泛化预警,形成告警数据层级关系;
知识库构建模块,所述知识库构建模块用于对告警数据进行特征提取和聚类分析,得到告警描述,并基于告警数据、通过可视化工具定位故障的根因,基于告警级别、告警描述和根因描述构建知识库;
故障根因预测模块,所述故障根因预测模块用于基于告警描述和根因描述构建样本数据,基于深度学习构建根因预测模型,所述根因预测模型用于基于告警描述预测输出根因级别,基于样本数据训练根因预测模型,通过训练后根因预测模型预测对新的告警描述进行根因预测,得到根因级别;
故障根因定位模块,所述故障根因定位模块用于基于得到的根因级别,根据根因和告警的相似度计算根因级别。
作为优选,所述设备信息为从OMC获取的设备信息,包括设备型号、设备状态和设备配置,用于确定设备故障的类型和位置;
所述设备运行数据包括设备的运行状态、信号强度和数据传输速率,用于预测设备可能出现的故障,并提供故障诊断和定位的依据;
所述设备拓关系信息为从资源管理系统获取的信息,包括设备之间的连接关系、信号传输路径,用于确定设备故障的具体位置;
所述环境信息为从动环系统获取的机房环境数据,包括机房温度、湿度;
所述数据预处理模块用于执行如下对获取的设备和拓扑关系数据进行数据预处理
去除设备和拓扑关系数据中的异常值和空缺值;
对设备和拓扑关系数据进行归一化处理;
基于聚类方法将设备和拓扑关系数据中的噪声数据剔除;
基于回归方法对设备和拓扑关系数据中的噪声数据进行预测,并将预测的噪声数据剔除。
作为优选,所述告警分析模块用于执行如下:
按照时间窗口将存储于分布式消息队列系统中的数据划分为多个时间段的数据,每个时间段内的数据包括告警数据;
对于每个时间段内的告警数据,使用聚类算法对告警数据进行聚类处理;
通过Apriori算法发现告警数据之间的频繁项集和关联规则,将具有相同根因的告警数据归为一类,将关联规则作为泛化预警的内容,并将泛化预警作为告警数据的摘要;
采用层次聚类算法将告警数据按照不同的层次进行聚类。
作为优选,所述知识库构建模块用于执行如下:
通过特征工程方法提取告警数据的关键特征,基于关键特征、使用聚类方法将相似的告警数据合并聚类,得到告警摘要,关键特征包括机房名称、网元名称和告警描述,所述告警摘要包括机房名称、网元名称、告警描述以及告警条数,其中,告警描述为告警的具体内容;
按照告警重要程度,将告警划分为多个级别;
基于告警数据、通过可视化工具进行故障根因定位,得到根因描述;
基于告警级别、告警描述和根因描述构建知识库;
所述根因故障预测模块用于执行如下:
将根因划分为多个级别,并建立根因级别之间的层级关系;
基于seq2seq模型构建根因预测模型,所述根因预测模型用于以告警摘要为输入、预测输出根因级别;
对告警摘要和根因级别进行编码,以编码后的告警摘要和根因级别为训练样本,通过训练样本对根因预测模型进行模型训练,得到训练后根因预测模型;
对新的告警摘要进行编码,将编码后的告警摘要作为输入序列输入训练后根因预测模型,通过训练后根因预测模型输出新的告警摘要对应的根因级别;
并将新的告警摘要以及预测输出的根因级别加入训练样本,对根因预测模型进行训练。
本发明的基于机器学习的无线网路设备故障根因定位方法及系统具有以下优点:
1、基于告警级别、告警描述和根因描述构建知识库,基于告警描述和根因描述训练构建的根因预测模型,并通过训练后根因预测模型预测对新的告警描述进行根因预测,根据预测的根因级别,并进一步根据根因和告警的相似度计算根因级别,实现了快速、精确的根因预测;
2、基于时间窗口和聚类算法对存储于分布式消息队列系统中的设备日志数据以及预处理后的设备和拓扑关系数据进行分析,得到告警数据的层级关系,通过多级告警以及多级根因,提高了根因预测的准确性;
3、对于告警数据,通过特征工程方法提取关键特征,基于关键特征、使用聚类方法将相似的告警数据合并聚类,得到告警摘要,后续通过根因预测模型进行根因预测时,以告警摘要为输入序列、以根因级别为输出序列,基于告警摘要和根因级别构建的样本,使得根因预测模型适配多个无线网络设备;
4、通过根因预测模型对输入的新的告警摘要进行预测后,将新的告警摘要以及对应的根因级别加入训练样本,实现了训练后根因预测模型的再次训练,提高了模型的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
下面结合附图对本发明进一步说明。
图1为实施例1一种基于机器学习的无线网路设备故障根因定位方法的流程框图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互结合。
本发明实施例提供基于机器学习的无线网路设备故障根因定位方法及系统,用于解决如何快速对无线设备进行根因分析和定位的技术问题。
实施例1:
本发明一种基于机器学习的无线网路设备故障根因定位方法,包括如下步骤:
S100、数据采集:获取对无线网络设备故障根因定位需要的设备和拓扑关系数据,所述设备和拓扑关系数据包括设备信息、拓扑关系信息、设备运行数据和环境数据;
S200、数据预处理:对获取的设备和拓扑关系数据进行数据预处理,通过数据预处理去除空值、异常值以及噪声,得到预处理后数据;
S300、数据存储:将获取的设备日志数据和预处理后数据存储至分布式消息队列系统中;
S400、告警分析:基于时间窗口和聚类算法将存储于分布式消息队列系统中的数据按照预定时间段内告警进行聚类处理,并使用关联规则挖掘算法将具有相同根因的告警归纳为能够涵盖告警内容的泛化预警,形成告警数据层级关系;
S500、知识库构建:对告警数据进行特征提取和聚类分析,得到告警描述,并基于告警数据、通过可视化工具定位故障的根因,基于告警级别、告警描述和根因描述构建知识库;
S600、故障根因预测:基于告警描述和根因描述构建样本数据,基于深度学习构建根因预测模型,所述根因预测模型用于基于告警描述预测输出根因级别,基于样本数据训练根因预测模型,通过训练后根因预测模型预测对新的告警描述进行根因预测,得到根因级别;
S700、故障根因定位:基于得到的根因级别,根据根因和告警的相似度计算根因级别。
对无线设备故障的原因进行定位需要输入多种数据,本实施例步骤S100采集的数据包括设备信息、拓扑关系信息、设备运行数据和环境数据。具体如下:
设备信息:需要从OMC获取设备信息,包括设备型号、设备状态、设备配置等,这些信息可以帮助确定设备故障的类型和位置;
设备运行数据:包括设备的运行状态、信号强度、数据传输速率等,这些数据可以帮助预测设备可能出现的故障,并提供故障诊断和定位的依据;
从资源管理系统获取设备拓扑关系信息、设备配置信息、光路信息、电路信息、拓扑关系信息,包括设备之间的连接关系、信号传输路径等,这些信息可以帮助确定设备故障的具体位置;
需要从动环系统获取机房环境数据,如机房温度、湿度等,这些数据可以通过环境监测设备或传感器来获取。
在采集无线设备故障定位所需的数据时,由于各种原因,数据中可能会存在噪声。为了提高数据的准确性和可靠性,步骤S200使用聚类方法和回归方法来除去数据中的噪声。
本实施例使用聚类方法将数据中的噪声分离出来。聚类方法是一种无监督学习方法,可以将数据分成多个类别,每个类别中的数据具有相似的特征。在数据中存在噪声的情况下,聚类方法可以将噪声数据分离出来,从而提高数据的准确性和可靠性。可以使用K-means聚类算法将数据分成多个类别,然后将噪声数据从数据中剔除。
使用回归方法预测数据中的噪声。回归方法是一种监督学习方法,可以通过对数据进行建模和分析,预测数据中的噪声。可以使用线性回归模型来预测数据中的噪声,然后将预测出的噪声从数据中剔除。
在使用聚类方法和回归方法除去数据中的噪声之前,需要去除数据中的异常值和空值,并对数据进行和归一化,以便更好地适应聚类算法和回归模型的要求。此外,还需要对聚类结果和回归模型进行评估和验证,以确保其准确性和可靠性。
同时,本实施例步骤S100还从无线网络设备的设备接口中获取设备日志数据,步骤S300将获取的设备日志数据和预处理后数据存储至分布式消息队列系统中。
本实施例分布式消息队列系统选用kafka,可以实现高吞吐量、低延迟的消息传输。在使用Kafka Producer API时,需要创建一个Producer对象,并将Producer对象的配置信息配置好。然后,可以使用Producer对象将接收到的日志正文内容发送到kafka队中。在发送消息时,需要指定消息的Topic和Partition等信息。
如果解析格式一致,则可以将数据存储到相同的Topic中。在kafka队中,Topic是消息的逻辑分类,可以将相同类型的消息存储到同一个Topic中。如果解析格式一致,则可以将去除噪声的数据存储到相同的Topic中。在存储数据时,需要指定数据的Topic和Partition等信息,以便更好地管理和维护数据。
步骤S400的告警分析包括如下操作:
(1)按照时间窗口将存储于分布式消息队列系统中的数据划分为多个时间段的数据,每个时间段内的数据包括告警数据;
(2)对于每个时间段内的告警数据,使用聚类算法对告警数据进行聚类处理;
(3)通过Apriori算法发现告警数据之间的频繁项集和关联规则,将具有相同根因的告警数据归为一类,将关联规则作为泛化预警的内容,并将泛化预警作为告警数据的摘要;
(4)采用层次聚类算法将告警数据按照不同的层次进行聚类。
本实施例的告警分析,使用时间窗口和聚类算法将存储的数据按一段时间内的告警进行聚类处理。时间窗口是一种将数据按时间分段的方法,可以将数据按一定时间间隔分成多个时间段。在每个时间段内,可以使用聚类算法将告警数据进行聚类处理。
使用关联规则挖掘算法将具有相同根因的告警归纳为能够涵盖告警内容的泛化预警。使用Apriori算法发现告警数据之间的频繁项集和关联规则,然后将具有相同根因的告警数据归为一类,并将关联规则作为泛化预警的内容。最后,将泛化预警作为告警数据的摘要,以便更好地理解和分析告警数据。
采用层次聚类算法将告警数据按照不同的层次进行聚类,从而保留细节,又能够具有很强的概括性。关联规则挖掘算法可以发现告警数据之间的关联规则,从而更好地理解告警数据之间的关系。
为了获取无线设备的异常预警根因,可以按照以下四个部分进行处理:收集预警信息、提取预警信息的关键特征、聚类处理、展示预警摘要。
第一部分:收集预警信息。收集预警信息是获取无线设备异常预警根因的第一步。可以通过设备管理系统、网络管理系统、环境监测系统等多个系统来收集预警信息。在收集预警信息时,需要选择合适的数据源,并对数据进行预处理和清洗,以确保数据的准确性和可靠性。本实施例基于存储于分布式消息队列系统中的数据获取告警数据作为预警信息。
第二部分:提取预警信息的关键特征。提取预警信息的关键特征是获取无线设备异常预警根因的关键步骤。可以使用特征工程的方法来提取预警信息的关键特征。特征工程是一种将原始数据转换为可用于机器学习算法的特征的方法。
第三部分:聚类处理。使用聚类算法将预警信息分成多个类别,每个类别中的预警信息具有相似的特征。
第四部分:展示预警摘要。展示预警摘要是将聚类处理后的告警数据以可视化的方式呈现的方法。可以使用可视化工具将告警数据以图形化的方式呈现,从而更好地理解告警数据之间的关系。
本实施例中,对告警使用特征工程的方法提取告警信息的关键特征,例如机房名称、网元名称(编号)、告警描述等。使用聚类算法将相似的告警信息合并聚类。
选取机房名称、网元名称(编号)、告警描述三个维度进行聚类,使用基于特征的聚类算法是一种将数据按照特征进行分组的方法,可以将具有相似特征的数据归为一类。得到如下表1所示的告警摘要。
表1:
本实施例中知识库是一种存储和管理知识的系统,可以用于记录和分享知识。在定义知识库时,需要考虑知识库的结构和内容。可以将知识库分为三个部分:级别、告警描述、根因描述。
级别:级别是告警的重要程度,可以分为多个级别,例如紧急、重要、一般等级别。在定义知识库时,需要将不同级别的告警进行分类,并记录其级别信息。
告警描述:告警描述是告警的具体内容,可以包括告警的名称、描述、类型等信息。
根因描述:根因描述是告警的根本原因,可以包括告警的来源、影响、解决方法等信息。知识库的呈现结构如表2所示。
表2:
基于上述分析,本实施例步骤S500构建知识库,包括如下步骤:
(1)通过特征工程方法提取告警数据的关键特征,基于关键特征、使用聚类方法将相似的告警数据合并聚类,得到告警摘要,关键特征包括机房名称、网元名称和告警描述,所述告警摘要包括机房名称、网元名称、告警描述以及告警条数,其中,告警描述为告警的具体内容;
(2)按照告警重要程度,将告警划分为多个级别;
(3)基于告警数据、通过可视化工具进行故障根因定位,得到根因描述;
(4)基于告警级别、告警描述和根因描述构建知识库。
本实施例中,优化人员接受到告警后,通过可视化工具来快速定位故障的大致方向。可视化工具可以将告警数据以图形化的方式呈现,从而更好地理解告警数据之间的关系。使用散点图、热力图等方式来呈现告警数据,以便更好地理解告警数据之间的关系。同时,还可以使用搜索工具来快速定位故障的大致方向。搜索工具可以根据关键字、时间、地点等条件来搜索告警数据,从而更好地定位故障的大致方向。
步骤S600使用seq2seq模型进行告警根因预测。包括如下步骤:
(1)将根因划分为多个级别,并建立根因级别之间的层级关系;
(2)基于seq2seq模型构建根因预测模型,所述根因预测模型用于以告警摘要为输入、预测输出根因级别;
(3)对告警摘要和根因级别进行编码,以编码后的告警摘要和根因级别为训练样本,通过训练样本对根因预测模型进行模型训练,得到训练后根因预测模型;
(4)对新的告警摘要进行编码,将编码后的告警摘要作为输入序列输入训练后根因预测模型,通过训练后根因预测模型输出新的告警摘要对应的根因级别;
(5)将新的告警摘要以及预测输出的根因级别加入训练样本,对根因预测模型进行训练。
作为具体实施,根因预测进行以下步骤:
数据预处理:需要将告警描述和根因进行编码和解码,以便输入到seq2seq模型中进行训练和预测。
模型训练:需要使用训练数据对seq2seq模型进行训练,以便模型能够学习到告警描述和根因之间的关系;
模型预测:需要使用训练好的seq2seq模型对新的告警描述进行预测,以便预测其一级根因、二级根因;
结果展示:需要将预测结果展示出来,以便用户查看和理解。同时,将预测结果写入知识库作为后续训练数据,可以提高模型的智能效果。
本实施例中使用聚类算法和seq2seq文本生成算法,根据设备的告警摘要输出根因级别。具体步骤如下:
(1)数据预处理:需要将设备的告警摘要进行预处理和清洗;
(2)聚类处理:可以使用聚类算法将设备的告警按照相似性进行分组,从而更好地理解告警之间的关系;
(3)seq2seq文本生成算法:使用seq2seq文本生成算法,将设备的告警摘要转换为告警描述。在使用seq2seq文本生成算法进行故障根因预测时,可以将告警摘要作为输入序列,将跟根因级别作为输出序列,然后使用seq2seq模型进行训练和预测。
(4)结果展示:需要将预测结果展示出来,以便用户查看和理解。
如果传输数据、动环数据匹配度差,可以采用层次聚类进行数据匹配分析。层次聚类是一种将数据按照相似性进行分组的方法,可以将具有相似特征的数据归为一类。然后,可以使用聚类算法将具有相似特征的数据归为一类。
针对匹配度差的情况,可以采用文本生成技术,生成告警原因。使用文本生成技术生成告警原因时,可以将传输数据、动环数据作为输入序列,将告警原因作为输出序列,然后使用文本生成模型进行训练和预测。
步骤S700在故障根因定位时,基于根因警情相似度计算,得出一级根因故障和二级根因故障。具体步骤如下:
(1)根因警情相似度计算。可以使用根因警情相似度计算方法,计算故障之间的相似度,根因警情相似度计算方法是一种将故障根因之间的相似度进行计算的方法,可以用于故障根因定位;
(2)一级根因故障和二级根因故障:根据聚类和根因警情相似度计算的结果,可以得出一级根因故障和二级根因故障,一级根因故障是指故障的根本原因,二级根因故障是指故障的次要原因。呈现结果如表3所示:
机房名称 网元 告警摘要 条数 一级根因 二级根因
A X1 xxxx XXX xxx xxx
A X2 xxxx XXX xxx xxx
B XXX
本实施例对集中维护发现的基站问题进行故障根因分析和定位,可以带来多方面的效果,可以提高通信网络的服务质量和用户满意度,降低基站维护成本和人力成本,提高基站故障排查的准确性和效率。
实施例2:
本发明一种基于机器学习的无线网络设备故障定位系统,包括数据采集模块、数据预处理模块、数据存储模块、告警分析模块、知识库构建模块、故障根因预测模块以及故障根因定位模块,该系统可通过实施例1公开的方法对无线网络设备的故障根因进行定位。
数据采集模块用于获取对无线网络设备故障根因定位需要的设备和拓扑关系数据,所述设备和拓扑关系数据包括设备信息、拓扑关系信息、设备运行数据和环境数据。
对无线设备故障的原因进行定位需要输入多种数据,本实施例数据采集模块采集的数据包括设备信息、拓扑关系信息、设备运行数据和环境数据。具体如下:
设备信息:需要从OMC获取设备信息,包括设备型号、设备状态、设备配置等,这些信息可以帮助确定设备故障的类型和位置;
设备运行数据:包括设备的运行状态、信号强度、数据传输速率等,这些数据可以帮助预测设备可能出现的故障,并提供故障诊断和定位的依据;
从资源管理系统获取设备拓扑关系信息、设备配置信息、光路信息、电路信息、拓扑关系信息,包括设备之间的连接关系、信号传输路径等,这些信息可以帮助确定设备故障的具体位置;
需要从动环系统获取机房环境数据,如机房温度、湿度等,这些数据可以通过环境监测设备或传感器来获取。
数据预处理模块用于对获取的设备和拓扑关系数据进行数据预处理,通过数据预处理去除空值、异常值以及噪声,得到预处理后数据。
在采集无线设备故障定位所需的数据时,由于各种原因,数据中可能会存在噪声。为了提高数据的准确性和可靠性,数据预处理模块用于使用聚类方法和回归方法来除去数据中的噪声。
本实施例使用聚类方法将数据中的噪声分离出来。聚类方法是一种无监督学习方法,可以将数据分成多个类别,每个类别中的数据具有相似的特征。在数据中存在噪声的情况下,聚类方法可以将噪声数据分离出来,从而提高数据的准确性和可靠性。可以使用K-means聚类算法将数据分成多个类别,然后将噪声数据从数据中剔除。
使用回归方法预测数据中的噪声。回归方法是一种监督学习方法,可以通过对数据进行建模和分析,预测数据中的噪声。可以使用线性回归模型来预测数据中的噪声,然后将预测出的噪声从数据中剔除。
在使用聚类方法和回归方法除去数据中的噪声之前,需要去除数据中的异常值和空值,并对数据进行和归一化,以便更好地适应聚类算法和回归模型的要求。此外,还需要对聚类结果和回归模型进行评估和验证,以确保其准确性和可靠性。
数据存储模块用于将获取的设备日志数据和预处理后数据存储至分布式消息队列系统中。
本实施例数据采集模块还用于从无线网络设备的设备接口中获取设备日志数据,数据存储模块用于将获取的设备日志数据和预处理后数据存储至分布式消息队列系统中。
本实施例分布式消息队列选用kafka,可以实现高吞吐量、低延迟的消息传输。在使用Kafka Producer API时,需要创建一个Producer对象,并将Producer对象的配置信息配置好。然后,可以使用Producer对象将接收到的日志正文内容发送到kafka队中。在发送消息时,需要指定消息的Topic和Partition等信息。
如果解析格式一致,则可以将数据存储到相同的Topic中。在kafka队中,Topic是消息的逻辑分类,可以将相同类型的消息存储到同一个Topic中。如果解析格式一致,则可以将去除噪声的数据存储到相同的Topic中。在存储数据时,需要指定数据的Topic和Partition等信息,以便更好地管理和维护数据。
告警分析模块用于基于时间窗口和聚类算法将存储于分布式消息队列系统中的数据按照预定时间段内告警进行聚类处理,并使用关联规则挖掘算法将具有相同根因的告警归纳为能够涵盖告警内容的泛化预警,形成告警数据层级关系。
作为告警分析模块的具体实施,本实施例该模块用于执行如下进行告警分析:
(1)按照时间窗口将存储于分布式消息队列系统中的数据划分为多个时间段的数据,每个时间段内的数据包括告警数据;
(2)对于每个时间段内的告警数据,使用聚类算法对告警数据进行聚类处理;
(3)通过Apriori算法发现告警数据之间的频繁项集和关联规则,将具有相同根因的告警数据归为一类,将关联规则作为泛化预警的内容,并将泛化预警作为告警数据的摘要;
(4)采用层次聚类算法将告警数据按照不同的层次进行聚类。
本实施例的告警分析,使用时间窗口和聚类算法将存储的数据按一段时间内的告警进行聚类处理。时间窗口是一种将数据按时间分段的方法,可以将数据按一定时间间隔分成多个时间段。在每个时间段内,可以使用聚类算法将告警数据进行聚类处理。
使用关联规则挖掘算法将具有相同根因的告警归纳为能够涵盖告警内容的泛化预警。使用Apriori算法发现告警数据之间的频繁项集和关联规则,然后将具有相同根因的告警数据归为一类,并将关联规则作为泛化预警的内容。最后,将泛化预警作为告警数据的摘要,以便更好地理解和分析告警数据。
采用层次聚类算法将告警数据按照不同的层次进行聚类,从而保留细节,又能够具有很强的概括性。关联规则挖掘算法可以发现告警数据之间的关联规则,从而更好地理解告警数据之间的关系。
知识库构建模块用于对告警数据进行特征提取和聚类分析,得到告警描述,并基于告警数据、通过可视化工具定位故障的根因,基于告警级别、告警描述和根因描述构建知识库。
为了获取无线设备的异常预警根因,可以按照以下四个部分进行处理:收集预警信息、提取预警信息的关键特征、聚类处理、展示预警摘要。
第一部分:收集预警信息。收集预警信息是获取无线设备异常预警根因的第一步。可以通过设备管理系统、网络管理系统、环境监测系统等多个系统来收集预警信息。在收集预警信息时,需要选择合适的数据源,并对数据进行预处理和清洗,以确保数据的准确性和可靠性。本实施例基于存储于分布式消息队列系统中的数据获取告警数据作为预警信息。
第二部分:提取预警信息的关键特征。提取预警信息的关键特征是获取无线设备异常预警根因的关键步骤。可以使用特征工程的方法来提取预警信息的关键特征。特征工程是一种将原始数据转换为可用于机器学习算法的特征的方法。
第三部分:聚类处理。使用聚类算法将预警信息分成多个类别,每个类别中的预警信息具有相似的特征。
第四部分:展示预警摘要。展示预警摘要是将聚类处理后的告警数据以可视化的方式呈现的方法。可以使用可视化工具将告警数据以图形化的方式呈现,从而更好地理解告警数据之间的关系。
本实施例中,对告警使用特征工程的方法提取告警信息的关键特征,例如机房名称、网元名称(编号)、告警描述等。使用聚类算法将相似的告警信息合并聚类。
选取机房名称、网元名称(编号)、告警描述三个维度进行聚类,使用基于特征的聚类算法是一种将数据按照特征进行分组的方法,可以将具有相似特征的数据归为一类。
本实施例中知识库是一种存储和管理知识的系统,可以用于记录和分享知识。在定义知识库时,需要考虑知识库的结构和内容。可以将知识库分为三个部分:级别、告警描述、根因描述。
级别:级别是告警的重要程度,可以分为多个级别,例如紧急、重要、一般等级别。在定义知识库时,需要将不同级别的告警进行分类,并记录其级别信息。
告警描述:告警描述是告警的具体内容,可以包括告警的名称、描述、类型等信息。
根因描述:根因描述是告警的根本原因,可以包括告警的来源、影响、解决方法等信息。
基于上述分析,本实施例知识库构建模块用于执行如下构建知识库:
(1)通过特征工程方法提取告警数据的关键特征,基于关键特征、使用聚类方法将相似的告警数据合并聚类,得到告警摘要,关键特征包括机房名称、网元名称和告警描述,所述告警摘要包括机房名称、网元名称、告警描述以及告警条数,其中,告警描述为告警的具体内容;
(2)按照告警重要程度,将告警划分为多个级别;
(3)基于告警数据、通过可视化工具进行故障根因定位,得到根因描述;
(4)基于告警级别、告警描述和根因描述构建知识库。
本实施例中,接受到告警后,通过可视化工具来快速定位故障的大致方向。可视化工具可以将告警数据以图形化的方式呈现,从而更好地理解告警数据之间的关系。使用散点图、热力图等方式来呈现告警数据,以便更好地理解告警数据之间的关系。同时,还可以使用搜索工具来快速定位故障的大致方向。搜索工具可以根据关键字、时间、地点等条件来搜索告警数据,从而更好地定位故障的大致方向。
故障根因预测模块用于基于告警描述和根因描述构建样本数据,基于深度学习构建根因预测模型,所述根因预测模型用于基于告警描述预测输出根因级别,基于样本数据训练根因预测模型,通过训练后根因预测模型预测对新的告警描述进行根因预测,得到根因级别。
本实施例故障根因预测模块用于使用seq2seq模型进行告警根因预测。具体执行如下操作:
(1)将根因划分为多个级别,并建立根因级别之间的层级关系;
(2)基于seq2seq模型构建根因预测模型,所述根因预测模型用于以告警摘要为输入、预测输出根因级别;
(3)对告警摘要和根因级别进行编码,以编码后的告警摘要和根因级别为训练样本,通过训练样本对根因预测模型进行模型训练,得到训练后根因预测模型;
(4)对新的告警摘要进行编码,将编码后的告警摘要作为输入序列输入训练后根因预测模型,通过训练后根因预测模型输出新的告警摘要对应的根因级别;
(5)将新的告警摘要以及预测输出的根因级别加入训练样本,对根因预测模型进行训练。
作为具体实施,根因预测进行以下步骤:
数据预处理:需要将告警描述和根因进行编码和解码,以便输入到seq2seq模型中进行训练和预测。
模型训练:需要使用训练数据对seq2seq模型进行训练,以便模型能够学习到告警描述和根因之间的关系;
模型预测:需要使用训练好的seq2seq模型对新的告警描述进行预测,以便预测其一级根因、二级根因;
结果展示:需要将预测结果展示出来,以便用户查看和理解。同时,将预测结果写入知识库作为后续训练数据,可以提高模型的智能效果。
本实施例中使用聚类算法和seq2seq文本生成算法,根据设备的告警摘要输出根因级别。具体步骤如下:
(1)数据预处理:需要将设备的告警摘要进行预处理和清洗;
(2)聚类处理:可以使用聚类算法将设备的告警按照相似性进行分组,从而更好地理解告警之间的关系;
(3)seq2seq文本生成算法:使用seq2seq文本生成算法,将设备的告警摘要转换为告警描述。在使用seq2seq文本生成算法进行故障根因预测时,可以将告警摘要作为输入序列,将跟根因级别作为输出序列,然后使用seq2seq模型进行训练和预测。
(4)结果展示:需要将预测结果展示出来,以便用户查看和理解。
如果传输数据、动环数据匹配度差,可以采用层次聚类进行数据匹配分析。层次聚类是一种将数据按照相似性进行分组的方法,可以将具有相似特征的数据归为一类。然后,可以使用聚类算法将具有相似特征的数据归为一类。
针对匹配度差的情况,可以采用文本生成技术,生成告警原因。使用文本生成技术生成告警原因时,可以将传输数据、动环数据作为输入序列,将告警原因作为输出序列,然后使用文本生成模型进行训练和预测。
故障根因定位模块用于基于得到的根因级别,根据根因和告警的相似度计算根因级别。
在故障根因定位时,故障根因定位模块用于基于根因警情相似度计算,得出一级根因故障和二级根因故障。具体执行如下操作:
(1)根因警情相似度计算。可以使用根因警情相似度计算方法,计算故障之间的相似度,根因警情相似度计算方法是一种将故障根因之间的相似度进行计算的方法,可以用于故障根因定位;
(2)一级根因故障和二级根因故障:根据聚类和根因警情相似度计算的结果,可以得出一级根因故障和二级根因故障,一级根因故障是指故障的根本原因,二级根因故障是指故障的次要原因。
上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。

Claims (10)

1.一种基于机器学习的无线网路设备故障根因定位方法,其特征在于,包括如下步骤:
数据采集:获取对无线网络设备故障根因定位需要的设备和拓扑关系数据,所述设备和拓扑关系数据包括设备信息、拓扑关系信息、设备运行数据和环境数据;
数据预处理:对获取的设备和拓扑关系数据进行数据预处理,通过数据预处理去除空值、异常值以及噪声,得到预处理后数据;
数据存储:将获取的设备日志数据和预处理后数据存储至分布式消息队列系统中;
告警分析:基于时间窗口和聚类算法将存储于分布式消息队列系统中的数据按照预定时间段内告警进行聚类处理,并使用关联规则挖掘算法将具有相同根因的告警归纳为能够涵盖告警内容的泛化预警,形成告警数据层级关系;
知识库构建:对告警数据进行特征提取和聚类分析,得到告警描述,并基于告警数据、通过可视化工具定位故障的根因,基于告警级别、告警描述和根因描述构建知识库;
故障根因预测:基于告警描述和根因描述构建样本数据,基于深度学习构建根因预测模型,所述根因预测模型用于基于告警描述预测输出根因级别,基于样本数据训练根因预测模型,通过训练后根因预测模型预测对新的告警描述进行根因预测,得到根因级别;
故障根因定位:基于得到的根因级别,根据根因和告警的相似度计算根因级别。
2.根据权利要求1所述的基于机器学习的无线网路设备故障根因定位方法,其特征在于,所述设备信息为从OMC获取的设备信息,包括设备型号、设备状态和设备配置,用于确定设备故障的类型和位置;
所述设备运行数据包括设备的运行状态、信号强度和数据传输速率,用于预测设备可能出现的故障,并提供故障诊断和定位的依据;
所述设备拓关系信息为从资源管理系统获取的信息,包括设备之间的连接关系、信号传输路径,用于确定设备故障的具体位置;
所述环境信息为从动环系统获取的机房环境数据,包括机房温度、湿度。
3.根据权利要求1所述的基于机器学习的无线网路设备故障根因定位方法,其特征在于,对获取的设备和拓扑关系数据进行数据预处理,包括如下步骤:
去除设备和拓扑关系数据中的异常值和空缺值;
对设备和拓扑关系数据进行归一化处理;
基于聚类方法将设备和拓扑关系数据中的噪声数据剔除;
基于回归方法对设备和拓扑关系数据中的噪声数据进行预测,并将预测的噪声数据剔除。
4.根据权利要求1所述的基于机器学习的无线网路设备故障根因定位方法,其特征在于,告警分析包括如下步骤:
按照时间窗口将存储于分布式消息队列系统中的数据划分为多个时间段的数据,每个时间段内的数据包括告警数据;
对于每个时间段内的告警数据,使用聚类算法对告警数据进行聚类处理;
通过Apriori算法发现告警数据之间的频繁项集和关联规则,将具有相同根因的告警数据归为一类,将关联规则作为泛化预警的内容,并将泛化预警作为告警数据的摘要;
采用层次聚类算法将告警数据按照不同的层次进行聚类。
5.根据权利要求1-4任一项所述的基于机器学习的无线网路设备故障根因定位方法,其特征在于,知识库构建包括如下步骤:
通过特征工程方法提取告警数据的关键特征,基于关键特征、使用聚类方法将相似的告警数据合并聚类,得到告警摘要,关键特征包括机房名称、网元名称和告警描述,所述告警摘要包括机房名称、网元名称、告警描述以及告警条数,其中,告警描述为告警的具体内容;
按照告警重要程度,将告警划分为多个级别;
基于告警数据、通过可视化工具进行故障根因定位,得到根因描述;
基于告警级别、告警描述和根因描述构建知识库。
6.根据权利要求5所述的基于机器学习的无线网路设备故障根因定位方法,其特征在于,根因故障预测包括如下步骤:
将根因划分为多个级别,并建立根因级别之间的层级关系;
基于seq2seq模型构建根因预测模型,所述根因预测模型用于以告警摘要为输入、预测输出根因级别;
对告警摘要和根因级别进行编码,以编码后的告警摘要和根因级别为训练样本,通过训练样本对根因预测模型进行模型训练,得到训练后根因预测模型;
对新的告警摘要进行编码,将编码后的告警摘要作为输入序列输入训练后根因预测模型,通过训练后根因预测模型输出新的告警摘要对应的根因级别;
并将新的告警摘要以及预测输出的根因级别加入训练样本,对根因预测模型进行训练。
7.一种基于机器学习的无线网络设备故障定位系统,其特征在于,用于通过如权利要求1-6任一项所述的基于机器学习的无线网路设备故障根因定位方法对无线网络设备的故障根因进行定位,所述系统包括:
数据采集模块,所述数据采集模块用于获取对无线网络设备故障根因定位需要的设备和拓扑关系数据,所述设备和拓扑关系数据包括设备信息、拓扑关系信息、设备运行数据和环境数据;
数据预处理模块,所述数据预处理模块用于对获取的设备和拓扑关系数据进行数据预处理,通过数据预处理去除空值、异常值以及噪声,得到预处理后数据;
数据存储模块,所述数据存储模块用于将获取的设备日志数据和预处理后数据存储至分布式消息队列系统中;
告警分析模块,所述告警分析模块用于基于时间窗口和聚类算法将存储于分布式消息队列系统中的数据按照预定时间段内告警进行聚类处理,并使用关联规则挖掘算法将具有相同根因的告警归纳为能够涵盖告警内容的泛化预警,形成告警数据层级关系;
知识库构建模块,所述知识库构建模块用于对告警数据进行特征提取和聚类分析,得到告警描述,并基于告警数据、通过可视化工具定位故障的根因,基于告警级别、告警描述和根因描述构建知识库;
故障根因预测模块,所述故障根因预测模块用于基于告警描述和根因描述构建样本数据,基于深度学习构建根因预测模型,所述根因预测模型用于基于告警描述预测输出根因级别,基于样本数据训练根因预测模型,通过训练后根因预测模型预测对新的告警描述进行根因预测,得到根因级别;
故障根因定位模块,所述故障根因定位模块用于基于得到的根因级别,根据根因和告警的相似度计算根因级别。
8.根据权利要求7所述的基于机器学习的无线网络设备故障定位系统,其特征在于,所述设备信息为从OMC获取的设备信息,包括设备型号、设备状态和设备配置,用于确定设备故障的类型和位置;
所述设备运行数据包括设备的运行状态、信号强度和数据传输速率,用于预测设备可能出现的故障,并提供故障诊断和定位的依据;
所述设备拓关系信息为从资源管理系统获取的信息,包括设备之间的连接关系、信号传输路径,用于确定设备故障的具体位置;
所述环境信息为从动环系统获取的机房环境数据,包括机房温度、湿度;
所述数据预处理模块用于执行如下对获取的设备和拓扑关系数据进行数据预处理
去除设备和拓扑关系数据中的异常值和空缺值;
对设备和拓扑关系数据进行归一化处理;
基于聚类方法将设备和拓扑关系数据中的噪声数据剔除;
基于回归方法对设备和拓扑关系数据中的噪声数据进行预测,并将预测的噪声数据剔除。
9.根据权利要求7所述的基于机器学习的无线网络设备故障定位系统,其特征在于,所述告警分析模块用于执行如下:
按照时间窗口将存储于分布式消息队列系统中的数据划分为多个时间段的数据,每个时间段内的数据包括告警数据;
对于每个时间段内的告警数据,使用聚类算法对告警数据进行聚类处理;
通过Apriori算法发现告警数据之间的频繁项集和关联规则,将具有相同根因的告警数据归为一类,将关联规则作为泛化预警的内容,并将泛化预警作为告警数据的摘要;
采用层次聚类算法将告警数据按照不同的层次进行聚类。
10.根据权利要求7-9任一项所述的基于机器学习的无线网络设备故障定位系统,其特征在于,所述知识库构建模块用于执行如下:
通过特征工程方法提取告警数据的关键特征,基于关键特征、使用聚类方法将相似的告警数据合并聚类,得到告警摘要,关键特征包括机房名称、网元名称和告警描述,所述告警摘要包括机房名称、网元名称、告警描述以及告警条数,其中,告警描述为告警的具体内容;
按照告警重要程度,将告警划分为多个级别;
基于告警数据、通过可视化工具进行故障根因定位,得到根因描述;
基于告警级别、告警描述和根因描述构建知识库;
所述根因故障预测模块用于执行如下:
将根因划分为多个级别,并建立根因级别之间的层级关系;
基于seq2seq模型构建根因预测模型,所述根因预测模型用于以告警摘要为输入、预测输出根因级别;
对告警摘要和根因级别进行编码,以编码后的告警摘要和根因级别为训练样本,通过训练样本对根因预测模型进行模型训练,得到训练后根因预测模型;
对新的告警摘要进行编码,将编码后的告警摘要作为输入序列输入训练后根因预测模型,通过训练后根因预测模型输出新的告警摘要对应的根因级别;
并将新的告警摘要以及预测输出的根因级别加入训练样本,对根因预测模型进行训练。
CN202310750489.3A 2023-06-25 2023-06-25 基于机器学习的无线网路设备故障根因定位方法及系统 Pending CN116708152A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310750489.3A CN116708152A (zh) 2023-06-25 2023-06-25 基于机器学习的无线网路设备故障根因定位方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310750489.3A CN116708152A (zh) 2023-06-25 2023-06-25 基于机器学习的无线网路设备故障根因定位方法及系统

Publications (1)

Publication Number Publication Date
CN116708152A true CN116708152A (zh) 2023-09-05

Family

ID=87843152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310750489.3A Pending CN116708152A (zh) 2023-06-25 2023-06-25 基于机器学习的无线网路设备故障根因定位方法及系统

Country Status (1)

Country Link
CN (1) CN116708152A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117609762A (zh) * 2023-11-22 2024-02-27 重庆杰友电气材料有限公司 基于智能燃气井的井盖预警监测方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117609762A (zh) * 2023-11-22 2024-02-27 重庆杰友电气材料有限公司 基于智能燃气井的井盖预警监测方法及系统

Similar Documents

Publication Publication Date Title
KR102483025B1 (ko) 운영 유지 시스템 및 방법
Capozzoli et al. Fault detection analysis using data mining techniques for a cluster of smart office buildings
CN108415789B (zh) 面向大规模混合异构存储系统的节点故障预测系统及方法
CN110287552B (zh) 基于改进随机森林算法的电机轴承故障诊断方法及系统
CN111475804A (zh) 一种告警预测方法及系统
US11409962B2 (en) System and method for automated insight curation and alerting
CN111858526B (zh) 基于信息系统日志的故障时间空间预测方法及系统
CN112183758A (zh) 用于实现模型训练的方法及装置、计算机存储介质
CN113935497A (zh) 智能运维故障处理方法、装置、设备及其存储介质
CN109992484B (zh) 一种网络告警相关性分析方法、装置和介质
CN116708152A (zh) 基于机器学习的无线网路设备故障根因定位方法及系统
CN114201374A (zh) 基于混合机器学习的运维时序数据异常检测方法及系统
CN112862233A (zh) 一种基于车联网数据的故障关联性分析系统及方法
CN116485020B (zh) 一种基于大数据的供应链风险识别预警方法、系统及介质
CN116932523B (zh) 一种整合和监管第三方环境检测机构的平台
JP2018503183A (ja) 神経言語挙動認識システム用の語彙解析器
CN112668733A (zh) 基于无监督学习的通信管理系统缺陷故障派单方法及装置
CN113313280A (zh) 云平台的巡检方法、电子设备及非易失性存储介质
CN117421994A (zh) 一种边缘应用健康度的监测方法和监测系统
CN115689320A (zh) 基站运行的健康管理方法、装置及计算机可读存储介质
CN117854693A (zh) 云计算驱动的医疗数据分析平台
CN116089218A (zh) 基于Kubernetes的历史数据和趋势分析的动态基线告警方法及系统
CN113593605B (zh) 一种基于深度神经网络的工业音频故障监测系统和方法
CN114416423A (zh) 一种基于机器学习的根因定位方法和系统
CN114020715A (zh) 一种日志数据的处理方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination