CN110198223A - 网络故障预测方法、装置及设备、存储介质 - Google Patents

网络故障预测方法、装置及设备、存储介质 Download PDF

Info

Publication number
CN110198223A
CN110198223A CN201810162150.0A CN201810162150A CN110198223A CN 110198223 A CN110198223 A CN 110198223A CN 201810162150 A CN201810162150 A CN 201810162150A CN 110198223 A CN110198223 A CN 110198223A
Authority
CN
China
Prior art keywords
failure
time
time window
characteristic
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810162150.0A
Other languages
English (en)
Other versions
CN110198223B (zh
Inventor
杜永生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201810162150.0A priority Critical patent/CN110198223B/zh
Publication of CN110198223A publication Critical patent/CN110198223A/zh
Application granted granted Critical
Publication of CN110198223B publication Critical patent/CN110198223B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开一种网络故障预测方法、装置及设备、计算机可读存储介质,该方法包括步骤:对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型;根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测。本发明通过定时检测的时间窗口以及预测模型对实时数据进行故障预测;可采取不同类型数据进行预测,提高预测准确性;解决故障的时间消耗对于用户服务质量的影响接近为零,降低了企业的运营消耗;对于不同故障或劣化,均可在其发生之前选取不同的时间节点进行预测,减少了系统的计算量、节省系统资源。

Description

网络故障预测方法、装置及设备、存储介质
技术领域
本发明涉及通信技术领域,尤其涉及一种网络故障预测方法、装置及设备、计算机可读存储介质。
背景技术
传统通信网络运维中关注的重点在于发现通信网络异常以及异常的原因,在发现通信网络异常之后,通过其他辅助的手段解决故障、恢复通信网络网络和设备的正常运行。但在解决通信网络故障中所花费的时间范围内,由于故障已经发生,此时所影响的最终用户的服务质量会变差,进而导致企业OPEX(Operational Expenditure,运营消耗)提高。
这种运维方式或降低用户的服务质量感受,或增加运维成本。如果能够将部分问题从事后排除故障转化为事前预测和提前维护,即在故障没有发生的时候进行预测,提前做好对应的解决。这样整个解决故障的时间消耗对于用户服务质量的影响就接近为零,从而减少企业内部的OPEX。
发明内容
有鉴于此,本发明实施例的目的在于提供一种网络故障预测方法、装置及设备、计算机可读存储介质,以解决在通信网络的故障还没有发生之前或者网络质量还没有劣化之前进行预测的问题。
本发明实施例解决上述技术问题所采用的技术方案如下:
根据本发明实施例的一个方面,提供的一种网络故障预测方法,所述方法包括:
对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型;
根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测。
根据本发明实施例的另一个方面,提供的一种网络故障预测装置,所述装置包括模型训练模块以及推理模块;
所述模型训练模块,用于对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型;
所述推理模块,用于根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测。
根据本发明实施例的另一个方面,提供的一种网络故障预测设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的故障预测程序,所述故障预测程序被所述处理器执行时实现上述的网络故障预测方法的步骤。
根据本发明实施例的另一个方面,提供的一种计算机可读存储介质,所述计算机可读存储介质上存储有故障预测程序,所述故障预测程序被处理器执行时实现上述的网络故障预测方法的步骤。
本发明实施例的网络故障预测方法、装置及设备、计算机可读存储介质,通过定时检测的时间窗口以及预测模型对实时数据进行故障预测;可采取不同类型数据进行预测,提高预测准确性;解决故障的时间消耗对于用户服务质量的影响接近为零,降低了企业的运营消耗;对于不同故障或劣化,均可在其发生之前选取不同的时间节点进行预测,减少了系统的计算量、节省系统资源。
附图说明
图1为本发明第一实施例的网络故障预测方法流程示意图;
图2为本发明第一实施例的网络故障预测方法另一流程示意图;
图3为本发明第二实施例的网络故障预测装置结构示意图;
图4为本发明第二实施例的网络故障预测装置另一结构示意图;
图5为本发明第二实施例的网络故障预测装置中模型训练模块结构示意图;
图6为本发明第三实施例的网络故障预测设备结构示意图;
图7为本发明实施例的实现KPI预警的系统结构示意图;
图8为本发明实施例的不同时间窗口预测结果示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
第一实施例
如图1所示,本发明第一实施例提供一种网络故障预测方法,该方法可用于通信网络运维设备当中,通信网络运维设备的类型在此不作限制。所述方法包括:
S11、对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型。
在本实施例中,固定时间窗口为具有运营意义(满足运营业务需求)的时间窗口,特征数据是具有时间维度、统一量纲的数据,数据选择整点数据,其发生的时间和故障发生的时间间隔可采取四舍五入的方式能等于满足有运营意义的几个固定时间窗口。例如:1小时、2小时、12小时、24小时、48小时的时间窗口。需要说明的是,固定时间窗口并限于例举情形。
在本实施例中,获得的预测模型相当于API(Application ProgrammingInterface,应用程序编程接口),通过该预测模型以及特征数据可对故障进行预测。
在本实施例中,所述对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口包括步骤(附图未示出):
对多个固定时间窗口的特征数据进行模型训练,获得模型训练结果;
根据所述模型训练结果,选择一组固定时间窗口,并将该组固定时间窗口中最小的固定时间窗口确定为所述定时检测的时间窗口。需要说明的是,选择的一组固定时间窗口包括多个固定时间窗口,具体地数量在此不作限制。
在本实施例中,模型训练可采用逻辑回归分类算法,例如:SVM(Support VectorMachine,支持向量机)、随机森林、XGBoost(eXtreme Gradient Boosting)等等。
请参考图8所示,作为示例地,对1、2、12、24、48小时的特征数据采取XGBoost算法进行模型训练(此处选择1、2、12、24、48小时,是因为1、2小时可以进行提前切换或者调整负荷进行修复,12、24、48小时可以协调资源去近端处理修复),发现12、24小时能同时满足业务需求,且预测成功率和漏报率比较接近,因此选择12、24小时,并将12小时作为后续定时检测的时间窗口。
请参考图2所示,在一种实施方式中,所述对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型之前还包括步骤:
S10、对所述特征数据进行预处理,获得预处理后的特征数据。
在该实施方式中,若固定时间窗口的数据不是具有时间维度、统一量纲的数据,可对固定时间窗口的数据进行预处理,形成具有时间维度、统一量纲的数据。
在该实施方式中,获得预处理后的特征数据之后,对预处理后的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型。
以通信网络为例,可采取配置、告警、KPI(Key Performance Indicator,关键绩效指标)、性能、信令、日志等不同类型的数据进行故障预测,但这些不同类型的数据需要进行预处理。
具体地,首先对不同类型的数据进行归一化、编码或者矢量化处理。例如:配置数据按照固定时间间隔进行抽样,其中数值型数据进行Z-score(零均值)归一化处理,分类数据进行哑编码处理,处理之后的配置数据C可如下所示:
其中,配置数据C的横向是时间维度,竖向是指不同的配置参数。
告警数据按照固定时间间隔进行抽样,由于只需要表明某一个告警发生的状态,所以对于某一个告警是否发生,取值1,0即可。KPI本身是基于时间的变量,只需要对分类型的数据进行哑编码,数值型数据进行归一化处理。对于信令和日志数据,进行关键数据提炼,并进行统计和抽样处理,抽样时间间隔保持一致。最终处理后的的数据以配置-c,性能-p,告警-a为例组成的矢量可如下所示:
之后,提取与故障发生相关的数据进行计算(例如:相关性计算或者降维计算),得到预处理后的特征数据。
S12、根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测。
在本实施例中,实时特征数据为通信网络运维过程中实时产生或者得到的特征数据。
请参考图2所示,在一种实施方式中,所述根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测之前还包括步骤:
S121、对所述定时检测的时间窗口的特征数据进行预判,若预判成功则执行所述根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测步骤。
在该实施方式中,可对占比最大的特征数据的阈值进行判断,以确定是否进行故障预测处理。
在该实施方式中,通过对定时检测的时间窗口的特征数据进行预判,可减少后续故障预测的计算量。
请再参考图2所示,在另一种实施方式中,所述根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测之后还包括步骤:
S122、故障预测的结果包括故障发生的时间间隔;若所述故障发生的时间间隔超过预设时间,则发出预警信息(图中的S1221所示);否则进行自动化运维动作(图中的S1222所示)。
在该实施方式中,发出的预警信息可包括故障预测值、故障发生的时间间隔、故障发生的概率等等,提醒用户进行提前维护。自动化运维动作可包含复位(例如调度资源恢复到初始状态)、补偿(例如调度资源降低影响,或者隔离故障的可能传播路径),通过这些动作降低通信网络故障发生的概率和影响。
为了更好地阐述本实施例,以下对小区故障预测的实现过程和单板预维过程进行说明:
1、小区故障预测的实现过程
a)、选择特征和扩展特征。这里选择小区位置,小区配置参数、单板生产日期、E_RAB掉线率、切换失败率、丢包率、上下行PRB平均利用率作为初始特征。然后进行特征扩展:小区位置扩展人口密度,区域最高负荷,所处场景;单板生产日期扩展为生产间隔,最近一次故障间隔,单板类型;丢包率可扩展最高丢包率,平均丢包率等。
b)、对上述特征数据进行预处理,首先进行矢量化处理、归一化处理以及编码处理(例如小区场景定义,单板类型)。例如对小区配置参数中的不同频率进行二进制编码确定不同类型,小区功率Z-score归一化,对告警按照0、1处理,对于性能数据也是按照以上原则进行归一化和分类处理。最后进行抽样,抽样间隔选择15分钟。把所有数据形成一个矢量和最终结果进行相关性统计,选择相关性较好的特征和所有特征降维结果进行比较,取并集。
c)、对1、2、12、24、48小时的特征数据采取XGBoost算法进行模型训练,发现12、24小时能同时满足业务需求,且预测成功率和漏报率比较接近,因此选择12、24小时,并将12小时作为后续定时检测的时间窗口。
d)、对于12小时的数据进行主成分分析,发现单板生产时间间隔、丢包率占比相关性大,则对这两个属性设置规则进行预判。后续接入实时数据,每间隔12小时对于实时数据预测成功率和漏报率进行检测,在满足单板时间间隔和丢包率的阈值的情况下,采用训练模型对于小区故障进行预测。
e)、如果预测小区异常,因为时间间隔为12小时,优先采取发出预警处理,预警中包含提示,其12小时后可能会发生故障,提示用户进行处理,自动处理可等用户确认后进行。
2、单板预维的实现过程
a)、根据预先确定的时间窗口T,实时获取单板的各项数据阈值,定时对预测单板质量进行任务安排,不同的单板有不同的预测固定时间窗口。
b)、根据实时数据,例如更换日期,厂商,误码率等,采取模型训练得到的预测模型,预测单板是否可能发生故障。
c)、发出预测故障通知。可分别进行补偿、隔离、预警处理,预测时间间隔较长则优先进行预警处理,预测时间间隔较短,则优先进行补偿处理。
d)、运维人员在收到预警信息之后,包含预警的单板位置、可能发生故障的时间、可能发生故障的时间等等,安排车辆上站更换单板,系统间断时间理论上接近为0。
本发明实施例的网络故障预测方法,通过定时检测的时间窗口以及预测模型对实时数据进行故障预测;可采取不同类型数据进行预测,提高预测准确性;解决故障的时间消耗对于用户服务质量的影响接近为零,降低了企业的运营消耗;对于不同故障或劣化,均可在其发生之前选取不同的时间节点进行预测,减少了系统的计算量、节省系统资源。
第二实施例
如图3所示,本发明第二实施例提供一种网络故障预测装置,所述装置包括模型训练模块以及推理模块;
所述模型训练模块21,用于对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型。
在本实施例中,固定时间窗口为具有运营意义(满足运营业务需求)的时间窗口,特征数据是具有时间维度、统一量纲的数据,数据选择整点数据,其发生的时间和故障发生的时间间隔可采取四舍五入的方式能等于满足有运营意义的几个固定时间窗口。例如:1小时、2小时、12小时、24小时、48小时的时间窗口。需要说明的是,固定时间窗口并限于例举情形。
在本实施例中,获得的预测模型相当于API(Application ProgrammingInterface,应用程序编程接口),通过该预测模型以及特征数据可对故障进行预测。
请参考图5所示,在本实施例中,所述模型训练模块包括模型训练单元211和选择单元212;
所述模型训练单元211,用于对多个固定时间窗口的特征数据进行模型训练,获得模型训练结果;
所述选择单元212,用于根据所述模型训练结果,选择一组固定时间窗口,并将该组固定时间窗口中最小的固定时间窗口确定为所述定时检测的时间窗口。需要说明的是,选择的一组固定时间窗口包括多个固定时间窗口,具体地数量在此不作限制。
在本实施例中,模型训练可采用逻辑回归分类算法,例如:SVM(Support VectorMachine,支持向量机)、随机森林、XGBoost(eXtreme Gradient Boosting)等等。
请参考图8所示,作为示例地,对1、2、12、24、48小时的特征数据采取XGBoost算法进行模型训练(此处选择1、2、12、24、48小时,是因为1、2小时可以进行提前切换或者调整负荷进行修复,12、24、48小时可以协调资源去近端处理修复),发现12、24小时能同时满足业务需求,且预测成功率和漏报率比较接近,因此选择12、24小时,并将12小时作为后续定时检测的时间窗口。
请参考图4所示,在一种实施方式中,所述装置还包括预处理模块23;
所述预处理模块23,用于对所述特征数据进行预处理,获得预处理后的特征数据。
在该实施方式中,若固定时间窗口的数据不是具有时间维度、统一量纲的数据,所述预处理模块23可对固定时间窗口的数据进行预处理,形成具有时间维度、统一量纲的数据。
在该实施方式中,获得预处理后的特征数据之后,对预处理后的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型。
以通信网络为例,可采取配置、告警、KPI(Key Performance Indicator,关键绩效指标)、性能、信令、日志等不同类型的数据进行故障预测,但这些不同类型的数据需要进行预处理。
具体地,首先对不同类型的数据进行归一化、编码或者矢量化处理。例如:配置数据按照固定时间间隔进行抽样,其中数值型数据进行Z-score(零均值)归一化处理,分类数据进行哑编码处理,处理之后的配置数据C可如下所示:
其中,此配置数据C的横向是时间维度,竖向是指不同的配置参数。
告警数据按照固定时间间隔进行抽样,由于只需要表明某一个告警发生的状态,所以对于某一个告警是否发生,取值1,0即可。KPI本身是基于时间的变量,只需要对分类型的数据进行哑编码,数值型数据进行归一化处理。对于信令和日志数据,进行关键数据提炼,并进行统计和抽样处理,抽样时间间隔保持一致。最终处理后的的数据以配置-c,性能-p,告警-a为例组成的矢量可如下所示:
之后,提取与故障发生相关的数据进行计算(例如:相关性计算或者降维计算),得到预处理后的特征数据。
所述推理模块22,用于根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测。
在本实施例中,实时特征数据为通信网络运维过程中实时产生或者得到的特征数据。
请参考图4所示,在一种实施方式中,所述装置还包括预判模块24;
所述预判模块24,用于对所述定时检测的时间窗口的特征数据进行预判,若预判成功则所述推理模块根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测。
在该实施方式中,可对占比最大的特征数据的阈值进行判断,以确定是否进行故障预测处理。
在该实施方式中,通过对定时检测的时间窗口的特征数据进行预判,可减少后续故障预测的计算量。
请再参考图4所示,在另一种实施方式中,所述装置还包括故障处理模块25;
所述推理模块的故障预测的结果包括故障发生的时间间隔;
所述故障处理模块25,用于若所述故障发生的时间间隔超过预设时间,则发出预警信息;否则执行自动化运维动作。
在该实施方式中,发出的预警信息可包括故障预测值、故障发生的时间间隔、故障发生的概率等等,提醒用户进行提前维护。自动化运维的动作可包含复位(例如调度资源恢复到初始状态)、补偿(例如调度资源降低影响,或者隔离故障的可能传播路径),通过这些动作降低通信网络故障发生的概率和影响。
为了更好地阐述本实施例,以下结合图7对实现KPI预警的过程以及系统进行说明:
如图7所示,实现KPI预警的系统包括历史数据231、实时数据221、预处理模块23、模型训练模块21、推理模块22、定时预测管理模块222、预警模块251、补偿模块252以及隔离模块253。
实现KPI预警需要对历史数据231进行预处理,预处理模块23从历史数据中抽取矢量数据,通过归一化和编码拉齐不同数据的量纲,然后通过相关性抽取不同预警问题的特征向量。
模型训练模块21对抽取的特征向量进行模型训练,获得时间窗口以及预测模型。
将获得的时间窗口以及预测模型注入到推理模块22中,在推理模块22中对实时数据221进行推理,预测在时间窗口中是否会发生故障。
对于即将发生的故障,可以通过补偿模块252进行预先补偿,例如在后续的运行中不断添加新的信道资源来弥补覆盖质量;其次也可以通过隔离模块253,避免故障发生;最后也可以通过预警模块251进行展示,告知用户提前维护。
而何时进行预测,什么条件下触发预测,则由定时预测管理模块222获取模型训练模块21的训练结果,通过选择合适的时间窗口,对占比最大的条件阈值进行判断,以决定是否进行预测处理。
本发明实施例的网络故障预测装置,通过定时检测的时间窗口以及预测模型对实时数据进行故障预测;可采取不同类型数据进行预测,提高预测准确性;解决故障的时间消耗对于用户服务质量的影响接近为零,降低了企业的运营消耗;对于不同故障或劣化,均可在其发生之前选取不同的时间节点进行预测,减少了系统的计算量、节省系统资源。
第三实施例
如图6所示,本发明第三实施例提供一种网络故障预测设备,所述设备包括:存储器31、处理器32及存储在所述存储器31上并可在所述处理器32上运行的故障预测程序,所述故障预测程序被所述处理器32执行时,用于实现以下所述的网络故障预测方法的步骤:
对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型;
根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测。
所述故障预测程序被所述处理器32执行时,还用于实现以下所述的网络故障预测方法的步骤:
对多个固定时间窗口的特征数据进行模型训练,获得模型训练结果;
根据所述模型训练结果,选择一组固定时间窗口,并将该组固定时间窗口中最小的固定时间窗口确定为所述定时检测的时间窗口。
所述故障预测程序被所述处理器32执行时,还用于实现以下所述的网络故障预测方法的步骤:
对所述特征数据进行预处理,获得预处理后的特征数据。
所述故障预测程序被所述处理器32执行时,还用于实现以下所述的网络故障预测方法的步骤:
对所述定时检测的时间窗口的特征数据进行预判,若预判成功则执行所述根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测步骤。
所述故障预测程序被所述处理器32执行时,还用于实现以下所述的网络故障预测方法的步骤:
故障预测的结果包括故障发生的时间间隔;若所述故障发生的时间间隔超过预设时间,则发出预警信息;否则进行自动化运维动作。
本发明实施例的网络故障预测设备,通过定时检测的时间窗口以及预测模型对实时数据进行故障预测;可采取不同类型数据进行预测,提高预测准确性;解决故障的时间消耗对于用户服务质量的影响接近为零,降低了企业的运营消耗;对于不同故障或劣化,均可在其发生之前选取不同的时间节点进行预测,减少了系统的计算量、节省系统资源。
第四实施例
本发明第四实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有故障预测程序,所述故障预测程序被处理器执行时用于实现第一实施例所述的网络故障预测方法的步骤。
本发明实施例的计算机可读存储介质,通过定时检测的时间窗口以及预测模型对实时数据进行故障预测;可采取不同类型数据进行预测,提高预测准确性;解决故障的时间消耗对于用户服务质量的影响接近为零,降低了企业的运营消耗;对于不同故障或劣化,均可在其发生之前选取不同的时间节点进行预测,减少了系统的计算量、节省系统资源。
需要说明的是,上述装置实施例与方法实施例属于同一构思,其具体实现过程详见方法实施例,且方法实施例中的技术特征在装置实施例中均对应适用,这里不再赘述。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件来实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上参照附图说明了本发明的优选实施例,并非因此局限本发明的权利范围。本领域技术人员不脱离本发明的范围和实质,可以有多种变型方案实现本发明,比如作为一个实施例的特征可用于另一实施例而得到又一实施例。凡在运用本发明的技术构思之内所作的任何修改、等同替换和改进,均应在本发明的权利范围之内。

Claims (10)

1.一种网络故障预测方法,其特征在于,所述方法包括:
对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型;
根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测。
2.根据权利要求1所述的方法,其特征在于,所述对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口包括步骤:
对多个固定时间窗口的特征数据进行模型训练,获得模型训练结果;
根据所述模型训练结果,选择一组固定时间窗口,并将该组固定时间窗口中最小的固定时间窗口确定为所述定时检测的时间窗口。
3.根据权利要求1或2所述的方法,其特征在于,所述对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型之前还包括步骤:
对所述特征数据进行预处理,获得预处理后的特征数据。
4.根据权利要求1或2所述的方法,其特征在于,所述根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测之前还包括步骤:
对所述定时检测的时间窗口的特征数据进行预判,若预判成功则执行所述根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测步骤。
5.根据权利要求1或2所述的方法,其特征在于,所述根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测之后还包括:
故障预测的结果包括故障发生的时间间隔;若所述故障发生的时间间隔超过预设时间,则发出预警信息;否则进行自动化运维动作。
6.一种网络故障预测装置,其特征在于,所述装置包括模型训练模块以及推理模块;
所述模型训练模块,用于对多个固定时间窗口的特征数据进行模型训练,获得定时检测的时间窗口以及预测模型;
所述推理模块,用于根据所述定时检测的时间窗口和所述预测模型,对实时特征数据进行故障预测。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括预处理模块;
所述预处理模块,用于对所述特征数据进行预处理,获得预处理后的特征数据。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括故障处理模块;
所述推理模块的故障预测的结果包括故障发生的时间间隔;
所述故障处理模块,用于若所述故障发生的时间间隔超过预设时间,则发出预警信息;否则进行自动化运维动作。
9.一种网络故障预测设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的故障预测程序,所述故障预测程序被所述处理器执行时实现如权利要求1至5中任一项所述的网络故障预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有故障预测程序,所述故障预测程序被处理器执行时实现如权利要求1至5中任一项所述的网络故障预测方法的步骤。
CN201810162150.0A 2018-02-27 2018-02-27 网络故障预测方法、装置及设备、存储介质 Active CN110198223B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810162150.0A CN110198223B (zh) 2018-02-27 2018-02-27 网络故障预测方法、装置及设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810162150.0A CN110198223B (zh) 2018-02-27 2018-02-27 网络故障预测方法、装置及设备、存储介质

Publications (2)

Publication Number Publication Date
CN110198223A true CN110198223A (zh) 2019-09-03
CN110198223B CN110198223B (zh) 2022-01-28

Family

ID=67750832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810162150.0A Active CN110198223B (zh) 2018-02-27 2018-02-27 网络故障预测方法、装置及设备、存储介质

Country Status (1)

Country Link
CN (1) CN110198223B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027591A (zh) * 2019-11-13 2020-04-17 西安交通大学 一种面向大规模集群系统的节点故障预测方法
CN111865407A (zh) * 2020-06-11 2020-10-30 烽火通信科技股份有限公司 光通道性能劣化智能预警方法、装置、设备及存储介质
CN111858526A (zh) * 2020-06-19 2020-10-30 国网福建省电力有限公司信息通信分公司 基于信息系统日志的故障时间空间预测方法及系统
CN111953533A (zh) * 2020-07-30 2020-11-17 腾讯科技(深圳)有限公司 目标网络节点的工作时长调控方法、装置、设备及存储介质
CN112485597A (zh) * 2020-12-01 2021-03-12 国家电网公司华中分部 基于多源数据的电力系统输电线路故障诊断方法及系统
CN113672467A (zh) * 2021-08-24 2021-11-19 中国电信股份有限公司 运维预警方法及装置、电子设备、存储介质
CN114827951A (zh) * 2022-04-24 2022-07-29 重庆长安汽车股份有限公司 一种基于车辆终端的车辆网络质量分析方法、系统及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129397A (zh) * 2010-12-29 2011-07-20 深圳市永达电子股份有限公司 一种自适应磁盘阵列故障预测方法及系统
GB2494778A (en) * 2011-09-19 2013-03-20 Fisher Rosemount Systems Inc Inferential Process Modelling, Quality Prediction And Fault Detection Using Multi-Stage Data Segregation
CN104573740A (zh) * 2014-12-22 2015-04-29 山东鲁能软件技术有限公司 一种基于svm分类模型的设备故障诊断方法
CN104866679A (zh) * 2015-06-01 2015-08-26 西安交通大学 一种开关设备的机械特性预测方法
CN105512799A (zh) * 2015-11-26 2016-04-20 中国电力科学研究院 一种基于海量在线历史数据的电力系统暂态稳定评估方法
CN105589800A (zh) * 2015-12-25 2016-05-18 中国银联股份有限公司 预测复杂系统故障的应用系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129397A (zh) * 2010-12-29 2011-07-20 深圳市永达电子股份有限公司 一种自适应磁盘阵列故障预测方法及系统
GB2494778A (en) * 2011-09-19 2013-03-20 Fisher Rosemount Systems Inc Inferential Process Modelling, Quality Prediction And Fault Detection Using Multi-Stage Data Segregation
CN104573740A (zh) * 2014-12-22 2015-04-29 山东鲁能软件技术有限公司 一种基于svm分类模型的设备故障诊断方法
CN104866679A (zh) * 2015-06-01 2015-08-26 西安交通大学 一种开关设备的机械特性预测方法
CN105512799A (zh) * 2015-11-26 2016-04-20 中国电力科学研究院 一种基于海量在线历史数据的电力系统暂态稳定评估方法
CN105589800A (zh) * 2015-12-25 2016-05-18 中国银联股份有限公司 预测复杂系统故障的应用系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
姚东: "基于流的大规模网络安全态势感知关键技术研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027591A (zh) * 2019-11-13 2020-04-17 西安交通大学 一种面向大规模集群系统的节点故障预测方法
CN111027591B (zh) * 2019-11-13 2022-07-12 西安交通大学 一种面向大规模集群系统的节点故障预测方法
CN111865407A (zh) * 2020-06-11 2020-10-30 烽火通信科技股份有限公司 光通道性能劣化智能预警方法、装置、设备及存储介质
CN111858526A (zh) * 2020-06-19 2020-10-30 国网福建省电力有限公司信息通信分公司 基于信息系统日志的故障时间空间预测方法及系统
CN111858526B (zh) * 2020-06-19 2022-08-16 国网福建省电力有限公司信息通信分公司 基于信息系统日志的故障时间空间预测方法及系统
CN111953533A (zh) * 2020-07-30 2020-11-17 腾讯科技(深圳)有限公司 目标网络节点的工作时长调控方法、装置、设备及存储介质
CN111953533B (zh) * 2020-07-30 2021-06-15 腾讯科技(深圳)有限公司 目标网络节点的工作时长调控方法、装置、设备及存储介质
CN112485597A (zh) * 2020-12-01 2021-03-12 国家电网公司华中分部 基于多源数据的电力系统输电线路故障诊断方法及系统
CN113672467A (zh) * 2021-08-24 2021-11-19 中国电信股份有限公司 运维预警方法及装置、电子设备、存储介质
CN114827951A (zh) * 2022-04-24 2022-07-29 重庆长安汽车股份有限公司 一种基于车辆终端的车辆网络质量分析方法、系统及存储介质

Also Published As

Publication number Publication date
CN110198223B (zh) 2022-01-28

Similar Documents

Publication Publication Date Title
CN110198223A (zh) 网络故障预测方法、装置及设备、存储介质
KR101984730B1 (ko) 서버 장애 자동 예측 시스템 및 자동 예측 방법
WO2019237118A1 (en) Business-aware intelligent incident and change management
Muller Fuzzy architecture assessment for critical infrastructure resilience
CN111309565B (zh) 告警处理方法、装置、电子设备以及计算机可读存储介质
CN110891283A (zh) 一种基于边缘计算模型的小基站监控装置及方法
US11586981B2 (en) Failure analysis device, failure analysis method, and failure analysis program
US11595288B2 (en) Predicting and resolving issues within a telecommunication network
CN105917625A (zh) 使用附加数据的检测到的网络异常的分类
US11368358B2 (en) Automated machine-learning-based ticket resolution for system recovery
CN115529595A (zh) 一种日志数据的异常检测方法、装置、设备及介质
CN115733762A (zh) 具有大数据分析能力的监控系统
Mahmoud et al. A review of machine learning use-cases in telecommunication industry in the 5G Era
CN110830504A (zh) 一种网络入侵行为检测方法及系统
CN108039971A (zh) 一种告警方法及装置
CN110647086B (zh) 一种基于运行大数据分析的智能运维监控系统
CN115016976B (zh) 一种根因定位方法、装置、设备及存储介质
GB2465860A (en) A directed graph behaviour model for monitoring a computer system in which each node of the graph represents an event generated by an application
US11922357B2 (en) System and method for identifying and handling data quality anomalies
US20220210682A1 (en) SYSTEM AND METHOD FOR ARTIFICIAL INTELLIGENCE (AI) DRIVEN VOICE OVER LONG-TERM EVOLUTION (VoLTE) ANALYTICS
CN110457367B (zh) 发现数据异动的方法和系统
EP3836599B1 (en) Method for detecting permanent failures in mobile telecommunication networks
Corazza et al. A machine learning approach for predictive maintenance for mobile phones service providers
US20230179616A1 (en) Systems and methods of network security anomaly detection
CN115134221B (zh) 终端的质差识别方法及装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant