CN111124840A - 业务运维中告警的预测方法、装置与电子设备 - Google Patents

业务运维中告警的预测方法、装置与电子设备 Download PDF

Info

Publication number
CN111124840A
CN111124840A CN201911215004.0A CN201911215004A CN111124840A CN 111124840 A CN111124840 A CN 111124840A CN 201911215004 A CN201911215004 A CN 201911215004A CN 111124840 A CN111124840 A CN 111124840A
Authority
CN
China
Prior art keywords
alarm
network element
prediction
hidden markov
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911215004.0A
Other languages
English (en)
Other versions
CN111124840B (zh
Inventor
徐键
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tianyuan Innovation Technology Co ltd
Original Assignee
Beijing Tianyuan Innovation Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tianyuan Innovation Technology Co ltd filed Critical Beijing Tianyuan Innovation Technology Co ltd
Priority to CN201911215004.0A priority Critical patent/CN111124840B/zh
Publication of CN111124840A publication Critical patent/CN111124840A/zh
Priority to PCT/CN2020/101818 priority patent/WO2021109578A1/zh
Application granted granted Critical
Publication of CN111124840B publication Critical patent/CN111124840B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例提供一种业务运维中告警的预测方法、装置与电子设备,其中所述方法包括:获取当前告警周期之前目标网元对象给定数量的历史告警数据,构成历史告警序列;基于所述历史告警序列,利用训练好的隐马尔科夫预测模型,对所述目标网元对象进行告警预测;其中,所述训练好的隐马尔科夫预测模型为预先通过分析故障管理系统中网元对象、网元故障和网元告警的关系信息进行初始化构建,并利用根据所述关系信息选取的原始数据样本进行训练获取的。本发明实施例能够有效提高业务运维中告警预测的准确性,从而有效避免故障或减小故障发生带来的影响。

Description

业务运维中告警的预测方法、装置与电子设备
技术领域
本发明涉及IT运维技术领域,更具体地,涉及一种业务运维中告警的预测方法、装置与电子设备。
背景技术
在IT运维领域,一个完善的运维体系中都包含具有故障管理能力的系统,通常称为故障管理系统。传统的故障管理系统一般具备设备告警监控、业务指标监控、响应故障和定位故障等功能。
传统故障管理系统关于设备告警监控,都是“后知后觉”的。即,相关的采集工具获取到数据后,发现数据触发了相应的规则才产生告警并审核派单。通常从发现告警到派单的过程越短,相应告警产生的影响就会越小,运维人员解决问题的时间窗口就越宽裕。因此,如果能够准确地提前预测到设备告警,就可以提前做好相应的规避措施,从而避免相关故障的产生或者减少相关故障产生时带来的影响。
目前,关于设备告警预测,相关学者和研究人员提出了基于人工智能的分析方法。例如,先采用机器学习和人工智能算法对数据进行聚类分析,提取设备或服务告警的规律信息,再采用相似性度量方式预测告警的发生。但是,由于该方法仅仅是对现有告警数据的规律性总结,并不能真正体现设备状态,导致对具体设备的告警预测准确性不高。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种业务运维中告警的预测方法、装置与电子设备,用以有效提高业务运维中告警预测的准确性,从而有效避免故障或减小故障发生带来的影响。
第一方面,本发明实施例提供一种业务运维中告警的预测方法,包括:
获取当前告警周期之前目标网元对象给定数量的历史告警数据,构成历史告警序列;
基于所述历史告警序列,利用训练好的隐马尔科夫预测模型,对所述目标网元对象进行告警预测;
其中,所述训练好的隐马尔科夫预测模型为预先通过分析故障管理系统中网元对象、网元故障和网元告警的关系信息进行初始化构建,并利用根据所述关系信息选取的原始数据样本进行训练获取的。
进一步的,在所述利用训练好的隐马尔科夫预测模型,对所述目标网元对象进行告警预测的步骤之前,本发明实施例的业务运维中告警的预测方法还包括:
通过分析故障管理系统中网元对象、网元故障和网元告警间的关系信息,初始化构建基于监督学习的隐马尔科夫初始模型,并根据所述关系信息,选取故障管理系统中相应的历史告警数据,构成训练样本集;
利用所述训练样本集中的各样本数据,采用极大似然估计法,迭代训练所述隐马尔科夫初始模型,获取满足设定标准的预测模型,作为所述训练好的隐马尔科夫预测模型。
其中可选的,所述选取故障管理系统中相应的历史告警数据,构成训练样本集的步骤具体包括:
结合运维知识,通过分析故障管理系统中网元对象、网元故障和网元告警的因果关系,选取第二给定数量的历史告警数据,所述历史告警数据中包括所述网元对象与所述网元告警一对一的对应关系;
对所述历史告警数据根据时序性和缺失值进行预处理,并对预处理结果进行编码,得到样本数据;
根据所有所述样本数据,构成所述训练样本集。
进一步的,在所述迭代训练所述隐马尔科夫初始模型的步骤之前,本发明实施例的业务运维中告警的预测方法还包括:
不断调整所述训练样本集中所述样本数据的数量,并对所述训练样本集进行划分,产生多个子训练样本集;
对产生的所有所述子训练样本集,按照固定比例划分出训练集和测试集。
其中可选的,所述迭代训练所述隐马尔科夫初始模型的步骤具体包括:
利用各所述子训练样本集中的训练集,分别采用极大似然估计法,迭代训练所述隐马尔科夫初始模型,对应获取多个候选预测模型;
利用所述子训练样本集中的测试集,对应验证各所述候选预测模型是否满足所述设定标准,选取满足所述设定标准的预测模型,作为所述训练好的隐马尔科夫预测模型;
其中,所述设定标准为利用所述测试集验证的预测结果的准确率为最高。
其中可选的,所述利用训练好的隐马尔科夫预测模型,对所述目标网元对象进行告警预测的步骤具体包括:从所有网元对象产生的告警集合中选取多个不同类别的告警,并基于所述历史告警序列和选取的各所述告警,利用所述训练好的隐马尔科夫预测模型分别进行前向计算,获取选取的各所述告警分别对应的概率,并基于所述概率,确定所述目标网元对象的告警预测结果。
其中可选的,所述基于所述概率,确定所述目标网元对象的告警预测结果的步骤具体包括:根据所述概率的大小,对所有所述概率进行排序,并根据排序结果获取取值最大者对应的告警,作为所述目标网元对象的下一预测周期的告警。
第二方面,本发明实施例提供一种业务运维中告警的预测装置,包括:
数据获取模块,用于获取当前告警周期之前目标网元对象给定数量的历史告警数据,构成历史告警序列;
预测输出模块,用于基于所述历史告警序列,利用训练好的隐马尔科夫预测模型,对所述目标网元对象进行告警预测;
其中,所述训练好的隐马尔科夫预测模型为预先通过分析故障管理系统中网元对象、网元故障和网元告警的关系信息进行初始化构建,并利用根据所述关系信息选取的原始数据样本进行训练获取的。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上第一方面所述的业务运维中告警的预测方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机指令,所述计算机指令被计算机执行时,实现如上第一方面所述的业务运维中告警的预测方法的步骤。
本发明实施例提供的业务运维中告警的预测方法、装置与电子设备,通过对故障管理系统中网元对象、故障和告警的关系的分析,并结合隐马尔科夫预测模型,对根据网元对象历史告警构建的目标序列进行运算处理,最终实现对网元对象的告警预测,能够有效提高业务运维中告警预测的准确性,从而有效避免故障或减小故障发生带来的影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的业务运维中告警的预测方法的流程示意图;
图2为本发明实施例提供的业务运维中告警的预测方法的执行原理示意图;
图3为本发明实施例提供的业务运维中告警的预测装置的结构示意图;
图4为本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明实施例的一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明实施例保护的范围。
针对运维过程中告警预测问题,即,若能较为准确地知道一些重要的告警在未来很短的一段时间内发生,就可以提前采取措施避免或减少相应的影响,本发明实施例提出了一种基于监督学习的隐马尔科夫告警预测方法,该方法采用离线的监督学习的方式产生预测模型,利用模型较为准确地预测下一个预测周期最可能产生的告警,从而提升运维的自动化和智能化。
也就是说,本发明实施例针对现有技术中对业务运维中告警预测准确性较差的问题,通过对故障管理系统中网元对象、故障和告警的关系的分析,并结合隐马尔科夫预测模型,对根据网元对象历史告警构建的目标序列进行运算处理,最终实现对网元对象的告警预测,能够有效提高业务运维中告警预测的准确性,从而有效避免故障或减小故障发生带来的影响。以下将具体通过多个实施例对本发明实施例进行展开说明和介绍。
图1为本发明实施例提供的业务运维中告警的预测方法的流程示意图,如图1所示,该方法包括:
S101,获取当前告警周期之前目标网元对象给定数量的历史告警数据,构成历史告警序列。
可以理解为,本发明实施例根据网元对象的历史告警数据,来对网元对象下一个告警周期的告警进行预测。因此,本发明实施例首先根据故障管理系统的历史记录数据,获取到目标网元对象在当前告警周期之前已经发出的告警,即历史告警数据。可以理解的是,为了避免偶然性带来的误差,兼顾隐马尔科夫预测模型的特性,选取的该历史告警数据的数量要达到一定的量,该一定的量可以通过实现设定得到。之后,可将这些历史告警数据按一定的时序性进行处理并编码,构成一数据序列,即为历史告警序列。
S102,基于历史告警序列,利用训练好的隐马尔科夫预测模型,对目标网元对象进行告警预测。其中,训练好的隐马尔科夫预测模型为预先通过分析故障管理系统中网元对象、网元故障和网元告警的关系信息进行初始化构建,并利用根据关系信息选取的原始数据样本进行训练获取的。
可以理解为,在得到目标网友对象的历史告警序列的基础上,可将其输入到预先训练好的隐马尔科夫预测模型中,通过该预测模型的前向计算,得到对目标网元对象下一个或多个告警周期的告警的预测结果。
可以理解的是,在对预测模型进行应用之前,需要采用一定的模型建立方法事先对模型进行建立。具体而言,可以先对故障管理系统中网元对象、故障和告警的关系进行分析,并基于此初始化构建出一隐马尔科夫初始模型。之后,根据上述分析的结果,选取出相应的原始告警数据,再对这些原始告警数据进行处理后,训练构建出的隐马尔科夫初始模型,最终得到训练好的隐马尔科夫预测模型,可用于网元对象的告警预测。
本发明实施例提供的业务运维中告警的预测方法,通过对故障管理系统中网元对象、故障和告警的关系的分析,并结合隐马尔科夫预测模型,对根据网元对象历史告警构建的目标序列进行运算处理,最终实现对网元对象的告警预测,能够有效提高业务运维中告警预测的准确性,从而有效避免故障或减小故障发生带来的影响。
进一步的,在上述各实施例的基础上,在利用训练好的隐马尔科夫预测模型,对目标网元对象进行告警预测的步骤之前,本发明实施例的业务运维中告警的预测方法还包括:
通过分析故障管理系统中网元对象、网元故障和网元告警间的关系信息,初始化构建基于监督学习的隐马尔科夫初始模型,并根据关系信息,选取故障管理系统中相应的历史告警数据,构成训练样本集;利用训练样本集中的各样本数据,采用极大似然估计法,迭代训练隐马尔科夫初始模型,获取满足设定标准的预测模型,作为训练好的隐马尔科夫预测模型。
可以理解为,在对预测模型进行应用之前,本发明实施例还采用一定的模型建立方法事先对模型进行建立。具体而言,首先根据故障管理系统的历史记录信息,获取故障管理系统中的网元对象,并获取各网元对象产生的故障数据和对应形成的告警数据。之后,对这些网元对象、故障和告警的关系进行综合分析,并在此基础上初始化构建出一基于监督学习的隐马尔科夫初始模型。同时,当然也可以在之前或之后,根据上述分析的结果,也即关系信息,从故障管理系统中选取一定量相应的历史告警数据,对应形成多个训练样本数据,并基于此构成初始预测模型的训练样本集。
然后,通过从上述训练样本集中逐个选取各样本数据,对初始化构建的隐马尔科夫初始模型采用极大似然估计法进行迭代训练,并在每轮训练过程中对模型的预测结果进行测试,最终得到满足设定标准的预测模型,即作为训练好的隐马尔科夫预测模型。
其中,根据上述各实施例可选的,选取故障管理系统中相应的历史告警数据,构成训练样本集的步骤具体包括:结合运维知识,通过分析故障管理系统中网元对象、网元故障和网元告警的因果关系,选取第二给定数量的历史告警数据,历史告警数据中包括网元对象与网元告警一对一的对应关系;对历史告警数据根据时序性和缺失值进行预处理,并对预处理结果进行编码,得到样本数据;根据所有样本数据,构成训练样本集。
可以理解为,本发明实施例实现对模型的训练样本集的构建。具体而言,首先结合运维知识,对故障管理系统历史记录信息中网元对象及网元对象产生的网元故障和网元告警的因果关系进行分析,并根据分析结果选取出给定数量的历史告警数据。其中,该历史告警数据表示为网元对象与其产生的告警信息之间的一对一的对应关系。例如,某历史时刻,某网元对象si产生了告警信息oi,则根据其选取的历史告警数据可表示为(oi,si)。
之后,对选取出的历史告警数据进行预处理,包括按时序进行处理以及对缺失值的等效补充等,再对预处理的结果进行编码处理,得到对应的编码结果作为样本数据。最后,根据这些样本数据构建一样本集合,即为训练样本集。
另外,在上述各实施例的基础上,在迭代训练隐马尔科夫初始模型的步骤之前,本发明实施例的业务运维中告警的预测方法还包括:不断调整训练样本集中样本数据的数量,并对训练样本集进行划分,产生多个子训练样本集;对产生的所有子训练样本集,按照固定比例划分出训练集和测试集。
可以理解为,本发明实施例在对预测模型进行训练之前,对训练样本集的划分进行改进处理,以改善传统仅将训练样本集划分为训练集和测试集时存在的缺陷。具体而言,根据实际训练样本集的容量情况,通过选取更多的历史告警数据,不断调整训练样本集中样本数据的数量。同时,对训练样本集按照应用需求进行子集划分,得到对应的多个子训练样本集。之后,再分别对各个子训练样本集,按照固定的比例划分出对应的多个训练集和测试集。
例如,如表1所示,为根据本发明实施例对训练样本集的划分示例表。表中将训练样本集中的样本数据均匀划分到五个子训练样本集中,并对每个子训练样本集按照固定比例7:3、8:2和9:1,划分出对应的训练集和测试集。
表1,根据本发明实施例对训练样本集的划分示例表
Figure BDA0002299265560000091
其中,根据上述各实施例可选的,迭代训练隐马尔科夫初始模型的步骤具体包括:利用各子训练样本集中的训练集,分别采用极大似然估计法,迭代训练隐马尔科夫初始模型,对应获取多个候选预测模型;利用子训练样本集中的测试集,对应验证各候选预测模型是否满足设定标准,选取满足设定标准的预测模型,作为训练好的隐马尔科夫预测模型;其中,设定标准为利用测试集验证的预测结果的准确率为最高。
可以理解为,为避免一次训练选取的损失函数不当而导致模型准确性不高的问题,本发明实施例利用根据上述实施例划分出的各子训练样本集,分别对构建的隐马尔科夫初始模型进行训练。具体而言,分别提取各子训练样本集中的训练集,采用极大似然估计法,对构建的隐马尔科夫初始模型分别单独进行训练,对应得到多个训练完成的预测模型作为候选预测模型。
之后,对于对应得到的各候选预测模型,利用与训练该候选预测模型的训练集对应的测试集,分别对应测试候选预测模型的准确性。也就是说,对于得到的任一候选预测模型,利用其对应的测试集进行前向计算得到预测结果,并与测试集中的参考告警结果进行比对测试预测准确性。则对于每个测试集,可对应得到一个准确率测试结果,该准确率测试结果表示为利用该测试集中的测试数据进行测试时,预测准确的数据占总测试数据的比例。
最后,选取各测试集对应的准确率测试结果中准确率最高者对应的测试对象,也即候选预测模型,认为其满足测试的设定标准,将其作为最终的训练好的隐马尔科夫预测模型。
本发明实施例通过改进对训练样本集的划分标准,能够有效避免一次训练选取的损失函数不当而导致过拟合问题,从而进一步提高预测模型的预测准确性。
其中,根据上述各实施例可选的,利用训练好的隐马尔科夫预测模型,对目标网元对象进行告警预测的步骤具体包括:从所有网元对象产生的告警集合中选取多个不同类别的告警,并基于历史告警序列和选取的各告警,利用训练好的隐马尔科夫预测模型分别进行前向计算,获取选取的各告警分别对应的概率,并基于概率,确定目标网元对象的告警预测结果。
可以理解为,在对目标网元对象进行告警预测时,不仅预测其是否发出告警,还包括其具体的告警类型。于是,对于根据当前告警周期前目标网元对象的历史告警数据得到的长度为n的历史告警序列,还需从故障管理系统中所有网元对象产生的告警信息集合中选取不同类别的告警,并将选取的每个告警与长度为n的历史告警序列结合,构造长度为n+1的目标序列。
之后,将上述各目标序列分别输入到训练好的隐马尔科夫预测模型中,进行前向计算,得到每个类别的告警分别对应的概率,并基于这些概率,确定目标网元对象的最终的告警预测结果。
其中可选的,基于概率,确定目标网元对象的告警预测结果的步骤具体包括:根据概率的大小,对所有概率进行排序,并根据排序结果获取取值最大者对应的告警,作为目标网元对象的下一预测周期的告警。
具体而言,对于得到的每个类别的告警分别对应的概率,按照取值大小进行排序,并根据排序结果选取其中的最大概率值。之后确定该最大概率值对应的告警及该告警的类别,作为目标网元对象的下一预测周期的预测告警。
为进一步说明本发明实施例的技术方案,本发明实施例根据上述各实施例提供如下具体说明,但不对本发明实施例的保护范围进行限制。
首先可以理解的是,关于监督学习隐马尔科夫的告警预测,是基于这样的事实:某一网元对象产生故障或相关指标达到某一阈值后,由故障管理系统产生相应的告警,再经过一些环节最终派单给运维人员,即网元对象产生告警。
如图2所示,为本发明实施例提供的业务运维中告警的预测方法的执行原理示意图,该原理图由两部分组成:第一部分是执行原理图的主体结点,描述了训练模型及通过模型预测的过程;第二部分是图顶端的时间轴,意在表示第一部分具体过程执行的先后顺序,即先训练得到模型,再结合模型对实时数据进行预测。可以理解的是,图中省略了一些关于数据处理的细节,因此,在意图一致的情况下,这些结点可以有其他的形式,或合并,或增加,总体上还是属于这一准备的范畴。
由图2的原理图可见,其示出了如下两个阶段的处理流程:
首先,模型训练阶段:根据提供的历史数据,通过极大似然估计的思想,结合具体的告警类别和网元对象类别,得到隐马尔科夫模型的初始状态概率、状态转移概率矩阵、观测概率矩阵,即隐马尔科夫模型。
即:先分析故障管理系统中网元对象、故障和告警的关系,并以这个关系为基础,构建监督学习的隐马尔科夫模型;再根据上述关系选取相应的原始数据,并对相应的数据进行预处理(时序性,缺失值、编码等),最终形成训练数据集;最后改进隐马尔科夫模型的训练数据集划分和模型选择的标准,对构建的隐马尔科夫模型进行训练。
其次,利用模型预测阶段:根据实时提供的时序数据,预测紧接着的一个周期可能出现的告警并输出。
即:在预测方面,根据当前长度为n的序列(输入序列),构造长度为n+1的序列(目标序列),结合前向算法得出概率最大的序列,完成预测。
可以理解的是,在对模型进行训练之前,需要对训练数据集进行获取和预处理,并需要确定模型选择策略。具体的,对训练数据集的获取包括:结合运维知识,明确网元对象、故障、告警等因果关系选取原始数据,对这些原始数据做相应的预处理工作,得到初步的训练数据集。对训练数据的划分包括:不断调整初始训练集的选取量,产生若干子训练集,对产生的所有子训练集按照固定比例划分训练集和测试集。
另外,训练过程包括:对所有子训练集,利用极大似然估计等方法估计参数,形成模型。模型选择的标准包括:对每个子训练集产生的模型,利用相应的子测试集进行模型验证,验证的依据是在未来的预测周期内(或若干个观测内)相应告警预测准确的比例,取所有模型准确比例最高的那个为最终模型。
为更清楚的说明上述处理过程,以下进行具体举例说明,但不对本发明的保护范围进行限制。本发明实施例的业务运维中告警的预测方法包括以下处理步骤:
首先,做出如下假设:某一区域或某一网元组内的网元对象的集合为S={s1,s2,...,sn},n=1,2,...,其中n为网元对象的总数,所有网元对象产生的告警类别的集合为O={o1,o2,...,om},m=1,2,...,其中m为告警类别的总数。
其次,说明具体处理过程。
步骤1,根据网元对象产生告警这样的关系,结合隐马尔科夫理论:将网元对象作为状态,将告警类别作为观测。
步骤2,获取一定数量的告警历史数据,构成历史告警序列D={(o1,s1),(o2,s2),...,(od,sd)},d=1,2,...,其中d为数据集中记录的数量,o和s分别是集合O和S中的元素,它们在一条记录中是一对一的关系。
步骤3,利用极大似然估计法,训练并得到隐马尔科夫模型M=(π,A,B),其中,π为初始概率分布向量(即D中每个网元对象的初始概率分布),如式(1)所示,A为状态转移矩阵(即D中前一时刻网元对象si到后一个时刻网元对象sj的概率),如式(2)所示,B为观测概率矩阵(即D中出现相应告警oi的概率),如式(3)所示。
π=(π12,...,πn); (1)
Figure BDA0002299265560000131
Figure BDA0002299265560000132
其中,n和m含义不变,πi表示第i个网元对象的初始概率,aij表示前一个时刻状态为i而在下一个时刻状态由i变为j的概率,bjk表示状态为j时出现观测为k的概率。
式(4)-式(8)为采用极大似然估计的思想,求解式(1)-式(3)中相关的未知数的相关数据。
Figure BDA0002299265560000141
Figure BDA0002299265560000142
Figure BDA0002299265560000143
Figure BDA0002299265560000144
Figure BDA0002299265560000145
其中,式(1)中π的每个分量πi由相应状态在数据集中的频数除以数据集总记录数得到,Aij是表示前一个时刻状态为i而在下一个时刻状态由i变为j的频数,式(2)中的aij是由Aij除以式(4)中A'相应一行元素的和求得的,Bjk表示状态为j时出现观测为k的频数,式(3)中的bjk是由Bjk除以式(5)中B'相应一行元素的和求得的。
步骤4,评估训练效果。对数据集D(一般而言,在网元对象未退网且相关结构不变的情况下,数据越多越好)按照表1进行分组,评估每组模型预测的准确率,从所有模型中选择最高的。
步骤5,利用训练得到的隐马尔科夫预测模型进行预测。即对于某一时刻的观测(告警)序列oi,oi+1,...,oi+j-1,预测下一个预测周期出现oi+j的概率:从O中依次选取ok,组成m个oi,oi+1,...,oi+j-1,ok序列,利用隐马尔科夫预测模型进行前向计算,得到各P(oi,oi+1,...,oi+j-1,ok|M)的大小,最终选取出
Figure BDA0002299265560000146
相应的k对应的告警就是预测出的下一个预测周期的告警。
本发明实施例利用监督学习的隐马尔科夫告警预测方法,能够较为准确地预测未来一小段时间产生的告警序列和相应产生告警的网元对象,为故障规避提供决策等,同时缩短了故障处理时间长、减小了故障的影响等问题。
基于相同的发明构思,本发明实施例根据上述各实施例提供一种业务运维中告警的预测装置,该装置用于在上述各实施例中实现对业务运维中告警的预测。因此,在上述各实施例的业务运维中告警的预测方法中的描述和定义,可以用于本发明实施例中各个执行模块的理解,具体可参考上述实施例,此处不在赘述。
根据本发明实施例的一个实施例,业务运维中告警的预测装置的结构如图3所示,为本发明实施例提供的业务运维中告警的预测装置的结构示意图,该装置可以用于实现上述各方法实施例中对业务运维中告警的预测,该装置包括:数据获取模块301和预测输出模块302。
其中:
数据获取模块301取当前告警周期之前目标网元对象给定数量的历史告警数据,构成历史告警序列;预测输出模块302于历史告警序列,利用训练好的隐马尔科夫预测模型,对目标网元对象进行告警预测。其中,训练好的隐马尔科夫预测模型为预先通过分析故障管理系统中网元对象、网元故障和网元告警的关系信息进行初始化构建,并利用根据关系信息选取的原始数据样本进行训练获取的。
具体而言,数据获取模块301根据故障管理系统的历史记录数据,获取到目标网元对象在当前告警周期之前已经发出的告警,即历史告警数据。可以理解的是,为了避免偶然性带来的误差,兼顾隐马尔科夫预测模型的特性,选取的该历史告警数据的数量要达到一定的量,该一定的量可以通过实现设定得到。之后,数据获取模块301可将这些历史告警数据按一定的时序性进行处理并编码,构成一数据序列,即为历史告警序列。
然后,预测输出模块302将得到目标网友对象的历史告警序列输入到预先训练好的隐马尔科夫预测模型中,通过该预测模型的前向计算,得到对目标网元对象下一个或多个告警周期的告警的预测结果。
可以理解的是,在对预测模型进行应用之前,需要采用一定的模型建立方法事先对模型进行建立。具体而言,可以先对故障管理系统中网元对象、故障和告警的关系进行分析,并基于此初始化构建出一隐马尔科夫初始模型。之后,根据上述分析的结果,选取出相应的原始告警数据,再对这些原始告警数据进行处理后,训练构建出的隐马尔科夫初始模型,最终得到训练好的隐马尔科夫预测模型,可用于网元对象的告警预测。
本发明实施例提供的业务运维中告警的预测装置,通过设置相应的执行模块,对故障管理系统中网元对象、故障和告警的关系的分析,并结合隐马尔科夫预测模型,对根据网元对象历史告警构建的目标序列进行运算处理,最终实现对网元对象的告警预测,能够有效提高业务运维中告警预测的准确性,从而有效避免故障或减小故障发生带来的影响。
可以理解的是,本发明实施例中可以通过硬件处理器(hardware processor)来实现上述各实施例的装置中的各相关程序模块。并且,本发明实施例的业务运维中告警的预测装置利用上述各程序模块,能够实现上述各方法实施例的业务运维中告警的预测流程,在用于实现上述各方法实施例中对业务运维中告警的预测时,本发明实施例的装置产生的有益效果与对应的上述各方法实施例相同,可以参考上述各方法实施例,此处不再赘述。
作为本发明实施例的又一个方面,本实施例根据上述各实施例提供一种电子设备,该电子设备包括存储器、处理器及存储在该存储器上并可在该处理器上运行的计算机程序,该处理器执行该计算机程序时,实现如上述各实施例所述的业务运维中告警的预测方法的步骤。
进一步的,本发明实施例的电子设备还可以包括通信接口和总线。参考图4,为本发明实施例提供的电子设备的实体结构示意图,包括:至少一个存储器401、至少一个处理器402、通信接口403和总线404。
其中,存储器401、处理器402和通信接口403通过总线404完成相互间的通信,通信接口403用于该电子设备与故障管理系统设备之间的信息传输;存储器401中存储有可在处理器402上运行的计算机程序,处理器402执行该计算机程序时,实现如上述各实施例所述的业务运维中告警的预测方法的步骤。
可以理解为,该电子设备中至少包含存储器401、处理器402、通信接口403和总线404,且存储器401、处理器402和通信接口403通过总线404形成相互间的通信连接,并可完成相互间的通信,如处理器402从存储器401中读取业务运维中告警的预测方法的程序指令等。另外,通信接口403还可以实现该电子设备与故障管理系统设备之间的通信连接,并可完成相互间信息传输,如通过通信接口403实现对网元对象告警数据的获取等。
电子设备运行时,处理器402调用存储器401中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取当前告警周期之前目标网元对象给定数量的历史告警数据,构成历史告警序列;基于历史告警序列,利用训练好的隐马尔科夫预测模型,对目标网元对象进行告警预测等。
上述的存储器401中的程序指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。或者,实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还根据上述各实施例提供一种非暂态计算机可读存储介质,其上存储有计算机指令,该计算机指令被计算机执行时,实现如上述各实施例所述的业务运维中告警的预测方法的步骤,例如包括:获取当前告警周期之前目标网元对象给定数量的历史告警数据,构成历史告警序列;基于历史告警序列,利用训练好的隐马尔科夫预测模型,对目标网元对象进行告警预测等。
本发明实施例提供的电子设备和非暂态计算机可读存储介质,通过执行上述各实施例所述的业务运维中告警的预测方法的步骤,对故障管理系统中网元对象、故障和告警的关系的分析,并结合隐马尔科夫预测模型,对根据网元对象历史告警构建的目标序列进行运算处理,最终实现对网元对象的告警预测,能够有效提高业务运维中告警预测的准确性,从而有效避免故障或减小故障发生带来的影响。
可以理解的是,以上所描述的装置、电子设备及存储介质的实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,既可以位于一个地方,或者也可以分布到不同网络单元上。可以根据实际需要选择其中的部分或全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上实施方式的描述,本领域的技术人员可以清楚地了解,各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如U盘、移动硬盘、ROM、RAM、磁碟或者光盘等,包括若干指令,用以使得一台计算机设备(如个人计算机,服务器,或者网络设备等)执行上述各方法实施例或者方法实施例的某些部分所述的方法。
另外,本领域内的技术人员应当理解的是,在本发明实施例的申请文件中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明实施例的说明书中,说明了大量具体细节。然而应当理解的是,本发明实施例的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明实施例公开并帮助理解各个发明方面中的一个或多个,在上面对本发明实施例的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。
最后应说明的是:以上实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述实施例对本发明实施例进行了详细的说明,本领域的技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范围。

Claims (10)

1.一种业务运维中告警的预测方法,其特征在于,包括:
获取当前告警周期之前目标网元对象给定数量的历史告警数据,构成历史告警序列;
基于所述历史告警序列,利用训练好的隐马尔科夫预测模型,对所述目标网元对象进行告警预测;
其中,所述训练好的隐马尔科夫预测模型为预先通过分析故障管理系统中网元对象、网元故障和网元告警的关系信息进行初始化构建,并利用根据所述关系信息选取的原始数据样本进行训练获取的。
2.根据权利要求1所述的业务运维中告警的预测方法,其特征在于,在所述利用训练好的隐马尔科夫预测模型,对所述目标网元对象进行告警预测的步骤之前,还包括:
通过分析故障管理系统中网元对象、网元故障和网元告警间的关系信息,初始化构建基于监督学习的隐马尔科夫初始模型,并根据所述关系信息,选取故障管理系统中相应的历史告警数据,构成训练样本集;
利用所述训练样本集中的各样本数据,采用极大似然估计法,迭代训练所述隐马尔科夫初始模型,获取满足设定标准的预测模型,作为所述训练好的隐马尔科夫预测模型。
3.根据权利要求2所述的业务运维中告警的预测方法,其特征在于,所述选取故障管理系统中相应的历史告警数据,构成训练样本集的步骤具体包括:
结合运维知识,通过分析故障管理系统中网元对象、网元故障和网元告警的因果关系,选取第二给定数量的历史告警数据,所述历史告警数据中包括所述网元对象与所述网元告警一对一的对应关系;
对所述历史告警数据根据时序性和缺失值进行预处理,并对预处理结果进行编码,得到样本数据;
根据所有所述样本数据,构成所述训练样本集。
4.根据权利要求2所述的业务运维中告警的预测方法,其特征在于,在所述迭代训练所述隐马尔科夫初始模型的步骤之前,还包括:
不断调整所述训练样本集中所述样本数据的数量,并对所述训练样本集进行划分,产生多个子训练样本集;
对产生的所有所述子训练样本集,按照固定比例划分出训练集和测试集。
5.根据权利要求4所述的业务运维中告警的预测方法,其特征在于,所述迭代训练所述隐马尔科夫初始模型的步骤具体包括:
利用各所述子训练样本集中的训练集,分别采用极大似然估计法,迭代训练所述隐马尔科夫初始模型,对应获取多个候选预测模型;
利用所述子训练样本集中的测试集,对应验证各所述候选预测模型是否满足所述设定标准,选取满足所述设定标准的预测模型,作为所述训练好的隐马尔科夫预测模型;
其中,所述设定标准为利用所述测试集验证的预测结果的准确率为最高。
6.根据权利要求1-5中任一项所述的业务运维中告警的预测方法,其特征在于,所述利用训练好的隐马尔科夫预测模型,对所述目标网元对象进行告警预测的步骤具体包括:
从所有网元对象产生的告警集合中选取多个不同类别的告警,并基于所述历史告警序列和选取的各所述告警,利用所述训练好的隐马尔科夫预测模型分别进行前向计算,获取选取的各所述告警分别对应的概率,并基于所述概率,确定所述目标网元对象的告警预测结果。
7.根据权利要求6所述的业务运维中告警的预测方法,其特征在于,所述基于所述概率,确定所述目标网元对象的告警预测结果的步骤具体包括:
根据所述概率的大小,对所有所述概率进行排序,并根据排序结果获取取值最大者对应的告警,作为所述目标网元对象的下一预测周期的告警。
8.一种业务运维中告警的预测装置,其特征在于,包括:
数据获取模块,用于获取当前告警周期之前目标网元对象给定数量的历史告警数据,构成历史告警序列;
预测输出模块,用于基于所述历史告警序列,利用训练好的隐马尔科夫预测模型,对所述目标网元对象进行告警预测;
其中,所述训练好的隐马尔科夫预测模型为预先通过分析故障管理系统中网元对象、网元故障和网元告警的关系信息进行初始化构建,并利用根据所述关系信息选取的原始数据样本进行训练获取的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1至7中任一项所述的业务运维中告警的预测方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令被计算机执行时,实现如权利要求1至7中任一项所述的业务运维中告警的预测方法的步骤。
CN201911215004.0A 2019-12-02 2019-12-02 业务运维中告警的预测方法、装置与电子设备 Active CN111124840B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201911215004.0A CN111124840B (zh) 2019-12-02 2019-12-02 业务运维中告警的预测方法、装置与电子设备
PCT/CN2020/101818 WO2021109578A1 (zh) 2019-12-02 2020-07-14 业务运维中告警的预测方法、装置与电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911215004.0A CN111124840B (zh) 2019-12-02 2019-12-02 业务运维中告警的预测方法、装置与电子设备

Publications (2)

Publication Number Publication Date
CN111124840A true CN111124840A (zh) 2020-05-08
CN111124840B CN111124840B (zh) 2022-02-08

Family

ID=70496872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911215004.0A Active CN111124840B (zh) 2019-12-02 2019-12-02 业务运维中告警的预测方法、装置与电子设备

Country Status (2)

Country Link
CN (1) CN111124840B (zh)
WO (1) WO2021109578A1 (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611517A (zh) * 2020-05-13 2020-09-01 咪咕文化科技有限公司 指标监控方法、装置、电子设备及存储介质
CN112085621A (zh) * 2020-09-11 2020-12-15 杭州华电下沙热电有限公司 一种基于K-Means-HMM模型的分布式光伏电站故障预警算法
CN112132195A (zh) * 2020-09-14 2020-12-25 江西山水光电科技股份有限公司 一种利用马尔科夫模型分析与预测机房故障的方法
CN112148561A (zh) * 2020-09-28 2020-12-29 建信金融科技有限责任公司 业务系统的运行状态预测方法、装置及服务器
CN112231183A (zh) * 2020-07-13 2021-01-15 国网宁夏电力有限公司电力科学研究院 通信设备告警预测方法和装置、电子设备和可读存储介质
CN112422351A (zh) * 2021-01-21 2021-02-26 南京群顶科技有限公司 一种基于深度学习的网络告警预测模型建立方法及装置
WO2021109578A1 (zh) * 2019-12-02 2021-06-10 北京天元创新科技有限公司 业务运维中告警的预测方法、装置与电子设备
CN113395182A (zh) * 2021-06-21 2021-09-14 山东八五信息技术有限公司 具有故障预测的智能网络设备管理系统及方法
CN113420917A (zh) * 2021-06-18 2021-09-21 广东工业大学 对业务系统未来故障预测的方法、计算机设备及存储介质
CN113446988A (zh) * 2021-06-08 2021-09-28 武汉理工大学 基于云边融合架构的机场跑道道面状态监测系统及方法
CN113609184A (zh) * 2021-07-13 2021-11-05 中国银行股份有限公司 一种异常操作的预警方法、装置及设备
CN113780597A (zh) * 2021-09-16 2021-12-10 睿云奇智(重庆)科技有限公司 影响传播关系模型构建和告警影响评估方法、计算机设备、存储介质
CN113835961A (zh) * 2021-09-23 2021-12-24 中国联合网络通信集团有限公司 告警信息监控方法、装置、服务器及存储介质
CN113852515A (zh) * 2021-08-26 2021-12-28 西安电子科技大学广州研究院 一种数字孪生网络的节点状态管控方法及系统
CN113988452A (zh) * 2021-11-08 2022-01-28 成都四方伟业软件股份有限公司 一种基于stacked LSTM的网元告警预测方法及装置
CN114095344A (zh) * 2020-08-04 2022-02-25 中国移动通信集团重庆有限公司 批量网络投诉的故障定位方法、设备及计算机存储介质
CN114201246A (zh) * 2022-02-18 2022-03-18 浙江中控技术股份有限公司 数据预测方法及相关设备
CN114237962A (zh) * 2021-12-21 2022-03-25 中国电信股份有限公司 告警根因判断方法、模型训练方法、装置、设备和介质
CN114374597A (zh) * 2021-12-27 2022-04-19 浪潮通信信息系统有限公司 一种网络事件的故障处理方法、装置、设备及产品
CN114422322A (zh) * 2021-12-29 2022-04-29 中国电信股份有限公司 一种告警压缩的方法、装置、设备及存储介质
CN114692487A (zh) * 2022-03-11 2022-07-01 中国电子科技集团公司第二十九研究所 电子装备维修备件预投方法、装置、设备及存储介质
CN114844767A (zh) * 2022-04-27 2022-08-02 中国电子科技集团公司第五十四研究所 一种基于对抗生成网络的告警数据生成方法
CN115134260A (zh) * 2022-07-12 2022-09-30 北京东土拓明科技有限公司 用户感知提升方法及装置、计算设备和存储介质
CN115208773A (zh) * 2021-04-09 2022-10-18 中国移动通信集团广东有限公司 网络隐性故障监测方法及装置
CN115311829A (zh) * 2022-10-12 2022-11-08 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) 一种基于海量数据的精准告警方法及系统
CN115361061A (zh) * 2022-08-24 2022-11-18 中铁电气化局集团有限公司 一种光纤故障监测方法
CN117057676A (zh) * 2023-10-11 2023-11-14 深圳润世华软件和信息技术服务有限公司 多数据融合的故障分析方法、设备及存储介质

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537349A (zh) * 2021-07-16 2021-10-22 中国工商银行股份有限公司 大型主机硬件故障识别方法、装置、设备及存储介质
CN113627496B (zh) * 2021-07-27 2024-09-24 交控科技股份有限公司 道岔转辙机故障预测方法、装置、电子设备和可读存储介质
CN113656691A (zh) * 2021-08-17 2021-11-16 北京沃东天骏信息技术有限公司 数据预测方法、装置及存储介质
CN113691311B (zh) * 2021-08-27 2022-12-06 中国科学院半导体研究所 光网络的故障定位方法、电子设备及计算机可读存储介质
CN113568991B (zh) * 2021-09-22 2022-02-08 北京必示科技有限公司 一种基于动态风险的告警处理方法及系统
CN113821408B (zh) * 2021-09-23 2024-08-27 中国建设银行股份有限公司 一种服务器告警处理方法及相关设备
CN114202110B (zh) * 2021-11-24 2024-10-18 中盈优创资讯科技有限公司 一种基于rf-xgboost的业务故障预测方法及装置
CN113987481B (zh) * 2021-12-23 2022-05-03 浙江国利网安科技有限公司 工控入侵检测方法、装置、存储介质和设备
CN114629813B (zh) * 2021-12-30 2024-08-27 亚信科技(中国)有限公司 意图报告上报方法、装置、电子设备、存储介质及产品
CN114398235B (zh) * 2022-01-14 2024-08-23 建信金融科技有限责任公司 基于融合学习和假设检验的内存回收趋势预警装置及方法
CN114785663B (zh) * 2022-01-28 2024-08-16 浙江华云信息科技有限公司 一种告警联动方法
CN114697203B (zh) * 2022-03-31 2023-07-25 浙江省通信产业服务有限公司 一种网络故障的预判方法、装置、电子设备及存储介质
CN114881321A (zh) * 2022-04-29 2022-08-09 三一汽车起重机械有限公司 机械部件故障预测方法、装置、电子设备及存储介质
CN115001753B (zh) * 2022-05-11 2023-06-09 绿盟科技集团股份有限公司 一种关联告警的分析方法、装置、电子设备及存储介质
CN114999182B (zh) * 2022-05-25 2023-07-04 中国人民解放军国防科技大学 基于lstm回馈机制的车流量预测方法、装置及设备
CN115225500B (zh) * 2022-06-20 2024-10-18 中国电信股份有限公司 一种网络切片分配方法及装置
CN115174355B (zh) * 2022-07-26 2024-01-19 杭州东方通信软件技术有限公司 故障根因定位模型的生成方法,故障根因定位方法和装置
CN117951854A (zh) * 2022-08-17 2024-04-30 国器智眸(重庆)科技有限公司 边缘设备的排障方法、装置、电子设备及存储介质
CN115550139B (zh) * 2022-09-19 2024-02-02 中国电信股份有限公司 故障根因定位方法、装置、系统、电子设备及存储介质
CN115238831B (zh) * 2022-09-21 2023-04-14 中国南方电网有限责任公司超高压输电公司广州局 故障预测方法、装置、计算机设备和存储介质
CN118200113A (zh) * 2022-12-12 2024-06-14 中兴通讯股份有限公司 一种网元故障处理方法、装置、存储介质及电子装置
CN115829172B (zh) * 2023-02-24 2023-05-12 清华大学 污染预测方法、装置、计算机设备和存储介质
CN116502156B (zh) * 2023-06-30 2023-09-08 中国电力科学研究院有限公司 一种换流站光ct异常状态智能辨识方法及系统
CN116910006B (zh) * 2023-07-24 2024-03-29 深圳市盛弘新能源设备有限公司 基于新能源电池的数据压缩存储处理方法及系统
CN117216481B (zh) * 2023-09-28 2024-10-11 浙江康巴赫科技股份有限公司 一种用于电器的远程监控方法及系统
CN117218300B (zh) * 2023-11-08 2024-03-01 腾讯科技(深圳)有限公司 三维模型的构建方法、三维构建模型的训练方法及装置
CN117592865B (zh) * 2023-12-21 2024-04-05 中国人民解放军军事科学院系统工程研究院 一种装备零备件质量状态预测方法及装置
CN118264315B (zh) * 2024-03-07 2024-09-20 国网青海省电力公司 光链路交叉比对与故障精准定位方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2530781A1 (en) * 2005-12-14 2007-06-14 Peter F. Werner Electrical component monitoring system
US20130226501A1 (en) * 2012-02-23 2013-08-29 Infosys Limited Systems and methods for predicting abnormal temperature of a server room using hidden markov model
CN103856344A (zh) * 2012-12-05 2014-06-11 中国移动通信集团北京有限公司 一种告警事件信息处理方法及装置
US20150186497A1 (en) * 2012-10-02 2015-07-02 Banjo, Inc. Dynamic event detection system and method
CN107562606A (zh) * 2017-08-29 2018-01-09 郑州云海信息技术有限公司 一种告警监控数据显示方法和装置
CN107822622A (zh) * 2017-09-22 2018-03-23 成都比特律动科技有限责任公司 基于深度卷积神经网络的心电图诊断方法和系统
CN108681923A (zh) * 2018-05-16 2018-10-19 浙江大学城市学院 一种基于改进型隐马尔可夫模型的消费者消费行为预测方法
CN108880915A (zh) * 2018-08-20 2018-11-23 全球能源互联网研究院有限公司 一种电力信息网络安全告警信息误报判定方法和系统
CN109117941A (zh) * 2018-07-16 2019-01-01 北京思特奇信息技术股份有限公司 告警预测方法、系统、存储介质及计算机设备
CN110224850A (zh) * 2019-04-19 2019-09-10 北京亿阳信通科技有限公司 电信网络故障预警方法、装置及终端设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107995008B (zh) * 2016-10-27 2021-07-06 中兴通讯股份有限公司 一种业务告警处理方法、装置及系统
US20190228105A1 (en) * 2018-01-24 2019-07-25 Rocket Fuel Inc. Dynamic website content optimization
CN111124840B (zh) * 2019-12-02 2022-02-08 北京天元创新科技有限公司 业务运维中告警的预测方法、装置与电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2530781A1 (en) * 2005-12-14 2007-06-14 Peter F. Werner Electrical component monitoring system
US20130226501A1 (en) * 2012-02-23 2013-08-29 Infosys Limited Systems and methods for predicting abnormal temperature of a server room using hidden markov model
US20150186497A1 (en) * 2012-10-02 2015-07-02 Banjo, Inc. Dynamic event detection system and method
CN103856344A (zh) * 2012-12-05 2014-06-11 中国移动通信集团北京有限公司 一种告警事件信息处理方法及装置
CN107562606A (zh) * 2017-08-29 2018-01-09 郑州云海信息技术有限公司 一种告警监控数据显示方法和装置
CN107822622A (zh) * 2017-09-22 2018-03-23 成都比特律动科技有限责任公司 基于深度卷积神经网络的心电图诊断方法和系统
CN108681923A (zh) * 2018-05-16 2018-10-19 浙江大学城市学院 一种基于改进型隐马尔可夫模型的消费者消费行为预测方法
CN109117941A (zh) * 2018-07-16 2019-01-01 北京思特奇信息技术股份有限公司 告警预测方法、系统、存储介质及计算机设备
CN108880915A (zh) * 2018-08-20 2018-11-23 全球能源互联网研究院有限公司 一种电力信息网络安全告警信息误报判定方法和系统
CN110224850A (zh) * 2019-04-19 2019-09-10 北京亿阳信通科技有限公司 电信网络故障预警方法、装置及终端设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
W. LIANG .ETC: "Multiscale Entropy-Based Weighted Hidden Markov Network Security Situation Prediction Model", 《2017 IEEE INTERNATIONAL CONGRESS ON INTERNET OF THINGS》 *
ZHEN CHEN .ETC: "Hidden Markov model with auto-correlated observations for remaining useful life prediction and optimal maintenance policy", 《RELIABILITY ENGINEERING & SYSTEM SAFETY》 *
钟将: "基于连续隐马尔可夫模型的故障预测算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021109578A1 (zh) * 2019-12-02 2021-06-10 北京天元创新科技有限公司 业务运维中告警的预测方法、装置与电子设备
CN111611517B (zh) * 2020-05-13 2023-07-21 咪咕文化科技有限公司 指标监控方法、装置、电子设备及存储介质
CN111611517A (zh) * 2020-05-13 2020-09-01 咪咕文化科技有限公司 指标监控方法、装置、电子设备及存储介质
CN112231183B (zh) * 2020-07-13 2022-09-30 国网宁夏电力有限公司电力科学研究院 通信设备告警预测方法和装置、电子设备和可读存储介质
CN112231183A (zh) * 2020-07-13 2021-01-15 国网宁夏电力有限公司电力科学研究院 通信设备告警预测方法和装置、电子设备和可读存储介质
CN114095344A (zh) * 2020-08-04 2022-02-25 中国移动通信集团重庆有限公司 批量网络投诉的故障定位方法、设备及计算机存储介质
CN114095344B (zh) * 2020-08-04 2023-10-27 中国移动通信集团重庆有限公司 批量网络投诉的故障定位方法、设备及计算机存储介质
CN112085621A (zh) * 2020-09-11 2020-12-15 杭州华电下沙热电有限公司 一种基于K-Means-HMM模型的分布式光伏电站故障预警算法
CN112085621B (zh) * 2020-09-11 2022-08-02 杭州华电下沙热电有限公司 一种基于K-Means-HMM模型的分布式光伏电站故障预警算法
CN112132195B (zh) * 2020-09-14 2024-03-29 江西山水光电科技股份有限公司 一种利用马尔科夫模型分析与预测机房故障的方法
CN112132195A (zh) * 2020-09-14 2020-12-25 江西山水光电科技股份有限公司 一种利用马尔科夫模型分析与预测机房故障的方法
CN112148561B (zh) * 2020-09-28 2022-12-09 建信金融科技有限责任公司 业务系统的运行状态预测方法、装置及服务器
CN112148561A (zh) * 2020-09-28 2020-12-29 建信金融科技有限责任公司 业务系统的运行状态预测方法、装置及服务器
CN112422351A (zh) * 2021-01-21 2021-02-26 南京群顶科技有限公司 一种基于深度学习的网络告警预测模型建立方法及装置
CN112422351B (zh) * 2021-01-21 2022-12-09 南京群顶科技股份有限公司 一种基于深度学习的网络告警预测模型建立方法及装置
CN115208773B (zh) * 2021-04-09 2023-09-19 中国移动通信集团广东有限公司 网络隐性故障监测方法及装置
CN115208773A (zh) * 2021-04-09 2022-10-18 中国移动通信集团广东有限公司 网络隐性故障监测方法及装置
CN113446988A (zh) * 2021-06-08 2021-09-28 武汉理工大学 基于云边融合架构的机场跑道道面状态监测系统及方法
CN113420917B (zh) * 2021-06-18 2023-10-27 广东工业大学 对业务系统未来故障预测的方法、计算机设备及存储介质
CN113420917A (zh) * 2021-06-18 2021-09-21 广东工业大学 对业务系统未来故障预测的方法、计算机设备及存储介质
CN113395182B (zh) * 2021-06-21 2022-03-18 山东八五信息技术有限公司 具有故障预测的智能网络设备管理系统及方法
CN113395182A (zh) * 2021-06-21 2021-09-14 山东八五信息技术有限公司 具有故障预测的智能网络设备管理系统及方法
CN113609184A (zh) * 2021-07-13 2021-11-05 中国银行股份有限公司 一种异常操作的预警方法、装置及设备
CN113852515A (zh) * 2021-08-26 2021-12-28 西安电子科技大学广州研究院 一种数字孪生网络的节点状态管控方法及系统
CN113780597A (zh) * 2021-09-16 2021-12-10 睿云奇智(重庆)科技有限公司 影响传播关系模型构建和告警影响评估方法、计算机设备、存储介质
CN113835961B (zh) * 2021-09-23 2023-05-16 中国联合网络通信集团有限公司 告警信息监控方法、装置、服务器及存储介质
CN113835961A (zh) * 2021-09-23 2021-12-24 中国联合网络通信集团有限公司 告警信息监控方法、装置、服务器及存储介质
CN113988452A (zh) * 2021-11-08 2022-01-28 成都四方伟业软件股份有限公司 一种基于stacked LSTM的网元告警预测方法及装置
CN114237962A (zh) * 2021-12-21 2022-03-25 中国电信股份有限公司 告警根因判断方法、模型训练方法、装置、设备和介质
CN114237962B (zh) * 2021-12-21 2024-05-14 中国电信股份有限公司 告警根因判断方法、模型训练方法、装置、设备和介质
CN114374597A (zh) * 2021-12-27 2022-04-19 浪潮通信信息系统有限公司 一种网络事件的故障处理方法、装置、设备及产品
CN114422322A (zh) * 2021-12-29 2022-04-29 中国电信股份有限公司 一种告警压缩的方法、装置、设备及存储介质
CN114422322B (zh) * 2021-12-29 2024-04-30 中国电信股份有限公司 一种告警压缩的方法、装置、设备及存储介质
CN114201246A (zh) * 2022-02-18 2022-03-18 浙江中控技术股份有限公司 数据预测方法及相关设备
CN114692487A (zh) * 2022-03-11 2022-07-01 中国电子科技集团公司第二十九研究所 电子装备维修备件预投方法、装置、设备及存储介质
CN114692487B (zh) * 2022-03-11 2023-05-26 中国电子科技集团公司第二十九研究所 电子装备维修备件预投方法、装置、设备及存储介质
CN114844767A (zh) * 2022-04-27 2022-08-02 中国电子科技集团公司第五十四研究所 一种基于对抗生成网络的告警数据生成方法
CN115134260A (zh) * 2022-07-12 2022-09-30 北京东土拓明科技有限公司 用户感知提升方法及装置、计算设备和存储介质
CN115361061A (zh) * 2022-08-24 2022-11-18 中铁电气化局集团有限公司 一种光纤故障监测方法
CN115311829A (zh) * 2022-10-12 2022-11-08 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) 一种基于海量数据的精准告警方法及系统
CN117057676B (zh) * 2023-10-11 2024-02-23 深圳润世华软件和信息技术服务有限公司 多数据融合的故障分析方法、设备及存储介质
CN117057676A (zh) * 2023-10-11 2023-11-14 深圳润世华软件和信息技术服务有限公司 多数据融合的故障分析方法、设备及存储介质

Also Published As

Publication number Publication date
WO2021109578A1 (zh) 2021-06-10
CN111124840B (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN111124840B (zh) 业务运维中告警的预测方法、装置与电子设备
US11650968B2 (en) Systems and methods for predictive early stopping in neural network training
CN109120462A (zh) 机会网络链路的预测方法、装置及可读存储介质
CN114297036B (zh) 数据处理方法、装置、电子设备及可读存储介质
CN112633421A (zh) 一种用户异常用电行为检测方法及装置
CN113379071B (zh) 一种基于联邦学习的噪声标签修正方法
CN109471698B (zh) 云环境下虚拟机异常行为检测系统和方法
CN112036540A (zh) 一种基于双种群混合人工蜂群算法的传感器数目优化方法
WO2017071369A1 (zh) 一种预测用户离网的方法和设备
CN115587543A (zh) 基于联邦学习和lstm的刀具剩余寿命预测方法及系统
CN113825165B (zh) 基于时间图网络的5g切片网络拥塞预警方法及装置
CN115204536A (zh) 楼宇设备故障预测方法、装置、设备及存储介质
CN114139589A (zh) 故障诊断方法、装置、设备与计算机可读存储介质
CN114611372A (zh) 一种基于物联网边缘计算的工业设备健康预测方法
CN114330650A (zh) 基于进化元学习模型训练的小样本特征分析方法及装置
CN115730947A (zh) 银行客户流失预测方法及装置
CN113743461B (zh) 无人机集群健康度评估方法及装置
CN114169460A (zh) 样本筛选方法、装置、计算机设备和存储介质
JP2019139651A (ja) 未知の複数次元のベクトルデータ群をクラス分類するプログラム、装置及び方法
US20200349495A1 (en) Analytical model training method for customer experience estimation
CN116432835A (zh) 客户流失预警归因方法、装置、计算机设备及存储介质
CN114202110B (zh) 一种基于rf-xgboost的业务故障预测方法及装置
US20210373987A1 (en) Reinforcement learning approach to root cause analysis
CN112423031A (zh) 基于iptv的kpi监测方法、装置及其系统
CN109474445B (zh) 一种分布式系统根源故障定位方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant