CN117118804A - 告警数据处理方法、装置和计算机可读存储介质 - Google Patents

告警数据处理方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN117118804A
CN117118804A CN202310987695.6A CN202310987695A CN117118804A CN 117118804 A CN117118804 A CN 117118804A CN 202310987695 A CN202310987695 A CN 202310987695A CN 117118804 A CN117118804 A CN 117118804A
Authority
CN
China
Prior art keywords
alarm
data
alert
event
alarm data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310987695.6A
Other languages
English (en)
Inventor
陈子鹏
常谦
孙佩霞
谢肖坡
赵龙刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Technology Innovation Center
China Telecom Corp Ltd
Original Assignee
China Telecom Technology Innovation Center
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Technology Innovation Center, China Telecom Corp Ltd filed Critical China Telecom Technology Innovation Center
Priority to CN202310987695.6A priority Critical patent/CN117118804A/zh
Publication of CN117118804A publication Critical patent/CN117118804A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开涉及一种告警数据处理方法、装置和计算机可读存储介质,涉及通信领域。该告警数据处理方法包括:获取告警流中的一个或多个告警数据的第一告警特征;按照一个或多个告警数据的时间信息,依次对每个告警数据进行匹配处理,其中,针对每个告警数据,匹配处理包括:根据告警数据的第一告警特征,将告警数据与最新建立的告警事件进行匹配,告警事件包括与告警事件匹配的告警数据;在告警数据与告警事件匹配的情况下,将告警数据添加至告警事件;在告警数据与告警事件不匹配的情况下,建立告警事件,并将告警数据添加至建立的告警事件。该告警数据处理方法能够有效提升处理告警的运维效率。

Description

告警数据处理方法、装置和计算机可读存储介质
技术领域
本公开涉及通信领域,特别涉及一种告警数据处理方法、装置和计算机可读存储介质。
背景技术
告警数据处理是网络运维的一个重要方面,通常根据告警数据分发多个工单,派发给运维人员处理,以便保证网络的正常运行。由于网络中网元数量众多,由网元引发的告警的数量也十分庞大,当前的运维效率难以满足需求。
发明内容
发明人研究发现,当前运维效率低的一个原因在于同一事件引发的告警可能会被分发到不同的工单,这就需要对同一事件引发的告警进行多次检查处理。因此,如果能将同一事件的告警分发到一个工单,以一次性地解决属于同一事件的告警,能够有效提升运维效率。
本公开所要解决的一个技术问题是:如何提升处理告警的运维效率。
根据本公开的一些实施例的第一方面,提供了一种告警数据处理方法,包括:获取告警流中的一个或多个告警数据的第一告警特征;按照一个或多个告警数据的时间信息,依次对每个告警数据进行匹配处理,其中,针对每个告警数据,匹配处理包括:根据告警数据的第一告警特征,将告警数据与最新建立的告警事件进行匹配,告警事件包括与告警事件匹配的告警数据;在告警数据与告警事件匹配的情况下,将告警数据添加至告警事件;在告警数据与告警事件不匹配的情况下,建立告警事件,并将告警数据添加至建立的告警事件。
在一些实施例中,获取告警流中的一个或多个告警数据的第一告警特征包括:在告警流中的一个或多个告警数据中,获取每个告警数据的中间特征;根据告警流中每个告警数据的中间特征,获取每个告警数据的第一告警特征。
在一些实施例中,根据告警流中每个告警数据的中间特征,获得每个告警数据的第一告警特征包括:利用第一双向长短期记忆(Bi-directional Long Short-TermMemory,简称:BiLSTM)网络对由告警流中每个告警数据的中间特征构成的序列进行处理,以获得每个告警数据的第一告警特征。
在一些实施例中,根据告警数据的第一告警特征,将告警数据与最新建立的告警事件进行匹配包括:将告警数据的第一告警特征与最新建立的告警事件中包括的告警数据的第一告警特征经池化、归一化处理后,获得告警数据与最新建立的告警事件的匹配值;在匹配值为目标数值的情况下,告警数据与最新建立的告警事件匹配;在匹配值不为目标数值的情况下,告警数据与最新建立的告警事件不匹配。
在一些实施例中,该告警数据处理方法,还包括:获取同一告警事件中的一个或多个告警数据的第二告警特征;根据第二告警特征,确定每个告警事件的根告警数据。
在一些实施例中,根据第二告警特征,确定每个告警事件的根告警数据包括:对于每个告警事件中的一个或多个告警数据:利用条件随机场对告警事件中的一个或多个告警数据的第二告警特征进行处理,以获得告警事件中的每个告警数据为根告警数据的概率值;将与最大概率值对应的告警数据确定为告警事件的根告警数据。
在一些实施例中,获取同一告警事件中的一个或多个告警数据的第二告警特征包括:在同一告警事件中的一个或多个告警数据中,获取每个告警数据的中间特征;根据告警事件中每个告警数据的中间特征,获取每个告警数据的第二告警特征。
在一些实施例中,根据告警事件中每个告警数据的中间特征,获取每个告警数据的第二告警特征包括:利用第二双向长短期记忆网络对由告警事件中每个告警数据的中间特征构成的序列进行处理,以获得每个告警数据的第二告警特征。
在一些实施例中,获取告警流中的一个或多个告警数据的第一告警特征包括:在所述告警流中的一个或多个告警数据中,获取每个告警数据的中间特征;
利用第一双向长短期记忆网络对由告警流中每个告警数据的中间特征构成的序列进行处理,以获得每个告警数据的第一告警特征;并且第一双向长短期记忆网络和第二双向长短期记忆网络是相同的网络模型、并且具有相同的网络参数值。
在一些实施例中,获取每个告警数据的中间特征包括:获取每个告警数据的至少一个子特征;融合每个告警数据的至少一个子特征,以获得每个告警数据的中间特征。
在一些实施例中,获取每个告警数据的至少一个子特征包括:获取每个告警数据的业务场景特征、网元端口特征、告警类型特征、时间间隔特征中的至少一个。
在一些实施例中,业务场景特征是利用来自变换器的双向编码器表征量语言模型,对告警数据中的业务场景信息进行处理而得到的;网元端口特征是利用异构图神经网络,对发送告警数据的网元端口的物理连接关系进行处理而得到的;告警类型特征是基于一个或多个告警数据中的频繁项集,获得一个或多个告警数据的告警类型之间的关系,并利用图神经网络对告警类型之间的关系进行处理而得到的;时间间隔特征是根据告警数据与在告警流中在告警数据之前发送的上一告警数据的告警时间间隔而得到的。
在一些实施例中,融合每个告警数据的至少一个子特征,以获得每个告警数据的中间特征包括:将每个告警数据的至少一个子特征转换到预设维度;利用第三双向长短期记忆网络对由进行维度转换后的至少一个子特征构成的序列进行处理,以获得每个告警数据的中间特征。
根据本公开的一些实施例的第二方面,提供了一种告警数据处理装置,包括:第一获取模块,被配置为获取告警流中的一个或多个告警数据的第一告警特征;匹配模块,被配置为按照所述一个或多个告警数据的时间信息,依次对每个告警数据进行匹配处理,其中,针对所述每个告警数据,匹配模块包括:匹配单元,被配置为根据告警数据的第一告警特征,将告警数据与最新建立的告警事件进行匹配,告警事件包括与告警事件匹配的告警数据;添加单元,被配置为在告警数据与告警事件匹配的情况下,将告警数据添加至告警事件;新建单元,被配置为在告警数据与告警事件不匹配的情况下,建立告警事件,并将告警数据添加至建立的告警事件。
在一些实施例中,该告警数据处理装置还包括第二获取模块,被配置为获取同一告警事件中的一个或多个告警数据的第二告警特征;确定模块,被配置为根据第二告警特征,确定每个告警事件的根告警数据。
根据本公开的一些实施例的第三方面,提供了一种告警数据处理装置,包括处理器;以及耦接至所述处理器的存储器,用于存储指令,所述指令被所述处理器执行时,使所述处理器执行如前所述的告警数据处理方法。
根据本公开的一些实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如前所述的告警数据处理方法的步骤。
本公开的实施例能够获取告警流中的告警数据的告警特征,并基于这些告警数据的时间信息,将告警流划分为至少一个告警事件,每个告警事件中包括至少一个告警数据。这样能够一次性地解决属于同一事件的告警,能够有效提升处理告警的运维效率。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开的一些实施例的告警数据处理方法的流程示意图。
图2示出本公开的一些实施例的获取中间特征的结构示意图。
图3示出本公开的一些实施例的获取第一告警特征的结构示意图。
图4示出本公开的一些实施例的识别根告警数据的模型结构示意图。
图5示出本公开的一些实施例的告警数据处理装置的结构示意图。
图6示出本公开的另一些实施例的告警数据处理装置的结构示意图。
图7示出本公开的又一些实施例的告警数据处理装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
由于告警数据包含时间信息,时间信息指示发出这条告警数据的时间,因此可以将众多的告警数据看作一个告警流。例如,可以以每天、每周、每月等为一个时间周期获取一个告警流,该时间周期可以根据运维需要设定。将告警流划分为至少一个告警事件,每个告警事件中包括由同一事件引发的告警数据,之后以告警事件为单位进行处理,能够有效提升处理告警的运维效率。
下面描述根据本公开的一些实施例的告警数据处理方法,该告警数据处理方法可以将告警流划分为至少一个告警事件。
图1示出本公开的一些实施例的告警数据处理方法的流程示意图。如图1所示,该实施例的方法包括步骤S102~S108。
在步骤S102中,获取告警流中的一个或多个告警数据的第一告警特征。每个告警数据的第一告警特征例如根据该告警数据本身的信息以及告警流中的其他告警数据的信息确定。
在告警流中包括一个或多个告警数据,而这一个或多个告警数据是由至少一个事件引发的,并且由同一事件引发的告警数据之间会有关联。例如在网络中产生了某一故障,由该故障直接引发了告警1,而由告警1引发了告警2、告警3、告警4,那么告警1、告警2、告警3和告警4则是由同一告警事件(例如称为事件1)引起的,告警1、告警2、告警3和告警4所对应的告警数据之间会有关联。
由于告警流中的告警数据带有时间信息,并且可能相互具有关联,因此可以通过长短期记忆网络来获取告警流中的告警数据的第一告警特征,以使得每个告警数据的第一告警特征能够带有告警流中与之邻近的告警数据的信息。另外,由于决定告警数据是否属于同一告警事件与发出告警数据的时间先后顺序没有必然联系,例如,某个告警数据之前的告警数据或之后的告警数据都有可能与其属于同一个告警事件,因此可以通过双向长短期记忆网络来获取告警流中的告警数据的第一告警特征。第一告警特征使告警数据的特征结合了告警流中其他的告警数据的特征信息,因此通过第一告警特征能够更准确获得告警数据与告警流中其他告警数据的关联情况,从而基于第一告警特征能够更准确地将告警流中的告警数据按照告警事件进行划分。
在一些实施例中,获取告警流中的一个或多个告警数据的第一告警特征包括:在告警流中的一个或多个告警数据中,获取每个告警数据的中间特征;根据告警流中每个告警数据的中间特征,获取每个告警数据的第一告警特征。告警数据的中间特征表示告警数据自身的特征信息,例如发出这条告警数据的时间信息、发送这条告警数据的网元端口信息等。
图2示出本公开的一些实施例的获取中间特征的结构示意图。如图2所示,获取每个告警数据的中间特征包括:获取每个告警数据的至少一个子特征;融合每个告警数据的至少一个子特征,以获得每个告警数据的中间特征。通过从告警数据的多个维度出发来获取中间特征,能够充分利用告警数据中的信息,来提升将告警流中的告警数据按照告警事件进行划分的准确性。
在一些实施例中,获取每个告警数据的至少一个子特征包括:获取每个告警数据的业务场景特征、网元端口特征、告警类型特征、时间间隔特征中的至少一个。
在一些实施例中,业务场景特征是利用来自变换器的双向编码器表征量(Bert)语言模型,对告警数据中的业务场景信息进行处理而得到的。告警流中的告警数据涉及多个业务场景,告警数据中包括指示业务场景的信息。例如,通过来自变换器的双向编码器表征量语言模型对告警数据中的业务场景信息进行处理,获得告警数据中业务场景信息的向量表示。由于告警数据的第一告警特征融合了业务场景特征,所以该告警数据处理方法能够跨业务场景将属于同一告警事件的告警数据进行归并,实现了跨专业的告警数据处理。
在一些实施例中,网元端口特征是利用异构图神经网络(HetGNN),对发送告警数据的网元端口的物理连接关系进行处理而得到的。发送告警数据的网元端口之间的物理连接关系属于无边权重的异构图(该异构图中的节点包括网元节点和端口节点,连接关系包括网元节点和网元节点、端口节点和端口节点以及网元节点和端口节点之间的连接,其中端口节点表示任一网元节点的端口。例如网元A具有端口1、端口2),因此通过异构图神经网络对该异构图进行处理,能够获得告警数据的网元端口特征的向量表示。
在一些实施例中,告警类型特征是基于一个或多个告警数据中的频繁项集,获得一个或多个告警数据的告警类型之间的关系,并利用图神经网络(GNN)对告警类型之间的关系进行处理而得到的。告警数据指示告警类型的信息,通过挖掘告警类型中的频繁项集,可以获得告警类型之间的关联关系,从而基于关联规则可以确定告警类型之间的因果关系。例如对于在一频繁项集中的两个告警类型,认为这两个告警类型之间具有因果关系,可以通过与告警类型对应的告警数据的时间信息来确定这两个告警类型的因果关系,也可以基于概率的方式进行统计分析确定这两个告警类型的因果关系。将这两个告警类型记为告警类型1和告警类型2,如果告警类型1的出现增加了告警类型2出现的概率,那么认为告警类型1是告警类型2的因,告警类型2是告警类型1的果,告警类型1和告警类型2之间的因果关系程度可以根据它们之间的关联关系确定。例如,对于告警类型之间的关联关系越强,则它们之间的因果关系程度越大,可以以数值的形式记录告警类型之间的因果关系。
从而在确定告警类型之间的因果关系后,能够构建以因果关系为边权重、告警类型为节点的同构图,之后可以通过图神经网络进一步训练该同构图,能够获得告警数据的告警类型特征的向量表示。
在一些实施例中,时间间隔特征是根据告警数据与在告警流中在该告警数据之前发送的上一告警数据的告警时间间隔而得到的。发送告警数据与上一告警数据的时间间隔可以通过时间的向量表示模型(Time2Vector)获得向量形式表示。
在获取每个告警数据的子特征后,将告警数据的所有子特征融合为一个整体,记为中间特征。相比于直接通过告警数据的所有子特征的多次处理来判断告警数据与其他告警数据是否属于同一告警事件,中间特征融合了所有子特征的信息,从而能够从整体上指示该告警数据的特点,能够使判断更准确,并且也能够简化判断流程。
在一些实施例中,融合每个告警数据的至少一个子特征,以获得每个告警数据的中间特征包括:将每个告警数据的至少一个子特征转换到预设维度;利用第三双向长短期记忆网络对由进行维度转换后的至少一个子特征构成的序列进行处理,以获得每个告警数据的中间特征。
由于告警数据的子特征的特征类型和维度可能不同,因此某些场景下不能直接将告警数据的子特征拼接为中间特征。为了解决这一问题,例如可以通过对告警数据的子特征的全连接层处理,将告警数据的子特征转换为相同的维度后,输入双向长短期记忆网络,从而将告警数据的子特征嵌入相同的空间,经池化层(例如平均池化)处理后,实现了告警数据的子特征的融合,记为告警数据的中间特征。
图3示出本公开的一些实施例的获取第一告警特征的结构示意图。如图3所示,告警流中包括告警数据a1,....,an。根据告警流中每个告警数据的中间特征,获得每个告警数据的第一告警特征包括:利用第一双向长短期记忆网络对由告警流中每个告警数据的中间特征构成的序列进行处理,以获得每个告警数据的第一告警特征。通过长短期记忆网络对告警流中的告警数据的中间特征进行处理后,获取的第一告警特征能够带有告警流中与该告警数据邻近的告警数据的信息。基于第一告警特征能够提升将告警流中的告警数据划分为至少一个告警事件的准确性。
然后,按照一个或多个告警数据的时间信息,依次对每个告警数据进行匹配处理,其中,针对每个告警数据,所述匹配处理包括步骤S104~S108。
在步骤S104中,根据告警数据的第一告警特征,将告警数据与最新建立的告警事件进行匹配,该告警事件包括与告警事件匹配的告警数据。
在一些实施例中,根据告警数据的第一告警特征,将告警数据与最新建立的告警事件进行匹配包括:将告警数据的第一告警特征与最新建立的告警事件中包括的告警数据的第一告警特征经池化(例如平均池化)、归一化处理后,获得所述告警数据与最新建立的告警事件的匹配值;在匹配值为目标数值的情况下,告警数据与最新建立的告警事件匹配;在匹配值不为目标数值的情况下,告警数据与最新建立的告警事件不匹配。
目标数值可以根据历史数据或当前需求设定。例如可以对历史数据进行统计分析,根据分析结果设定目标数值。在一些实施例中,目标数值可以设定为1。
在步骤S106中,在告警数据与该告警事件匹配的情况下,将告警数据添加至该告警事件。
在步骤S108中,在告警数据与该告警事件不匹配的情况下,建立告警事件,并将告警数据添加至该建立的告警事件。
在对告警流中的告警数据与告警事件进行匹配时,通常可以确定某一告警数据属于某一告警事件,那么可以按照告警数据的时间顺序从头对告警数据与告警事件进行匹配。例如告警流中包括告警数据a1,....,an,可以认为a1属于事件e1,事件e1包括告警数据a1。之后依次将a2,....,an与事件e1进行匹配,也就是告警数据a2,....,an的第一告警特征依次与告警数据a1的第一告警特征经池化(例如平均池化)、归一化处理后,获得了告警数据a2,....,an与事件e1的匹配值。
下面描述告警数据与告警事件的匹配过程。
对于告警流a1,....,an,可以记为A0=(a1,....,an)=(A(0,1),....,A(0,n)),A0表示初始待匹配的告警流。
新建告警事件e1,e1=(A(0,1),),此时待匹配的告警流为A1=(a2,....,an)=(A(1,1),....,A(1,n-1))。
依次将告警数据a2,....,an与事件e1匹配,并且每次匹配后根据匹配结果更新告警事件e1。例如在告警数据a2与告警事件e1匹配时,告警事件e1=(A(0,1),A(1,1))。之后将告警数据a3与告警事件e1=(A(0,1),A(1,1))匹配,并且在匹配后根据匹配结果更新告警事件e1。告警数据a4,....,an与告警事件e1的匹配与前述a2、a3的匹配过程类似。
在完成告警数据a2,....,an与告警事件e1的匹配过程后,待匹配的告警流A1中与告警事件e1匹配的告警数据被添加至告警事件e1中,此时从告警流a1,....,an中完成了对同属于告警事件e1的告警数据的归并。在待匹配的告警流A1不为空集时,表示待匹配的告警流A1中还存在不与告警事件e1匹配的告警数据,将其记为待匹配的告警流A2。之后对待匹配的告警流A2执行上述类似的匹配过程。
新建告警事件e2,告警事件e2中包括待匹配的告警流A2中第一个告警数据,之后将待匹配的告警流A2中的除第一个告警数据之外的其他告警数据依次与告警事件e2进行匹配,匹配过程与上述与告警事件e1的匹配过程类似。
在待匹配的告警流Ai为空集时,表示告警流a1,....,an中所有的告警数据都已经匹配完毕。根据告警数据的匹配结果,告警流被划分为了至少一个告警事件。
上述实施例能够获取告警流中的告警数据的第一告警特征,并基于这些告警数据的时间信息,将告警流划分为至少一个告警事件,每个告警事件中包括至少一个告警数据。这样能够一次性地解决属于同一事件的告警,能够有效提升处理告警的运维效率。
对于同一告警事件中的告警数据,还可以划分为根告警数据和从告警数据。根告警数据指示直接由故障引发的告警,在根告警被解决之后,从告警会自动恢复。因此识别告警事件中的根告警数据能够进一步提升处理告警的运维效率。
在一些实施例中,该告警数据处理方法还包括:获取同一告警事件中的一个或多个告警数据的第二告警特征;根据第二告警特征,确定每个告警事件的根告警数据。每个告警数据的第二告警特征例如根据该告警数据本身的信息以及告警事件中其他告警数据的信息确定。
图4示出本公开一些实施例的识别根告警数据的模型结构示意图。如图4所示,告警数据am,am+i,....,am+j属于同一告警事件,ym,ym+i,....,ym+j表示对应的告警数据am,am+i,....,am+j为根告警数据的概率值。图4中第二告警特征与第一告警特征的获取方式类似。对于同一事件中的告警数据,在获取告警数据自身的特征后,通过长短期记忆网络获取告警数据的结合了其他告警数据的特征信息的第二告警特征,从而更准确地识别出根告警数据。
在一些实施例中,获取同一告警事件中的一个或多个告警数据的第二告警特征包括:在同一告警事件中的一个或多个告警数据中,获取每个告警数据的中间特征;根据告警事件中每个告警数据的中间特征,获取每个告警数据的第二告警特征。
获取告警事件中的告警数据的中间特征与前述获取告警流中的告警数据的中间特征方式类似,这里不再赘述。
在一些实施例中,根据告警事件中每个告警数据的中间特征,获取每个告警数据的第二告警特征包括:利用第二向长短期记忆网络对由告警事件中每个告警数据的中间特征构成的序列进行处理,以获得每个告警数据的第二告警特征。通过长短期记忆网络对同一告警事件中的告警数据的中间特征进行处理后,获取的第二告警特征能够带有该告警事件中与该告警数据邻近的告警数据的信息。因此基于第二告警特征进行处理,能够提升对该告警事件中的根告警数据的识别的准确性。
在一些实施例中,根据所述第二告警特征,确定每个告警事件的根告警数据包括:对于每个告警事件中的一个或多个告警数据:利用条件随机场(Conditional RandomField,简称:CRF)层对一个或多个告警数据的第二告警特征构成的序列进行处理,以获得一个或多个告警数据中的每个告警数据为根告警数据的概率值;将与最大概率值对应的告警数据确定为告警事件的根告警数据。当然,也可以结合概率值与其他条件来确定根告警数据,例如,将满足预设筛选条件的、具有最大概率值的告警数据确定为告警事件的根告警数据。
上述实施例在识别同一告警事件的根告警数据时,获取的中间特征、第二告警特征与前述进行告警数据与告警事件的匹配过程中获取中间特征、第一告警特征相对应,因此可以采用同样的处理模型。在一些实施例中,第一双向长短期记忆网络和第二双向长短期记忆网络是相同的网络模型、并且具有相同的网络参数值。例如,第一双向长短期记忆网络和第二双向长短期记忆网络是相同的。此外还可以基于管道(Pipeline)训练方式并行处理识别根告警数据过程和告警数据与告警事件的匹配过程。例如,可以获取标记了所属告警事件和是否为根因告警的告警数据作为训练数据。然后,利用相同的双向长短期记忆网络作为特征抽取模型(即第一双向长短期记忆模型和第二双向长短期记忆模型),在抽取各个告警数据的第一告警特征和第二告警特征后,获得预测的对告警事件的划分结果和对根因告警的确定结果。接下来,利用预测的结果与标记值的差距,对预测过程中所用的模型(包括特征抽取模型)进行参数调整,以完成训练过程。在一些实施例中,在识别同一告警事件的根告警数据时和进行告警数据与告警事件的匹配过程中获取中间特征所采用的Bert语言模型、异构图神经网络、图神经网络的模型和参数值也相同。
由于告警数据与告警事件的匹配过程与对同一告警事件中的根告警数据的识别过程相辅相成,并且这两个过程中可以具有相同的特征抽取结构,因此利用相同的双向长短期记忆模型、并进行参数共享能够充分发挥这两个过程的作用,也能提升告警数据的处理效率。
上述实施例在将告警流中的告警数据划分为至少一个告警事件后,进一步确定出每个告警事件中的根告警数据,使得一次性处理告警事件中的告警时,直接处理告警事件中的根告警,使告警事件中的从告警自动恢复,减少了运维工作量,进一步提升了处理告警的运维效率。
图5示出本公开的一些实施例的告警数据处理装置的示意图。如图5所示,该告警数据处理装置50包括:
第一获取模块510,被配置为获取告警流中的一个或多个告警数据的第一告警特征;
匹配模块520,被配置为按照所述一个或多个告警数据的时间信息,依次对每个告警数据进行匹配处理,其中,针对所述每个告警数据,所述匹配模块520包括:
匹配单元5201,被配置为:根据所述告警数据的所述第一告警特征,将所述告警数据与最新建立的告警事件进行匹配,所述告警事件包括与所述告警事件匹配的告警数据;
添加单元5202,被配置为:在所述告警数据与所述告警事件匹配的情况下,将所述告警数据添加至所述告警事件;
新建单元5203,被配置为:在所述告警数据与所述告警事件不匹配的情况下,建立告警事件,并将所述告警数据添加至建立的告警事件。
在一些实施例中,该告警数据处理装置50还包括:
第二获取模块530,被配置为获取同一告警事件中的一个或多个告警数据的第二告警特征;
确定模块540,被配置为根据所述第二告警特征,确定每个告警事件的根告警数据。
在一些实施例中,第一获取模块510被进一步配置为:在告警流中的一个或多个告警数据中,获取每个告警数据的中间特征;根据告警流中每个告警数据的中间特征,获取每个告警数据的第一告警特征。
在一些实施例中,第一获取模块510被进一步配置为利用第一双向长短期记忆网络对由告警流中每个告警数据的中间特征构成的序列进行处理,以获得每个告警数据的第一告警特征。
在一些实施例中,匹配单元5201被进一步配置为:将告警数据的第一告警特征与最新建立的告警事件中包括的告警数据的第一告警特征经池化、归一化处理后,获得告警数据与最新建立的告警事件的匹配值;在匹配值为目标数值的情况下,告警数据与最新建立的告警事件匹配;在匹配值不为目标数值的情况下,告警数据与最新建立的告警事件不匹配。
在一些实施例中,第二获取模块530被进一步配置为:在同一告警事件中的一个或多个告警数据中,获取每个告警数据的中间特征;根据告警事件中每个告警数据的中间特征,获取每个告警数据的第二告警特征。
在一些实施例中,第二获取模块530被进一步配置为:利用第二双向长短期记忆网络对由告警事件中每个告警数据的中间特征构成的序列进行处理,以获得每个告警数据的第二告警特征。
在一些实施例中,第一获取模块510被进一步配置为在告警流中的一个或多个告警数据中,获取每个告警数据的中间特征;利用第一双向长短期记忆网络对由告警流中每个告警数据的中间特征构成的序列进行处理,以获得每个告警数据的第一告警特征,其中,第一双向长短期记忆网络和第二双向长短期记忆网络是相同的网络模型、并且具有相同的网络参数值。
在一些实施例中,第一获取模块510和第二获取模块530被进一步配置为:获取每个告警数据的至少一个子特征;融合每个告警数据的至少一个子特征,以获得每个告警数据的中间特征。
在一些实施例中,第一获取模块510和第二获取模块530被进一步配置为:获取每个告警数据的业务场景特征、网元端口特征、告警类型特征、时间间隔特征中的至少一个。
在一些实施例中,业务场景特征是利用来自变换器的双向编码器表征量语言模型,对告警数据中的业务场景信息进行处理而得到的;网元端口特征是利用异构图神经网络,对发送告警数据的网元端口的物理连接关系进行处理而得到的;告警类型特征是基于一个或多个告警数据中的频繁项集,获得一个或多个告警数据的告警类型之间的关系,并利用图神经网络对告警类型之间的关系进行处理而得到的;时间间隔特征是根据告警数据与在告警流中在告警数据之前发送的上一告警数据的告警时间间隔而得到的。
在一些实施例中,第一获取模块510和第二获取模块530被进一步配置为:将每个告警数据的至少一个子特征转换到预设维度;利用第三双向长短期记忆网络对由进行维度转换后的至少一个子特征构成的序列进行处理,以获得每个告警数据的中间特征。
在一些实施例中,确定模块540被进一步配置为:对于每个告警事件中的一个或多个告警数据:利用条件随机场对告警事件中的一个或多个告警数据的第二告警特征进行处理,以获得告警事件中的每个告警数据为根告警数据的概率值;将与最大概率值对应的告警数据确定为告警事件的根告警数据。
上述实施例能够获取告警流中的告警数据的第一告警特征,并基于这些告警数据的时间信息,将告警流划分为至少一个告警事件,每个告警事件中包括至少一个告警数据。这样能够一次性地解决属于同一事件的告警,能够有效提升处理告警的运维效率。
并且上述实施例在将告警流中的告警数据划分为至少一个告警事件后,进一步确定出每个告警事件中的根告警数据,使得一次性处理告警事件中的告警时,直接处理告警事件中的根告警,使告警事件中的从告警自动恢复,减少了运维工作量,进一步提升了处理告警的运维效率。
本公开的实施例中的告警数据处理装置可各由各种计算设备或计算机系统来实现,下面结合图6以及图7进行描述。
图6示出本公开的另一些实施例的告警数据处理装置的结构示意图。如图6所示,该实施例的装置60包括:存储器610以及耦接至该存储器610的处理器620,处理器620被配置为基于存储在存储器610中的指令,执行本公开中任意一些实施例中的告警数据处理方法。
其中,存储器610例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。
图7示出本公开的又一些实施例的告警数据处理装置的结构示意图。如图7所示,该实施例的装置70包括:存储器710以及处理器720,分别与存储器610以及处理器620类似。还可以包括输入输出接口730、网络接口740、存储接口750等。这些接口730,740,750以及存储器710和处理器720之间例如可以通过总线760连接。其中,输入输出接口730为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口740为各种联网设备提供连接接口,例如可以连接到数据库服务器或者云端存储服务器等。存储接口750为SD卡、U盘等外置存储设备提供连接接口。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一序列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (17)

1.一种告警数据处理方法,包括:
获取告警流中的一个或多个告警数据的第一告警特征;
按照所述一个或多个告警数据的时间信息,依次对每个告警数据进行匹配处理,其中,针对所述每个告警数据,所述匹配处理包括:
根据所述告警数据的所述第一告警特征,将所述告警数据与最新建立的告警事件进行匹配,所述告警事件包括与所述告警事件匹配的告警数据;
在所述告警数据与所述告警事件匹配的情况下,将所述告警数据添加至所述告警事件;
在所述告警数据与所述告警事件不匹配的情况下,建立告警事件,并将所述告警数据添加至建立的告警事件。
2.根据权利要求1所述的告警数据处理方法,其中,所述获取告警流中的一个或多个告警数据的第一告警特征包括:
在所述告警流中的一个或多个告警数据中,获取每个告警数据的中间特征;
根据所述告警流中每个告警数据的中间特征,获取所述每个告警数据的第一告警特征。
3.根据权利要求2所述的告警数据处理方法,其中,所述根据所述告警流中每个告警数据的中间特征,获得所述每个告警数据的第一告警特征包括:
利用第一双向长短期记忆网络对由所述告警流中每个告警数据的中间特征构成的序列进行处理,以获得所述每个告警数据的第一告警特征。
4.根据权利要求1所述的告警数据处理方法,其中,所述根据所述告警数据的所述第一告警特征,将所述告警数据与最新建立的告警事件进行匹配包括:
将所述告警数据的第一告警特征与最新建立的告警事件中包括的告警数据的第一告警特征经池化、归一化处理后,获得所述告警数据与最新建立的告警事件的匹配值;
在匹配值为目标数值的情况下,所述告警数据与最新建立的告警事件匹配;
在匹配值不为目标数值的情况下,所述告警数据与最新建立的告警事件不匹配。
5.根据权利要求1所述的告警数据处理方法,还包括:
获取同一告警事件中的一个或多个告警数据的第二告警特征;
根据所述第二告警特征,确定每个告警事件的根告警数据。
6.根据权利要求5所述的告警数据处理方法,其中,所述根据所述第二告警特征,确定每个告警事件的根告警数据包括:
对于每个告警事件中的一个或多个告警数据:
利用条件随机场对所述告警事件中的一个或多个告警数据的第二告警特征进行处理,以获得所述告警事件中的每个告警数据为根告警数据的概率值;
将与最大概率值对应的告警数据确定为所述告警事件的根告警数据。
7.根据权利要求5所述的告警数据处理方法,其中,所述获取同一告警事件中的一个或多个告警数据的第二告警特征包括:
在同一告警事件中的一个或多个告警数据中,获取每个告警数据的中间特征;
根据所述告警事件中每个告警数据的中间特征,获取所述每个告警数据的第二告警特征。
8.根据权利要求7所述的告警数据处理方法,其中,所述根据所述告警事件中每个告警数据的中间特征,获取所述每个告警数据的第二告警特征包括:
利用第二双向长短期记忆网络对由所述告警事件中每个告警数据的中间特征构成的序列进行处理,以获得所述每个告警数据的第二告警特征。
9.根据权利要求8所述的告警数据处理方法,其中,所述获取告警流中的一个或多个告警数据的第一告警特征包括:
在所述告警流中的一个或多个告警数据中,获取每个告警数据的中间特征;
利用第一双向长短期记忆网络对由所述告警流中每个告警数据的中间特征构成的序列进行处理,以获得所述每个告警数据的第一告警特征;并且
所述第一双向长短期记忆网络和所述第二双向长短期记忆网络是相同的网络模型、并且具有相同的网络参数值。
10.根据权利要求2或7所述的告警数据处理方法,其中,所述获取每个告警数据的中间特征包括:
获取每个告警数据的至少一个子特征;
融合所述每个告警数据的至少一个子特征,以获得所述每个告警数据的中间特征。
11.根据权利要求10所述的告警数据处理方法,其中,所述获取每个告警数据的至少一个子特征包括:
获取每个告警数据的业务场景特征、网元端口特征、告警类型特征、时间间隔特征中的至少一个。
12.根据权利要求11所述的告警数据处理方法,其中:
所述业务场景特征是利用来自变换器的双向编码器表征量语言模型,对所述告警数据中的业务场景信息进行处理而得到的;
所述网元端口特征是利用异构图神经网络,对发送所述告警数据的网元端口的物理连接关系进行处理而得到的;
所述告警类型特征是基于所述一个或多个告警数据中的频繁项集,获得所述一个或多个告警数据的告警类型之间的关系,并利用图神经网络对所述告警类型之间的关系进行处理而得到的;
所述时间间隔特征是根据所述告警数据与在所述告警流中在所述告警数据之前发送的上一告警数据的告警时间间隔而得到的。
13.根据权利要求10所述的告警数据处理方法,其中,所述融合所述每个告警数据的至少一个子特征,以获得所述每个告警数据的中间特征包括:
将所述每个告警数据的所述至少一个子特征转换到预设维度;
利用第三双向长短期记忆网络对由进行维度转换后的至少一个子特征构成的序列进行处理,以获得所述每个告警数据的中间特征。
14.一种告警数据处理装置,包括:
第一获取模块,被配置为获取告警流中的一个或多个告警数据的第一告警特征;
匹配模块,被配置为按照所述一个或多个告警数据的时间信息,依次对每个告警数据进行匹配处理,包括:
匹配单元,被配置为根据所述告警数据的所述第一告警特征,将所述告警数据与最新建立的告警事件进行匹配,所述告警事件包括与所述告警事件匹配的告警数据;
添加单元,被配置为在所述告警数据与所述告警事件匹配的情况下,将所述告警数据添加至所述告警事件;
新建单元,被配置为在所述告警数据与所述告警事件不匹配的情况下,建立告警事件,并将所述告警数据添加至所述建立的告警事件。
15.根据权利要求14所述的告警处理装置,还包括:
第二获取模块,被配置为获取同一告警事件中的一个或多个告警数据的第二告警特征;
确定模块,被配置为根据所述第二告警特征,确定每个告警事件的根告警数据。
16.一种告警数据处理装置,包括
处理器;以及
耦接至所述处理器的存储器,用于存储指令,所述指令被所述处理器执行时,使所述处理器执行如权利要求1-13中任一项所述的告警数据处理方法。
17.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-13中任一项所述的告警数据处理方法的步骤。
CN202310987695.6A 2023-08-07 2023-08-07 告警数据处理方法、装置和计算机可读存储介质 Pending CN117118804A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310987695.6A CN117118804A (zh) 2023-08-07 2023-08-07 告警数据处理方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310987695.6A CN117118804A (zh) 2023-08-07 2023-08-07 告警数据处理方法、装置和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN117118804A true CN117118804A (zh) 2023-11-24

Family

ID=88810254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310987695.6A Pending CN117118804A (zh) 2023-08-07 2023-08-07 告警数据处理方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN117118804A (zh)

Similar Documents

Publication Publication Date Title
CN111158977B (zh) 一种异常事件根因定位方法及装置
CN111475804A (zh) 一种告警预测方法及系统
CN105095048B (zh) 一种基于业务规则的监控系统告警关联处理方法
CN113556258B (zh) 一种异常检测方法及装置
CN109255523B (zh) 基于kks编码规则和大数据架构的分析指标计算平台
US11847130B2 (en) Extract, transform, load monitoring platform
CN111176953B (zh) 一种异常检测及其模型训练方法、计算机设备和存储介质
CN104267346B (zh) 一种发电机励磁系统故障远程诊断方法
CN112769605B (zh) 一种异构多云的运维管理方法及混合云平台
JP7442001B1 (ja) 水力発電ユニットの故障総合診断方法
CN114666224A (zh) 业务资源容量动态分配方法、装置、设备及存储介质
CN109934368B (zh) 订单数量和订单状态的预测方法、装置及系统
CN113313280A (zh) 云平台的巡检方法、电子设备及非易失性存储介质
KR101960755B1 (ko) 미취득 전력 데이터 생성 방법 및 장치
CN112799868B (zh) 一种根因确定方法、装置、计算机设备及存储介质
CN112700065A (zh) 基于深度学习的业务流程完成时间区间预测方法和系统
CN117149565A (zh) 云平台关键性能指标的状态检测方法、装置、设备及介质
CN109446291B (zh) 一种路网状态统计方法、装置和计算机可读存储介质
CN117118804A (zh) 告警数据处理方法、装置和计算机可读存储介质
CN114911677A (zh) 集群中容器的监控方法、装置和计算机可读存储介质
CN115767601A (zh) 一种基于多维数据的5gc网元自动化纳管方法及装置
CN114757448A (zh) 一种基于数据空间模型的制造环节间最优价值链构建方法
CN114385398A (zh) 一种请求响应状态确定方法、装置、设备和存储介质
CN113821418A (zh) 故障跟因分析方法及装置、存储介质和电子设备
CN114911654A (zh) 一种故障分类方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination