WO2021259273A1

WO2021259273A1 - 树模型构建方法、装置、设备和存储介质

Info

Publication number: WO2021259273A1
Application number: PCT/CN2021/101572
Authority: WO
Inventors: 姜磊; 申山宏; 周波; 杜家强
Original assignee: 中兴通讯股份有限公司
Priority date: 2020-06-24
Filing date: 2021-06-22
Publication date: 2021-12-30
Also published as: JP2023532013A; EP4170975A4; EP4170975A1; CN113839802A

Abstract

一种树模型构建方法、装置、设备和存储介质。该方法包括：对告警数据进行预处理，得到向量化告警关联关系集合(S101)；对向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理(S102)；根据向量化告警关联关系集合、归一化处理后的第一特征以及训练得到的分类模型，确定集合中各告警数据的标签(S103)；根据集合中各告警数据的标签构建树模型(S104)。

Description

树模型构建方法、装置、设备和存储介质

相关申请的交叉引用

本申请基于申请号为202010592638.4、申请日为2020年06月24日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及数据分析处理领域，尤其涉及一种树模型构建方法、装置、设备和存储介质。

背景技术

在通信领域，通信设备经常会产生大量告警，其中有些告警存在关联关系，这些关联关系可以通过拓扑链路、业务关系、专业关系、告警级别等确定。在例如第五代移动通信技术(5th-Generation，5G)等新网络场景下，其拓扑关系和业务关系也发生了变化，传统的根据拓扑链路辅助确定告警根因关系的方式，其有效性会大幅下降。

目前的解决方式是以知识图谱迭代、更新的方式表达告警关联关系。常见的知识图谱更新的方式为全面更新或增量更新，但全面更新的方式对资源消耗较大，增量更新的方式要求半自动化半人工干预，工作量较大。

发明内容

本申请实施例提出一种树模型构建方法、装置、设备和存储介质。

有鉴于此，本申请实施例提供了一种树模型构建方法，该方法包括以下步骤：对告警数据进行预处理，得到向量化告警关联关系集合；对向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理；根据向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定集合中各告警数据的标签；其中，分类模型是通过训练得到的；根据集合中各告警数据的标签构建树模型。

本申请实施例还提出了一种树模型构建装置，该装置包括：处理模块，被设置成对告警数据进行预处理，得到向量化告警关联关系集合；处理模块，还被设置成对向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理；确定模块，被设置成根据向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定集合中各告警数据的标签；其中，分类模型是通过训练得到的；构建模块，被设置成根据集合中各告警数据的标签构建树模型。

本申请实施例还提出了一种设备，该设备包括：存储器、处理器，存储在存储器上并可在处理器上运行的程序以及用于实现处理器和存储器之间的连接通信的数据总线，当程序被处理器执行时，实现前述方法的步骤。

本申请提供了一种可读写存储介质，用于计算机存储，存储介质存储有一个或者多个程序，一个或者多个程序可被一个或者多个处理器执行，以实现前述方法的步骤。

附图说明

图1是本申请实施例提供的一种树模型构建方法的流程图。

图2是本申请实施例提供的独热编码示意图。

图3是本申请实施例提供的独热编码后的告警关联关系的存储方式示意图。

图4是本申请实施例提供的一种确定各告警数据标签的方法的流程图。

图5是本申请实施例提供的一种子树模型示意图。

图6是本申请实施例提供的一种子树模型示意图。

图7是本申请实施例提供的一种子树模型示意图。

图8是本申请实施例提供的一种树模型示意图。

图9是本申请实施例提供的一种树模型构建装置的结构示意图。

图10是本申请实施例提供的一种设备结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚明白，下文中将结合附图对本申请的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

另外，在本申请实施例中，“可选地”或者“示例性地”等词用于表示作例子、例证或说明。本申请实施例中被描述为“可选地”或者“示例性地”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“可选地”或者“示例性地”等词旨在以具体方式呈现相关概念。

为了便于理解本申请实施例提供的方案，示例地给出了部分与本申请相关概念的说明以供参考。如下所示：

主次关系：在同一拓扑关系下，光口接收链路故障导致远端射频模块(Remote Radio Unit，RRU)链路断，在同一拓扑关系和业务关系下，RRU链路断导致长期演进技术(Long Term Evolution，LTE)小区退出服务(简称：LTE小区退服)，假设在10分钟内发生LTE小区退服和RRU链路断告警，则可以将LTE小区退服作为主告警，将RRU链路断作为子告警，两个告警之间的关联关系为主次关系。

同源关系：同一个故障原因导致同一网元产生的多条告警关联，或者，同一个故障原因导致同一专业内相连的多个网元产生的多条告警关联，或者，同一个故障原因导致涉及多个专业的多条告警关联。例如，某一个网元宕机，则其他各网元到该网元的“目的信令点不可达”告警可进行同源关联。

父子关系：表示树模型中告警关联关系的主次关系。在主次关系中，可以将主告警作为父告警，子告警不变，即将主次关系转化为树模型中的父子关系。在同源关系中，可以将源告警作为父告警，其他告警作为子告警，这样可以将同源关系转化为树模型中的父子关系。

在上述概念的基础上，本申请实施例提供了一种树模型构建方法，如图1所示，该方法包括以下步骤：

S101、对告警数据进行预处理，得到向量化告警关联关系集合。

在无线网络中存在基于各种原因产生的大量告警，由于个别告警可能不会对其他告警的关联关系有参考作用，因此，可以以数据清洗的方式对告警数据进行预处理。

在一些实例中，本申请实施例提供一种对告警数据进行预处理的实现方式可以为，对告警数据进行挖掘，得到告警关联关系备选集合，从而实现对告警数据的清洗过程。在本申请实施例中，还可以对挖掘得到的告警关联关系备选集合中的告警数据进行独热编码，进而，将独热编码后的告警数据作为输入，对告警向量神经网络进行训练，以获取到向量化告警关联关系集合。

在一些实例中，上述对告警数据的预处理过程中，可以采用Apriori算法、FP Growth算法、FPMAX算法等进行告警挖掘，告警向量神经网络可以采用Skip-gram等网络模型。

S102、对向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理。

在一些实例中，本步骤中的第一特征可以包括告警拓扑关系、告警业务关系、告警级别、告警专业关系、告警余弦相似度、告警支持度、告警确信度中的至少一项。

在一些实例中，在第一特征包括告警拓扑关系、告警业务关系、告警级别、告警专业关系中的至少之一的情况下，可以根据实际网络结构对各告警关联关系的告警拓扑关系、告警业务关系、告警级别、告警专业关系中的至少之一进行归一化处理。例如，在实际网络结构中，假设告警A和告警B分别发生在室内基带处理单元(Building Base Band Unit，BBU)和基站，以拓扑关系这一特征为例，进行归一化处理。设A是B的父告警，B不是A的父告警，则A是B的父告警这一维度可以为标记为0，B不是A的父告警这一维度可以标记为1。

类似地，告警专业关系、告警业务关系、告警级别也可以根据实际的网络结构进行归一化处理，其中，告警级别的归一化值可以为实际的告警级别值。

在第一特征包括告警支持度、告警确信度、告警余弦相似度中至少之一的情况下，可以根据归一化阈值对各告警关联关系的告警支持度、告警确信度、告警余弦相似度中的至少之一进行归一化处理。例如，以告警余弦相似度为例，假设告警A与告警B的余弦相似度为0.9，设余弦相似度归一化阈值为0.7，即告警A与告警B的余弦相似度大于对应的余弦相似度归一化阈值，则可以将该维度设置为1，相反，若告警A与告警B的余弦相似度小于对应的余弦相似度归一化阈值，则可以将该维度设置为0。

其中，告警数据A与告警数据B的余弦相似度可以通过步骤S101中的告警向量神经网络得到，告警支持度、告警确信度可以在告警数据挖掘过程中获得。

需要说明的是，上述告警支持度、告警确信度、告警余弦相似度可以分别对应相应的归一化阈值。例如，以告警确信度为例，可以按照其对应的归一化阈值对这一特征进行归一化处理。当然，不同第一特征对应的归一化阈值可以相同，本申请实施例对此不作限定。

可以理解的是，在第一特征包括告警拓扑关系、告警业务关系、告警级别、告警专业关系中的至少之一，以及告警支持度、告警确信度、告警余弦相似度中至少之一的情况下，可以按照上述两种方式分别对对应的第一特征进行归一化处理。

S103、根据向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定集合中各告警数据的标签。

其中，上述分类模型可以是通过机器学习训练得到的。例如，通过训练数据和测试数据进行训练、优化。其中，训练数据和测试数据可以根据连续发生的告警时间段进行选取。当然，在进行分类模型训练时，可以事先通过挖掘算法对训练数据和测试数据进行频繁集挖掘，以缩小数据范围。

在一些实例中，在基于训练数据和测试数据训练分类模型的过程中，可以对分类模型的学习效果进行评估，例如，在某次基于测试数据评估网络模型后，该模型的分类准确率不到80％，则可以通过调整参数的方式对网络模型进行优化、重新学习。

在一些实例中，调整参数的方式可以有以下两种情况：一、重新设计训练数据，比如训练数据过少，容易过拟合；二、重新定义正则化，比如训练数据训练结果较优，而测试数据测试结果的准确率不高。

根据训练数据和测试数据训练得到分类模型后，可以基于该分类模型，结合通过步骤S101和步骤S102得到的向量化告警关联关系集合以及归一化处理后的第一特征进行分类、学习，确定向量化告警关联关系集合中各告警数据的标签。

其中，告警数据的标签可以表示该告警数据为父节点或者子节点。

注意，上述分类模型，可以采用逻辑回归或者SVM等常见机器学习的分类模型。

S104、根据集合中各告警数据的标签构建树模型。

通过上述步骤获取向量化告警关联关系集合中各告警数据的标签，即确定告警数据为父节点或者子节点后，可以根据该告警数据的标签构建树模型。

在一些实例中，在已有知识图谱(下文称为原树模型)的情况下，本步骤中根据告警数据的标签可以构建子树模型，并将构建的子树模型融入原树模型中，以构建新的树模型。这样不仅可以基于树模型方便、快速地查找各告警之间的关联关系，并且可以动态实现树模型的不断生长。

本申请实施例提供了一种树模型构建方法，具体为对告警数据进行预处理，得到向量化告警关联关系集合；对向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理；根据向量化告警关联关系集合、归一化处理后的第一特征以及训练得到的分类模型，确定集合中各告警数据的标签；根据集合中各告警数据的标签构建树模型。这样可以通过树模型表达各告警之间的主次关联关系，并且基于训练得到的分类模型对告警数据进行学习、分析，动态生成相应的树模型，从而实现树的不断生长。

如图2所示，在一种实施例中，上述步骤S101中对告警数据进行预处理的过程中，对告警数据进行独热编码时，可以仅将对应的告警维度设为1，其余位置设为0。即在挖掘出的所有可能关联的n个类型告警中采用独热编码时，只将某一告警自身设置为1，其余关联告警均设置为0。相应地，在进行数据保存时，例如，将独热编码后的告警关联关系保存至数据库中，则可以按照告警为1的位置这一维度进行设计。如图3所示，图2中LTE小区退服为1的位置为6，则LTE小区退服对应的独热编码为6，图2中RRU链路断链为1的位置为3，则RRU链路断链对应的独热编码为3，光口接收链路故障为1的位置为2，则光口接收链路故障对应的独热编码为2。

如图4所示，在一种实施例中，上述步骤S103中确定向量化告警关联关系集合中各告警数据的标签的实现方式可以包括但不限于以下步骤：

S401、根据向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定各告警关联关系对应的概率和余弦相似度。

本步骤中的概率可以用于表示对应告警关联关系中，任一告警数据为另一告警数据的父节点的概率，余弦相似度可以用于表示对应的告警关联关系中，任一告警数据与另一告警数据之间的关联性大小。例如，通过告警向量神经网络进行向量化训练，计算向量化告警关联关系集合中两两告警数据之间的余弦相似度，通过逻辑回归分类模型中的Sigmoid函数计算任一告警数据为另一告警数据的父节点的概率。

S402、在余弦相似度大于等于相似度归一化阈值，且对应的告警关联关系的概率大于预设值的情况下，将对应的告警关联关系中任一告警数据的标签标记为父节点，将另一告警数据的标签标记为子节点。

在一些实例中，假设相似度归一化阈值为0.5，计算得到的告警数据A与告警数据B之间的余弦相似度为0.9，大于相似度归一化阈值，则确定告警数据A与告警数据B之间存在强关联性。对应地，若告警数据A为告警数据B的父节点的概率为0.83，大于预设值0.45，则将告警数据A的标签标记为父节点，将告警数据B的标签标记为子节点。

S403、在余弦相似度小于相似度归一化阈值的情况下，将对应的告警关联关系中任一告警数据与另一告警数据的标签均标记为子节点。

同样地，假设相似度归一化阈值为0.5，基于分类模型计算得到的告警数据A与告警数据B之间的余弦相似度为0.35，小于相似度归一化阈值，则确定告警数据A与告警数据B之间不存在强关联性。因此，可以将告警数据A与告警数据B的标签均标记为子节点。

可以理解的是，在树模型的最顶端仅存在一个父节点，由于告警数据A与告警数据B之间不存在强关联性，那么这两个数据也不可能同时为树模型最顶端的父节点，即使告警数据A与告警数据B可能分别为其他节点的父节点，那么告警数据A与告警数据B也必然是其他节点的子节点，因此，可以将不存在强关联性的告警数据A与告警数据B的标签均标记为子节点。

在一种实施例中，上述步骤S104中根据集合中各告警数据的标签构建树模型可以包括以下不同的情形。

在各告警数据的标签不存在冲突的情况下，根据各告警数据的标签构建子树模型。例如，假设在告警数据A和告警数据B中，告警数据A为父节点，告警数据B为子节点，在告警数据B和告警数据C中，告警数据B为父节点，告警数据C为子节点，即告警数据A为告警数据B的父节点，告警数据B为告警数据C的父节点，那么可以基于告警数据A、B、C的标签构建如图5所示的子树模型。

在各告警数据的标签存在冲突的情况下，根据各告警数据所属告警关联关系对应的概率，对各告警数据的标签进行更新，根据更新后的各告警数据的标签构建子树模型。例如，假设在告警数据A和告警数据B中，告警数据A为父节点，告警数据B为子节点，在告警数据B和告警数据C中，告警数据B为父节点，告警数据C为子节点，在告警数据A和告警数据C中，告警数据C为父节点，告警数据A为子节点，即告警数据A、B、C之间的标签产生冲突，不能构成子树模型，那么可以基于各告警数据所属告警关联关系对应的概率对各告警数据的标签进行更新。设告警关联关系A和B中，告警数据A是告警数据B的父节点的概率为53％，告警关联关系B和C中，告警数据B是告警数据C的父节点的概率为85％，告警关联关系A和C中，告警数据C是告警数据A的父节点的概率为75％，则可以选取概率接近50％的告警关联关系，即告警关联关系A和B，将告警数据B为告警数据A的父节点的概率更新为47％，那么在告警数据A和告警数据B中，可以将告警数据A的标签更新为子节点，将告警数据B的标签更新为父节点，即各告警数据更新后的标签为，告警数据B为C的父节点，告警数据C为告警数据A的父节点，这样基于更新后的各告警数据的标签可以构建如图6所示的子树模型。

当然，上述示例均为各告警数据之间存在强关联性，若告警数据之间不存在强关联性，即余弦相似度小于相似度归一化阈值，那么可以按照如下方式更新各告警数据的标签。例如，假设告警关联关系A和C中，告警数据A和告警数据C不存在强关联性，告警关联关系A和B，以及告警关联关系C和B均为强关联性，并且告警数据A是告警数据B的父节点的概率为53％，告警数据B是告警数据C的父节点的概率为85％，那么按照上述方式，可以将不存在强关联性的告警数据A和C的标签均标记为子节点。在告警数据A和告警数据B中，告警数据A为父节点，告警数据B为子节点，在告警数据B和告警数据C中，告警数据B为父节点，告警数据C为子节点。因为，告警数据A的标签更新为子节点，并且其为告警数据B的父节点的概率为53％，那么告警数据B为告警数据A的父节点的概率为47％，可以将告警数据B的标签更新为父节点，即告警数据B作为父节点，告警数据A和C作为子节点，这样可以构建如图7所示的子树模型。

针对上述几种不同的情形构建子树模型后，可以根据构建的子树模型构建树模型，即实现树模型的生长。

同样地，构建树模型的过程中可能存在以下不同的情形。例如，在子树模型的父节点存在于原树模型的情况下，可以将该原树模型与子树模型的父节点相同的节点作为目标节点，将子树模型挂接在原树模型的目标节点上。如图8所示，假设构建的子树模型如虚线框部分所示，其父节点为LTE小区退服，而在原树模型中存在与“LTE小区退服”这一父节点相同的节点，则将原树模型中的“LTE小区退服”作为目标节点，将虚线框部分的子树模型挂接在原树模型的“LTE小区退服”这一节点上，从而实现树模型的生长。

另一种情形，在子树模型的父节点不存在于原树模型的情况下，导致子树模型无法挂接在原树模型上，那么可以根据子树模型中各告警数据所属告警关联关系对应的概率，更新子树模型中各告警数据的标签。例如，可以根据上述所列出的更新各告警数据标签的方式进行更新，并根据更新后的各告警数据的标签重构子树模型，直至重构后的子树模型的父节点存在于原树模型中。这样，可以将原树模型中与重构后的子树模型的父节点相同的节点作为目标节点，将重构后的子树模型挂接在原树模型的目标节点上，以实现树模型的增长。

图9为本申请实施例提供的一种树模型构建装置，如图9所示，该装置包括：处理模块901、确定模块902、构建模块903；

其中，处理模块，被设置成对告警数据进行预处理，得到向量化告警关联关系集合；

处理模块，还被设置成对向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理；

确定模块，被设置成根据向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定集合中各告警数据的标签；

其中，分类模型是通过训练得到的；

第一特征可以包括以下至少一项：告警拓扑关系、告警业务关系、告警级别、告警专业关系、告警余弦相似度、告警支持度、告警确信度。

构建模块，被设置成根据集合中各告警数据的标签构建树模型。

在一种实施例中，上述处理模块，被设置成对告警数据进行挖掘，得到告警关联关系备选集合；对告警关联关系备选集合中的告警数据进行独热编码；根据独热编码后的告警数据进行向量告警神经网络训练，得到向量化告警关联关系集合。

在一种实施例中，上述处理模块的归一化处理过程可以为在第一特征包括告警拓扑关系、告警业务关系、告警级别、告警专业关系中的至少之一的情况下，根据实际网络结构对各告警关联关系的告警拓扑关系、告警业务关系、告警级别、告警专业关系中的至少之一进行归一化处理；

和/或，在第一特征包括告警支持度、告警确信度、告警余弦相似度中至少之一的情况下，根据归一化阈值对各告警关联关系的告警支持度、告警确信度、告警余弦相似度中的至少之一进行归一化处理；

其中，告警支持度、告警确信度、告警余弦相似度各自对应相应的归一化阈值。

在一种实施例中，确定模块，可以被设置成根据向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定各告警关联关系对应的概率和余弦相似度；

其中，概率用于表示对应的告警关联关系中，任一告警数据为另一告警数据的父节点的概率，余弦相似度用于表示对应的告警关联关系中，任一告警数据与另一告警数据之间的关联性大小；

在余弦相似度大于等于相似度归一化阈值，且对应的告警关联关系的概率大于预设值的情况下，确定模块可以被设置成将对应的告警关联关系中任一告警数据的标签标记为父节点，将另一告警数据的标签标记为子节点；在余弦相似度小于相似度归一化阈值的情况下，确定模块可以被设置成将对应的告警关联关系中任一告警数据与另一告警数据的标签均标记为子节点。

在一种实施例中，上述构建模块，可以被设置成在各告警数据的标签不存在冲突的情况下，根据各告警数据的标签构建子树模型；

或者，在各告警数据的标签存在冲突的情况下，根据各告警数据所属告警关联关系对应的概率，对各告警数据的标签进行更新，根据更新后的各告警数据的标签构建子树模型；

根据子树模型构建树模型。

在一些实例中，上述构建树模型的实现方式可以包括但不限于以下方式：

在子树模型的父节点存在于原树模型的情况下，将原树模型中与子树模型的父节点相同的节点作为目标节点，将子树模型挂接在原树模型的目标节点上；

或者，在子树模型的父节点不存在于原树模型的情况下，根据子树模型中各告警数据所属告警关联关系对应的概率，更新子树模型中各告警数据的标签；

根据更新后的各告警数据的标签重构子树模型，直至重构后的子树模型的父节点存在于原树模型中；

将原树模型中与重构后的子树模型的父节点相同的节点作为目标节点，将重构后的子树模型挂接在原树模型的目标节点上。

本实施例提供的树模型构建装置用于实现图1所示实施例的树模型构建方法，其实现原理和技术效果类似，此处不再赘述。

图10为一实施例提供的一种设备的结构示意图，如图10所示，该设备包括处理器1001和存储器1002；设备中处理器1001的数量可以是一个或多个，图10中以一个处理器1001为例；设备中的处理器1001和存储器1002可以通过总线或其他方式连接，图10中以通过总线连接为例。

存储器1002作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本申请图1实施例中的树模型构建方法对应的程序指令/模块(例如，树模型构建装置中的处理模块901、确定模块902、构建模块903)。处理器1001通过运行存储在存储器1002中的软件程序、指令以及模块实现上述的树模型构建方法。

存储器1002可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据机顶盒的使用所创建的数据等。此外，存储器1002可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。

本申请实施例还提供了一种可读写存储介质，用于计算机存储，该存储介质存储有一个或者多个程序，一个或者多个程序可被一个或者多个处理器执行，以执行一种树模型构建方法，该方法包括：

对告警数据进行预处理，得到向量化告警关联关系集合；

对向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理；

根据向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定集合中各告警数据的标签；

其中，分类模型是通过训练得到的；

根据集合中各告警数据的标签构建树模型。

本申请实施例提供了一种树模型构建方法、装置、设备和存储介质，其中该方法包括对告警数据进行预处理，得到向量化告警关联关系集合；对向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理；根据向量化告警关联关系集合、归一化处理后的第一特征以及训练得到的分类模型，确定集合中各告警数据的标签；根据集合中各告警数据的标签构建树模型。这样可以通过树模型表达各告警之间的主次关联关系，并且基于训练得到的分类模型对告警数据进行学习、分析，动态生成相应的树模型，从而实现树的不断生长。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。

在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

以上参照附图仅说明了本申请的一些实施例而已，并非因此局限本申请的权利范围。本领域技术人员不脱离本申请的范围和实质内所作的任何修改、等同替换和改进，均应在本申请的权利范围之内。

Claims

一种树模型构建方法，包括以下步骤：

对告警数据进行预处理，得到向量化告警关联关系集合；

对所述向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理；

根据所述向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定所述集合中各告警数据的标签；

其中，所述分类模型是通过训练得到的；

根据所述集合中各告警数据的标签构建树模型。
根据权利要求1所述的方法，其中，所述对告警数据进行预处理，得到向量化告警关联关系集合，包括：

对所述告警数据进行挖掘，得到告警关联关系备选集合；

对所述告警关联关系备选集合中的告警数据进行独热编码；

根据独热编码后的告警数据进行告警向量神经网络训练，得到向量化告警关联关系集合。
根据权利要求1所述的方法，其中，所述第一特征包括以下至少一项：

告警拓扑关系、告警业务关系、告警级别、告警专业关系、告警余弦相似度、告警支持度、告警确信度。
根据权利要求3所述的方法，其中，对所述向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理，包括：

在所述第一特征包括告警拓扑关系、告警业务关系、告警级别、告警专业关系中的至少之一的情况下，根据实际网络结构对所述各告警关联关系的告警拓扑关系、告警业务关系、告警级别、告警专业关系中的至少之一进行归一化处理；

和/或，在所述第一特征包括告警支持度、告警确信度、告警余弦相似度中至少之一的情况下，根据归一化阈值对所述各告警关联关系的告警支持度、告警确信度、告警余弦相似度中的至少之一进行归一化处理；

其中，告警支持度、告警确信度、告警余弦相似度各自对应相应的归一化阈值。
根据权利要求1-4任一项所述的方法，其中，所述根据所述向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定所述集合中各告警数据的标签，包括：

根据所述向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定各告警关联关系对应的概率和余弦相似度；

其中，所述概率用于表示对应的告警关联关系中，任一告警数据为另一告警数据的父节点的概率，所述余弦相似度用于表示对应的告警关联关系中，任一告警数据与另一告警数据之间的关联性大小；

在所述余弦相似度大于等于相似度归一化阈值，且对应的告警关联关系的概率大于预设值的情况下，将所述对应的告警关联关系中任一告警数据的标签标记为父节点，将另一告警数据的标签标记为子节点；

在所述余弦相似度小于相似度归一化阈值的情况下，将对应的告警关联关系中任一告警数据与另一告警数据的标签均标记为子节点。
根据权利要求1所述的方法，其中，所述根据所述集合中各告警数据的标签构建树模型，包括：

在所述各告警数据的标签不存在冲突的情况下，根据所述各告警数据的标签构建子树模型；

或者，在所述各告警数据的标签存在冲突的情况下，根据所述各告警数据所属告警关联关系对应的概率，对所述各告警数据的标签进行更新，根据更新后的所述各告警数据的标签构建子树模型；

根据所述子树模型构建所述树模型。
根据权利要求6所述的方法，其中，所述根据所述子树模型构建所述树模型，包括：

在所述子树模型的父节点存在于原树模型的情况下，将所述原树模型中与所述子树模型的父节点相同的节点作为目标节点，将所述子树模型挂接在所述原树模型的目标节点上；

或者，在所述子树模型的父节点不存在于所述原树模型的情况下，根据所述子树模型中各告警数据所属告警关联关系对应的概率，更新所述子树模型中各告警数据的标签；

根据更新后的各告警数据的标签重构子树模型，直至重构后的子树模型的父节点存在于所述原树模型中；

将所述原树模型中与重构后的子树模型的父节点相同的节点作为目标节点，将所述重构后的子树模型挂接在所述原树模型的目标节点上。
一种树模型构建装置，包括：

处理模块，被设置成对告警数据进行预处理，得到向量化告警关联关系集合；

所述处理模块，还被设置成对所述向量化告警关联关系集合中各告警关联关系的第一特征进行归一化处理；

确定模块，被设置成根据所述向量化告警关联关系集合、归一化处理后的第一特征以及分类模型，确定所述集合中各告警数据的标签；

其中，所述分类模型是通过训练得到的；

构建模块，被设置成根据所述集合中各告警数据的标签构建树模型。
一种设备，包括：存储器、处理器，存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线，其中，所述程序被所述处理器执行时实现如权利要求1-7任一项所述的树模型构建方法。
一种可读写存储介质，用于计算机存储，其中，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如权利要求1-7任一项所述的树模型构建方法。