CN115426671B - 图神经网络训练、无线小区故障预测方法、系统及设备 - Google Patents
图神经网络训练、无线小区故障预测方法、系统及设备 Download PDFInfo
- Publication number
- CN115426671B CN115426671B CN202211064023.XA CN202211064023A CN115426671B CN 115426671 B CN115426671 B CN 115426671B CN 202211064023 A CN202211064023 A CN 202211064023A CN 115426671 B CN115426671 B CN 115426671B
- Authority
- CN
- China
- Prior art keywords
- time
- neural network
- space
- fault
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 134
- 238000012549 training Methods 0.000 title claims abstract description 87
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000010586 diagram Methods 0.000 claims abstract description 131
- 230000001364 causal effect Effects 0.000 claims abstract description 76
- 238000013507 mapping Methods 0.000 claims abstract description 63
- 239000011159 matrix material Substances 0.000 claims abstract description 37
- 238000011176 pooling Methods 0.000 claims description 62
- 238000012545 processing Methods 0.000 claims description 53
- 230000006870 function Effects 0.000 claims description 40
- 239000013598 vector Substances 0.000 claims description 31
- 230000004913 activation Effects 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 12
- 210000004027 cell Anatomy 0.000 description 93
- 238000010801 machine learning Methods 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000000547 structure data Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 208000018910 keratinopathic ichthyosis Diseases 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/04—Arrangements for maintaining operational condition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/06—Testing, supervising or monitoring using simulated traffic
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了图神经网络训练或无线小区故障预测方法、系统及设备,通过利用性能指标及故障类型构建故障因果路径图,使用该路径图对无线小区的历史性能数据进行图谱化,图谱化数据中不仅包含节点自身特征数据、节点间相关关系的邻接矩阵,还包含时序数据,从而能够在空间和时间两个维度对无线小区的历史性能数据进行聚合,能够提高故障预测准确性。针对图谱化数据,提出构建多层次的图神经网络,提高网络模型的健壮性和预测准确率。因此,本公开实施例采用改进的图神经网络,首次将图神经网络应用在无线小区故障预测场景中,也是业界首次使用故障因果路径图进行故障预测,在空间和时间两个维度将数据聚合,提高故障预测准确性。
Description
技术领域
本发明涉及无线网络技术领域,具体地说,涉及图神经网络训练、无线小区故障预测方法、系统及设备。
背景技术
无线小区也称蜂窝小区,是指在蜂窝移动通信系统中,其中的一个基站或基站的一部分(扇形天线)所覆盖的区域,在这个区域内移动台可以通过无线信道可靠地与基站进行通信,因此无线小区是为用户提供无线通信业务的一片区域,是无线网络的基本组成单位。
无线小区的性能会受到许多因素的影响,例如数据和语音业务负载、RF覆盖范围、小区间干扰水平、用户位置和硬件故障。在许多情况下,一些无线小区的性能可能看起来异常,并且由这些小区服务的移动用户将遭受糟糕的用户体验,糟糕的用户体验会引起客户的不满。
因此,无线小区网络运营商通常需要检测故障行为,然后在发生故障之前采取措施来解决故障问题,无线小区的故障预测是电信网络智能运维的应用场景之一。因此,如何精确预测无线小区的故障,是业界普遍考虑的课题。
需要说明的是,上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
针对现有技术中的问题,本发明的目的在于提供图神经网络训练、无线小区故障预测方法、系统及设备,克服了现有技术的困难,能够提升无线小区故障预测准确率。
本发明的实施例提供一种图神经网络训练方法,其包括:
获取无线小区的故障因果路径图,在故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
基于故障因果路径图对无线小区的历史性能数据基于时序关系进行图谱化处理,得到训练数据,训练数据包括故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中特征向量是对历史性能数据中的各个时间点的节点数据进行向量化得到的;
利用训练数据训练图神经网络。
可选地,图神经网络包括至少两个级联的网络单元及第一全连接层,每个网络单元包括依次级联的时空图神经网络、通道注意力模块和激活函数;
利用训练数据训练图神经网络包括:
将训练数据输入第一个网络单元直到获得第一全连接层输出的故障预测值,根据故障预测值与实际值之间的损失函数训练每个网络单元,直到达到训练停止条件;
其中,在每个网络单元上,利用时空图神经网络提取多个通道的特征,利用通道注意力模块对多个通道的特征进行加权处理,并在激活函数中对加权特征进行处理并输出。
可选地,其中,每个时空图神经网络包括至少两个级联的时空图卷积块和第二全连接层;
利用时空图神经网络提取多个通道的特征,包括:
通过级联的时空图卷积块进行空间特征及时间依赖关系特征的提取处理,得到时空特征;
将时空特征输入第二全连接层,输出多个通道的特征。
可选地,时空图卷积块包括两个门控时间卷积层及位于两个门控时间卷积层之间的图卷积层;
通过级联的时空图卷积块进行空间特征及时间依赖关系特征的提取处理,得到时空特征,包括:
利用门控时间卷积层进行门控时间卷积运算,得到时间依赖关系特征;
利用图卷积层进行图卷积运算,得到空间特征;
根据时间依赖关系特征和空间特征得到时空特征。
可选地,在图神经网络包括偶数个单向级联的网络单元的情况下,从第一个网络单元开始,在第偶数位的网络单元之后连接池化层,池化层与第一全连接层之间设置为单向级联关系;
将训练数据输入第一个网络单元直到获得第一全连接层输出的故障预测值,包括:
将训练数据输入第一个网络单元,并将第偶数位的网络单元的输出结果输入到其后连接的池化层,通过池化层进行池化处理;
将池化结果输入第一全连接,通过第一全连接层对池化结果进行处理,得到故障预测值。
可选地,损失函数为交叉熵损失函数。
本公开实施例还提供一种无线小区故障预测方法,其包括:
获取无线小区的故障因果路径图,在故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
基于故障因果路径图对目标无线小区的目标性能数据基于时序关系进行图谱化处理,得到图谱化数据,图谱化数据包括故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中特征向量是对目标性能数据中各个时间点的节点数据进行向量化得到的;
将图谱化数据输入图神经网络,输出下一个目标时间点的故障预测值。
在一些实施例中,图神经网络包括至少两个级联的网络单元及第一全连接层,每个网络单元包括依次级联的时空图神经网络、通道注意力模块和激活函数;
将图谱化数据输入图神经网络,输出下一个时间点的故障预测值,包括:
将图谱化数据输入第一个网络单元直到获得第一全连接层输出的下一个时间点的故障预测值;
其中,在每个网络单元上,利用时空图神经网络提取多个通道的特征,利用通道注意力模块对多个通道的特征进行加权处理,并在激活函数中对加权特征进行处理并输出。
在一些实施例中,其中,每个时空图神经网络包括至少两个级联的时空图卷积块和第二全连接层;
利用时空图神经网络提取多个通道的特征,包括:
通过级联的时空图卷积块进行空间特征以及时间依赖关系特征的提取处理,得到时空特征;
将时空特征输入第二全连接层,输出多个通道的特征。
在一些实施例中,时空图卷积块包括两个门控时间卷积层及位于两个门控时间卷积层之间的图卷积层;
通过级联的时空图卷积块进行空间特征以及时间依赖关系特征的提取处理,得到时空特征,包括:
利用门控时间卷积层进行门控时间卷积运算,得到时间依赖关系特征;
利用图卷积层进行图卷积运算,得到空间特征;
根据时间依赖关系特征和空间特征得到时空特征。
在一些实施例中,在图神经网络包括偶数个单向级联的网络单元的情况下,从第一个网络单元开始,在第偶数位的网络单元之后连接池化层,池化层与第一全连接层之间设置为单向级联关系;
将图谱化数据输入第一个网络单元直到获得第一全连接层输出的下一个时间点的故障预测值,包括:
将图谱化数据输入第一个网络单元,并将第偶数位的网络单元的输出结果输入到其后连接的池化层,通过池化层进行池化处理;
将池化结果输入第一全连接,通过第一全连接层对池化结果进行处理,获得下一个时间点的故障预测值。
本公开实施例还提供一种图神经网络训练系统,其包括:
第一获取模块,获取无线小区的故障因果路径图,在故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
第一图谱化处理模块,基于故障因果路径图对无线小区的历史性能数据进行图谱化处理,得到训练数据,训练数据包括故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中特征向量是对历史性能数据中的各个时间点的节点数据进行向量化得到的;
训练模块,利用训练数据训练图神经网络。
本公开实施例还提供一种无线小区故障预测系统,其包括:
第二获取模块,获取无线小区的故障因果路径图,在故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
第二图谱化处理模块,基于故障因果路径图对目标无线小区的目标性能数据进行图谱化处理,得到图谱化数据,图谱化数据包括故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中特征向量是对目标性能数据中各个时间点的节点数据进行向量化得到的;
预测模块,将图谱化数据输入图神经网络,输出下一个目标时间点的故障预测值。
本发明的实施例还提供一种电子设备,包括:
处理器;
存储器,其中存储有处理器的可执行指令;
其中,处理器配置为经由执行可执行指令来执行上述图神经网络训练或无线小区故障预测方法的步骤。
本发明的实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现上述图神经网络训练或无线小区故障预测方法的步骤。
本发明的目的在于提供图神经网络训练或无线小区故障预测方法、系统及设备,通过利用性能指标及故障类型构建故障因果路径图,使用该路径图对无线小区的历史性能数据进行图谱化,图谱化数据中不仅包含节点自身特征数据、节点间相关关系的邻接矩阵,还包含时序数据,从而能够在空间和时间两个维度对无线小区的历史性能数据进行聚合,能够提高故障预测准确性。针对图谱化数据,提出构建多层次的图神经网络,提高网络模型的健壮性和预测准确率,并在具体故障类型预测上有良好的表现。
因此,本公开实施例采用改进的图神经网络,首次将图神经网络应用在无线小区故障预测场景中,也是业界首次使用故障因果路径图进行故障预测,在空间和时间两个维度将数据聚合,并能解决传统机器学习和深度学习不能很好处理复杂的图结构数据和高稀疏性的节点属性数据的问题,提高故障预测准确性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是本公开实施例提供的无线小区故障预测方法的流程图;
图2-图4是本公开实施例提供的无线小区故障预测方法的原理示意图;
图5是本公开实施例提供的图神经网络的结构图之一;
图6是本公开实施例提供的图神经网络的结构图之二;
图7是本公开实施例提供的图神经网络中网络单元的结构图;
图8是本公开实施例提供的图神经网络训练方法的流程图;
图9是本公开实施例提供的图神经网络训练系统的模块结构示意图;
图10是本公开实施例提供的无线小区故障预测系统的模块结构示意图;
图11是本发明的电子设备运行的示意图;
图12示出了根据本公开实施方式的存储介质的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使本发明全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件转发模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
此外,附图中所示的流程仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤可以分解,有的步骤可以合并或部分合并,且实际执行的顺序有可能根据实际情况改变。具体描述时使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。需要说明的是,在不冲突的情况下,本发明的实施例及不同实施例中的特征可以相互组合。
在相关技术中,运营商依靠性能指标,如关键性能指标(Key PerformanceIndicator,KPI)和关键质量指标(Key Quality Indicator,KQI)来预测无线小区的性能。
目前,传统小区故障预测算法主要依据上述KPI、KQI等性能指标进行预测,主要分为统计模型预测方法、数学模型预测方法和智能预测方法。通过利用KPI数据特征或者将其维度变换,基于机器学习算法如BP(Back Propagation)神经网络、贝叶斯网络、核方法,基于深度学习算法如长短期记忆LSTM(Long short-term memory)和卷积神经网络CNN(Convolutional Neural Networks)等,实现对无线小区的故障预测诊断。
但是,本案发明人在实践中发现,相关技术的无线小区故障预测方案准确率不高。
本案发明人通过对相关技术进行剖析发现,相关技术在进行故障预测时,单纯考虑传统KPI等性能指标,并据此构建故障预测规则或机器学习模型,忽略了故障之间时序性影响的缺陷,这是导致无线小区故障预测准确率不高的原因之一。
本公开实施例提供一种基于图神经网络的无线小区故障预测方案,其发明思想是,利用性能指标及故障类型构建故障因果路径图,使用该路径图对无线小区的历史性能数据进行图谱化,图谱化数据中不仅包含节点自身特征数据、节点间相关关系的邻接矩阵,还包含时序数据,从而能够在空间和时间两个维度对无线小区的历史性能数据进行聚合,能够提高故障预测准确性。针对图谱化数据,提出构建多层次的图神经网络,提高网络模型的健壮性和预测准确率,并在具体故障类型预测上有良好的表现。
因此,本公开实施例采用改进的图神经网络,首次将图神经网络应用在无线小区故障预测场景中,也是业界首次使用故障因果路径图进行故障预测,在空间和时间两个维度将数据聚合,并能解决传统机器学习和深度学习不能很好处理复杂的图结构数据和高稀疏性的节点属性数据的问题,提高故障预测准确性。
图1为本公开实施例提供的无线小区故障预测方法的流程图。如图1所示,无线小区故障预测方法包括如下步骤:
步骤110:获取无线小区的故障因果路径图,在故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
步骤120:基于故障因果路径图对目标无线小区的目标性能数据基于时序关系进行图谱化处理,得到图谱化数据,图谱化数据包括故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中特征向量是对目标性能数据中各个时间点的节点数据进行向量化得到的;
步骤130:将图谱化数据输入图神经网络,输出下一个目标时间点的故障预测值。
本公开实施例使用故障因果路径图对无线小区的目标性能数据基于时序关系进行图谱化,图谱化数据中不仅包含节点自身特征数据、节点间相关关系的邻接矩阵,还包含时序数据,从而能够在空间和时间两个维度对无线小区的历史性能数据进行聚合,能够提高故障预测准确性。针对图谱化数据,提出构建多层次的图神经网络,提高网络模型的健壮性和预测准确率,并在具体故障类型预测上有良好的表现。
因此,本公开实施例提出基于知识引导和图神经网络的无线小区故障预测方法,能够提高故障预测的准确性。
举例来说,如图2所示,T0、T1……TK-1、TK表征时间点,C0表征小区a未发生故障,C1表征小区发生故障,x表征输入Input,即引发当前小区结果C0或C1的性能数据。使用本实施例,通过T0-到TK-1之间的目标性能数据预测TK时间点小区a的故障情况。
图3为关于故障因果路径图的原理示意图,整个图由父子关系的多层结构组成。其中叶子节点A、B、C、D分别表征四种故障类型,其上方的父节点是导致故障的多种性能指标,其中包含箭头的边由父节点指向下层子节点,表征故障因果关系。
其中,叶子节点A基于时序关系Temporal的故障类型表征为[1,0,1,0],其中1表征发生故障A,0表征未发生故障A。其他叶子节点B、C、D参考之。
图4为基于时序关系(Temporal)的无线小区性能数据,结合图4所示,1、2、3、4分别表征时间点,在时间节点1发生故障类型A和B,因此在进行图谱化时,图3所示A和B的图谱化数据中的第一位分别赋值为1,而C和D的图谱化数据中的第一位分别赋值为0。对应地,参考图3所示,直接或间接导致故障类型A和B的节点,其图谱化数据的第一位分别赋值1,而直接或间接导致故障类型D的节点,其图谱化数据的第一位被赋值为0。
对时间节点2、3和4,请参考上述时间节点1的内容,不再赘述。
由实施例可知,使用故障因果路径图对目标性能数据进行图谱化处理,并借助图神经网络进行故障预测,从而能够解决相关技术未充分考虑故障之间时序性影响的缺陷,提升无线小区故障预测准确性。
在本公开实施例中,故障因果路径图的构建方法具体说明如下:
(1)在构建的故障因果路径图中,定义故障类型为m1,m2,m3,...,m|M|,其中|M|表示总的故障类型数量,其中,故障类型可以包含:空口上行用户面丢包率、PDCP流量、同频切换失败次数等等;
(2)对任意无线小区被定义为a,无线小区性能数据的时间序列为T表示无效小区的时间点;
(3故障因果路径图包含所有导致故障的性能指标,如KPI、异常描述、异常原因和处理方法等,整个图由父子关系的多层结构组成。每个叶子节点为包含在M中的具体故障类型,父节点则是导致故障的多种性能指标,定义Λ=a1,a2,...,aΛ,其中|Λ|为父节点的总数量;
(4)定义小区发生故障时具有不变的无向图G=(V,E),节点结合V=v1,v2,...,v|N|,且|N|=|M|+|Λ|;
边的节点E=e1,e2,...,e|H|,其中H为父子关系数量,则邻接矩阵A∈R|N|×|N|;
(5)进行图谱化处理,当发生一次故障时赋值每个节点vi一个标量属性,初始化G的特征向量记为F∈R|N|×1,在T的时间线上,小区性能数据可以使用F∈R|N|×T表示。例如,本公开实施例可以使用8周或其他时间区间为一个周期,利用该周期内的目标性能数据去预测第9周是否发生故障。
之后,将上述邻接矩阵A和特征向量F作为图神经网络的输入。
在本公开实施例中,参考图5,图神经网络包括至少两个级联的网络单元及第一全连接层,每个网络单元包括依次级联的时空图神经网络ST-GCN(Spatial Temporal GraphConvolutional Networks)、通道注意力模块(Channel-wise Attention Module)和激活函数(Activation Function);
在这种情况下,将图谱化数据输入图神经网络,输出下一个时间点的故障预测值,包括:
将图谱化数据输入第一个网络单元直到获得第一全连接层输出的下一个时间点的故障预测值;
其中,在每个网络单元上,利用时空图神经网络提取多个通道的特征,利用通道注意力模块对多个通道的特征进行加权处理,并在激活函数中对加权特征进行处理并输出。
使用本公开实施例,图神经网络采用ST-GCN、channel-wise attention和激活函数构成的网络单元,图神经网络包含多个网络单元,能够对图谱化数据进行多级特征提取,从而提取到故障预测的关键指标特征,达到特征增强的目的,提升预测准确性。
其中,ST-GCN的核心思想是将时域卷积网络TCN(Temporal ConvolutionalNetwork)与图卷积神经网络GCN(Graph Convolutional Network,GCN)相结合,用来处理有时序关系的图谱化数据。其中,GCN对输入图谱化数据进行空间卷积,即不考虑时间的因素,卷积作用于同一时间点的不同数据。TCN对图谱化数据进行时序卷积,考虑不同时间点同一指标的关系,卷积作用于不同时间点同一指标的数据。
因此,ST-GCN有效提升本案可行性。
其中,通道注意力机制的本质,在于建模了各个特征之间的重要性,对于不同的任务可以根据输入进行特征分配,简单而有效。使用通道注意力模块对图谱化数据中各个通道的特征进行加权处理,得到加权后特征图谱。这样,突出了重要通道的特征,弱化了不重要通道的特征,达到特征增强的目的。
在本公开实施例中,激活函数是一种添加到人工神经网络中的函数,旨在帮助网络学习数据中的复杂模式。类似于人类大脑中基于神经元的模型,激活函数最终决定了要发射给下一个神经元的内容。本实施例的激活函数选择relu函数,但不排除其他可替代激活函数。
其中,全连接层,是每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来。本实施例的第一全连接层可以将上一层提取到的特征综合起来,并进行故障预测。
图6为本公开一种实施例的图神经网络的结构图,其中,在图神经网络包括偶数个单向级联的网络单元的情况下,从第一个网络单元开始,在第偶数位的网络单元之后连接池化层(pool),池化层与第一全连接层之间设置为单向级联关系;
将图谱化数据输入第一个网络单元直到获得第一全连接层输出的下一个时间点的故障预测值,包括:
将图谱化数据输入第一个网络单元,并将第偶数位的网络单元的输出结果输入到其后连接的池化层,通过池化层进行池化处理;
将池化结果输入第一全连接,通过第一全连接层对池化结果进行处理,获得下一个时间点的故障预测值。
在本实施例中,最终第一全连接层的输入不仅包括最后一组网络单元提取到的局部特征,还包括前面网络单元提取到的特征,这样,通过将前面网络单元提取到的特征也输入到第一全连接层,可以避免最后一组网络单元提取到的局部特征缺失而可能导致故障预测准确率不够的问题,从而进一步提升无线小区预测准确率。
其中,池化层的作用是,对前面及中间位置的网络单元提取到的特征进行降维后输入到第一全连接层中,从而起到压缩数据和参数的量,减小过拟合。因此,在本实施例中,池化层能够降低第一全连接层的数据处理负担,减小过拟合,提升本实施例故障预测效率,并进一步提升本实施例在提升故障预测准确率方面的可行性。
在图6中,图神经网络包含六个网络单元,并对第二、四、六个网络单元的输出进行池化操作,最后进入第一全连接层完成故障预测。第一、二网络单元有64个或其他数量的输出通道,第三、四网络单元有128个或其他数量输出通道,第五、六网络单元有256个或其他数量的输出通道,并在第二、四、六个网络单元后面接入池化操作,最后经过一个全连接层和softmax层完成小区故障预测。Softmax层的输出0到1之间的概率值,也就是说,表征预测为某个故障类型的概率。
在本公开其他实施例中,图神经网络中可以包含其他数量的网络单元,不受本实施例限定。
其中,池化层可以随机单向级联在任何一个或一组网络单元之后,池化层的输出直接输入到第一全连接层。
在本公开其他实施例中,也可以不设置池化层,而是将至少一个网络单元的输出直接输入到第一全连接层。
如图7a所示,在本公开实施例中,每个时空图神经网络包括至少两个级联的时空图卷积块(ST-Conv Block)和第二全连接层;
在这种情况下,利用时空图神经网络提取多个通道的特征,包括:
通过级联的时空图卷积块进行空间特征以及时间依赖关系特征的提取处理,得到时空特征;
将时空特征输入第二全连接层,输出多个通道的特征。
在该实施例中,每个时空图卷积块中包含TCN和GCN,以对输入进行时序卷积及空间卷积。第二全连接层的作用是对前一层的输出进行特征聚合。
图7a示出了两个ST-Conv Block,此为示例,还可以为至少1个的其他数量。其中,Output Layer是指输出层,使用第二全连接层实现。
如图7b所示,在本公开实施例中,时空图卷积块ST-Conv Block包括两个门控时间卷积层(Temporal Gated-Conv)及位于两个门控时间卷积层(Temporal Gated-Conv)之间的图卷积层(Spatial Graph-Conv);
在这种情况下,通过级联的时空图卷积块进行空间特征以及时间依赖关系特征的提取处理,得到时空特征,包括:
利用门控时间卷积层进行门控时间卷积运算,得到时间依赖关系特征;
利用图卷积层进行图卷积运算,得到空间特征;
根据时间依赖关系特征和空间特征得到时空特征。
在该实施例中,时空图卷积块包括两个门控时间卷积层和一个图卷积层。处于中间的图卷积层,承接两个门控时间卷积层,可取得使空间状态能够从图卷积到门控时间卷积快速传播。这种网络结构也助于充分应用瓶颈策略(bottleneck strategy)来实现通过压缩通道来进行规模缩放和特征压缩。
其中,图b中的Temporal Gated-Conv的通道C=64,此为示例,还可以是其他通道数量。而Spatial Graph-Conv中的通道C16,还可以是其他通道数量。
其中,如图7c所示,门控时间卷积是上文时域卷积层的一个实施例,它由具有相同输入和输出长度的扩张的、因果的一维1D卷积层组成。
时空图卷积块的输入和输出都是三维张量,时空图卷积块l的输入 和输出/>通过下式计算:
其中,和是Γ1 l块l的上下两个时间核,Θl是图卷积的谱核,Relu(·)是激活函数。
在两个时空图卷积块后,连接一个第二全连接层作为最终的输出层。第二全连接层将最后一个时空图卷积块(ST_Conv block)的输出映射为一个单步预测。从模型得到输出Z∈Rnxc之后,通过一个跨通道的线性变化得到n个节点的故障预测值。
在本公开实施例中,图卷积层对输入进行图卷积运算,以单个工单数据为例,以上述邻接矩阵A和特征向量F为输入,通过下式完成运算:
其中D∈R|N|×|N|为图G的度矩阵;
I∈R|N|×|N|为单位矩阵,W为权重矩阵;
门控时间卷积层对输入进行时间卷积计算,门控时间卷积层定义一个参数γ控制时间卷积核大小,时间卷积操作如下所示:
最后一个门控时间卷积层的输出变为L维,对应标签维l的故障类型,最后的输出为:
yT+1=Sigmoid(Ftemporal)。
当预测小区T+1时刻是否发生故障时为二分类,0表示不发生、1表示发生故障;当预测T+1时刻发生哪种故障时为多分类。
下面,本公开实施例继续对基于图神经网络的故障预测方法进行进一步举例说明。
图谱化数据作为图神经网络的输入,首先会经过一个规范化处理层,将数据标准规范化,进入模型第一个网络单元。其中,如图7a和图7b所示,ST-GCN包括两个时空图卷积块(ST-Conv Block)和一个输出全连接层(Output Layer),其中时空图卷积块由两个时间门控卷积和空间图卷积组成。
其中,图谱化数据在ST-GCN经过空间图卷积,将节点数据和它们的邻居节点数据的空间信息进行整合,然后利用时间卷积捕获每个节点生成向量之间的时间依赖关系,生成的新向量经Output Layer输出进入Channel-wise Attention Layer,将模型关注点集中在有意义的通道上,数据在输出后进入一个Relu函数。
其中,GCN是一种处理图谱化数据的CNN网络,图谱化数据中包含节点的特征向量和边所对应邻接矩阵。在使用时,利用图的傅里叶变换在谱域中进行卷积操作,采用图谱方法将卷积操作应用在图谱化数据上。在图谱化处理方法中,可以利用图对应的拉普拉斯矩阵(Laplacian Matrix)表示,即L=D-A,归一化后的拉普拉斯矩阵可表示为:
其中IN表示单位矩阵,A表示邻接矩阵,D∈RN×N是有节点度数组成的对角度矩阵,Dii=∑jAij。L=UΛUT表示对拉普拉斯矩阵进行特征值分解,其中U表示傅里叶基,Λ=diag([λ0,...,λN-1])∈RN×N表示L的特征值所组成的对角矩阵。
图结构的相关特性隐藏在拉普拉斯矩阵机器对应的特征值中,对图信号进行傅里叶变化,假设t时刻的小区数据为xt∈RN,进行傅里叶变换后可表示为:傅里叶基U为正交矩阵,故其对应的逆傅里叶变换为:/>使用卷积核Θ对图信号进行图卷积操作:
其中卷积核Θ是一个对角矩阵。上述公式利用傅里叶变换先将卷积核Θ和图信号x分别变换到谱域,再将两者谱域的变换结果向乘,在得到卷积傅里叶变化的谱域结果后利用逆傅里叶变换得到卷积操作后的结果。
当图的规模较大时,直接采用特征值分解法代价高,使用切比雪夫多项式近似:
其中θk∈Rk表示切比雪夫多项式系数,K表示卷积核x的大小,所有的卷积可以对每个节点提取其[0,k-1]阶近邻中的信息。 λmax是拉普拉斯矩阵的最大特征值。切比雪夫多项式递归公式为:Tk(x)=2xjk-1(x)-Tk-2(x),其中T0(x)=1,T1(x)=x。当K=2时,1阶近似的图卷积操作表示为:
其中θ0,θ1是卷积核的两个共享参数,为了减少参数数量,使用θ代替θ0,θ1,Λ和D使用和/>的归一化结果,最后图卷积可表达为:
图卷积的泛化:定义n维向量x∈Rn上的图卷积运算*g也可以应用到多维张量上,对于一个有Ci个通道的信号X∈Rn×Ci,图卷积操作扩展为:
其中,切比雪夫系数θi,j∈RK有CI×CO个向量(Ci,Co分别是输入和输出特征值的大小)。针对二维变量的图卷积表示为Θ*gX,其中 需要注意的是,输入的小区故障预测是由T个时间步组成,每个时间步所组成的故障因果路径图G可以视为一个矩阵,它的第i列是图Gt中第i个顶点的一个为Ci维的值,也就是/>对于M中每个时间步t,相同的核与相同的图卷积在/>中并行运算。
如图7c所示,门控时间卷积层包含了一个一维卷积,卷积核的宽度为Kt,之后接一个门控线性激活单元GLU(Gated Linear Unit)。对于图7c中的每一个顶点,门控时间卷积对于输入元素Kt个近邻进行运算,以致每次将序列长度缩短Kt-1。因此每个顶点的时间卷积的输入可以看作是长度为M的序列,有Ci个通道,卷积核/>是映射Y单一输出/>门控时间卷积公式为:
其中,P和Q分别是GLU的门输入,⊙表示即元素对应相乘,sigmoidδ(Q)门控制当前状态的哪个输入P与时间序列中的组成结构和动态方差相关。
图8为本公开实施例提供的图神经网络训练方法的流程图,其中使用该方法训练得到的图神经网络可以用于图1所示无线小区故障预测方法。但图1所示无线小区故障预测方法所使用的图神经网络也可以限于图8所示训练方法得到的。
如图8所示,图神经网络训练方法具体可以包括如下步骤:
步骤810:获取无线小区的故障因果路径图,在故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
步骤820:基于故障因果路径图对无线小区的历史性能数据基于时序关系进行图谱化处理,得到训练数据,训练数据包括故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中特征向量是对历史性能数据中的各个时间点的节点数据进行向量化得到的;
步骤830:利用训练数据训练图神经网络。
使用本实施例训练得到的图神经网络可用于无线小区故障预测,本实施例首次将图神经网络应用在无线小区故障预测场景中,也是业界首次使用故障因果路径图进行故障预测,在空间和时间两个维度将数据聚合,并能解决传统机器学习和深度学习不能很好处理复杂的图结构数据和高稀疏性的节点属性数据的问题,提高故障预测准确性。
在本公开一些实施例中,图神经网络包括至少两个级联的网络单元及第一全连接层,每个网络单元包括依次级联的时空图神经网络、通道注意力模块和激活函数;
利用训练数据训练图神经网络包括:
将训练数据输入第一个网络单元直到获得第一全连接层输出的故障预测值,根据故障预测值与实际值之间的损失函数训练每个网络单元,直到达到训练停止条件;
其中,在每个网络单元上,利用时空图神经网络提取多个通道的特征,利用通道注意力模块对多个通道的特征进行加权处理,并在激活函数中对加权特征进行处理并输出。
在一些实施例中,中,每个时空图神经网络包括至少两个级联的时空图卷积块和第二全连接层;
利用时空图神经网络提取多个通道的特征,包括:
通过级联的时空图卷积块进行空间特征及时间依赖关系特征的提取处理,得到时空特征;
将时空特征输入第二全连接层,输出多个通道的特征。
在一些实施例中,时空图卷积块包括两个门控时间卷积层及位于两个门控时间卷积层之间的图卷积层;
通过级联的时空图卷积块进行空间特征及时间依赖关系特征的提取处理,得到时空特征,包括:
利用门控时间卷积层进行门控时间卷积运算,得到时间依赖关系特征;
利用图卷积层进行图卷积运算,得到空间特征;
根据时间依赖关系特征和空间特征得到时空特征。
在一些实施例中,在图神经网络包括偶数个单向级联的网络单元的情况下,从第一个网络单元开始,在第偶数位的网络单元之后连接池化层,池化层与第一全连接层之间设置为单向级联关系;
将训练数据输入第一个网络单元直到获得第一全连接层输出的故障预测值,包括:
将训练数据输入第一个网络单元,并将第偶数位的网络单元的输出结果输入到其后连接的池化层,通过池化层进行池化处理;
将池化结果输入第一全连接,通过第一全连接层对池化结果进行处理,得到故障预测值。
在本公开一些实施例中,损失函数为交叉熵损失函数。
具体地,将第一全连接层的输出变为L维,对应标签为l的故障类型,最后的输出为:
损失函数使用交叉熵损失函数:
其中n为总的故障类型数。
图9是本公开提供的图神经网络训练系统的一种实施例的模块示意图,如图9所示,图神经网络训练系统900包括但不限于如下模块:
第一获取模块910,获取无线小区的故障因果路径图,在故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
第一图谱化处理模块920,基于故障因果路径图对无线小区的历史性能数据进行图谱化处理,得到训练数据,训练数据包括故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中特征向量是对历史性能数据中的各个时间点的节点数据进行向量化得到的;
训练模块930,利用训练数据训练图神经网络。
上述模块的实现原理参见图8所示图神经网络训练方法中的相关介绍,此处不再赘述。
可选地,图神经网络包括至少两个级联的网络单元及第一全连接层,每个网络单元包括依次级联的时空图神经网络、通道注意力模块和激活函数;
训练模块930具体用于:
将训练数据输入第一个网络单元直到获得第一全连接层输出的故障预测值,根据故障预测值与实际值之间的损失函数训练每个网络单元,直到达到训练停止条件;
其中,在每个网络单元上,利用时空图神经网络提取多个通道的特征,利用通道注意力模块对多个通道的特征进行加权处理,并在激活函数中对加权特征进行处理并输出。
可选地,其中,每个时空图神经网络包括至少两个级联的时空图卷积块和第二全连接层;
训练模块930具体用于:
通过级联的时空图卷积块进行空间特征及时间依赖关系特征的提取处理,得到时空特征;
将时空特征输入第二全连接层,输出多个通道的特征。
可选地,时空图卷积块包括两个门控时间卷积层及位于两个门控时间卷积层之间的图卷积层;
训练模块930具体用于:
利用门控时间卷积层进行门控时间卷积运算,得到时间依赖关系特征;
利用图卷积层进行图卷积运算,得到空间特征;
根据时间依赖关系特征和空间特征得到时空特征。
可选地,在图神经网络包括偶数个单向级联的网络单元的情况下,从第一个网络单元开始,在第偶数位的网络单元之后连接池化层,池化层与第一全连接层之间设置为单向级联关系;
训练模块930具体用于:
将训练数据输入第一个网络单元,并将第偶数位的网络单元的输出结果输入到其后连接的池化层,通过池化层进行池化处理;
将池化结果输入第一全连接,通过第一全连接层对池化结果进行处理,得到故障预测值。
可选地,损失函数为交叉熵损失函数。;
使用本实施例的图神经网络训练系统训练得到的图神经网络可用于无线小区故障预测,本实施例首次将图神经网络应用在无线小区故障预测场景中,也是业界首次使用故障因果路径图进行故障预测,在空间和时间两个维度将数据聚合,并能解决传统机器学习和深度学习不能很好处理复杂的图结构数据和高稀疏性的节点属性数据的问题,提高故障预测准确性。
图10是本公开提供的无线小区故障预测系统的一种实施例的模块示意图,如图10所示,无线小区故障预测系统1000包括但不限于如下模块:
第二获取模块1010,获取无线小区的故障因果路径图,在故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
第二图谱化处理模块1020,基于故障因果路径图对目标无线小区的目标性能数据进行图谱化处理,得到图谱化数据,图谱化数据包括故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中特征向量是对目标性能数据中各个时间点的节点数据进行向量化得到的;
预测模块1030,将图谱化数据输入图神经网络,输出下一个目标时间点的故障预测值。
上述模块的实现原理参见图1所示无线小区故障预测方法中的相关介绍,此处不再赘述。
可选地,图神经网络包括至少两个级联的网络单元及第一全连接层,每个网络单元包括依次级联的时空图神经网络、通道注意力模块和激活函数;
预测模块1030具体用于:
将图谱化数据输入第一个网络单元直到获得第一全连接层输出的下一个时间点的故障预测值;
其中,在每个网络单元上,利用时空图神经网络提取多个通道的特征,利用通道注意力模块对多个通道的特征进行加权处理,并在激活函数中对加权特征进行处理并输出。
可选地,其中,每个时空图神经网络包括至少两个级联的时空图卷积块和第二全连接层;
预测模块1030具体用于:
通过级联的时空图卷积块进行空间特征以及时间依赖关系特征的提取处理,得到时空特征;
将时空特征输入第二全连接层,输出多个通道的特征。
可选地,时空图卷积块包括两个门控时间卷积层及位于两个门控时间卷积层之间的图卷积层;
预测模块1030具体用于:
利用门控时间卷积层进行门控时间卷积运算,得到时间依赖关系特征;
利用图卷积层进行图卷积运算,得到空间特征;
根据时间依赖关系特征和空间特征得到时空特征。
可选地,在图神经网络包括偶数个单向级联的网络单元的情况下,从第一个网络单元开始,在第偶数位的网络单元之后连接池化层,池化层与第一全连接层之间设置为单向级联关系;
预测模块1030具体用于:
将图谱化数据输入第一个网络单元,并将第偶数位的网络单元的输出结果输入到其后连接的池化层,通过池化层进行池化处理;
将池化结果输入第一全连接,通过第一全连接层对池化结果进行处理,获得下一个时间点的故障预测值。
本公开实施例的无线小区故障预测系统利用性能指标及故障类型构建故障因果路径图,使用该路径图对无线小区的历史性能数据进行图谱化,图谱化数据中不仅包含节点自身特征数据、节点间相关关系的邻接矩阵,还包含时序数据,从而能够在空间和时间两个维度对无线小区的历史性能数据进行聚合,能够提高故障预测准确性。针对图谱化数据,提出构建多层次的图神经网络,提高网络模型的健壮性和预测准确率,并在具体故障类型预测上有良好的表现。
因此,本公开实施例采用改进的图神经网络,首次将图神经网络应用在无线小区故障预测场景中,也是业界首次使用故障因果路径图进行故障预测,在空间和时间两个维度将数据聚合,并能解决传统机器学习和深度学习不能很好处理复杂的图结构数据和高稀疏性的节点属性数据的问题,提高故障预测准确性。
本发明实施例还提供一种电子设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的图神经网络训练或无线小区故障预测方法的步骤。
如上所示,本公开实施例的电子设备能够利用性能指标及故障类型构建故障因果路径图,使用该路径图对无线小区的历史性能数据进行图谱化,图谱化数据中不仅包含节点自身特征数据、节点间相关关系的邻接矩阵,还包含时序数据,从而能够在空间和时间两个维度对无线小区的历史性能数据进行聚合,能够提高故障预测准确性。针对图谱化数据,提出构建多层次的图神经网络,提高网络模型的健壮性和预测准确率,并在具体故障类型预测上有良好的表现。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图11本发明的电子设备的结构示意图。下面参照图11来描述根据本发明的这种实施方式的电子设备1100。图11显示的电子设备1100仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图11所示,电子设备1100以通用计算设备的形式表现。电子设备1100的组件可以包括但不限于:至少一个处理单元1110、至少一个存储单元1120、连接不同平台组件(包括存储单元1120和处理单元1110)的总线1130、显示单元1140等。
其中,存储单元存储有程序代码,程序代码可以被处理单元1110执行,使得处理单元1110执行本说明书图神经网络训练或无线小区故障预测方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元1110可以执行图1或图8所示的步骤。
存储单元1120可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)1121和/或高速缓存存储单元1122,还可以进一步包括只读存储单元(ROM)1123。
存储单元1120还可以包括具有一组(至少一个)程序模块1125的程序/实用工具1124,这样的程序模块1125包括但不限于:处理系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1130可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1100也可以与一个或多个外部设备110(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1100交互的设备通信,和/或与使得该电子设备1100能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1150进行。
并且,电子设备1100还可以通过网络适配器1160与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器1160可以通过总线1130与电子设备1100的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1100使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的图神经网络训练或无线小区故障预测方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述图神经网络训练或无线小区故障预测方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图12所示,描述了根据本公开实施方式的用于实现上述方法的程序产品1200。根据本发明的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明处理的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上,本发明的目的在于提供图神经网络训练或无线小区故障预测方法、系统及设备,通过利用性能指标及故障类型构建故障因果路径图,使用该路径图对无线小区的历史性能数据进行图谱化,图谱化数据中不仅包含节点自身特征数据、节点间相关关系的邻接矩阵,还包含时序数据,从而能够在空间和时间两个维度对无线小区的历史性能数据进行聚合,能够提高故障预测准确性。针对图谱化数据,提出构建多层次的图神经网络,提高网络模型的健壮性和预测准确率,并在具体故障类型预测上有良好的表现。
因此,本公开实施例采用改进的图神经网络,首次将图神经网络应用在无线小区故障预测场景中,也是业界首次使用故障因果路径图进行故障预测,在空间和时间两个维度将数据聚合,并能解决传统机器学习和深度学习不能很好处理复杂的图结构数据和高稀疏性的节点属性数据的问题,提高故障预测准确性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (15)
1.一种图神经网络训练方法,其特征在于,包括:
获取无线小区的故障因果路径图,在所述故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
基于所述故障因果路径图对无线小区的历史性能数据基于时序关系进行图谱化处理,得到训练数据,所述训练数据包括所述故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中所述特征向量是对所述历史性能数据中的各个时间点的节点数据进行向量化得到的;
利用所述训练数据训练图神经网络。
2.根据权利要求1所述的图神经网络训练方法,其特征在于,所述图神经网络包括至少两个级联的网络单元及第一全连接层,每个所述网络单元包括依次级联的时空图神经网络、通道注意力模块和激活函数;
利用所述训练数据训练图神经网络包括:
将所述训练数据输入第一个网络单元直到获得所述第一全连接层输出的故障预测值,根据所述故障预测值与实际值之间的损失函数训练每个网络单元,直到达到训练停止条件;
其中,在每个网络单元上,利用所述时空图神经网络提取多个通道的特征,利用所述通道注意力模块对多个通道的特征进行加权处理,并在所述激活函数中对加权特征进行处理并输出。
3.根据权利要求2所述的图神经网络训练方法,其特征在于,其中,每个时空图神经网络包括至少两个级联的时空图卷积块和第二全连接层;
利用所述时空图神经网络提取多个通道的特征,包括:
通过级联的时空图卷积块进行空间特征及时间依赖关系特征的提取处理,得到时空特征;
将所述时空特征输入所述第二全连接层,输出多个通道的特征。
4.根据权利要求3所述的图神经网络训练方法,其特征在于,所述时空图卷积块包括两个门控时间卷积层及位于两个门控时间卷积层之间的图卷积层;
通过级联的时空图卷积块进行空间特征及时间依赖关系特征的提取处理,得到时空特征,包括:
利用所述门控时间卷积层进行门控时间卷积运算,得到所述时间依赖关系特征;
利用所述图卷积层进行图卷积运算,得到所述空间特征;
根据所述时间依赖关系特征和空间特征得到所述时空特征。
5.根据权利要求2所述的图神经网络训练方法,其特征在于,在所述图神经网络包括偶数个单向级联的网络单元的情况下,从第一个网络单元开始,在第偶数位的网络单元之后连接池化层,所述池化层与所述第一全连接层之间设置为单向级联关系;
将所述训练数据输入第一个网络单元直到获得所述第一全连接层输出的故障预测值,包括:
将所述训练数据输入第一个网络单元,并将第偶数位的网络单元的输出结果输入到其后连接的池化层,通过所述池化层进行池化处理;
将池化结果输入所述第一全连接,通过所述第一全连接层对所述池化结果进行处理,得到所述故障预测值。
6.根据权利要求2所述的图神经网络训练方法,其特征在于,所述损失函数为交叉熵损失函数。
7.一种无线小区故障预测方法,其特征在于,包括:
获取无线小区的故障因果路径图,在所述故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
基于所述故障因果路径图对目标无线小区的目标性能数据基于时序关系进行图谱化处理,得到图谱化数据,所述图谱化数据包括所述故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中所述特征向量是对所述目标性能数据中各个时间点的节点数据进行向量化得到的;
将所述图谱化数据输入图神经网络,输出下一个目标时间点的故障预测值。
8.根据权利要求7所述的无线小区故障预测方法,其特征在于,所述图神经网络包括至少两个级联的网络单元及第一全连接层,每个所述网络单元包括依次级联的时空图神经网络、通道注意力模块和激活函数;
将所述图谱化数据输入图神经网络,输出下一个时间点的故障预测值,包括:
将所述图谱化数据输入第一个网络单元直到获得所述第一全连接层输出的下一个时间点的故障预测值;
其中,在每个网络单元上,利用所述时空图神经网络提取多个通道的特征,利用所述通道注意力模块对多个通道的特征进行加权处理,并在所述激活函数中对加权特征进行处理并输出。
9.根据权利要求8所述的无线小区故障预测方法,其特征在于,其中,每个时空图神经网络包括至少两个级联的时空图卷积块和第二全连接层;
利用所述时空图神经网络提取多个通道的特征,包括:
通过级联的时空图卷积块进行空间特征以及时间依赖关系特征的提取处理,得到时空特征;
将所述时空特征输入所述第二全连接层,输出多个通道的特征。
10.根据权利要求9所述的无线小区故障预测方法,其特征在于,所述时空图卷积块包括两个门控时间卷积层及位于两个门控时间卷积层之间的图卷积层;
通过级联的时空图卷积块进行空间特征以及时间依赖关系特征的提取处理,得到时空特征,包括:
利用所述门控时间卷积层进行门控时间卷积运算,得到所述时间依赖关系特征;
利用所述图卷积层进行图卷积运算,得到所述空间特征;
根据所述时间依赖关系特征和空间特征得到所述时空特征。
11.根据权利要求8所述的无线小区故障预测方法,其特征在于,在所述图神经网络包括偶数个单向级联的网络单元的情况下,从第一个网络单元开始,在第偶数位的网络单元之后连接池化层,所述池化层与所述第一全连接层之间设置为单向级联关系;
将所述图谱化数据输入第一个网络单元直到获得所述第一全连接层输出的下一个时间点的故障预测值,包括:
将所述图谱化数据输入第一个网络单元,并将第偶数位的网络单元的输出结果输入到其后连接的池化层,通过所述池化层进行池化处理;
将池化结果输入所述第一全连接,通过所述第一全连接层对所述池化结果进行处理,获得下一个时间点的故障预测值。
12.一种图神经网络训练系统,其特征在于,包括:
第一获取模块,获取无线小区的故障因果路径图,在所述故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
第一图谱化处理模块,基于所述故障因果路径图对无线小区的历史性能数据进行图谱化处理,得到训练数据,所述训练数据包括所述故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中所述特征向量是对所述历史性能数据中的各个时间点的节点数据进行向量化得到的;
训练模块,利用所述训练数据训练图神经网络。
13.一种无线小区故障预测系统,其特征在于,包括:
第二获取模块,获取无线小区的故障因果路径图,在所述故障因果路径图中,叶子节点表征故障类型,父节点表征性能指标,边表征节点之间的故障因果关系;
第二图谱化处理模块,基于所述故障因果路径图对目标无线小区的目标性能数据进行图谱化处理,得到图谱化数据,所述图谱化数据包括所述故障因果路径图中各节点的特征向量、及表征节点之间连接关系的邻接矩阵,其中所述特征向量是对所述目标性能数据中各个时间点的节点数据进行向量化得到的;
预测模块,将所述图谱化数据输入图神经网络,输出下一个目标时间点的故障预测值。
14.一种电子设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至6任一项所述的图神经网络训练方法、或权利要求7至11任意一项所述无线小区故障预测方法的步骤。
15.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现权利要求1至6任一项所述的图神经网络训练方法、或权利要求7至11任意一项所述无线小区故障预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211064023.XA CN115426671B (zh) | 2022-09-01 | 2022-09-01 | 图神经网络训练、无线小区故障预测方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211064023.XA CN115426671B (zh) | 2022-09-01 | 2022-09-01 | 图神经网络训练、无线小区故障预测方法、系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115426671A CN115426671A (zh) | 2022-12-02 |
CN115426671B true CN115426671B (zh) | 2023-10-31 |
Family
ID=84201172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211064023.XA Active CN115426671B (zh) | 2022-09-01 | 2022-09-01 | 图神经网络训练、无线小区故障预测方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115426671B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117174319B (zh) * | 2023-11-03 | 2024-03-01 | 神州医疗科技股份有限公司 | 一种基于知识图谱的脓毒症时序预测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109150564A (zh) * | 2017-06-19 | 2019-01-04 | 中国移动通信集团广东有限公司 | 一种用于小区故障告警的预测方法及装置 |
CN113709779A (zh) * | 2021-07-29 | 2021-11-26 | 南京邮电大学 | 一种蜂窝网络故障诊断方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11674994B2 (en) * | 2021-02-24 | 2023-06-13 | Mitsubishi Electric Research Laboratories, Inc. | Distribution fault location using graph neural network with both node and link attributes |
-
2022
- 2022-09-01 CN CN202211064023.XA patent/CN115426671B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109150564A (zh) * | 2017-06-19 | 2019-01-04 | 中国移动通信集团广东有限公司 | 一种用于小区故障告警的预测方法及装置 |
CN113709779A (zh) * | 2021-07-29 | 2021-11-26 | 南京邮电大学 | 一种蜂窝网络故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115426671A (zh) | 2022-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112350899B (zh) | 一种基于图卷积网络融合多特征输入的网络流量预测方法 | |
US20230196117A1 (en) | Training method for semi-supervised learning model, image processing method, and device | |
Afrasiabi et al. | Advanced deep learning approach for probabilistic wind speed forecasting | |
CN110929047B (zh) | 关注邻居实体的知识图谱推理方法和装置 | |
US10387768B2 (en) | Enhanced restricted boltzmann machine with prognosibility regularization for prognostics and health assessment | |
CN111814685B (zh) | 基于双支路卷积自编码器的高光谱图像分类方法 | |
CN113705880A (zh) | 基于时空注意力图卷积网络的交通速度预测方法和装置 | |
CN111814607B (zh) | 一种适用于小样本高光谱影像分类的深度学习模型 | |
CN113780584B (zh) | 标签预测方法、设备、存储介质 | |
CN115759413B (zh) | 一种气象预测方法、装置、存储介质及电子设备 | |
CN112464057A (zh) | 一种网络数据分类方法、装置、设备及可读存储介质 | |
WO2023207411A1 (zh) | 一种基于时空数据的流量确定方法、装置、设备和介质 | |
CN114118150A (zh) | 一种配电网单相接地故障选线方法及系统 | |
CN115426671B (zh) | 图神经网络训练、无线小区故障预测方法、系统及设备 | |
WO2019003234A1 (en) | NETWORK NODE AND METHOD IMPLEMENTED THEREFOR FOR GENERATING A MISSING DATA VALUE OF A DATA SET FROM ONE OR MORE DEVICES | |
CN112396231A (zh) | 针对时空数据的建模方法、装置、电子设备及可读介质 | |
CN113962262B (zh) | 一种基于连续学习的雷达信号智能分选方法 | |
CN115983370A (zh) | 散乱数据插值模型训练方法、插值方法及装置 | |
CN114338416B (zh) | 一种时空多指标预测方法、装置和存储介质 | |
CN117853596A (zh) | 无人机遥感测绘方法及系统 | |
CN111310996B (zh) | 基于图自编码网络的用户信任关系预测方法及系统 | |
CN117834061A (zh) | 一种基于图卷积网络的无线频谱感知数据预测方法 | |
CN112396166A (zh) | 基于混合粒度聚合器的图卷积神经网络训练方法及装置 | |
CN117671278A (zh) | 电力图像数据处理方法、装置、设备、介质和程序产品 | |
CN115174421B (zh) | 基于自监督解缠绕超图注意力的网络故障预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |