CN113348691A - 用于网络管理中的故障预测的方法和装置 - Google Patents

用于网络管理中的故障预测的方法和装置 Download PDF

Info

Publication number
CN113348691A
CN113348691A CN201880100652.9A CN201880100652A CN113348691A CN 113348691 A CN113348691 A CN 113348691A CN 201880100652 A CN201880100652 A CN 201880100652A CN 113348691 A CN113348691 A CN 113348691A
Authority
CN
China
Prior art keywords
network
state
vector
data
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880100652.9A
Other languages
English (en)
Inventor
B·舒尔茨
J·T·阿里-托尔帕
M·卡约
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Nokia Solutions and Networks Oy
Original Assignee
Nokia Networks Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Networks Oy filed Critical Nokia Networks Oy
Publication of CN113348691A publication Critical patent/CN113348691A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0888Throughput

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

描述了网络管理装置和方法。网络管理装置包括用于接收代表通信网络当前状况的网络数据的网络数据接收部件,网络数据包括指示网络元件的性能的多个值;用于将所接收的网络数据变换为指示网络的当前状态的网络状态向量的网络数据变换部件;以及用于根据当前网络状态向量来预测网络的未来网络状态向量的网络状态预测部件,该网络状态预测部件包括具有用于存储至少一个内部状态的存储器的自学习预测模块。

Description

用于网络管理中的故障预测的方法和装置
技术领域
本文档涉及用于网络管理和故障预测的方法和装置,具体地是用于移动网络的。
背景技术
通信网络的管理(诸如移动网络)很大程度上依赖于使用由运营商或者网络构架师生成和维护的规则集。随着网络在大小、复杂度,以及多样性上的增加,由于过多的人类劳动力需求,该方法变得越来越不可行。为了减低劳动强度,实现从示例数据集得出的自动规则生成——被称为机器学习的过程——是当前最成功的备选方案。
自组织网络(SON)可以使用针对故障检测、校正动作的诊断和部署而生成的规则集,以实现网络的自动化自愈。到目前为止,这些努力主要是在严格的人类监督下进行,并且被集中于反应式的自愈;其后的退化校正已经变得有害/明显。使用描述网络的精确机器学习规则/模型,可以实现更先进的自愈,其中故障在很早的阶段被预测和校正,避免了完全的性能降级。这种概念被称为主动自愈,在其中采取措施以防止故障的发生。
在很多情况下,现成的机器学习算法在它们相应任务中执行性能较差。这是由监测系统生成的数据结构或者这些算法试图建模的系统本身的个案差别导致的。从这个意义上来说,移动网络针对机器学习算法施加了独特的环境,因为通常有大量来自网络外部的影响因素,诸如人类日常行为、天气、用户移动等。移动网络的另一方面是很多不同的元件的互通行为,诸如基站或者网关。使用机器学习算法而不使它们适配于这种独特环境很可能意味着没有充分利用它们的潜能。
移动网络数据是独特的,因为它们展现了复杂的时间、空间和维度相关性,这三者通常全部同时存在。由于目前最强大先进的机器学习算法的构建器是深度神经网络,因此使用它们用于学习和预测移动网络行为是合乎逻辑的想法。针对在移动域中收集的序列数据进行建模的一种选择是递归神经网络(RNN),具体是长短期记忆RNN(LSTM)。
作为大多数网络优化和自愈用例的基本输入的网络性能管理(PM)数据包括连续的数值(也称为关键性能指标,KPI)。这些值形成了从大量网络元件处的测量中收集的多维数据流。问题是RNN类似于状态机,这使它们更适合于处理量化的或者离散的数据流,诸如书面文本。这种数据结构中的不匹配使直接被用于PM数据时的LSTM的预测准确度下降,从而降低了被用于主动自愈时的早期故障检测的可能性。这种预测式的自愈功能在认知网络管理中是很可取的,因为它们将改进用以在导致服务降级之前检测故障的系统能力。
发明内容
在广泛的方面,本公开提供了一种网络管理装置,包括网络数据接收部件,其被配置用于接收代表网络通信当前状况的网络数据。网络数据可以是测量的数据或者从测量数据得出,并且包括指示网络元件或者通信网络的性能的多个值。通信网络可以是移动网络或者是具有多个网络元件的任何其他类型的通信网络。网络数据可以包括网络的性能管理(PM)数据和/或配置管理(CM)数据。网络数据可以包括多个测量的连续数值(关键性能指标,KPI)。例如,网络数据可以涉及针对由网络处理的语音和/或数据通信的性能指标,并且可以包括针对个体网络元件(例如天线、基站、网关、路由器等)或者整个网络的一下一项或多项:业务指标、吞吐量指标、延迟指标、时延指标、可用性指标、可接入性指标、成功率、失败率等。针对KPI的另外的示例在下文展示。网络管理装置可以直接从其被测量的网络元件、网络管理数据库和/或经由其他网络实体接收网络数据。在该上下文中,网络数据接收部件可以包括数据通信接口和/或数据库接口。
网络管理装置还包括网络数据变换部件,其被配置用于将接收的网络数据变换为指示网络的当前状态的网络状态向量。换言之,网络数据变换部件将测量的性能值的向量(可能是高维的)映射到网络的状态空间。网络的状态空间可以包括针对个体网络元件(例如,天线、基站、网关、路由器等)或者整个网络的工作/非工作情况、负载状况、故障等的多个状态。网络状态向量可以包括针对每个所考虑状态的元素。状态向量元素的值可以代表网络处于该状态的可能性或者概率。
网络管理设备还包括网络状态预测部件,其被配置为根据针对时刻(t)的网络的当前网络状态向量来针对网络针对时刻(t+1)预测未来网络状态向量(t+1)。网络状态预测部件包括具有用于存储至少一个内部状态的存储器的自学习预测模块。自学习预测模块已经在训练数据上被训练,以基于当前网络状态自动学习未来网络状态的预测。在训练期间,预测模块的内部参数可以从训练数据中被自动确定。在内部参数的训练之后,预测模块被配置为执行预期的预测功能。自学习预测模块包括用以存储历史信息的内部存储器,例如先前的网络状态或者可能是先前所见状态的合并的内部状态。因此,网络状态预测的功能是根据当前状态和存储的历史信息(例如,指定数目的先前状态)预测网络的下一状态。因此,自学习预测模块不仅提供状态的固定映射,而且基于能够编码历史的内部状态(例如多个先前的网络状态)进行操作,因此预测是取决于网络之前所经历的状态的序列。
网络数据变换部件可以包括被配置用于将网络数据的向量变换到网络状态空间中的向量量化器。这样的向量量化器根据量化准则将输入示例指配给最能代表输入向量的量子或者质心。在很多情况下,量化准则是基于输入向量与其使用给定度量的最近的量子之间的距离的误差函数。向量量化器可以通过使用算法从训练数据中自动学习,该算法针对训练数据确定使误差函数最小化的多个量子(质心)。然后,学习到的量子的集合对应于网络的状态,其中每个量子代表某个网络状态。换言之,量子的集合对应于所考虑的网络状态的集合。在实施例中,向量量化器可以基于K均值算法或者边界球量化(Bounding SphereQuantization,BSQ)算法用于自动针对训练数据确定量子的集合。在操作期间,向量量化器可以确定并且指示针对输入向量的最接近的量子。因此,向量量化器可以提供针对当前网络数据向量的最接近的量子的指示(例如索引)作为最可能的网络状态的指示。
网络数据变换部件可以包括距离变换模块,该距离变换模块被配置用于生成代表网络状态的概率的网络状态向量。考虑将量化器的量子的集合作为状态的代表,距离变换模块可以将网络数据的向量变换为网络状态的概率值或者似然值。这样,距离变换模块可以针对每个状态确定指示网络数据的向量与状态的集合的特定状态相关的概率或者可能性的值。因此,通过使用距离变换,不仅确定了最可能的网络状态,还提供了针对所有网络状态的概率得分/排名,其指示了状态针对由网络数据测量的当前网络状况的相关程度。
在实施例中,距离变换模块可以对网络数据的向量应用软距离变换,使用向量量化器的量子以用于构建向量空间并且提供用于距离测量的参考(质心)。软距离变换可以测量网络数据的向量和每个量子(质心)之间的距离以提供输入向量和网络状态(由量子表示)之间相似性的测量。针对网络状态的相似性的测量可以被用作网络状态向量。距离变换模块可以随后将网络状态向量的相似性的测量重新缩放为单位长度以确保所有估计值总和为1并且代表适当的概率。
网络数据变换部件可以包括数据稀疏模块,其被配置用于抑制代表针对对应网络状态的低概率的网络状态向量的元素。因此,只有具有与当前网络数据相关的合理概率的网络状态(即接近网络数据向量的量子)是相关的(活动的),并且接收网络状态向量中的非零值。其他状态不相关(非活动),以为它们的量子距网络数据向量太远。
数据稀疏模块可以基于s稀疏算法,该s稀疏算法将除了s个最大元素之外的所有向量元素置零。换言之,确定网络状态向量中的s个最大值并且将其他值设置为0。为了针对状态向量中的个体状态产生适当的概率值,数据稀疏模块可以将网络状态向量重新缩放为单位长度以使其所有元素加和为1。备选地,可以对状态向量应用阈值,并且将具有低于阈值的概率的所有元素置零。
自学习预测模块可以包括递归神经网络,具体是长短期记忆(LSTM)递归神经网络。这种神经网络具有内部存储器单元格(cells)并且很适合根据先前的输入向量学习从代表当前网络状态的输入向量到代表未来网络状态的输出向量的复杂状态映射。这些神经网络可以在训练数据上被训练以学习它们的内部参数。也可以使用其他神经网络结构,具体是具有用于存储内部状态的内部存储器的网络。此外,其他的自学习算法也适用。
为了产生适当的概率值,网络状态预测可以包括应用于神经网络输出向量的softmax模块,以生成单位长度的网络状态向量。在一些情况下,softmax函数被集成到神经网络的输出层。Softmax函数或者标准化指数函数是逻辑函数的广义化,其将任意实值的k维向量“压扁(squashes)”为如下实值的k维向量,其中每个条目都在(0,1)范围内并且所有条目相加和为1。在概率论中,softmax函数的输出可以被用于代表类别的分布——即k个不同可能结果的概率分布。
在上述方法中,网络状态预测部件根据当前网络状态向量和在预测器内部状态中的编码的先前网络状态来生成针对下一时刻的短期预测网络状态向量。为了生成针对更多未来时刻的长期预测,预测的网络状态向量可以被用作下一网络状态向量的估计并且作为输入被循环回网络数据变换部件。例如,针对下一时刻(t+1)的预测的未来网络状态向量(根据在时间(t)当前网络状态预测的)可以作为输入数据反馈到网络数据变换部件,以用于未来网络状态向量的长期预测,例如针对下一时刻(t+2)。换言之,预测的网络状态向量被用于替代实际的网络数据,以用于未来网络状态向量的预测。预测模块可以继续迭代以预测针对之后的时刻(t+3)、(t+4)…的未来网络状态向量。例如,预测的未来网络状态向量可以被输入到数据稀疏模块,然后该数据稀疏模块利用低概率抑制状态预测,并且可能重新缩放其输入向量以使总和为1。然后数据变换部件的该经重新缩放的输出向量可以被输入到网络状态预测,以用于预测针对下一时刻的网络状态向量。这允许迭代子过程,以用于多个时刻上的未来网络状态的长期预测(从时刻(t)的当前网络状态和在预测器内部状态中编码的先前网络状态开始),其中网络状态预测在循环中被使用,该循环重复使用其自身的预测作为输入以用于进一步预测。
当新的实际网络数据针对下一时刻(t+1)可用时,新的网络数据作为输入被提供给网络数据变换部件,并且在时刻(t+2)针对网络状态向量进行新预测。再次,该预测可以被反馈到网络数据变换部件,以用于在时刻(t+3)进行网络状态向量的另外的预测。该子过程可以以迭代的方式用于长期预测,现在从下一时刻(t+1)的实际网络数据开始。预测被循环送回以生成针对下一预测的人工(预测的)输入,而不是使用实际网络数据。由于预测的性质,预测器对其自身预测的数据的迭代时间越长,预测的准确度越劣化。一旦新的实际新网络数据可用,针对下一时刻的短期预测和针对另外的时刻的迭代子过程可以再次开始。
网络管理装置可以还包括网络管理模块,其被配置为基于预测的网络状态向量执行校正网络管理动作。例如,如果预测的网络状态向量利用合理的概率指示未来可能发生故障状态,则网络管理模块可以重新配置网络集合或者个体网络元件。网络管理模块可以响应于这样的指示而改变任何种类的适当的网络参数以防止预期的故障状态实际发生。
上述网络管理装置可以由至少一个处理器和包括计算机程序代码的至少一个存储器实现,该至少一个存储器和计算机程序代码被配置为与至少一个处理器一起使装置至少执行上述功能,诸如接收网络数据、变换接收的网络数据,以及预测未来网络状态向量。
备选地,上述网络管理装置可以由电路系统实现,例如被配置为接收网络数据的网络数据接收电路系统、被配置为变换接收的网络数据的网络数据变换电路系统,以及用以预测未来网络状态向量的网络状态预测电路系统。
如本申请中所使用的,术语“电路系统”可以指以下一项或多项或全部:
(a)仅硬件电路实现(诸如仅在模拟和/或数字电路系统中的实现)
(b)硬件电路和软件的组合,诸如(如可用):
(i)(多个)模拟和/或数字硬件电路与软件/固件的组合以及
(ii)具有软件(包括(多个)数字信号处理器)、软件以及(多个)存储器的(多个)硬件处理器的任何部分,其共同工作以使装置,诸如移动电话或者服务器执行各种功能,以及
(c)(多个)硬件电路和/或(多个)处理器,(诸如(多个)微处理器或者(多个)微处理器的部分),其需要软件(例如,固件)以用于操作,但在软件在操作不需要时可以不存在。
电路系统的该定义适用于本申请中该术语的所有使用,包括在任何权利要求中。作为进一步的示例,如本申请中所使用的,术语电路系统还涵盖仅硬件电路或者处理器(或者多个处理器)或者硬件电路的部分或者处理器及它的(或者它们的)附附软件和/或固件的实现。术语电路系统还涵盖了(例如,并且如果适用于具体的权利要求元素)用于移动设备的基带集成电路或者处理器集成电路,或者服务器、蜂窝网络设备或者其他计算或网络设备中的类似的集成电路。
在另一广泛的方面,公开了一种用于在通信网络上执行网络管理活动的网络管理方法。该方法包括接收代表通信网络当前状况的网络数据。网络数据包括指示网络元件或者通信网络的性能的多个值。接下来,接收到的网络数据被变换为指示网络的当前状态的网络状态向量。最后,通过应用网络状态预测,根据网络的当前网络状态向量针对网络预测未来网络状态向量。网络状态预测是基于具有用于存储至少一个内部状态的存储器的自学习预测算法。预测的未来网络状态可以被用于主动校正网络管理动作。自学习预测算法可以基于递归神经网络,诸如如上所述的长短期记忆(LSTM)递归神经网络。
在该方法中,所述变换接收的网络数据可以包括对网络数据应用向量量化算法,以用于将网络数据指配到网络状态并且生成代表针对当前网络数据的网络状态的概率的网络状态向量。例如,K均值或者BSQ的可以被用于向量量化。
此外,所述变换接收的网络数据可以包括对网络状态向量应用稀疏变换,以便抑制具有低概率的状态。
该方法可以还包括将预测的未来网络状态向量反馈到所述变换步骤以生成指示网络的下一状态的新的网络状态向量,以用于根据新的网络状态向量对另外的网络状态向量进行长期预测。例如,预测的未来网络状态向量可以被输入到网络状态向量的稀疏变换中。
用于网络管理装置的上述公开的方面可以以所提出方法的类似方式被应用。
根据另一广泛的方面,公开了一种计算机程序,包括用于使装置执行任何上述方法的指令。此外,公开了一种计算机可读介质,包括用于使装置执行任何上述方法的程序指令。
此外,公开了一种非瞬态计算机可读介质,包括存储在其上的程序指令,该程序指令用于至少执行以下操作:接收网络数据、变换接收的网络数据,以及预测未来网络状态向量。
所公开装置的实现可以包括但不限于使用一个或多个处理器、一个或多个专用集成电路(ASIC)和/或一个或多个现场可编程门阵列(FPGA)。装置的实现还可以还包括使用其他传统的和/或定制的硬件,诸如软件可编程处理器。
应当理解的是,方法步骤和装置的特点可以以多种方式互换。具体的,如本领域的技术人员将理解的,所公开装置的细节可以被实施为方法。
本公开的其他实施例和另外的实施例将在以下讨论的过程期间并且通过参考附图变得明显。
附图说明
本公开的实施例以示例性的方式参考附图在下文被解释,在附图中:
图1示出了图示所提出装置的示例的框图;
图2示出了图示在小型人工示例上的K均值和BSQ的对比的示意图;
图3a图示了针对作为用于诊断功能的预处理步骤的网络状态预测模块的示例;
图3b图示了针对作为建立在具有现存状态空间的另一模块上的功能的网络状态预测模块的示例;
图4示出了图示针对网络状态的长期预报的网络状态预测的使用的框图;
图5示出了图示针对量化的预测器相对于原始LSTM的长期预报误差示意图;
图6示出了示例网络管理方法的示例的流程图。
具体实施方式
本公开提出了一种针对LSTM RNN的特别定制的用于数据变换的技术,以增加它们在对于移动网络独特的数据集上的长期预测能力。所提出的方法不是预测未来的KPI值,而是使用量化来预测特定的网络状态,具体是;移动网络中的故障。该量化步骤接下来是距离变换,而不是使用硬分类决策;距离变换的输出由代表属于网络状态的概率的连续值组成。以类似的方式,预测过程的输出是由代表属于状态的概率的连续值组成。
数据变换不是旨在可逆,因为目标不是预测实际的未来KPI值,而是预报网络或者网络元件的状态。该变换针对故障预测是自然的,其中降级可以被编码为网络元件能够存在的独特状态。作为附加的考虑,与原始KPI值相比,通过为它们附接描述性标签(诸如无线电环境降级、高分组丢失导致的吞吐量降级等),状态通常可以被更好的翻译以用于人类的理解。非常需要注意的是,代表正常执行功能的状态的预测可能可以被用于其他网络管理或者控制任务,诸如认知网络管理功能。
向量量化算法可以被定制为在不管密度情况的情况下在训练数据中均匀分布量子。该放置有助于为了所提出的距离变换能够创建非常适合于LSTM RNN的经变换的数据。
本公开的元素是:
·使用向量量化从网络管理数据(PM、CM)中生成精细的(discreet)网络状态;
·距离变换和稀疏执行器函数,其使用网络状态描述状态归属概率;
·LSTM RNN状态预测器,使用和预测状态归属概率。
图1图示了根据示例实施例的用于通信网络(例如移动网络)的网络管理装置的框图。网络数据变换单元10经由网络数据接收单元(未示出)接收代表通信网络当前状况的各种网络数据。在图示的实施例中,网络数据被存储在网络数据库16中,但是网络数据可以从网络元件或者其他网络实体被接收。网络数据包括指示网络元件或网络的性能的多个测量的或存储的值。网络数据可以包括拓扑数据、历史PM数据、历史CM数据、当前PM数据、以及附加输入(例如,警报)。网络数据可以包括网络或者其元件的关键性能指标(KPI)。网络数据由网络数据接收单元组装(assemble),以形成多维网络数据向量。在实施例中,可以使用不同的数据集。
移动网络中KPI的示例为:
·总VoLTE业务
·PRB利用率,DL/UL
·平均时延,DL/UL
·PDCP SDU量,DL/UL
·RRC释放
·RRC设立尝试
·PDCP吞吐量,DL/UL
·平均CQI
·平均CQI偏移
·平均PUSCH SINR
·平均活动UE,DL/UL
·具有缓冲器中的数据的平均活动Ue,DL
网络数据变换单元10将网络数据变换为指示通信网络的当前状态的网络状态向量。针对每个所考虑的网络状态,网络状态向量具有一个元素,并且对处于具体状态的网络的概率进行编码。
针对特定时刻的当前网络状态向量作为输入被提供给网络状态预测器20,以用于根据所提供的输入向量预测网络的未来状态。为此,网络状态预测器20输出预测的网络状态向量,其中每个向量元素代表网络在下一时刻处于该状态的概率。该预测的网络状态向量可以由网络管理装置用于确定将对监测的通信网络应用的管理活动,例如,校正动作,用以预防网络或者其一个或多个元件的预测的故障。
在实施例中,针对网络状态的示例可以是:
·正常状态:
ο低吞吐量——低利用率
ο中等吞吐量——高利用率(具有低无线电质量的少量用户)
ο高吞吐量——高利用率
·故障状态:
ο差CQI/SINR(由于倾斜的不当配置而来自另一个小区的干扰)
ο在具有通常高负载的时间帧中的低吞吐量(回程拥塞)
ο无呼入连接/用户(休眠小区)
取决于针对这种网络状态的所预测的概率,网络管理装置可以确定适当的动作,诸如网络中或者网络元件的重新配置。
在所描述的示例实施例中,网络数据变换单元10包括用于执行输入空间量化功能的向量量化器11。在操作中,量化器包括用于对输入空间进行聚类的量子的集合。量化器在被放入无监督学习算法的操作之前,可能已经学习了量子,例如基于历史PM和/或CM数据,或者不同地例如经由适当初始化来得出。量子可以被认为是向量输入空间簇的质心。下文将讨论不同的量化算法。
在任何情况下,量子和当前网络数据的集合被输入预处理单元12,该预处理单元12从其输入数据生成状态归属概率的向量。状态归属概率的向量和可选附加的(非量化的)输入数据(例如,网络警报)由可选的输入收集器单元13组装,以形成针对当前时刻的网络状态向量。在某些情况下,输入收集器单元13可以将网络状态向量重新缩放为单位长度以确保适当概率的表示。然后针对当前时刻的网络状态向量作为输入被提供给网络状态预测器20。
网络状态预测器20包括自学习预测模块22,其可以基于递归神经网络(RNN)。例如,长短期记忆RNN(LSTM)可以被预测模块22使用。LSTM由Sepp Hochreiter和JürgenSchmidhuber在论文“Long short-term memory”,神经计算9(8):1735-1780中提出,其通过引用而被合并。LSTM是具有内部存储器单元格的递归网络,该存储器单元格可以被布置在存储器单元格块中。存储器单元格可以具有内部输入门单元以保护存储器内容不被无关输入干扰,以及内部输入门单元以避免其他单元被存储在单元格中的当前无关存储器内容干扰。布置在存储器单元格块中的存储器单元格可以共享输入/输出门单元。LSTM具有多层单元并且通过基于梯度的学习算法被训练,该算法通过内部状态执行恒定的误差流。这种神经网络可以有利地被部署,以用于根据先前的状态变量来预测离散的状态变量。
在所描绘的实施例中,所生成的网络状态向量被置于LSTM的输入字段,然后LSTM计算针对未来时刻的预测网络状态向量的对应输出字段23。为了保证预测的状态向量的元素恰当地代表网络状态的概率并且符合单位长度要求,可以对输出字段23应用softmax函数。
更详细地,在所示出的示例中,生成状态归属概率向量的预处理单元12包括距离变换14和稀疏功能15。距离变换14可以是软距离变换,其确定其输入向量与代表网络状态的量化器11的每个量子之间的距离。换言之,距离变换计算从网络数据接收单元接收的网络数据的当前向量和量化器的簇的质心之间的相应的距离,该距离是网络数据和相应网络状态之间的相似性的测量。这些距离或者相似性的测量可以受制于进一步的变换以生成状态归属概率的预测,例如,通过对相应的距离应用逻辑函数。可选地,到目前为止由距离变换14计算的网络状态向量的值可以被重新缩放以保证状态向量的元素适当地代表针对网络状态的概率(即元素总和为1)。如果由距离变换14所提供的距离值被直接用作网络状态预测器20的输入(例如在没有接下来描述的稀疏的情况下),则该重新缩放可能是重要的。
在所描绘的示例中,计算的状态归属概率受制于可选的向量稀疏功能15,该功能通过将其在网络状态向量中相应概率值置零来抑制具有小概率的状态,从而针对后续状态预测20使相关状态的数目稀疏。稀疏功能可以是s稀疏器,其保留了具有最高s概率值的向量元素并且将剩余的向量元素置零。其他稀疏技术也可以被使用。然后稀疏网络状态向量被提供给状态预测20,可能还伴随有由可选输入收集器功能13所添加的元素。这种另外的元素可以基于其他基于事件的数据,诸如例如从网络的故障管理(FM)系统收集的警报事件。该基于事件的数据可以是指示网络中事件发生的二进制数据。这样,基于事件的数据可能不需要被重新缩放。
所提出的网络状态预测可以形成强大的故障预测系统的骨干,其可以作为自动网络管理系统的部分被实现。由于方法可以被处理的多种输入类型,因此其不限于特定的用例。其可以被用于自动化网络管理系统的各个部分。
如早前所提及的,所提出的方法不旨在预测移动网络测量将在未来采取的实际值,而是预测未来将处于的状态。为此它使用量化步骤,将原始KPI空间变换为网络状态空间。在实施例中,两种算法针对该任务被提出,K均值算法和边界球量化(BSQ)算法。
K均值算法和BSQ算法使用相同的期望最大化框架,但在它们所优化的目标函数中不同。K均值固有地具有更佳的平均重建误差;然而,它通过对数据的密度部分进行过表示(over-representing)而实现这点,从而导致无意义多样的量子。这导致较低的实际量子命中准确度(即以正确量子被预测的比率)。相较于这点,BSQ被设计以利用等量量子代表数据。这产生了在稀疏区域(例如数据的边缘)具有更好分辨率的更有意义的量子,该预测方法可以更好的使用该量子,从而产生更高的量子准确度,这可能是优选的。虽然在很多应用中K均值是用于训练量化的可靠和良好的选择(或者取决于任务来用于聚类),针对该任务,尤其是针对移动网络数据,BSQ更适合。BSQ算法的具体描述可以参见:Marton Kajo、Benedek Schultz、Janne Ali-Tolppa、Georg Carle的NOMS 2018-2018 IEEE/IFIP网络操作和管理座谈会的“Equal-Volume Quantization of Network Data Using BoundingSpheres and Boxes”,其通过引用而被包括在本公开中。
图2图示了在小型二维示例上通过K均值和BSQ执行的不同聚类。可以看到由K均值算法生成的簇更紧凑,而BSQ的簇在稀疏区域提供了更好的分辨率。
虽然在一些情况下,使用BSQ算法更有益,但是所提出的装置和方法部署不明令地取决于其,所提出的装置和方法允许使用其他向量量化算法。虽然所提出的距离变换是对为BSQ算法定制的,但一般方法论是独立于实际的向量量化器的,因此所提出的过程可以与其他依赖状态空间的系统结合使用或者在其他依赖状态空间的系统上被构建。增强的预测能力可以形成其他主动网络管理功能的基石,诸如负载平衡或者拥塞避免。
对于使用量化空间进行预测的缺点是量化所导致的硬决策会在量化边缘针对输入数据的小变化而产生任意大的差异,从而使预测器(例如LSTM RNN)学习一些人工的区别,从而降低了可能的准确度。为了抵消这点,软距离变换可以被引入,其基于由量化器生成的距离值生成软归属概率。这种方法使量化的“锚定”效应被保留,而量子边缘上的软决策提升了预测的性能。
图3图示了所提出的网络状态预测方法的不同的示例实施例。图3a图示了作为用于网络管理和诊断功能40的预处理步骤的网络状态预测模块的示例。网络状态预测模块从移动网络30接收网络数据,并且向网络管理和诊断功能40提供预测的网络状态。如之前图1中的那样,网络状态预测模块包括具有向量量化器和预处理的数据变换单元10、以及网络状态预测器20。
图3b图示了作为依赖于建立在具有现有状态空间的另一模块上的功能的网络状态预测模块的示例。另一模块是网络管理和诊断功能40,其从移动网络30接收网络数据并且具有提供现有状态空间的内置向量量化器11’。预处理模块12’包括上述软距离变换14并且使用该现有状态空间以用于生成表示相应状态的概率的网络状态向量。可选地,可以在预处理模块12’中提供向量稀疏器15。(可能被稀疏的)网络状态向量作为输入被提供给预测器20,预测器20预测针对未来时刻的网络状态向量。然后,针对未来时刻的预测的网络状态向量可以被循环回网络管理和诊断功能40,以用于诊断网络故障并且可能执行校正动作。
在RNN(或者通常是神经网络)的情况下,量化的空间通过使用one-hot(独热)编码来表示,即如果状态空间具有k=8个量子,然后第二个量子由向量(0,1,0,0,0,0,0,0)=onehot(2)表示。RNN采用这种one-hot向量的序列,并且输出softmax向量v∈[0,1]k,其中
Figure BDA0003182689940000151
然后预测的状态为p=argmax vi,所以是最高概率状态。然后通过将向量onehot(p)反馈到神经网络预测器的输入,来完成下一时步的预报,迭代该过程以用于长期预报。
在示例实施例中,提出的预处理包括两个主要部分:距离变换和s稀疏。这两项将在下文被更详细的描述。
软距离变换被应用于预测器的输入。针对KPI向量
Figure BDA0003182689940000152
和量子
Figure BDA0003182689940000153
输入向量v∈[0,1]k被生成使得
Figure BDA0003182689940000154
从中
Figure BDA0003182689940000155
此处scale是向量到单位长度的缩放操作,而exp通常是指数函数。
Figure BDA0003182689940000156
j=1…k常数涉及量子的紧密度,为简单起见,它们既可以在量子之间被选择作为常数(即cj=1),也可以被计算为量子的大小(针对BSQ算法这很自然,但针对其他量化方法这也是简单的估计)。
s稀疏通过首先选择被称为支持大小的正整数
Figure BDA0003182689940000161
来完成。然后,不使用onehot(p)用于预测器的输入(因此是最高概率状态的硬决策),而是构造具有支持大小s的支持向量v(s),其中v的除了s个最大值之外的全部值都被置零。例如,如果v=(0.05,0.45,0.1,0.35,0.02,0.01,0.01,0.01),其中s=2,则v(s)=(0,0.45,0,0.35,0,0,0,0)被生成。其后,向量v(s)被重新缩放,以使其具有||v(s)||=1的单位长度,然后这被用于预测器的下一个输入。
图4示出了用以图示用于网络状态的长期预报的网络状态预测的使用的框图。KPI原始数据首先被使得通过距离变换14,然后s稀疏器15获得稀疏归属概率。针对未来状态归属概率的长期预报,预测器20的输出(其来自于softmax最大输出层)被直接反馈到s稀疏器15,因此提供被反馈到预测器的稀疏归属概率向量。换言之,在很多情况下,期望提前预报多个步骤。在这种情况下,由于LSTM未来只能提前预测一个步骤,以此预测结果会被迭代的反馈给预测器网络以生成多个步骤。预测器输出不直接反馈作为输入,而是在系统训练期间通过相同的(多个)稀疏器作为历史数据。
图4中所示的示例图示了针对网络管理装置的示例,该装置包括从量化器(未示出)接收量子信息11a和KPI值的向量的距离变换单元14。该距离变换单元14通过测量KPI值的向量与量子信息11a中的量子的集合之间的距离,来对KPI值的向量应用软距离变换。距离变换单元14针对代表网络状态的量子的集合生成状态归属概率,并且将概率传播到状态向量。网络状态向量v被提供给s稀疏器15。框15中的第一个向量示出了具有上述示例的概率值的由稀疏器15接收的状态向量的v。第二个向量输出了保留的s=2个最大概率并且剩余的值被置零。第三个向量示出了经重新缩放后的状态向量v(s),使得状态概率的总和为1。然后,经重新缩放的状态向量被提供给预测器20,这里是LSTM。针对长期预测,在softmax函数被应用于此之后,针对下一时刻的预测状态向量被作为输入循环回稀疏器15,以用于预测针对未来时刻的进一步的状态向量。该子过程可以被迭代地重复以用于从针对一个时刻的KPI值的向量中预测未来较长时间的网络状态向量。如果新的KPI向量针对下一时刻是可用的,则可以从该新的KPI向量重新开始长期预测并且迭代地循环回预测。
存在两种稀疏中的极端情况要强调:如果一方使用s=1,然后该方会得到简单的one-hot表示,因此是通常的LSTM预测器惯例。相反如果一方设置s=k,使得支持大小为最大(量子的数目),然后实质上,该确切的softmax输出被反馈到预测器网络。这两种极端之间存在平滑的过度,这使用户能够微调量化的算法和LSTM网络的大小。
使用BSQ和软距离还允许LSTM网络自然地将资源集中于学习状态空间的重要部分,而不是人工执行。使用基于状态空间的预报而不是真实值的预报的另一个有趣并且极大的优势是虽然短期预测稍好于真实值(仅由于通过向量量化引入的量化误差),但当使用量化的空间时,长期预报更加准确。这可以由量子所做的“锚定”来解释,使RNN能够学习重要的状态变化而不是将资源浪费在对网络的整体状态没有贡献的微小变化上。
图5示出了图示针对量化的预测器相对于使用未量化的原始LSTM的长期预报误差的示意图。可以看到针对量化的预测器的预报误差低于针对未量化的LSTM预报误差。
图6示出了针对示例网络管理方法的流程图。该方法可以被用于对通信网络执行网络管理活动。
在步骤100中,代表通信网络的当前状况的网络数据被接收。该网络数据包括指示通信网络的网络元件性能的多个测量值。
在步骤110中,接收的网络数据被变换为指示网络的当前状态的网络状态向量。变换接收的网络数据可以包括将向量量化算法应用到网络数据,以用于将网络数据指配到网络状态并且生成代表网络状态的概率的网络状态向量。该变换还可以包括对网络状态向量应用稀疏变换。
在步骤120中,通过应用基于自学习预测算法的网络状态预测,根据网络的当前网络状态向量针对网络预测未来网络状态向量。预测的网络未来状态向量可以被反馈到所述变换接收的网络数据,以用于进一步的未来网络状态向量的预测。步骤120可以被重复以用于长期预测,并且该方法迭代地生成针对未来时刻的更多预测的状态向量。
当针对下一时刻,新网络数据可用时,该方法可以返回步骤100以用于处理新网络数据,并且该方法可以通过上述步骤进行循环。
所提出的网络状态的预测的优点是:
·非常适合依赖量化的其他网络管理方法,诸如CBR知识共享或者异常检测系统。
·量化步骤和距离变换两者都使网络数据更易于向人类解释。
·用于以下功能的使能器:预警和主动自愈。
应当进一步注意的是,描述和附图仅图示所提出设备的原理。本领域的技术人员将能够实施各种布置。虽然未在本文明确描述或示出,但体现了本发明的原理并且被包括在其精神和范围内。此外,本文档中所概述的所有示例和实施例主要专门用于解释的目的以帮助读者理解所提出设备的原理。此外,提供本发明的原理、方面、以及实施例、以及其具体示例的本文所有陈述旨在涵盖其等价事物。
Figure BDA0003182689940000181
Figure BDA0003182689940000191

Claims (15)

1.一种网络管理装置,包括:
网络数据接收部件,用于接收代表通信网络的当前状况的网络数据,所述网络数据包括指示网络元件的性能的多个值;
网络数据变换部件,用于将所接收的所述网络数据变换为指示所述网络的当前状态的网络状态向量;以及
网络状态预测部件,用于根据当前网络状态向量来预测所述网络的未来网络状态向量,所述网络状态预测部件包括自学习预测模块,所述自学习预测模块具有用于存储至少一个内部状态的存储器。
2.根据权利要求1所述的网络管理装置,其中所述网络数据变换部件包括向量量化器,所述向量量化器被配置用于将网络数据的向量变换到网络状态空间中。
3.根据权利要求2所述的网络管理装置,其中所述向量量化器基于所述K均值算法或者所述边界球量化算法。
4.根据任一项前述权利要求所述的网络管理装置,其中所述网络数据变换部件包括距离变换模块,所述距离变换模块被配置用于生成代表网络状态的概率的所述网络状态向量。
5.根据权利要求4所述的网络管理装置,其中所述距离变换模块基于所述向量量化器的量子对网络数据的所述向量应用软距离变换。
6.根据任一项前述权利要求所述的网络管理装置,其中所述网络数据变换部件包括数据稀疏模块,所述数据稀疏模块被配置用于抑制代表针对对应的网络状态的低概率的所述网络状态向量的元素。
7.根据权利要求6所述的网络管理装置,其中所述数据稀疏模块基于s稀疏算法,所述s稀疏算法将除了s个最大元素之外的所有向量元素置零,并且随后将所述网络状态向量重新缩放为单位长度。
8.根据任一项前述权利要求所述的网络管理装置,其中所述自学习预测模块包括递归神经网络,具体是长短期记忆递归神经网络。
9.根据任一项前述权利要求所述的网络管理装置,其中所述网络状态预测部件包括softmax模块,所述softmax模块被配置为生成单位长度的网络状态向量。
10.根据任一项前述权利要求所述的网络管理装置,其中预测的未来网络状态向量被反馈到所述网络数据变换部件,以生成指示所述网络的下一状态的新的网络状态向量,以用于根据所述新的网络状态向量对进一步的未来网络状态向量进行长期预测。
11.根据任一项前述权利要求所述的网络管理装置,还包括网络管理模块,所述网络管理模块被配置为基于所述预测的未来网络状态向量来执行校正网络管理动作。
12.一种用于对通信网络执行网络管理活动的网络管理方法,包括:
接收代表所述通信网络的当前状况的网络数据,所述网络数据包括指示网络元件的性能的多个值;
将所接收的所述网络数据变换为指示所述网络的当前状态的网络状态向量;以及
通过应用基于自学习预测算法的网络状态预测,来根据所述网络的所述当前网络状态向量针对所述网络而预测未来网络状态向量,所述自学习预测算法具有用于存储至少一个内部状态的存储器。
13.根据权利要求12所述的方法,其中变换所接收的所述网络数据包括对所述网络数据应用向量量化算法,以用于将所述网络数据指配到网络状态并且生成代表网络状态的概率的所述网络状态向量。
14.根据权利要求12或13所述的方法,其中变换所接收的所述网络数据包括对所述网络状态向量应用稀疏变换。
15.根据权利要求12至14中任一项所述的方法,还包括将预测的未来网络状态向量反馈到所述变换的步骤,以生成指示所述网络的下一状态的新的网络状态向量,以用于根据所述新的网络状态对进一步的未来网络状态向量进行长期预测。
CN201880100652.9A 2018-11-28 2018-11-28 用于网络管理中的故障预测的方法和装置 Pending CN113348691A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2018/082814 WO2020108747A1 (en) 2018-11-28 2018-11-28 A method and an apparatus for fault prediction in network management

Publications (1)

Publication Number Publication Date
CN113348691A true CN113348691A (zh) 2021-09-03

Family

ID=64661299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880100652.9A Pending CN113348691A (zh) 2018-11-28 2018-11-28 用于网络管理中的故障预测的方法和装置

Country Status (4)

Country Link
US (1) US11558262B2 (zh)
EP (1) EP3888390A1 (zh)
CN (1) CN113348691A (zh)
WO (1) WO2020108747A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112994944B (zh) * 2021-03-03 2023-07-25 上海海洋大学 一种网络状态预测方法
US11568345B1 (en) * 2021-08-20 2023-01-31 Dish Wireless L.L.C. Cognitive-defined network management
US20230199565A1 (en) * 2021-12-20 2023-06-22 Intel Corporation Methods and devices for management of the radio resources

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592171A (zh) * 2011-12-30 2012-07-18 南京邮电大学 基于bp神经网络的认知网络性能预测方法及装置
US9306962B1 (en) * 2013-07-25 2016-04-05 Niddel Corp Systems and methods for classifying malicious network events
US20160359719A1 (en) * 2015-06-05 2016-12-08 Apple Inc. System and method for predicting changes in network quality
US20170048109A1 (en) * 2015-08-14 2017-02-16 Accenture Global Services Limited Core network analytics system
CN106603293A (zh) * 2016-12-20 2017-04-26 南京邮电大学 虚拟网络环境下一种基于深度学习的网络故障诊断方法
CN107409075A (zh) * 2015-03-24 2017-11-28 华为技术有限公司 用于网络时间序列数据的自适应的基于异常检测的预测器
US20180019910A1 (en) * 2016-07-13 2018-01-18 Incelligent P.C. Early warning and recommendation system for the proactive management of wireless broadband networks
EP3382938A1 (en) * 2017-03-31 2018-10-03 Telefonica Digital España, S.L.U. A computer implemented method, a system and computer programs to forecast the performance of a network

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11423323B2 (en) * 2015-09-02 2022-08-23 Qualcomm Incorporated Generating a sparse feature vector for classification
WO2018157951A1 (en) 2017-03-01 2018-09-07 Telefonaktiebolaget Lm Ericsson (Publ) A method and apparatus for key performance indicator forecasting using artificial life
WO2020015831A1 (en) 2018-07-19 2020-01-23 Nokia Technologies Oy Environment modeling and abstraction of network states for cognitive functions
US20210359899A1 (en) * 2018-09-11 2021-11-18 Telefonaktiebolaget Lm Ericsson (Publ) Managing Event Data in a Network

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592171A (zh) * 2011-12-30 2012-07-18 南京邮电大学 基于bp神经网络的认知网络性能预测方法及装置
US9306962B1 (en) * 2013-07-25 2016-04-05 Niddel Corp Systems and methods for classifying malicious network events
CN107409075A (zh) * 2015-03-24 2017-11-28 华为技术有限公司 用于网络时间序列数据的自适应的基于异常检测的预测器
US20160359719A1 (en) * 2015-06-05 2016-12-08 Apple Inc. System and method for predicting changes in network quality
US20170048109A1 (en) * 2015-08-14 2017-02-16 Accenture Global Services Limited Core network analytics system
US20180019910A1 (en) * 2016-07-13 2018-01-18 Incelligent P.C. Early warning and recommendation system for the proactive management of wireless broadband networks
CN106603293A (zh) * 2016-12-20 2017-04-26 南京邮电大学 虚拟网络环境下一种基于深度学习的网络故障诊断方法
EP3382938A1 (en) * 2017-03-31 2018-10-03 Telefonica Digital España, S.L.U. A computer implemented method, a system and computer programs to forecast the performance of a network

Also Published As

Publication number Publication date
US11558262B2 (en) 2023-01-17
WO2020108747A1 (en) 2020-06-04
US20220021587A1 (en) 2022-01-20
EP3888390A1 (en) 2021-10-06

Similar Documents

Publication Publication Date Title
CN112913274B (zh) 用于自组织网络的优化的过程
Mulvey et al. Cell fault management using machine learning techniques
US11109283B1 (en) Handover success rate prediction and management using machine learning for 5G networks
WO2021186158A1 (en) A distributed network traffic data decomposition method
WO2019184836A1 (zh) 数据分析设备、多模型共决策系统及方法
US20230292142A1 (en) Transfer learning of network traffic prediction model among cellular base stations
EP3803694B1 (en) Methods, apparatus and computer-readable mediums relating to detection of cell conditions in a wireless cellular network
CN113348691A (zh) 用于网络管理中的故障预测的方法和装置
EP4075752A1 (en) Intelligent capacity planning and optimization
Moysen et al. A mobile network planning tool based on data analytics
Clemente et al. Traffic forecast in mobile networks: Classification system using machine learning
US20230259744A1 (en) Grouping nodes in a system
Manalastas et al. A data-driven framework for inter-frequency handover failure prediction and mitigation
CN113825165B (zh) 基于时间图网络的5g切片网络拥塞预警方法及装置
WO2023011371A1 (en) Method and system for configuring a threshold value for a handover parameter of a wireless communication system
Bakri et al. Channel stability prediction to optimize signaling overhead in 5G networks using machine learning
Sun et al. Zero-shot multi-level feature transmission policy powered by semantic knowledge base
Horsmanheimo et al. NES—Network Expert System for heterogeneous networks
CN111492632A (zh) 用于预测网络节点的状态改变的系统和方法
Alzahrani et al. Network Traffic Forecasting in Network Cybersecurity: Granular Computing Model
Chawla et al. Graph-based Interpretable Anomaly Detection Framework for Network Slice Management in Beyond 5G Networks
US20220131764A1 (en) Method of controlling state control parameter for adjusting state of network of base station by using any one of plurality of models and electronic device performing the method
US20240089757A1 (en) Systems and methods for selecting a machine learning model that predicts a subscriber network experience in a geographic area
CN113297045B (zh) 分布式系统的监控方法及装置
US20240112012A1 (en) Systems and methods for providing a unified causal impact model with hyperedge-enhanced embedding for network interventions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination