CN116192665A - 数据处理方法、装置、计算机设备及存储介质 - Google Patents
数据处理方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN116192665A CN116192665A CN202211686442.7A CN202211686442A CN116192665A CN 116192665 A CN116192665 A CN 116192665A CN 202211686442 A CN202211686442 A CN 202211686442A CN 116192665 A CN116192665 A CN 116192665A
- Authority
- CN
- China
- Prior art keywords
- sequence
- preset
- eigenmode
- modal
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 33
- 238000013528 artificial neural network Methods 0.000 claims abstract description 66
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 61
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 52
- 238000012545 processing Methods 0.000 claims abstract description 52
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims description 42
- 230000006870 function Effects 0.000 claims description 25
- 230000009466 transformation Effects 0.000 claims description 18
- KJONHKAYOJNZEC-UHFFFAOYSA-N nitrazepam Chemical compound C12=CC([N+](=O)[O-])=CC=C2NC(=O)CN=C1C1=CC=CC=C1 KJONHKAYOJNZEC-UHFFFAOYSA-N 0.000 claims description 15
- 210000004027 cell Anatomy 0.000 claims description 13
- 210000002569 neuron Anatomy 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000001228 spectrum Methods 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 7
- 238000007405 data analysis Methods 0.000 claims description 3
- 239000010410 layer Substances 0.000 description 79
- 239000004973 liquid crystal related substance Substances 0.000 description 20
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000002159 abnormal effect Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000004913 activation Effects 0.000 description 6
- 125000004122 cyclic group Chemical group 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 239000002355 dual-layer Substances 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241000288105 Grus Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/127—Avoiding congestion; Recovering from congestion by using congestion prediction
Abstract
本申请公开了一种数据处理方法、装置、计算机设备及存储介质。该方法包括获取网络流量数据,通过变分模态分解算法,对网络流量数据的第一时间序列进行分解,得到K个本征模态序列;根据K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与每个本征模态序列对应的流量预测结果;整合与每个本征模态序列对应的流量预测结果,得到预测网络流量数据。如此,根据变分模态分解算法将不平稳的时间序列分解为平稳的本征模态序列,并通过流量预测模型对每个平稳的本征模态序列进行网络流量预测,实现网络流量的预测,避免依赖人工资源造成的流量拥堵,有效节省资源消耗,提高了网络管理的效率和质量。
Description
技术领域
本申请属于计算机技术领域,具体涉及一种数据处理方法、装置、计算机设备及存储介质。
背景技术
随着互联网的快速发展,特别是第五代移动通信技术(5th Generation MobileCommunication Technology,5G)时代的来临,用户量持续增长,网络上承载的业务和应用也日趋丰富,使得网络流量呈爆发式增长,网络规模也随之不断扩大,这给各个服务平台的网络管理带来了巨大的挑战。
在相关技术中,网络管理是响应式的解决方式,即当流量出现异常情况,网络管理系统发出告警后,管理人员再着手解决问题,如此,该网络管理方式过于依赖人工资源,如果人工处于无法及时处理异常情况,就会造成流量拥堵,降低处理异常情况效率,影响网络管理的效率和质量。
发明内容
本申请实施例提供一种数据处理方法、装置、计算机设备及存储介质,能够解决现有技术中响应式的网络管理方式过于依赖人工资源,容易造成流量拥堵,降低处理异常情况效率,影响网络管理的效率和质量的问题。
第一方面,本申请实施例提供一种数据处理方法,该方法可以包括:
获取网络流量数据;
通过变分模态分解算法,对网络流量数据的第一时间序列进行分解,得到K个本征模态序列,K为大于1的整数;
根据K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与每个本征模态序列对应的流量预测结果;其中,流量特征由网络流量数据和皮尔森相关算法确定,流量特征为网络流量数据中对网络流量具有预设影响的特征;
整合与每个本征模态序列对应的流量预测结果,得到第一预设时间段内的预测网络流量数据。
第二方面,本申请实施例提供了一种数据处理装置,该装置可以包括:
获取模块,用于获取网络流量数据;
分解模块,用于通过变分模态分解算法,对网络流量数据的第一时间序列进行分解,得到K个本征模态序列,K为大于1的整数;
计算模块,用于根据K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与每个本征模态序列对应的流量预测结果;其中,流量特征由网络流量数据和皮尔森相关算法确定,流量特征为网络流量数据中对网络流量具有预设影响的特征;
处理模块,用于整合与每个本征模态序列对应的流量预测结果,得到第一预设时间段内的预测网络流量数据。
第三方面,本申请实施例提供了一种计算设备,该计算设备包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现如第一方面所示的数据处理方法。
第四方面,本申请实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所示的数据处理方法。
第五方面,本申请实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面所示的数据处理方法。
第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面、所示的数据处理方法。
本申请实施例的数据处理方法、装置、计算机设备及存储介质,获取网络流量数据,并通过变分模态分解算法,对网络流量数据的第一时间序列进行分解,得到K个本征模态序列,K为大于1的整数,接着,根据K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与每个本征模态序列对应的流量预测结果;其中,流量特征由网络流量数据和皮尔森相关算法确定,流量特征为网络流量数据中对网络流量具有预设影响的特征,然后,整合与每个本征模态序列对应的流量预测结果,得到第一预设时间段内的预测网络流量数据。由此,可以根据变分模态分解算法(VMD)能够将不平稳的时间序列分解为平稳的本征模态序列,同时避免了经验模态分解分解中出现的端点效应和模态混叠问题,以及通过改进双层门控循环单元神经网络(GRU)流量预测模型,对每个平稳的本征模态序列进行网络流量预测,以选择最优参数,以及,通过整合每个与每个本征模态序列对应的网络流量预测结果,得到第一预设时间段内的预测网络流量数据,更为准确的实现网络流量的预测,避免了过于依赖人工资源,容易造成流量拥堵,降低处理异常情况效率的情况,有效节省了资源消耗,能够实现中长期预测,进而提高网络管理的效率和质量。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据处理架构的结构示意图;
图2为本申请实施例提供的一种数据处理方法的流程图;
图3为本申请实施例提供的一种数据处理方法的确定网络流量数据的示意图;
图4为本申请实施例提供的一种数据处理方法的确定步长的示意图;
图5为本申请实施例提供的一种数据处理方法中的训练双层门控循环单元神经网络流量预测模型的示意图;
图6为本申请实施例提供的一种双层门控循环单元神经网络流量预测模型的结构示意图;
图7是本申请一个实施例提供的一种构建双层门控循环单元神经网络流量预测模型的结构示意图;
图8是本申请一个实施例提供的一种数据处理装置的结构示意图;
图9是本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
随着互联网的快速发展,网络用户量持续的增长,网络上承载的服务和应用也日趋丰富。网络流量预测是提高网络运行速度和利用率的重要举措。为了加强网络建设,对网络流量进行预测是运营管理的重要方面。
在相关技术中,网络管理是响应式的解决方式,当流量出现异常情况,网络管理系统发出告警后,管理人员再着手解决,这种管理方式会大大影响网络的正常运行,给用户带来不便。网络流量预测可以在流量过载前分析,观察网络状态,提早采取相应措施,从而保证网络持续稳定的运行,提高网络的可用性。网络流量的预测模型主要分为线性预测和非线性预测两类。其中线性模型主要有基于短相交特性的自回归滑动平均模型、自回归综合滑动平均模型和基于长相关特性的差分自回归滑动平均模型等,模型简单,计算量小,但是线性模型多用于分析平稳的序列,误差相对来说也比较大。随后,非线性模型也逐渐被提出,即包括支持向量机、小波预测、神经网络、可加回归模型等,非线性模型在预测精度方面有一定的提高,但同时也会增加模型的复杂度和计算消耗。
具体地,可以利用经验模态分解(empirical mode decomposition,EMD)和聚类的组合模型实现了网络流量的预测,通过经验模态分解将网络流量分解为IMF,然后将IMF利用K均值聚类算法(K-means clustering algorithm,K-Means)进行聚类,对聚类后的IMF分类采用自适应加权马尔可夫模型预测。然而,上述方式中在网络流量预测过程中将网络流量分解为时间序列,大都具有强烈的非平稳性和高强度复杂性,单个的模型难以建立精准的预测模型,所以提出“先分解后组合”的建模方法,虽然提高了单个模型的预测精度,但仍存在一些不足:其一,在网络流量预测过程中,通过经验模态EMD分解将网络流量分解为不同尺度上的子序列,容易存在端点效应和模态混叠的问题;其二,经EMD分解后得到的子序列众多,通过K-Means算法对序列进行聚类需要人工设定聚类的个数,而合并的序列个数难以事先确定;其三,EMD分解是自适应的,对于很长的时间序列,EMD分解效果差;其四,自适应加权马尔可夫模型对过程的预测效果良好,但是链式不适用于系统中长期预测。
基于此,为了解决上述出现的问题,本申请实施例根据容器云平台的网络质量管理要求,提供了一种基于面向集群的VMD和门控单元循环神经网络GRU的流量预测的数据处理方法、装置、计算机设备及存储介质,获取网络流量数据,并通过变分模态分解算法,对网络流量数据的第一时间序列进行分解,得到K个本征模态序列,K为大于1的整数,接着,根据K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与每个本征模态序列对应的流量预测结果;其中,流量特征由网络流量数据和皮尔森相关算法确定,流量特征为网络流量数据中对网络流量具有预设影响的特征,然后,整合与每个本征模态序列对应的流量预测结果,得到第一预设时间段内的预测网络流量数据。由此,可以根据变分模态分解算法(VMD)能够将不平稳的时间序列分解为平稳的本征模态序列,同时避免了经验模态分解分解中出现的端点效应和模态混叠问题,以及通过改进双层门控循环单元(Gate Recurrent Unit,GRU)神经网络流量预测模型,对每个平稳的本征模态序列进行网络流量预测,以选择最优参数,以及,通过整合每个与每个本征模态序列对应的网络流量预测结果,得到第一预设时间段内的预测网络流量数据,更为准确的实现网络流量的预测,避免了过于依赖人工资源,容易造成流量拥堵,降低处理异常情况效率的情况,有效节省了资源消耗,能够实现中长期预测,进而提高网络管理的效率和质量。
本申请实施例提供了一种数据处理架构,下面结合图1,对本申请实施例提供的数据处理架构进行详细地说明。
如图1所示,数据处理架构10可以包括变分模态分解(VMD)模块101和双层门控循环单元神经网络(GRU)预测模块102和输出模块103。
具体地,VMD模块101,用于通过服务监控系统和时间序列数据库(Prometheus)采集集群中的网络流量数据。以及,VMD模块101还用于,通过变分模态分解算法,将不稳定的网络流量数据的时间序列,将网络流量数据的时间序列进行分解,分解成K个平稳的本征模态序列如IMF1、IMF2、……、IMFK。
GRU预测模块102,用于通过双层门控循环单元神经网络(GRU)流量预测模型如GRU1、GRU2、……、GRUK、GRUK+1,分别对每个本征模态序列进行预测,得到与所述每个本征模态序列对应的流量预测结果,以利用模型选择最优参数。
输出模块103还用于,整合与所述每个本征模态序列对应的流量预测结果,得到第一预设时间段内的预测网络流量数据。
基于上述数据处理架构,本申请实施例提供了一种数据处理方法、装置、设备及存储介质。下面将结合附图2至图7,详细描述本申请实施例的数据处理方法、装置、设备及存储介质,应注意,这些实施例并不是用来限制本申请公开的范围。
下面结合图2对本申请实施例提供的数据处理方法进行详细说明。
图2为本申请实施例提供的一种数据处理方法的流程图。
如图2所示,该数据处理方法可以应用于如图1所示的数据处理架构,该数据处理方法具体可以包括如下步骤:
步骤210,获取网络流量数据;步骤220,通过变分模态分解算法,对网络流量数据的第一时间序列进行分解,得到K个本征模态序列,K为大于1的整数;步骤230,根据K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与每个本征模态序列对应的流量预测结果;其中,流量特征由网络流量数据和皮尔森相关算法确定,流量特征为网络流量数据中对网络流量具有预设影响的特征;步骤240,整合与每个本征模态序列对应的流量预测结果,得到第一预设时间段内预测网络流量数据。
由此,根据变分模态分解算法能够将不平稳的时间序列分解为平稳的本征模态序列,同时避免了经验模态分解分解中出现的端点效应和模态混叠问题,以及通过改进双层门控循环单元神经网络流量预测模型,对每个平稳的本征模态序列进行网络流量预测,以选择最优参数,然后,整合每个与每个本征模态序列对应的网络流量预测结果,得到第一预设时间段内的预测网络流量数据,更为准确的实现网络流量的预测,有效节省了资源消耗,能够实现中长期预测。
下面对上述步骤进行详细说明,具体如下所示。
首先,涉及步骤210,在一种或多种可能的实施例中,该步骤210具体可以包括:
将第一预设时间段内的时长确定为提取窗口;
按照提取窗口,从第二预设时间段内的网络流量数据中提取网络流量数据。
这里,需要说明的是,该第二预设时间段为当前时间点之前的时间段,即历史的时间段。
示例性地,如图3所示,具体以Prometheus为例,对该步骤进行详细说明。
以Prometheus server(监控服务组件,用于收集和存储时间序列数据)为中心,依据待预测流量的时间长度即第一预设时间段作为时间尺度,获取第二时间段内的网络流量数据。Prometheus server通过pull(方式)从各个Targets(目标)和Exporter(目标采集组件/目标主机)中获取数据。这里,可以通过exporters采集metrics数据(指标名称和描述当前样本特征的labelsets),然后发送到prometheus server,其中,所有向promtheusserver提供监控数据的程序都可以被称为exporter。以及,Prometheus server从jobs(静态配置)或exporters中拉取metrics,或接收(中间网关)Pushgateway(各个目标主机可上报数据到pushgateway,然后prometheus server统一从pushgateway拉取数据)发送的metrics,或其他的Prometheus server中拉取metrics。如此,Prometheus server在本地存储收集到的metrics,运行定义好的alert.rule,记录新的时间序列,得到网络流量数据。
其次,涉及步骤220,可以通过VMD模块分解不稳定的时间序列,其中,VMD是一种自适应、完全非递归的模态变分和信号处理的算法,将不平稳的第一时间序列{Xt,t∈T}作为原始信号f(t)分解为有限带宽不同数量如K个的本征模态序列(IMF),经过计算更新,以便各本征模态序列确定自己的最佳中心频率,实现原始信号的有效分解。
基于此,在一种或多种可能的实施例中,变分模态分解算法包括拉格朗日表达式和傅里叶等距变换函数,该步骤220具体可以包括步骤2201至步骤2204,具体如下所示。
步骤2201,对第一时间序列进行分解,得到L个模态分量,L个模态分量中每个模态分量与第一中心频率对应,L个模态分量的带宽之和小于或等于预设带宽,L为正整数。
进一步地,该步骤2201具体可以包括:
步骤22011,根据预设分解条件,对第一时间序列进行分解,得到P个初始模态分量,P为正整数;
步骤22012,分别对P个初始模态分量中每个初始模态分量进行希尔伯特(Hilbert)变换,得到每个初始模态分量的单边频谱;
步骤22013,通过预设混合估计中心频率,将每个初始模态分量的单边频谱调制到基频带,得到目标基频带;
步骤22014,通过高斯平滑估计算法,对目标基频带进行高斯平滑估计处理,得到每个初始模态分量的带宽;
步骤22015,根据每个初始模态分量的带宽,对P个初始模态分量重新划分,得到L个模态分量。
步骤2202,根据每个模态分量和每个模态分量对应的第一中心频率,通过拉格朗日表达式,计算每个模态分量对应的第二中心频率。
步骤2203,通过傅里叶等距变换函数对第二中心频率进行更新。
进一步地,在一个示例中,更新条件满足预设更新条件包括更新后的L大于或等于预设更新数量,基于此,该步骤2203具体可以包括:
基于预设迭代次数n,通过傅里叶等距变换函数,对第二中心频率和L个模态分量中每个模态分量的单分量调幅调频信号进行更新,得到与预设迭代次数n对应的迭代结果;
令n=n+1,循环执行基于预设迭代次数n,通过傅里叶等距变换函数,对第二中心频率和L个模态分量中每个模态分量的单分量调幅调频信号进行更新,直至更新后的L大于或等于预设更新数量,停止执行更新。
步骤2204,在更新条件满足预设更新条件的情况下,根据与更新次数对应的模态分量的数量和预设精度值,确定K的取值。
进一步地,在一个示例中,变分模态分解算法还包括变分模态求解算法,基于此,该步骤2204具体可以包括:
根据与更新次数对应的模态分量的数量,通过变分模态求解算法,对拉格朗日乘数进行更新,拉格朗日表达式与拉格朗日乘数对应;
在更新后的拉格朗日乘数与更新后的L个模态分量中每个模态分量的单分量调幅调频信号的关联指数小于或等于预设精度值的情况下,将与更新次数对应的模态分量的数量值确定为K的值。
示例性地,VMD算法分为两部分,即变分模态问题定义和变分模态模型求解。其中,变分模态问题是将一个第一时间序列f(t)分解为K个具有固定第二中心频率ωk的本征模态序列IMF,使每个本征模态序列的带宽之和最小。变分模态模型求解是指VMD算法通过构造变分问题求解的方式将原始信号f(t)分解为K个本征模态序列(子信号)μk(t),K=1,2...K,即受约束变分模型定义为公式(1):
基于此,可以对第一时间序列f(t)进行分解,得到P个初始模态分量,对初始模态分量进行Hilbert变换得到其单边频谱,通过预设混合估计中心频率,将各初始模态分量的单边频谱调制到基频带,再经过对调节信号梯度的L2正则化进行高斯平滑估计,得到每个初始模态分量的带宽。根据所述每个初始模态分量的带宽,对P个初始模态分量重新划分,得到L个模态分量。
其次,变分模态问题求解,即引入拉格朗日乘子λ(t),二次惩罚因子a,得到非约束问题,扩展的拉格朗日表达式,如公式(2):
根据公式(2)寻找非约束问题的最佳解,接着,利用傅里叶等距变换求解上述的变分问题,得到新的最佳解表示如公式(3):
如此,VMD算法的具体实现过程:
n=n+1,进入循环;
依据公式(3)公式(4)更新μk,ωk,直至更新后的L大于或等于预设更新数量时停止内循环;
依据公式(5)更新λ
给定预设精度ε,满足条件如公式(6)时停止:
其中,μk为分解后的单分量调幅调频信号;ωk为第二中心频率即每个单分量调幅调频信号的中频率;λ为拉格朗日乘数;n为预设迭代次数,经过中心频率和惩罚算子不断地相互交替更新,最终获得最佳分解模态数,即K的值。
这样,VMD分解效果主要是受初始模态分量的影响,当初始模态分量的选取值较小时,原始信号中一些重要信息可能会被过滤,影响预测精度;初始模态分量的选取值较大时,相邻模态分量的中心频率则会相距比较近,导致模态重复或产生额外的噪声。如此,选取K时需要观察不同模态下第二中心频率分布来选取合适的值。
在另一种或多种可能的实施例中,在该步骤220之前,该数据处理方法还可以包括:
步骤2501,通过自相关性检验函数,对网络流量数据进行数据分析处理,得到与网络流量数据对应的自相关系数;
步骤2502,在自相关系数满足第一预设条件的情况下,将与网络流量数据对应的时间序列确定为第一时间序列。
示例性地,时间序列平稳性分析,这里,本申请实施例中将采集的网络流量数据作为时间序列进行分析,在时间序列平稳性检验上,根据自相关性检验函数(ACF)分析判定该观察序列是否为平稳序列。对于第一时间序列{Xt,t∈T},任取t,s∈T,第一时间序列{Xt}的自相关系数γ(s,t)可以通过变分模态求解算法即公式(7)实现:
再者,涉及步骤230,在一种或多种可能的实施例中,本申请实施例还提供了一种获取流量特征的步骤,基于此,在步骤230之前,该数据处理方法还可以包括:
通过皮尔森相关算法,从网络流量数据中提取流量特征。
示例性地,可以通过如下公式(8)选择用于双层门控循环单元神经网络流量预测模型构建的流量特征。本申请实施例中选用皮尔森相关算法选择与网络流量预测的流量特征:
实现皮尔森相关算法的计算公式如公式(8)所示:
这里,xi,是x的第i个观测值,表示特征;yi,是y的第i个观测值,表示网络流量数值,q为预设常量。皮尔森相关算法是用于测量两组连续变量之间的关联程度,皮尔森相关系数就是两个协方差除以两个变量标准差乘积。
在另一种或多种可能的实施例中,双层门控循环单元神经网络流量预测模型包括第一门控循环单元层和第二门控循环单元层,一门控循环单元层的神经元个数大于第二门控循环单元层的神经元个数,基于此,该步骤230具体可以包括:
步骤2301,将每个本征模态序列对应的目标时间步长转换为多元三维序列;
步骤2302,通过第一门控循环单元层对多元三维序列和流量特征进行预测处理,得到第一预测结果;
步骤2303,将第一预测结果输入第二门控循环单元层,通过第二门控循环单元层对第一预测结果进行预测处理,得到与每个本征模态序列对应的流量预测结果。
另外,在步骤230之前,本申请实施例提供的数据处理方法还可以包括构建模型的步骤,基于此,在步骤230之前,该数据处理方法还可以包括:
步骤2601,获取第二预设时间段内的网络流量数据;
步骤2602,通过偏自相关算法,根据第二预设时间段内的网络流量数据的第二时间序列,计算第二预设时间段内的网络流量数据的偏自相关系数;
步骤2603,根据第二预设时间段内的网络流量数据的偏自相关系数和初始双层门控循环单元神经网络流量预测模型的时间步长,从第二时间序列中提取第一时刻t对应的样本时间序列以及第二时刻的隐藏状态值,第二时刻为第一时刻之前的时刻;
步骤2604,根据样本时间序列和隐藏状态值对初始双层门控循环单元神经网络流量预测模型进行训练,直至满足预设训练条件,得到双层门控循环单元神经网络流量预测模型。
示例性地,流量预测模型具体的实现过程如下,首先,确定时间步长,时间步长决定了在每个门控循环单元中输入的数据包括多少个时间戳的数据,在构建双层门控循环单元神经网络时,根据预测目标及输入的时间序列所具有的特征来确定时间步长的数目往往能够提升模型的预测准确度。
通过分析网络流量时间序列的偏自相关系数来确定双层门控循环单元神经网络的时间步长。滞后K偏自相关系数(PACF)是指在给定中间K-1个随机变Xt-1,Xt-2,...,Xt-k+1的条件下,或者说,在剔除了中间K-1个随机变量的干扰后,Xt-k对Xt影响的相关度量,滞后K偏自相关系数计算如公式(9)所示:
这里,公式(9)中的K与上述其他公式所表达的含义不同,这里的K为滞后K偏自相关系数。基于此,如图4所示,根据偏自相关图,观察滞变量g为何值时,偏自相关系数衰减为0,并且当大于g时,在0值上下波动,此时的步长效果较好。为了使双层门控循环单元神经网络流量预测模型更准确,可以通过预设测试模型来验证步长设置是否合理,通过观察不同步长下模型的误差值,选择误差最小时的步长。
接着,构建双层门控循环单元神经网络流量预测模型,构建以上述确定的步长作为运算参数的双层门控循环单元神经网络流量预测模型对网络流量进行预测,双层门控循环单元神经网络流量预测模型在时间序列的处理过程中示意图如图5所示,假设设定的步长为4,在设定以4小时为时间步长的序列上的t时刻下,将当前时刻的输入值序列x={xt-4,xt-3,xt-2,xt-1}与前一时刻的隐藏状态值ht-1一同作为GRU单元的输入,再经过单元计算得到输出值Yt,如此对序列内的每一个时间步进行递归,其中,参数用3个矩阵权重定义,U、V、W分别对应输入、输出和隐藏状态的权重,且全部参数在所有时间步上共享。
基于此,在一个示例中,初始双层门控循环单元神经网络流量预测模型包括第一初始门控循环单元层和第二初始门控循环单元层;满足预设训练条件包括对第二初始门控循环单元的训练次数大于或等于预设训练次数,这样,该步骤2604具体可以包括:
根据样本时间序列和隐藏状态值对第一初始门控循环单元层进行训练,得到第一训练结果;
根据第一训练结果对第二初始门控循环单元层进行训练,直至对第二初始门控循环单元的训练次数大于或等于预设训练次数,得到GRU神经网络流量预测模型。
示例性地,如图6所示,由于初始双层门控循环单元神经网络流量预测模型是循环神经网络的一种,所以,本申请实施例可以按照时间顺序把信息进行有效的整合和筛选,其特殊的门控结构能够有效改善在反向传播期间由于时间序列较长而导致的梯度消失问题,梯度消失问题是指当梯度随着时间的推移反向传播时梯度不断下降,如果梯度值变得非常小(无限接近于零)时,就不会再进行学习,无法实现长期依赖,因此,采用初始双层门控循环单元神经网络流量预测模型才能实现中长期预测。
如此,参照图1并结合图7,可通过如下公式(10)-公式(13)实现构建双层门控循环单元神经网络流量预测模型:
(1)更新门:确定上一层隐藏层状态中记忆信息
rt=σ(xtWxr+ht-1Whr+br) (10)
(2)重置门:确定上一时刻隐藏层中遗忘信息
zt=σ(xtWxz+ht-1Whz+bz) (11)
(3)确定当前记忆内容
(4)确定当前适合隐藏层保留的信息
和上述公式中ht-1为相对于当前时刻t上一时刻的状态,Xt与ht分别为当前t时刻GRU模块的输入和输出,rt与zt分别为GRU模块中的重置门和更新门。σ为用于神经网络层的激活函数,Wxr与Whr为重置门的权重参数,br,bz,bh分别为重置门、更新门及输出候选值中的偏置矢量,Wxz与Wh z为更新门的权重参数,Wx h和Whh为求取输出候选值过程中的参数,运算符/>表示进行数组。
基于此,在实际中,网络流量信号数据量较大,因此构建分离的双层门控循环单元神经网络流量预测模型。如图6所示(图中灰色圆点代表激活后的神经元,白色圆点代表失活的神经元)。本申请实施例中的在神经网络的架构设计上以堆叠式双层GRU为主,第一层GRU层负责接收输入层中由多个确定的时间步长的输入序列所组成的多元三维矩阵,假设该网络层中神经元个数设有200个,第二层GRU层中设置有100个神经元,这些神经元接收到经上一GRU层处理过后的序列信息再次对其进行计算,深化模型训练过程。同时每个GRU计算单元层后伴随着一个Dropout层作为防止模型过拟合的设置。输出层设置为具有一个神经元的Dense层用于输出模型的预测结果。本申请实施例中所构建的双层门控循环单元神经网络流量预测模型中上方的GRU层向下方的GRU层提供序列输出,而不是单个值输出。具体来说,每个输入时间步长对应一个输出,而不是所有输入时间步长对应着一个输出时间步长,如此,具备深度叠加式网络层级结构的模型在预测精度和训练效率上相比单层神经网络更加可靠,将经过VMD分解后的本征模态序列与选出来的流量特征M共同构建向量矩阵作为GRU神经网络的输入变量,放入构建完整的多步双层神经网络进行迭代和训练,以得到预测网络流量数据。
此外,上述涉及的激活函数可以通过如下方式确定,激活函数是促使神经网络中神经元内计算并产生输出信号的重要工具,根据本申请实施例中设计隐藏层,选用ReLU函数作为GRU网络中的激活函数,激活函数具体的计算公式如(14)所示:
以及,优化双层门控循环单元神经网络流量预测模型,这样,过拟合优化:采用Droupout技术防止GRU神经网络在训练模型时出现过拟合现象。学习率优化:使用Adam优化器优化神经网络中的学习率。
然后,涉及步骤240,第一预设时间段是为还未发生的时间段,如未来24小时内。
由此,获取网络流量数据,并通过变分模态分解算法,对网络流量数据的第一时间序列进行分解,得到K个本征模态序列,K为大于1的整数,接着,根据K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与每个本征模态序列对应的流量预测结果;其中,流量特征由网络流量数据和皮尔森相关算法确定,流量特征为网络流量数据中对网络流量具有预设影响的特征,然后,整合与每个本征模态序列对应的流量预测结果,得到第一预设时间段内的预测网络流量数据。由此,可以根据变分模态分解算法能够将不平稳的时间序列分解为平稳的本征模态序列,同时避免了经验模态分解分解中出现的端点效应和模态混叠问题,以及通过改进双层门控循环单元神经网络流量预测模型,对每个平稳的本征模态序列进行网络流量预测,以选择最优参数,以及,通过整合每个与每个本征模态序列对应的网络流量预测结果,得到第一预设时间段内的预测网络流量数据,更为准确的实现网络流量的预测,避免了过于依赖人工资源,容易造成流量拥堵,降低处理异常情况效率的情况,有效节省了资源消耗,能够实现中长期预测,进而提高网络管理的效率和质量。
基于相同的发明构思,本申请还提供了一种数据处理装置。具体结合图8进行详细说明。
图8是本申请一个实施例提供的一种数据处理装置的结构示意图。
在本申请一些实施例中,图8所示数据处理装置可以设置于如图1所示的数据处理架构。
如图8所示,该数据处理装置80具体可以包括:
获取模块801,用于获取网络流量数据;
分解模块802,用于通过变分模态分解算法,对网络流量数据的第一时间序列进行分解,得到K个本征模态序列,K为大于1的整数;
计算模块803,用于根据K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与每个本征模态序列对应的流量预测结果;其中,流量特征由网络流量数据和皮尔森相关算法确定,流量特征为网络流量数据中对网络流量具有预设影响的特征;
处理模块804,用于整合与每个本征模态序列对应的流量预测结果,得到第一预设时间段内的预测网络流量数据。
下面分别对本申请实施例中数据处理装置80进行详细说明。
在一种或者多种可选的实施例中,本申请实施例中数据处理装置80还包括第一分解模块、第一更新模块和第一确定模块;其中,
第一分解模块,用于对第一时间序列进行分解,得到L个模态分量,L个模态分量中每个模态分量与第一中心频率对应,L个模态分量的带宽之和小于或等于预设带宽,L为正整数;
计算模块803还用于,根据每个模态分量和每个模态分量对应的第一中心频率,通过拉格朗日表达式,计算每个模态分量对应的第二中心频率;
第一更新模块,用于通过傅里叶等距变换函数对第二中心频率进行更新;
第一确定模块,用于在更新条件满足预设更新条件的情况下,根据与更新次数对应的模态分量的数量和预设精度值,确定K的取值。
在另一种或者多种可选的实施例中,本申请实施例中数据处理装置80还包括第二分解模块、变换模块、调制模块和划分模块;其中,
第二分解模块,用于根据预设分解条件,对第一时间序列进行分解,得到P个初始模态分量;
变换模块,用于分别对P个初始模态分量中每个初始模态分量进行希尔伯特变换,得到每个初始模态分量的单边频谱;
调制模块,用于通过预设混合估计中心频率,将每个初始模态分量的单边频谱调制到基频带,得到目标基频带;
处理模块804还用于,通过高斯平滑估计算法,对目标基频带进行高斯平滑估计处理,得到每个初始模态分量的带宽;
划分模块,用于根据每个初始模态分量的带宽,对P个初始模态分量重新划分,得到L个模态分量。
在又一种或者多种可选的实施例中,本申请实施例中数据处理装置80还包括第二更新模块;其中,
第二更新模块,用于在更新条件满足预设更新条件包括更新后的L大于或等于预设更新数量的情况下,基于预设迭代次数n,通过傅里叶等距变换函数,对第二中心频率和L个模态分量中每个模态分量的单分量调幅调频信号进行更新,得到与预设迭代次数n对应的迭代结果;
令n=n+1,循环执行基于预设迭代次数n,通过傅里叶等距变换函数,对第二中心频率和L个模态分量中每个模态分量的单分量调幅调频信号进行更新,直至更新后的L大于或等于预设更新数量,停止执行更新。
在再一种或者多种可选的实施例中,本申请实施例中数据处理装置80还包括第三更新模块和第二确定模块;其中,
第三更新模块,用于在变分模态分解算法还包括变分模态求解算法的情况下,根据与更新次数对应的模态分量的数量,通过变分模态求解算法,对拉格朗日乘数进行更新,拉格朗日表达式与拉格朗日乘数对应;
第二确定模块,用于在更新后的拉格朗日乘数与更新后的L个模态分量中每个模态分量的单分量调幅调频信号的关联指数小于或等于预设精度值的情况下,将与更新次数对应的模态分量的数量值确定为K的值。
在再一种或者多种可选的实施例中,申请实施例中数据处理装置80还包括转换模块和预测模块;其中,
转换模块,用于在双层门控循环单元神经网络流量预测模型包括第一门控循环单元层和第二门控循环单元层,一门控循环单元层的神经元个数大于第二门控循环单元层的神经元个数的情况下,将每个本征模态序列对应的目标时间步长转换为多元三维序列;
预测模块,用于通过第一门控循环单元层对多元三维序列和流量特征进行预测处理,得到第一预测结果;
预测模块还用于,将第一预测结果输入第二门控循环单元层,通过第二门控循环单元层对第一预测结果进行预测处理,得到与每个本征模态序列对应的流量预测结果。
在再一种或者多种可选的实施例中,申请实施例中数据处理装置80还包括第一提取模块和第一训练模块;其中,
获取模块801还用于,获取第二预设时间段内的网络流量数据;
计算模块803还用于,通过偏自相关算法,根据第二预设时间段内的网络流量数据的第二时间序列,计算第二预设时间段内的网络流量数据的偏自相关系数;
第一提取模块,用于根据第二预设时间段内的网络流量数据的偏自相关系数和初始双层门控循环单元神经网络流量预测模型的时间步长,从第二时间序列中提取第一时刻对应的样本时间序列以及第二时刻的隐藏状态值,第二时刻为第一时刻之前的时刻;
第一训练模块,用于根据样本时间序列和隐藏状态值对初始双层门控循环单元神经网络流量预测模型进行训练,直至满足预设训练条件,得到双层门控循环单元神经网络流量预测模型。
在再一种或者多种可选的实施例中,申请实施例中数据处理装置80还包括第二训练模块;其中,
第二训练模块,用于在初始双层门控循环单元神经网络流量预测模型包括第一初始门控循环单元层和第二初始门控循环单元层;满足预设训练条件包括对第二初始门控循环单元的训练次数大于或等于预设训练次数的情况下,根据样本时间序列和隐藏状态值对第一初始门控循环单元层进行训练,得到第一训练结果;
第二训练模块还用于,根据第一训练结果对第二初始门控循环单元层进行训练,直至对第二初始门控循环单元的训练次数大于或等于预设训练次数,得到双层门控循环单元神经网络流量预测模型。
在再一种或者多种可选的实施例中,申请实施例中数据处理装置80还包括第三确定模块和第二提取模块;其中,
第三确定模块,用于将第一预设时间段内的时长确定为提取窗口;
第二提取模块,用于按照提取窗口,从第二预设时间段内的网络流量数据中提取网络流量数据。
在再一种或者多种可选的实施例中,申请实施例中数据处理装置80还包括第三提取模块;其中,
第三提取模块,用于通过皮尔森相关算法,从网络流量数据中提取流量特征。
在再一种或者多种可选的实施例中,申请实施例中数据处理装置80还包括第四确定模块;其中,
处理模块804还用于,通过自相关性检验函数,对网络流量数据进行数据分析处理,得到与网络流量数据对应的自相关系数;
第四确定模块,用于在自相关系数满足第一预设条件的情况下,将与网络流量数据对应的时间序列确定为第一时间序列。
综上,本申请实施例中获取网络流量数据,并通过变分模态分解算法,对网络流量数据的第一时间序列进行分解,得到K个本征模态序列,K为大于1的整数,接着,根据K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与每个本征模态序列对应的流量预测结果;其中,流量特征由网络流量数据和皮尔森相关算法确定,流量特征为网络流量数据中对网络流量具有预设影响的特征,然后,整合与每个本征模态序列对应的流量预测结果,得到第一预设时间段内的预测网络流量数据。由此,可以根据变分模态分解算法(VMD)能够将不平稳的时间序列分解为平稳的本征模态序列,同时避免了经验模态分解分解中出现的端点效应和模态混叠问题,以及通过改进双层门控循环单元神经网络(GRU)流量预测模型,对每个平稳的本征模态序列进行网络流量预测,以选择最优参数,以及,通过整合每个与每个本征模态序列对应的网络流量预测结果,得到第一预设时间段内的预测网络流量数据,更为准确的实现网络流量的预测,避免了过于依赖人工资源,容易造成流量拥堵,降低处理异常情况效率的情况,有效节省了资源消耗,能够实现中长期预测,进而提高网络管理的效率和质量。
基于相同的发明构思,本申请还提供了一种计算机设备。具体结合图9进行详细说明。
图9是本申请一个实施例提供的计算机设备的结构示意图。
如图9所示,该计算机设备可以包括电子设备或服务器。其中,该计算机设备可以包括处理器901以及存储有计算机程序指令的存储器902。
具体地,上述处理器901可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器902可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器902可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器902可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器902可在综合网关容灾设备的内部或外部。在特定实施例中,存储器902是非易失性固态存储器。在特定实施例中,存储器902包括固态存储(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器901通过读取并执行存储器902中存储的计算机程序指令,以实现上述实施例中的任意一种数据处理方法。
在一个示例中,数据处理设备还可包括通信接口903和总线910。其中,如图9所示,处理器901、存储器902、通信接口903通过总线910连接并完成相互间的通信。
通信接口903,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线910包括硬件、软件或两者,将流量控制设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线910可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该数据处理设备可以执行本申请实施例中的数据处理方法,从而实现结合图1至图8描述的数据处理方法和装置。
另外,结合上述实施例中的数据处理方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种数据处理方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (14)
1.一种数据处理方法,其特征在于,包括:
获取网络流量数据;
通过变分模态分解算法,对所述网络流量数据的第一时间序列进行分解,得到K个本征模态序列,K为大于1的整数;
根据所述K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与所述每个本征模态序列对应的流量预测结果;其中,所述流量特征由所述网络流量数据和皮尔森相关算法确定,所述流量特征为所述网络流量数据中对网络流量具有预设影响的特征;
整合与所述每个本征模态序列对应的流量预测结果,得到第一预设时间段内的预测网络流量数据。
2.根据权利要求1所述的方法,其特征在于,所述变分模态分解算法包括拉格朗日表达式和傅里叶等距变换函数;
所述通过变分模态分解算法,对所述网络流量数据的第一时间序列进行分解,得到K个本征模态序列,包括:
对所述第一时间序列进行分解,得到L个模态分量,所述L个模态分量中每个模态分量与第一中心频率对应,所述L个模态分量的带宽之和小于或等于预设带宽,L为正整数;
根据所述每个模态分量和所述每个模态分量对应的第一中心频率,通过所述拉格朗日表达式,计算每个模态分量对应的第二中心频率;
通过所述傅里叶等距变换函数对所述第二中心频率进行更新;
在更新条件满足预设更新条件的情况下,根据与更新次数对应的模态分量的数量和预设精度值,确定K的取值。
3.根据权利要求2所述的方法,其特征在于,所述对所述第一时间序列进行分解,得到L个模态分量,包括:
根据预设分解条件,对所述第一时间序列进行分解,得到P个初始模态分量,P为正整数;
分别对所述P个初始模态分量中每个初始模态分量进行希尔伯特变换,得到所述每个初始模态分量的单边频谱;
通过预设混合估计中心频率,将所述每个初始模态分量的单边频谱调制到基频带,得到目标基频带;
通过高斯平滑估计算法,对所述目标基频带进行高斯平滑估计处理,得到所述每个初始模态分量的带宽;
根据所述每个初始模态分量的带宽,对所述P个初始模态分量重新划分,得到L个模态分量。
4.根据权利要求2所述的方法,其特征在于,所述更新条件满足预设更新条件包括更新后的L大于或等于预设更新数量;所述通过所述傅里叶等距变换函数对所述第二中心频率进行更新,包括:
基于预设迭代次数n,通过所述傅里叶等距变换函数,对所述第二中心频率和L个模态分量中每个模态分量的单分量调幅调频信号进行更新,得到与所述预设迭代次数n对应的迭代结果;
令n=n+1,循环执行基于预设迭代次数n,通过所述傅里叶等距变换函数,对所述第二中心频率和L个模态分量中每个模态分量的单分量调幅调频信号进行更新,直至更新后的L大于或等于预设更新数量,停止执行更新。
5.根据权利要求2所述的方法,其特征在于,所述变分模态分解算法还包括变分模态求解算法;所述根据与更新次数对应的模态分量的数量和预设精度值,确定K的取值,包括:
根据所述与更新次数对应的模态分量的数量,通过变分模态求解算法,对拉格朗日乘数进行更新,所述拉格朗日表达式与所述拉格朗日乘数对应;
在更新后的拉格朗日乘数与更新后的L个模态分量中每个模态分量的单分量调幅调频信号的关联指数小于或等于预设精度值的情况下,将与更新次数对应的模态分量的数量值确定为K的值。
6.根据权利要求1所述的方法,其特征在于,所述双层门控循环单元神经网络流量预测模型包括第一门控循环单元层和第二门控循环单元层,所述一门控循环单元层的神经元个数大于第二门控循环单元层的神经元个数;
所述根据所述K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与所述每个本征模态序列对应的流量预测结果,包括:
将所述每个本征模态序列对应的目标时间步长转换为多元三维序列;
通过所述第一门控循环单元层对所述多元三维序列和所述流量特征进行预测处理,得到第一预测结果;
将所述第一预测结果输入所述第二门控循环单元层,通过所述第二门控循环单元层对所述第一预测结果进行预测处理,得到与所述每个本征模态序列对应的流量预测结果。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第二预设时间段内的网络流量数据;
通过偏自相关算法,根据所述第二预设时间段内的网络流量数据的第二时间序列,计算所述第二预设时间段内的网络流量数据的偏自相关系数;
根据所述第二预设时间段内的网络流量数据的偏自相关系数和初始双层门控循环单元神经网络流量预测模型的时间步长,从所述第二时间序列中提取第一时刻对应的样本时间序列以及第二时刻的隐藏状态值,所述第二时刻为所述第一时刻之前的时刻;
根据所述样本时间序列和所述隐藏状态值对所述初始双层门控循环单元神经网络流量预测模型进行训练,直至满足预设训练条件,得到所述双层门控循环单元神经网络流量预测模型。
8.根据权利要求7所述的方法,其特征在于,所述初始双层门控循环单元神经网络流量预测模型包括第一初始门控循环单元层和第二初始门控循环单元层;所述满足预设训练条件包括对所述第二初始门控循环单元的训练次数大于或等于预设训练次数;
所述根据所述样本时间序列和所述隐藏状态值对所述初始双层门控循环单元神经网络流量预测模型进行训练,直至满足预设训练条件,得到所述双层门控循环单元神经网络流量预测模型,包括:
根据所述样本时间序列和所述隐藏状态值对所述第一初始门控循环单元层进行训练,得到第一训练结果;
根据所述第一训练结果对所述第二初始门控循环单元层进行训练,直至对所述第二初始门控循环单元的训练次数大于或等于预设训练次数,得到所述神经网络流量预测模型。
9.根据权利要求1所述的方法,其特征在于,所述获取网络流量数据,包括:
将所述第一预设时间段内的时长确定为提取窗口;
按照所述提取窗口,从第二预设时间段内的网络流量数据中提取所述网络流量数据。
10.根据权利要求1所述的方法,其特征在于,所述计算与所述每个本征模态序列对应的流量预测结果之前,所述方法还包括:
通过所述皮尔森相关算法,从所述网络流量数据中提取所述流量特征。
11.根据权利要求1所述的方法,其特征在于,所述通过变分模态分解算法,对所述网络流量数据的第一时间序列进行分解,得到K个本征模态序列之前,所述方法还包括:
通过自相关性检验函数,对所述网络流量数据进行数据分析处理,得到与所述网络流量数据对应的自相关系数;
在所述自相关系数满足第一预设条件的情况下,将与所述网络流量数据对应的时间序列确定为所述第一时间序列。
12.一种数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取网络流量数据;
分解模块,用于通过变分模态分解算法,对所述网络流量数据的第一时间序列进行分解,得到K个本征模态序列,K为大于1的整数;
计算模块,用于根据所述K个本征模态序列中的每个本征模态序列和流量特征,通过双层门控循环单元神经网络流量预测模型,计算与所述每个本征模态序列对应的流量预测结果;其中,所述流量特征由所述网络流量数据和皮尔森相关算法确定,所述流量特征为所述网络流量数据中对网络流量具有预设影响的特征;
处理模块,用于整合与所述每个本征模态序列对应的流量预测结果,得到第一预设时间段内的预测网络流量数据。
13.一种计算机设备,所述计算设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-11任意一项所述的数据处理方法。
14.一种存储介质,所述存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-11任意一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211686442.7A CN116192665A (zh) | 2022-12-27 | 2022-12-27 | 数据处理方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211686442.7A CN116192665A (zh) | 2022-12-27 | 2022-12-27 | 数据处理方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116192665A true CN116192665A (zh) | 2023-05-30 |
Family
ID=86449881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211686442.7A Pending CN116192665A (zh) | 2022-12-27 | 2022-12-27 | 数据处理方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116192665A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117648589A (zh) * | 2024-01-30 | 2024-03-05 | 云储新能源科技有限公司 | 一种储能电池热失控预警方法、系统、电子设备及介质 |
CN117648589B (zh) * | 2024-01-30 | 2024-05-14 | 云储新能源科技有限公司 | 一种储能电池热失控预警方法、系统、电子设备及介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108829818A (zh) * | 2018-06-12 | 2018-11-16 | 中国科学院计算技术研究所 | 一种文本分类方法 |
US20190354836A1 (en) * | 2018-05-17 | 2019-11-21 | International Business Machines Corporation | Dynamic discovery of dependencies among time series data using neural networks |
CN110852655A (zh) * | 2019-11-29 | 2020-02-28 | 湖南科技大学 | 带有太阳能供电系统的家庭用电负荷分解系统与分解方法 |
CN111860982A (zh) * | 2020-07-06 | 2020-10-30 | 东北大学 | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 |
CN112801386A (zh) * | 2021-02-04 | 2021-05-14 | 北京工业大学 | 一种基于三阶段模型的短时交通流预测方法 |
CN113126489A (zh) * | 2021-03-29 | 2021-07-16 | 华北电力大学 | 一种基于cnn-gru-binn的重型燃气轮机控制系统智能bit设计方法 |
CN113392961A (zh) * | 2021-08-17 | 2021-09-14 | 中国海洋大学 | 中尺度涡轨迹平稳序列提取与循环神经网络预测方法 |
CN113836823A (zh) * | 2021-10-29 | 2021-12-24 | 武汉大学 | 一种基于负荷分解和优化双向长短期记忆网络的负荷组合预测方法 |
CN114692947A (zh) * | 2022-02-28 | 2022-07-01 | 江苏大学 | 一种基于VMD-Lasso-CNN-LSTM的用户用电能耗预测方法 |
CN115225516A (zh) * | 2022-07-18 | 2022-10-21 | 重庆邮电大学 | 一种基于改进abc-vmd的最小二乘支持向量机网络流量预测方法 |
CN115496180A (zh) * | 2022-08-29 | 2022-12-20 | 北京邮电大学 | 网络流量特征序列生成模型的训练方法、生成方法及装置 |
-
2022
- 2022-12-27 CN CN202211686442.7A patent/CN116192665A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190354836A1 (en) * | 2018-05-17 | 2019-11-21 | International Business Machines Corporation | Dynamic discovery of dependencies among time series data using neural networks |
CN108829818A (zh) * | 2018-06-12 | 2018-11-16 | 中国科学院计算技术研究所 | 一种文本分类方法 |
CN110852655A (zh) * | 2019-11-29 | 2020-02-28 | 湖南科技大学 | 带有太阳能供电系统的家庭用电负荷分解系统与分解方法 |
CN111860982A (zh) * | 2020-07-06 | 2020-10-30 | 东北大学 | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 |
CN112801386A (zh) * | 2021-02-04 | 2021-05-14 | 北京工业大学 | 一种基于三阶段模型的短时交通流预测方法 |
CN113126489A (zh) * | 2021-03-29 | 2021-07-16 | 华北电力大学 | 一种基于cnn-gru-binn的重型燃气轮机控制系统智能bit设计方法 |
CN113392961A (zh) * | 2021-08-17 | 2021-09-14 | 中国海洋大学 | 中尺度涡轨迹平稳序列提取与循环神经网络预测方法 |
CN113836823A (zh) * | 2021-10-29 | 2021-12-24 | 武汉大学 | 一种基于负荷分解和优化双向长短期记忆网络的负荷组合预测方法 |
CN114692947A (zh) * | 2022-02-28 | 2022-07-01 | 江苏大学 | 一种基于VMD-Lasso-CNN-LSTM的用户用电能耗预测方法 |
CN115225516A (zh) * | 2022-07-18 | 2022-10-21 | 重庆邮电大学 | 一种基于改进abc-vmd的最小二乘支持向量机网络流量预测方法 |
CN115496180A (zh) * | 2022-08-29 | 2022-12-20 | 北京邮电大学 | 网络流量特征序列生成模型的训练方法、生成方法及装置 |
Non-Patent Citations (1)
Title |
---|
黄国伦;诸葛丽强;杨乐;磨唯;: "基于LSTM的电力通信流量预测", 中国科技信息, no. 1, 15 February 2020 (2020-02-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117648589A (zh) * | 2024-01-30 | 2024-03-05 | 云储新能源科技有限公司 | 一种储能电池热失控预警方法、系统、电子设备及介质 |
CN117648589B (zh) * | 2024-01-30 | 2024-05-14 | 云储新能源科技有限公司 | 一种储能电池热失控预警方法、系统、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7526461B2 (en) | System and method for temporal data mining | |
US20070260563A1 (en) | Method to continuously diagnose and model changes of real-valued streaming variables | |
CN110675623A (zh) | 基于混合深度学习的短时交通流量预测方法、系统、装置 | |
CN109886464B (zh) | 基于优化奇异值分解生成特征集的低信息损失短期风速预测方法 | |
Nguyen et al. | A resource usage prediction system using functional-link and genetic algorithm neural network for multivariate cloud metrics | |
CN111435463A (zh) | 数据处理方法及相关设备、系统 | |
CN110621026B (zh) | 一种基站流量多时刻预测方法 | |
CN114495507B (zh) | 融合时空注意力神经网络和交通模型的交通流预测方法 | |
CN114721835A (zh) | 边缘数据中心服务器能耗预测方法、系统、设备及介质 | |
Bi et al. | Hybrid task prediction based on wavelet decomposition and ARIMA model in cloud data center | |
CN115146764A (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN115114128A (zh) | 一种卫星健康状态评估系统及评估方法 | |
CN115130894A (zh) | 基于人工智能的生产规划方法、装置、计算机设备及介质 | |
Paliwal et al. | Traffic estimation and prediction via online variational Bayesian subspace filtering | |
CN114219562A (zh) | 模型的训练方法、企业信用评估方法和装置、设备、介质 | |
Pandhiani et al. | Time series forecasting by using hybrid models for monthly streamflow data | |
Rimella et al. | Exploiting locality in high-dimensional Factorial hidden Markov models | |
CN110222840B (zh) | 一种基于注意力机制的集群资源预测方法和装置 | |
CN107169532A (zh) | 一种基于小波分析和半监督学习的车联网油耗数据质量评估方法 | |
CN116192665A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN116578858A (zh) | 基于图神经网络的空压机故障预测与健康度评价方法及系统 | |
CN116486341A (zh) | 基于rfid的人体行为识别模型的训练、识别方法及装置 | |
CN114720129B (zh) | 一种基于双向gru的滚动轴承剩余寿命预测方法及系统 | |
CN113449920A (zh) | 一种风电功率预测方法、系统及计算机可读介质 | |
CN113297540A (zh) | 在边缘物联代理服务下的app资源需求预测方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |