CN114221876B - 基于模糊控制与多特征融合的承载网流量预测方法及系统 - Google Patents
基于模糊控制与多特征融合的承载网流量预测方法及系统 Download PDFInfo
- Publication number
- CN114221876B CN114221876B CN202111354814.1A CN202111354814A CN114221876B CN 114221876 B CN114221876 B CN 114221876B CN 202111354814 A CN202111354814 A CN 202111354814A CN 114221876 B CN114221876 B CN 114221876B
- Authority
- CN
- China
- Prior art keywords
- sequence
- fuzzy control
- network
- data
- traffic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000004927 fusion Effects 0.000 title claims abstract description 21
- 238000005516 engineering process Methods 0.000 claims abstract description 23
- 238000003384 imaging method Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 230000007246 mechanism Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 9
- 238000003062 neural network model Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims 1
- 238000004891 communication Methods 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 18
- 239000011159 matrix material Substances 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- YLOCGHYTXIINAI-XKUOMLDTSA-N (2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-aminopentanedioic acid;(2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O.OC(=O)[C@@H](N)CCC(O)=O.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLOCGHYTXIINAI-XKUOMLDTSA-N 0.000 description 3
- 108010072051 Glatiramer Acetate Proteins 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 229940042385 glatiramer Drugs 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/043—Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Fuzzy Systems (AREA)
- Computational Mathematics (AREA)
- Automation & Control Theory (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于通信技术领域,提供了一种基于模糊控制与多特征融合的承载网流量预测方法及系统,包括:获取历史承载网网络流量序列数据;采用滑动窗口技术,将数据划分为多个子窗口,对每个子窗口的序列数据进行转换,得到多种类型的网络流量时间序列;采用格拉米差分角场序列成像技术,将多种类型的网络流量时间序列转换为二维图片,将多种类型的二维图片融合得到格拉米差分角场图片集;根据格拉米差分角场图片集和训练后的预测模型得到下一时刻的网络的承载量,通过叠加节假日的因素与考虑网络流量序列之间的相关性提高预测精度。
Description
技术领域
本发明属于通信技术领域,尤其涉及基于模糊控制与多特征融合的承载网流量预测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
运营商对用户推出不限量的流量套餐,做出这样举措的一个结果就会对现有网络造成一定的冲击,为了防止冲击造成的不良影响,网络运营商需要进行流量预测,从而指导承载网络的调整和扩容。众所周知,黄金周和春节等节假日的保障一直是运营商运维的重点工作,而且用户在节假日与非节假日所使用的流量的多少的是不同的,而且这种差异与地域、用户习惯以及消费水平等都有所联系。这就造成了网络流量数据之间的数据相关性程度并不密切,如何通过叠加节假日的因素与考虑网络流量序列之间的相关性,进而提高网络流量预测精度是本方法所研究的重要问题。
发明内容
为了解决上述背景技术中存在的至少一项技术问题,本发明提供基于格拉米角场的承载网流量预测方法及系统,为保证网络流量序列之间的相关性,采用格拉米角场成像技术将一维时间序列转换为二维图片,考虑到节假日等特定时期用户的流量使用情况,采用了增长熵和标准差分别去衡量在特定期间的用户流量使用情况的复杂性程度和用户流量使用的波动程度,将这两个衡量指标作为一种控制参考因素,添加到ConvLSTM网络中,进而构成了对流量的历史数据进行模糊控制,在考虑了这两种的参考因素下,进一步的提升了网络流量的预测精度。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供基于模糊控制与多特征融合的承载网流量预测方法,包括如下步骤:
获取历史承载网网络流量序列数据;
采用滑动窗口技术,将历史承载网网络流量序列数据进行划分为多个子窗口,对每个子窗口的序列数据进行转换,得到多种类型的网络流量时间序列;
采用格拉米差分角场序列成像技术,将多种类型的网络流量时间序列转换为二维图片,将多种类型的二维图片融合得到格拉米差分角场图片集;
根据格拉米差分角场图片集和训练后的预测模型得到下一时刻的网络的承载量,其中,在预测模型的单元向单元流动中添加模糊控制机制,根据模糊控制信息对预测模型进行子空间重构。
本发明的第二个方面提供基于模糊控制与多特征融合的承载网流量预测系统。
数据获取模块,被配置为:获取历史承载网网络流量序列数据;
数据预处理模块,被配置为:采用滑动窗口技术,将历史承载网网络流量序列数据进行划分为多个子窗口,对每个子窗口的序列数据进行转换,得到多种类型的网络流量时间序列;
采用格拉米差分角场序列成像技术,将多种类型的网络流量时间序列转换为二维图片,将多种类型的二维图片融合得到格拉米差分角场图片集;
网络流量预测模块,被配置为:根据格拉米差分角场图片集和训练后的预测模型得到下一时刻的网络的承载量,其中,在预测模型的单元向单元流动中添加模糊控制机制,根据模糊控制信息对预测模型进行子空间重构。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于模糊控制与多特征融合的承载网流量预测方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于模糊控制与多特征融合的承载网流量预测方法中的步骤。
与现有技术相比,本发明的有益效果是:
考虑到节假日流量使用与非假期期间用户流量使用的不同,采用了两个衡量指标增长熵和标准差来对这种差异进行衡量,利用格拉米角场序列成像技术,将一维网络流量序列进行升维处理,处理之后的图片作为输入进入到预测模型的ConvLSTM-F层,进而可以提取到原始序列的时间和空间方面的特征,实现对承载网智能流量的预测。
将这两个衡量指标作为控制参考因素,添加到原始的ConvLSTM网络中,进而构成了对流量的历史数据进行的模糊控制模块(ConvLSTM-F),在考虑了这两种的参考因素下,不仅可以提取到序列的时间方面的信息还能进一步提取空间的信息,进而在丰富输入信息的同时,提升了模型的预测精度。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是基于格拉米角场的承载网流量预测方法的整体流程图;
图2是采用滑动窗口技术采集序列数据图;
图3是增长熵序列生成过程;
图4是序列数据转换为图片的过程图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
本发明为了衡量在节假日和非节假日的流量使用的情况,使用了增长熵和标准差两种衡量数据的方法,分别衡量了这一阶段数据的复杂性程度和波动程度,采用的预测模型的主体是ConvLSTM-F,模型的输入数据是二维图片,因此采用使用格拉米角场成像技术,将多特征的序列进行转换成图片,从图片的角度进行分析预测,图片的像素与像素之间具有空间性的联系,而图片和图片之间也存在存在一个长期的时序关系,为提取特征,一层ConvLSTM-F用作特征提取,第二层ConvLSTM-F用作数据预测。
如图1所示,本实施例提供了一种基于格拉米角场的承载网流量预测方法,包括如下步骤:
S1:获取历史承载网网络流量序列数据;
给定一个D维总长度为N的历史承载网网络流量序列X,{1,2,3,…,N}∈t,其中t为时间戳,/>表示在第t时刻D维网络流量序列的所有维度的观测值,/>表示D维网络流量序列在第d维度上每一个时刻的观测值。
当D=1时,表示的是一维网络流量序列。
本实施例中,采用的数据为一维网络流量序列。
黄金周和春节等节假日的保障一直是运营商运维的重点工作,而且用户在节假日与非节假日所使用的流量的多少的是不同的。
再如,每年的双十一等一些特殊的节日,是淘宝购物的黄金时期,而在这阶段期间用户的流量使用情况是与平时是不一样的,网络运营商为了提前为用户提供合适的流量套餐,需要预测用户在这段时间的网络流量。
因此首先可以获取历史淘宝网网络流量序列数据;
S2:对历史承载网网络流量序列数据进行预处理得到转换为二维图片,将多种类型的二维图片融合得到格拉米差分角场图片集;
具体包括如下步骤:
S201:采用滑动窗口技术,按照窗口大小和滑动补偿,将历史承载网网络流量序列数据进行划分为多个子窗口,对每个子窗口的序列数据进行转换,得到多种类型的网络流量时间序列;
网络流量序列不仅在时间方面含有大量的信息,在空间方面也存在很多重要的信息。
但如今大多数的预测系统,很少能在处理网络流量序列时间方面的信息的同时,进一步考虑网络流量时间序列空间方面的信息。
为了解决上述问题,在进入预测模型之前,首先要对原始网络流量序列数据进行预处理。
所述采用滑动窗口技术对历史承载网网络流量序列数据进行划分,使用滑动窗口技术对原始数据进行划分,再对每个窗口的数据进行转换,使得网络流量序列数据要生成四种类型的数据,这四种数据来代替原始数据,从而表现出数据的更多特性。
本实施例中,初步设定窗口大小为74,滑动步长为6,划分为64个子窗口。选取一个窗口的序列数据,窗口的下一个数据为本窗口数据的标签值,如图2所示为滑动窗口采集序列数据。
所述网络流量时间序列的类别包括原始值序列、差值序列、增长熵序列、标准差序列。
所述增长熵序列的获取过程包括:
(1)选取子窗口的序列U,对子窗口序列进行增长重构,对子窗口序列U进行一节差分,得到差分序列数据{v(i)}:
vi=ui+1-ui,1≤i<n (1)
(2)确定子窗口序列长度n和嵌入维度m对差分序列数据{v(i)}进行重构,生成多个子序列:
V(i)=v(i),v(i+1),…,v(i+m-1),其中1≤i≤(n-m)。
可以理解的是,对于较短序列,嵌入维度m的范围应是2≤m≤6,波动幅度的精度g的范围应是3≤g≤8,增长熵的表现序列复杂程度较好。
例如,在实施例中,给定一个长度为74的网络流量时间序列,子窗口序列长度n=10,嵌入维度m=2,则每个子序列中包含2个元素,且序列长度n=10,因此此时共生成8个子序列。
(3)根据每个子序列V(i)求得其对应的模式向量w(i);
其中,所述每个模式向量w(i)表示的是对于每个子序列V(i)中的每个元素的符号和数值大小,即:
w(i)=[(s(1),q(1)),(s(2),q(2)),...,(s(m),q(m))]
其中,s(i)表示每个元素的符号,q(i)表示每个元素的数值大小。
其中,每个元素的符号和每个元素的数值大小计算公式如下:
当std({v(i)})=0时,则每个元素的数值大小q(i)=0。
(4)根据每个子序列中的模式向量的种类出现的个数,记为Q(w(i)),如果出现的种类都是相同的话,Q(w(i))为1。
计算模式向量w(i)的频率P(w(i)),计算公式为:
(5)计算窗口序列的增长熵,计算公式为:
本实施例中,如图3所示,例如,按照上述操作步骤,将64个子窗口分别求得各个窗口的序列增长熵值,使用这64个序列增长熵值所形成的增长熵序列(IncrEn data)作为原始大窗口序列数据的一种数据表示形式。
为保证四种形式的窗口序列长度一致,对于原始值序列数据(original data)是选自每个大窗口下的后64位元素值,此操作的原因是越靠近窗口标签的数据,其数据所蕴含的特征会越有利于标签值的预测。
其中,对于差值序列(difference data)的生成,是对大窗口的数据进行一阶差分计算,即使用后一项数据减前一项数据,从而计算得到大窗口数据的差值序列。
例如,大窗口数据长度为74,求得的差值序列长度为73。采用原始值序列数据相同的数据切割方法,新的差值序列选自原始差值序列后64位元素值。
标准差作为概率统计的一种方法,其数值大小可代表数据的波动程度。对于标准差序列(std data),将大窗口的序列按照滑动窗口技术划分为,设定子窗口大小n为10,步长为1,即每个大窗口划分为64个子窗口,按照标准差计算公式计算出每个子窗口的标准差值,在计算公式中X作为子窗口序列数据的均值。根据标准差计算公式,从而求得大窗口的标准差序列。
标准差计算公式如下:
其中,为使得预测结果更加贴近窗口标签值并能挖掘丰富的数据特征,将一个窗口数据分别使用四种不同形式来表示,这四种形式分别为部分原始值序列、差值序列、增长熵序列、标准差序列,在每一种形式下,数据的长度都相同。
在本实施例中,长度可为64。
其中增长熵可以标记序列的复杂性程度,其不仅考虑了时间序列中的次序等级,还考虑了序列的变化尺度的问题。
对于窗口数据采用增长熵的目的是根据增长熵的特性,求得窗口数据的复杂性程度,从而在后续预测模型中,增长熵数据所形成的输入数据作为数据控制的参考因素之一,对单元数据起到一个流量控制的作用,过滤掉一些数据噪音及异常点。
S202:采用格拉米差分角场序列成像技术,将多种类型的网络流量时间序列转换为二维图片,将多种类型的二维图片融合得到格拉米差分角场图片集;
上述步骤的目的是为了进一步挖掘网络流量时间序列的空间信息。格拉米差分角场(GADF)拥有着序列在转换的同时,依旧可以保持着良好的时间相关性,以至于一维序列在转换为二维图片后,依然存在原始序列中的重要信息。
如图4所示,本实施例以标准差序列转换二维图片的过程进行说明。
所述将网络流量标准差序列的转换为二维图片的过程包括:
(1)将差值序列中的每个元素缩放至区间[-1,1],其中数据的缩放公式为:
其中,S={s1,s2,s3,…,sn}为差值序列,n为序列长度。
(2)将缩放后的差值数据编码为角余弦,并将序列中的每个元素的时间戳除以正则化常数因子的值作为半径,经过转换将直角坐标系下的差值数据转换为极坐标下的差值序列。
坐标转换所应用的计算公式为:
其中,R是正则化常数因子,ti表示的是差值序列的时间戳。
(3)对于在极坐标下的差值序列,考虑差值序列中每个点的三角和或三角差的关系,使用角度透视定义来计算求得格拉米差分角场图片,从而实现从时间序列转换为图片的操作;
计算公式为:
其中,I表示的是单位行向量[1,1,…,1],表示的是差值序列的向量转置。
格拉米差分角场图片的形成是由长度为n的差分序列经过上述一系列的转化,最终会生成一张n×n的图片,主要生成原因为差值序列在计算格拉米差值角场矩阵时,元素的计算是由矩阵的左上方至矩阵的右下方依次计算而成,并且格拉米差值角场矩阵的元素是根据矩阵对角线对称,从而使得格拉米差值角场图片保存着差值序列的重要信息,使格拉米差值角场拥有了时间相关性的优点。
根据上述图片形成的方法,每一个大窗口的序列数据都会形成4种不同类型的图片,且每张图片的尺寸均为64×64,使用图片拼接技术,将四张图片拼接为一张尺寸大小为128×128的图片,从而使得将原始网络流量序列数据集转换为格拉米差分角场图片集。
S3:根据格拉米差分角场图片集和训练后的预测模型预测下一时刻的值,所述预测模型的单元向单元流动中添加了模糊控制机制获得模糊控制信息,根据模糊控制信息对预测模型进行子空间重构。
其中,输入层的是从预处理阶段得到的格拉米差分角场图片的像素矩阵,每一张格拉米差分角场图片对应一个标签值,这个标签值是划分窗口数据的下一时刻的真实值,预测的结果是下一时刻的值。
本实施例中,所述预测模型采用ConvLSTM-F神经网络模型,所述ConvLSTM神经网络模型包括为输入层、两层ConvLSTM-F层、展平层、输出层。上一层的输出为本层的输入,最后的输出层输出模型的预测结果。
所述两层ConvLSTM-F层中,第一层第一层的主要任务是提取流量图片特征,第二层是根据上一层获取的特征进行流量预测。
以第一层为例,每一个ConvLSTM-F单元都有三个门,即输入门、输出门、遗忘门,输入门的作用是决定了当前时刻网络的输入xt有多少保存到单元状态ct;遗忘门的作用是决定上一时刻的单元状态ct-1有多少保留到当前时刻ct;输出门的作用是控制单元状态ct-1有多少输出到ConvLSTM-F的当前输出值ht。
所述预测模型输入可以是一个5维张量模式(samples,time,rows,cols,channels),
因为格拉米差分角场图片是GRB图片,故模型的通道数设为3。
模型的输出是一个K维的向量Y,Y=[y1,y2,y3,…,yk],其中,yk表示当前输入经过模型后得到的结果在维度k上的值,当k=1时,模型的输出即为一个预测值。
预测的整体思想为:通过首先进行二维高斯计算;然后采用卷积计算提取模糊控制信息,最后在对输入门的单元信息进行处理。
所述预测模型的单元向单元流动中添加了模糊控制机制获得模糊控制信息的过程包括:
所述两层ConvLSTM-F层包括多个ConvLSTM-F单元,在ConvLSTM-F单元向ConvLSTM-F单元流动中添加了模糊控制机制,所述模糊控制机制为:以网络流量时间序列的增长熵和波动程度作为两个控制参考因素,得到格拉米差分角场图片的二维高斯函数从而获得模糊控制信息。
通过计算从上一个单元的输出门至本单元的输入门流入单元内部的信息量,进而提高模型预测精度。
所述根据模糊控制信息对ConvLSTM神经网络模型中的输入门进行子空间重构,对ConvLSTM单元中的输入门机制采用模糊控制,对增长熵和标准差所形成的二维图像矩阵计算二维高斯函数。
由于在节假日期间用户使用网络流量比非假期期间的网络流量的使用频繁,导致节假日期间的数据产生比较大的波动,以至于会影响未来网络流量的数据走势。
采用增长熵和标准差分别衡量网络流量时间序列的复杂性程度和波动程度,结合这两个的衡量指标,对ConvLSTM单元中的输入门的数据进行数据过滤得到fuzzi;
其中,过滤的主要目的是去除一些异常点及波动程度大的点。
数据过滤的主要方式是对ConvLSTM单元中的输入门机制采用模糊控制,对增长熵和标准差所形成的二维图像矩阵计算二维高斯函数。
其中,二维高斯函数又称为二维正态函数,这个函数的主要原理为系统在模糊半径的范围内,对图片的像素值乘上该部分的像素权重矩阵,由于越靠近图片内部的像素其对应的权重值越高,在模糊范围外的部分像素权重越低,其权重对于这部分像素值造成的影响就越小,说明在边缘部分的像素值相较于模糊半径内的像素值,其重要性程度并不高。
所述二维高斯函数的计算过程为设定模糊半径,在模糊半径的范围内,选取一个中心像素,平均中心像素周边的像素值得到所需的模糊像素值,计算公式为:
式中,o和p是周边像素对于中心像素的相对坐标,z是设定的模糊半径。
在本实施例中,所述模糊半径为1.5,模糊计算的权重矩阵的形状大小为3×3。
与原始ConvLSTM神经网络模型不同的是,对原始ConvLSTM神经网络模型中的门控机制的设定进行了修改,主要是对原始模型中的输入门进行子空间重构,添加了原始输入数据的增长熵和标准差的信息,这两个指标均是经过二维高斯函数平滑处理过的模糊数据,增长熵和标准差的图片使用上述算法模糊后的所形成的输入使用fuzzi进行表示。
所述模糊控制信息的公式为:
hi=Whi*ht-1 (10)
hfuzz_i=Wfuzz_i*fuzzi (11)
式中,hi表示对上一个单元进行卷积计算后的结果,Whi表示对上一个单元进行卷积计算的卷积矩阵,ht-1表示的是上一单元的输出,hfuzz_i表示模糊信息进行卷积滤波完的一个结果,Wfuzz_i表示对模糊后的信息进行卷积计算的卷积矩阵,表示哈达玛算子,fuzzi表示增长熵和标准差的图片使用二维高斯函数模糊后的信息,Wfuzz_i表示对模糊后的信息进行卷积计算的卷积矩阵。
对ConvLSTM神经网络模型中的输入门进行子空间重构,根据模糊控制信息,剔除输入当前单元的部分异常数据,所述对输入门的子空间重构是将上个单元的输入到每个单元的输入信息ht-1进行处理,当前单元输入门的输入ht_i的数学定义为:
ht_i=ht-1-hi+hfi (13)
此时,模型ConvLSTM-F的剩余部分和原始ConvLSTM模型中输入门、遗忘门、输出门的计算原理相同。
所述门控机制的计算公式为:
式中,*表示的卷积算子。参数{Whi,Wxi,Wci,bi},{Whf,Wxf,Wcf,bf},{Who,Wxo,Wco,bo}分别为模型输入门、遗忘门、输出门的网络参数。
所述预测模型的训练过程为:因为ConvLSTM-F模型是连续可微的,所以满足反向传播算法的训练要求,采用反向传播算法实现对模型中的参数的训练。
为了使模型能以较快的速度实现收敛,在模型训练时,采用batch技术,从样本池中按顺序选取batch数量的样本进行训练,在训练过程中,根据网络输出值和目标值之间的差值的平方作为目标函数,即均方误差(Mean Squared Error,MSE),同时采用随机梯度下降的优化器调整参数,从而训练出最优模型。
MSE数学定义公式如下:
式中,N代表总样本数,targett代表了t时刻的样本的实际观测值,predictt代表了t时刻样本的网络预测值。
本实施例中,由于模型的训练集、测试集的规模较小,故设定batch的大小为16。
ConvLSTM-F模型的整体训练过程如表1所示。
表1
在本实施例中,考虑到节假日流量使用与非假期期间用户流量使用的不同,采用了两个衡量指标增长熵和标准差来对这种差异进行衡量,后利用格拉米角场序列成像技术,将一维网络流量序列进行升维处理,处理之后的图片作为输入进入到ConvLSTM-F层,进而可以提取到原始序列的时间和空间方面的特征,实现对承载网智能流量的预测。在预测模型中,因使用ConvLSTM-F模块不仅可以提取到序列的时间方面的信息还能进一步提取空间的信息,进而在丰富输入信息的同时,提升了模型的预测精度。
实施例二
本实施例提供了基于模糊控制与多特征融合的承载网流量预测系统,包括:
数据获取模块,被配置为:获取历史承载网网络流量序列数据;
数据预处理模块,被配置为:采用滑动窗口技术,将历史承载网网络流量序列数据进行划分为多个子窗口,对每个子窗口的序列数据进行转换,得到多种类型的网络流量时间序列;
采用格拉米差分角场序列成像技术,将多种类型的网络流量时间序列转换为二维图片,将多种类型的二维图片融合得到格拉米差分角场图片集;
网络流量预测模块,被配置为:根据格拉米差分角场图片集和训练后的预测模型得到预测结果,其中,在预测模型的单元向单元流动中添加模糊控制机制,对预测模型进行子空间重构。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于模糊控制与多特征融合的承载网流量预测方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于模糊控制与多特征融合的承载网流量预测方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于模糊控制与多特征融合的承载网流量预测方法,其特征在于,包括如下步骤:
获取历史承载网流量序列数据;
采用滑动窗口技术,将历史承载网流量序列数据进行划分为多个子窗口,对每个子窗口的序列数据进行转换,得到多种类型的网络流量时间序列;
采用格拉米差分角场序列成像技术,将多种类型的网络流量时间序列转换为二维图片,将多种类型的二维图片融合得到格拉米差分角场图片集;
根据格拉米差分角场图片集和训练后的预测模型得到下一时刻的网络的承载量,其中,在预测模型的单元向单元流动中添加模糊控制机制,根据模糊控制信息对预测模型进行子空间重构。
2.如权利要求1所述的基于模糊控制与多特征融合的承载网流量预测方法,其特征在于,所述网络流量时间序列的类别包括原始值序列、差值序列、增长熵序列以及标准差序列。
3.如权利要求2所述的基于模糊控制与多特征融合的承载网流量预测方法,其特征在于,所述增长熵序列的获取过程包括:
选取子窗口的序列,对子窗口序列进行增长重构,对子窗口序列进行一节差分,得到差分序列数据;
确定子窗口序列长度和嵌入维度对差分序列数据进行重构,生成多个子序列;
根据每个子序列求得其对应的模式向量,根据模式向量出现的频率计算窗口序列的增长熵。
4.如权利要求1所述的基于模糊控制与多特征融合的承载网流量预测方法,其特征在于,将网络流量标准差序列的转换为二维图片的过程包括:
根据缩放公式将差值序列中的每个元素缩放;
将缩放后的差值数据编码为角余弦,并将序列中的每个元素的时间戳除以正则化常数因子的值作为半径,经过转换将直角坐标系下的差值数据转换为极坐标下的差值序列;
根据在极坐标下的差值序列,结合差值序列中每个点的三角和或三角差的关系,采用角度透视定义来得到格拉米差分角场图片。
5.如权利要求1所述的基于模糊控制与多特征融合的承载网流量预测方法,其特征在于,所述预测模型采用ConvLSTM神经网络模型。
6.如权利要求1所述的基于模糊控制与多特征融合的承载网流量预测方法,其特征在于,所述模糊控制机制为:以网络流量时间序列的增长熵和波动程度作为两个控制参考因素,根据格拉米差分角场图片的二维高斯函数获得模糊控制信息。
7.如权利要求5所述的基于模糊控制与多特征融合的承载网流量预测方法,其特征在于,所述根据模糊控制信息对预测模型进行子空间重构包括:在原始模型中的输入门进行了子空间重构,添加了历史承载网网络流量序列数据的增长熵和标准差两个指标的信息,所述两个指标的信息为经过二维高斯函数平滑处理过的模糊数据。
8.基于模糊控制与多特征融合的承载网流量预测系统,其特征在于,包括:
数据获取模块,被配置为:获取历史承载网流量序列数据;
数据预处理模块,被配置为:采用滑动窗口技术,将历史承载网流量序列数据进行划分为多个子窗口,对每个子窗口的序列数据进行转换,得到多种类型的网络流量时间序列;
采用格拉米差分角场序列成像技术,将多种类型的网络流量时间序列转换为二维图片,将多种类型的二维图片融合得到格拉米差分角场图片集;
网络流量预测模块,被配置为:根据格拉米差分角场图片集和训练后的预测模型得到下一时刻的网络的承载量,其中,在预测模型的单元向单元流动中添加模糊控制机制,根据模糊控制信息对预测模型进行子空间重构。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于模糊控制与多特征融合的承载网流量预测方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于模糊控制与多特征融合的承载网流量预测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111354814.1A CN114221876B (zh) | 2021-11-16 | 2021-11-16 | 基于模糊控制与多特征融合的承载网流量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111354814.1A CN114221876B (zh) | 2021-11-16 | 2021-11-16 | 基于模糊控制与多特征融合的承载网流量预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114221876A CN114221876A (zh) | 2022-03-22 |
CN114221876B true CN114221876B (zh) | 2024-03-12 |
Family
ID=80697267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111354814.1A Active CN114221876B (zh) | 2021-11-16 | 2021-11-16 | 基于模糊控制与多特征融合的承载网流量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114221876B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109876216A (zh) * | 2019-01-08 | 2019-06-14 | 江苏大学 | 一种基于无创测量的lvad无差别自适应的模糊pi控制方法 |
CN110730099A (zh) * | 2019-10-21 | 2020-01-24 | 电子科技大学 | 基于历史流量数据时间序列的流量预测方法 |
CN111970163A (zh) * | 2020-06-30 | 2020-11-20 | 网络通信与安全紫金山实验室 | 一种基于注意力机制的lstm模型的网络流量预测方法 |
CN112291122A (zh) * | 2020-12-31 | 2021-01-29 | 迈普通信技术股份有限公司 | 网络流量检测方法、装置、电子设备及可读存储介质 |
CN112532439A (zh) * | 2020-11-24 | 2021-03-19 | 山东科技大学 | 一种基于注意力多组件时空跨域神经网络模型的网络流量预测方法 |
CN113316163A (zh) * | 2021-06-18 | 2021-08-27 | 东南大学 | 基于深度学习的长期网络流量预测方法 |
CN113570861A (zh) * | 2021-07-26 | 2021-10-29 | 浙江财经大学 | 一种基于合成数据的交通流量预测方法及装置 |
-
2021
- 2021-11-16 CN CN202111354814.1A patent/CN114221876B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109876216A (zh) * | 2019-01-08 | 2019-06-14 | 江苏大学 | 一种基于无创测量的lvad无差别自适应的模糊pi控制方法 |
CN110730099A (zh) * | 2019-10-21 | 2020-01-24 | 电子科技大学 | 基于历史流量数据时间序列的流量预测方法 |
CN111970163A (zh) * | 2020-06-30 | 2020-11-20 | 网络通信与安全紫金山实验室 | 一种基于注意力机制的lstm模型的网络流量预测方法 |
CN112532439A (zh) * | 2020-11-24 | 2021-03-19 | 山东科技大学 | 一种基于注意力多组件时空跨域神经网络模型的网络流量预测方法 |
CN112291122A (zh) * | 2020-12-31 | 2021-01-29 | 迈普通信技术股份有限公司 | 网络流量检测方法、装置、电子设备及可读存储介质 |
CN113316163A (zh) * | 2021-06-18 | 2021-08-27 | 东南大学 | 基于深度学习的长期网络流量预测方法 |
CN113570861A (zh) * | 2021-07-26 | 2021-10-29 | 浙江财经大学 | 一种基于合成数据的交通流量预测方法及装置 |
Non-Patent Citations (1)
Title |
---|
高峰期网络流量高精准度预测模型研究;刘维嘉;;网络新媒体技术;20180315(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114221876A (zh) | 2022-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107369166B (zh) | 一种基于多分辨率神经网络的目标跟踪方法及系统 | |
CN108491835A (zh) | 面向面部表情识别的双通道卷积神经网络 | |
Naik et al. | Improved and Accurate Face Mask Detection Using Machine Learning in the Crowded Places | |
CN115018888A (zh) | 一种基于Transformer的光流无监督估计方法 | |
CN112862838A (zh) | 基于用户实时点击交互的自然图像抠图方法 | |
CN116824307A (zh) | 基于sam模型的图像标注方法、装置及相关介质 | |
CN112270691A (zh) | 一种基于动态滤波器网络的单目视频结构和运动预测方法 | |
Lee et al. | Channel pruning via gradient of mutual information for light-weight convolutional neural networks | |
CN102713974B (zh) | 学习装置、识别装置、学习识别系统和学习识别装置 | |
CN114221876B (zh) | 基于模糊控制与多特征融合的承载网流量预测方法及系统 | |
CN114821285A (zh) | 基于ACONV-LSTM与New-GANs组合的蓝藻水华预测系统及预测方法 | |
CN114330102A (zh) | 基于降雨相似与模型参数智能适配的快速洪水预报方法及装置 | |
CN116882486B (zh) | 一种迁移学习权重的构建方法和装置及设备 | |
CN116518868B (zh) | 基于人工智能的变形测量方法、装置、设备及存储介质 | |
CN105405152A (zh) | 基于结构化支持向量机的自适应尺度目标跟踪方法 | |
CN110097530B (zh) | 基于超像素聚类与联合低秩表示的多聚焦图像融合方法 | |
Ferraro et al. | Entropy-based representation of image information | |
EP3588441B1 (en) | Imagification of multivariate data sequences | |
CN111047654A (zh) | 一种基于色彩信息的高清高速视频背景建模方法 | |
CN115601357A (zh) | 一种基于小样本的冲压件表面缺陷检测方法 | |
CN110460463A (zh) | 基于深度神经网络的服务质量预测方法及其系统 | |
CN113658180A (zh) | 一种基于空间上下文引导的表面缺陷区域分割方法和装置 | |
CN115035164A (zh) | 一种运动目标识别方法及装置 | |
Zhang et al. | CAD‐Aided 3D Reconstruction of Intelligent Manufacturing Image Based on Time Series | |
CN112862395A (zh) | 基于区块链的物流供应链管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |