CN117081942A - 一种网络流量预测方法、装置、设备及介质 - Google Patents
一种网络流量预测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117081942A CN117081942A CN202310955863.3A CN202310955863A CN117081942A CN 117081942 A CN117081942 A CN 117081942A CN 202310955863 A CN202310955863 A CN 202310955863A CN 117081942 A CN117081942 A CN 117081942A
- Authority
- CN
- China
- Prior art keywords
- sequence
- future
- time sequence
- time
- network traffic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 238000012549 training Methods 0.000 claims description 45
- 230000015654 memory Effects 0.000 claims description 25
- 230000001932 seasonal effect Effects 0.000 claims description 25
- 238000000354 decomposition reaction Methods 0.000 claims description 23
- 238000003860 storage Methods 0.000 claims description 10
- 238000009499 grossing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 description 16
- 238000013461 design Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000714 time series forecasting Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种网络流量预测方法、装置、设备及介质,该方法包括:将目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列;利用第一时间序列预测模型对所述历史网络流量时间序列的线性趋势序列进行预测,得到未来线性趋势序列;利用第二时间序列预测模型对所述历史网络流量时间序列的非线性残差序列进行预测,得到未来非线性残差序列;基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列。该方法能够在使用较低质量的历史网络流量数据进行网络流量预测时,提高预测的准确度。
Description
技术领域
本申请实施例涉及网络信息化领域,尤其涉及一种网络流量预测方法、装置、设备及介质。
背景技术
随着通信技术的迅猛发展,无线网络用户急剧增加,网络流量呈爆发式增长。为了适应网络流量的快速增长,满足上层业务和应用的承载,运营商需密切监控网络流量现状、及时评估和预测规划期内流量的走向和规模,并以此作为后续网络规划的输入,最终实现对网络结构、带宽分布的优化改造或扩容建设。根据网络规划的需求,网络流量的预测往往需要基于历史流量数据精准预测未来一至两年的流量大小。
目前,网络流量预测方法包括传统的统计学方法和机器学习方法。其中,传统的统计学方法包括朴素法、简单平均法、简单指数法等方法,但是这些方法的预测精确度较低。机器学习方法包括RNN(Recurrent Neural Network)、LSTM(Long Short Term Memorynetwork,长短期记忆网络)等方法,相对于传统的统计预测方法,机器学习方法的预测精确度较高,但是机器学习方法对数据质量有较高的要求。
因此,如何在使用较低质量的历史网络流量数据进行网络流量预测时,提高预测的准确度是目前亟待解决的问题。
发明内容
本申请实施例提供一种网络流量预测方法、装置、设备及介质,用以在使用较低质量的历史网络流量数据进行网络流量预测时,提高预测的准确度。
第一方面,本申请实施例提供一种网络流量预测方法,包括:
将目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列;
利用第一时间序列预测模型对所述历史网络流量时间序列的线性趋势序列进行预测,得到未来线性趋势序列;其中,所述第一时间序列预测模型用于预测未来网络流量的趋势项随时间变化的规律;
利用第二时间序列预测模型对所述历史网络流量时间序列的非线性残差序列进行预测,得到未来非线性残差序列;其中,所述第二时间序列预测模型用于预测未来网络流量的残差项随时间变化的规律;
基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列。
本申请实施例中,通过将目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列,从而实现更准确地描述历史网络流量时间序列的特性和变化规律,以及对历史网络流量时间序列进行更细致的分析。本申请通过利用第一时间序列预测模型对线性趋势序列进行预测,得到未来线性趋势序列,利用第二时间序列预测模型对非线性残差序列进行预测,得到未来非线性残差序列,并且基于未来线性趋势序列和未来非线性残差序列,得到未来网络流量时间序列。因此,本申请通过对线性趋势序列和非线性残差序列使用对应的时间预测模型进行更精准的预测,从而根据各时间预测模型预测的结果得到更准确的未来网络流量时间序列,进而在使用较低质量的历史网络流量数据进行网络流量预测时,提高预测的准确度。
在一种可能的设计中,所述历史网络流量时间序列通过以下方法获得:
获取所述目标网络在设定时间段内各个历史时刻对应的网络流量数据;
基于时间顺序和所述各个历史时刻对应的网络流量数据,得到所述历史网络流量时间序列。
在一种可能的设计中,所述基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列,包括:
将所述未来线性趋势序列与所述未来非线性残差序列之和作为所述未来网络流量时间序列。
本申请实施例中,通过将未来线性趋势序列与未来非线性残差序列相加,得到更为精确的未来网络流量时间序列。
在一种可能的设计中,所述将历史网络流量时间序列分解为线性趋势序列和非线性残差序列,包括:
利用时间序列分解方法,将所述历史网络流量时间序列分解为所述线性趋势序列和所述非线性残差序列。
本申请实施例中,通过时间序列分解方法,将历史网络流量时间序列分解为线性趋势序列和非线性残差序列,从而实现更准确地描述历史网络流量时间序列的特性和变化规律,以及对历史网络流量时间序列进行更细致的分析。
在一种可能的设计中,所述利用时间序列分解方法,将所述历史网络流量时间序列分解为所述线性趋势序列和所述非线性残差序列,包括:
对所述历史网络流量时间序列进行平滑处理,得到平滑后的历史网络流量时间序列;
将所述平滑后的历史网络流量时间序列进行周期性分解,得到季节性序列;
从所述历史网络流量时间序列中去除所述季节性序列,得到所述线性趋势序列;
从所述平滑后的历史网络流量时间序列中,去除所述季节性序列和所述线性趋势序列,得到所述非线性残差序列。
本申请实施例中,通过将历史网络流量时间序列分解为线性趋势序列和非线性残差序列,从而实现更准确地描述历史网络流量时间序列的特性和变化规律,以及对历史网络流量时间序列进行更细致的分析。
在一种可能的设计中,所述第一时间序列预测模型通过以下方法训练得到:
获取第一训练样本集,其中,所述第一训练样本集包括多个第一样本数据,每个第一样本数据包括历史网络流量时间序列的线性趋势序列,以及未来线性趋势序列;
将所述训练样本集中的各第一样本数据输入预先构建的第一时间序列预测模型,利用所述预先构建的第一时间序列预测模型进行未来线性趋势序列预测,以输出所述第一样本数据对应的未来线性趋势序列为目标,训练所述预先构建的第一时间序列预测模型;
直到所述预先构建的第一时间序列模型收敛,得到所述第一时间序列模型。
本申请实施例中,通过利用第一训练样本集对预先构建的第一时间序列预测模型进行训练,从而得到训练好的第一时间序列预测模型,使得利用第一时间序列预测模型进行预测得到的未来线性趋势序列更准确。
在一种可能的设计中,所述第二时间序列预测模型通过以下方法训练得到:
获取第二训练样本集,其中,所述第二训练样本集包括多个第二样本数据,每个第二样本数据包括历史网络流量时间序列的非线性残差序列,以及未来非线性残差序列;
将所述训练样本集中的各第二样本数据输入预先构建的第二时间序列预测模型,利用所述预先构建的第二时间序列预测模型进行未来非线性残差序列预测,以输出所述第二样本数据对应的未来非线性残差序列为目标,训练所述预先构建的第二时间序列预测模型;
直到所述预先构建的第二时间序列模型收敛,得到所述第二时间序列模型。
本申请实施例中,通过利用第二训练样本集对预先构建的第二时间序列预测模型进行训练,从而得到训练好的第二时间序列预测模型,使得利用第二时间序列预测模型进行预测得到的未来非线性残差序列更准确。
第二方面,本申请实施例提供一种网络流量预测装置,包括:
分解模块,用于将目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列;
第一预测模块,用于利用第一时间序列预测模型对所述历史网络流量时间序列的线性趋势序列进行预测,得到未来线性趋势序列;其中,所述第一时间序列预测模型用于预测未来网络流量的趋势项随时间变化的规律;
第二预测模块,用于利用第二时间序列预测模型对所述历史网络流量时间序列的非线性残差序列进行预测,得到未来非线性残差序列;其中,所述第二时间序列预测模型用于预测未来网络流量的残差项随时间变化的规律;
获得模块,用于基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列。
在一种可能的设计中,所述分解模块用于通过以下方法获得历史网络流量时间序列:
获取所述目标网络在设定时间段内各个历史时刻对应的网络流量数据;
基于时间顺序和所述各个历史时刻对应的网络流量数据,得到所述历史网络流量时间序列。
在一种可能的设计中,所述获得模块用于:
将所述未来线性趋势序列与所述未来非线性残差序列之和作为所述未来网络流量时间序列。
在一种可能的设计中,所述分解模块用于:
利用时间序列分解方法,将所述历史网络流量时间序列分解为所述线性趋势序列和所述非线性残差序列。
在一种可能的设计中,所述分解模块用于:
对所述历史网络流量时间序列进行平滑处理,得到平滑后的历史网络流量时间序列;
将所述平滑后的历史网络流量时间序列进行周期性分解,得到季节性序列;
从所述历史网络流量时间序列中去除所述季节性序列,得到所述线性趋势序列;
从所述平滑后的历史网络流量时间序列中,去除所述季节性序列和所述线性趋势序列,得到所述非线性残差序列。
在一种可能的设计中,所述第一预测模块用于通过以下方法训练得到所述第一时间序列预测模型:
获取第一训练样本集,其中,所述第一训练样本集包括多个第一样本数据,每个第一样本数据包括历史网络流量时间序列的线性趋势序列,以及未来线性趋势序列;
将所述训练样本集中的各第一样本数据输入预先构建的第一时间序列预测模型,利用所述预先构建的第一时间序列预测模型进行未来线性趋势序列预测,以输出所述第一样本数据对应的未来线性趋势序列为目标,训练所述预先构建的第一时间序列预测模型;
直到所述预先构建的第一时间序列模型收敛,得到所述第一时间序列模型。
在一种可能的设计中,所述第二预测模块用于通过以下方法训练得到所述第二时间序列预测模型:
获取第二训练样本集,其中,所述第二训练样本集包括多个第二样本数据,每个第二样本数据包括历史网络流量时间序列的非线性残差序列,以及未来非线性残差序列;
将所述训练样本集中的各第二样本数据输入预先构建的第二时间序列预测模型,利用所述预先构建的第二时间序列预测模型进行未来非线性残差序列预测,以输出所述第二样本数据对应的未来非线性残差序列为目标,训练所述预先构建的第二时间序列预测模型;
直到所述预先构建的第二时间序列模型收敛,得到所述第二时间序列模型。
第三方面,本申请实施例提供一种电子设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行第一方面及其任意一种设计的方法包括的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时,使所述计算机执行第一方面及其任意一种设计的方法。
第二方面至第四方面及其任意一种设计所带来的技术效果可参见第一方面中对应的设计所带来的技术效果,此处不再赘述。
附图说明
图1为本申请实施例提供的应用场景示意图;
图2为本申请实施例提供的一种网络流量预测方法的流程图;
图3为本申请实施例提供的一种网络流量预测方法的详细流程图;
图4为本申请实施例提供的一种第二时间序列预测模型的结构示意图;
图5为本申请实施例提供的一种获取目标网络的历史网络流量时间序列方法的流程图;
图6为本申请实施例提供的一种分解历史网络流量时间序列方法的流程图;
图7为本申请实施例提供的一种训练第一时间序列预测模型方法的流程图;
图8为本申请实施例提供的一种训练第二时间序列预测模型方法的流程图;
图9为本申请实施例提供的一种网络流量预测装置的结构示意图;
图10为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以按不同于此处的顺序执行所示出或描述的步骤。
本申请的说明书和权利要求书及上述附图中的术语“第一”和“第二”是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请中的“多个”可以表示至少两个,例如可以是两个、三个或者更多个,本申请实施例不做限制。
本申请技术方案中,对数据的采集、传播、使用等,均符合国家相关法律法规要求。
在介绍本申请实施例所提供的一种网络流量预测方法之前,为了便于理解,首先对下面对本申请实施例的技术背景进行详细介绍。
目前,网络流量预测方法包括传统的统计学方法和机器学习方法。其中,传统的统计学方法包括朴素法、简单平均法、简单指数法等方法,但是这些方法的预测精确度较低。机器学习方法包括RNN、LSTM等方法,相对于传统的统计预测方法,机器学习方法的预测精确度较高,但是机器学习方法对数据质量有较高的要求。
因此,如何在使用较低质量的历史网络流量数据进行网络流量预测时,提高预测的准确度是目前亟待解决的问题。
为了解决上述问题,本发明提出了一种网络流量预测确定方法、装置、设备及介质,用以在使用较低质量的历史网络流量数据进行网络流量预测时,提高预测的准确度。
首先参考图1,其为本公开实施例的应用场景示意图,包括采集器11和服务器12。其中,采集器11用于采集目标网络的历史网络流量时间序列,并将历史网络流量事件序列发送给服务器12;服务器12用于基于采集器11发送的历史网络流量时间序列预测未来网络流量时间序列。
本公开实施例中,服务器12将采集器11采集的目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列;利用第一时间序列预测模型对所述历史网络流量时间序列的线性趋势序列进行预测,得到未来线性趋势序列;其中,所述第一时间序列预测模型用于预测未来网络流量的趋势项随时间变化的规律;利用第二时间序列预测模型对所述历史网络流量时间序列的非线性残差序列进行预测,得到未来非线性残差序列;其中,所述第二时间序列预测模型用于预测未来网络流量的残差项随时间变化的规律;基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列。
下面参考图2示出的一种网络流量预测方法的流程图,对本申请实施例提供的技术方案进行说明:
步骤201,将目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列;
可选地,将目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列,包括:
利用时间序列分解方法,将所述历史网络流量时间序列分解为所述线性趋势序列和所述非线性残差序列。
其中,上述历史网络流量时间序列为一组按照历史时间发生顺序进行排列的网络流量。
上述时间序列分解方法是一种用于分析和预测时间序列的方法,其将时间序列分解成趋势、季节性和残差(随机成分)三个部分,其中,趋势是长期变化趋势,季节性是周期性变化趋势,残差是不规律变化趋势。上述时间序列分解方法可以为STL(Seasonal andTrend Decomposition using Loess,滤波方式分解季节性和趋势)、朴素分解方法等方法。
步骤202,利用第一时间序列预测模型对所述历史网络流量时间序列的线性趋势序列进行预测,得到未来线性趋势序列;
其中,所述第一时间序列预测模型用于预测未来网络流量的趋势项随时间变化的规律。所述第一时间序列模型可以为线性模型ARIMA(Autoregressive Integrated MovingAverage model,差分整合移动平均自回归模型),也可以为其他线性的时间序列预测模型。
步骤203,利用第二时间序列预测模型对所述历史网络流量时间序列的非线性残差序列进行预测,得到未来非线性残差序列;
其中,所述第二时间序列预测模型用于预测未来网络流量的残差项随时间变化的规律。所述第二时间序列模型可以为N-BEATS(Neural Basis Expansion Analysis forInterpretable Time Series Forecasting,对可解释时序预测的神经基础扩展分析),也可以为其他非线性的时间序列预测模型。
步骤204,基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列。
可选地,基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列,包括:
将所述未来线性趋势序列与所述未来非线性残差序列之和作为所述未来网络流量时间序列。
本申请实施例中,通过将目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列,从而实现更准确地描述历史网络流量时间序列的特性和变化规律,以及对历史网络流量时间序列进行更细致的分析。本申请通过利用第一时间序列预测模型对线性趋势序列进行预测,得到未来线性趋势序列,利用第二时间序列预测模型对非线性残差序列进行预测,得到未来非线性残差序列,并且基于未来线性趋势序列和未来非线性残差序列,得到未来网络流量时间序列。因此,本申请通过对线性趋势序列和非线性残差序列使用对应的时间预测模型进行更精准的预测,从而根据各时间预测模型预测的结果得到更准确的未来网络流量时间序列,从而在使用较低质量的历史网络流量数据进行网络流量预测时,提高预测的准确度。
下面将对上述提供的网络流量预测方法的具体步骤进行详细说明,如图3所示:
步骤301,获取目标网络的历史网络流量时间序列;
步骤302,将所述历史网络流量时间序列分解为线性趋势序列和非线性残差序列;
本申请可以利用时间序列分解方法,将所述历史网络流量时间序列分解为所述线性趋势序列和所述非线性残差序列。其中,时间序列分解方法可以为STL。STL是以鲁棒局部加权回归作为平滑方法的时间序列分解方法。其中,Loess(Locally WeightedRegression,局部多项式回归拟合)是对两维散点图进行平滑的常用方法,其结合了传统线性回归的简洁性和非线性回归的灵活性。当要估计某个响应变量值时,先从其预测变量附近取一个数据子集,然后对该子集进行线性回归或二次回归,回归时采用加权最小二乘法,即越靠近估计点的值其权重越大,最后利用得到的局部回归模型来估计响应变量的值。用该方法进行逐点运算得到整条拟合曲线。
基于Loess将第t时刻的网络流量数据xt分解为趋势项(Trend Component)、季节性项(Seasonal Component)和残差项(Remainder Component):
xt=Tt+St+Rt;
其中,Tt为第t时刻的趋势项,St为第t时刻的季节性项,Rt为第t时刻的残差项。
本申请可以使用STL方法,将历史网络流量时间序列分解为线性趋势序列和非线性残差序列。
步骤303,利用第一时间序列预测模型对所述历史网络流量时间序列的线性趋势序列进行预测,得到未来线性趋势序列;
其中,所述第一时间序列预测模型用于预测未来网络流量的趋势项随时间变化的规律。本申请中的第一时间序列模型可以为ARIMA模型。ARIMA模型主要用来预测长期趋势时间序列和季节性时间序列。
步骤304,利用第二时间序列预测模型对所述历史网络流量时间序列的非线性残差序列进行预测,得到未来非线性残差序列;
其中,所述第二时间序列预测模型用于预测未来网络流量的残差项随时间变化的规律。所述第二时间序列模型可以为N-BEATS模型。N-BEATS模型主要用来预测不规则波动序列,即残差序列。
图4为本申请实施例提供的一种第二时间序列预测模型的结构示意图,N-BEATS模型的具体结构如图4所示,整个N-BEATS模型包括多个stack(堆栈),每个stack包括多个block(模块),每个block是N-BEATS模型的最基础结构模块,由多个FC(Full Connection,全连接)层组成。每个block包含两个主要部分,第一个部分是一个全连接网络,产生用于预测的expansion coefficients(膨胀系数),从而将输入的时间序列映射成expansioncoefficients(膨胀系数)。第二部分将expansion coefficients映射回时间序列。
expansion coefficients是存储时间序列内在的信息,从而形成的一个低维向量。在模型实现上,其是一个向量映射过程:将输入的时间序列(维度为length)映射成低维向量(维度为dim),之后再将其映射回时间序列(长度为length)。假设每个block的输入为x,将其映射为expansion coefficients的过程可以表示为。
每个block会生成两组expansion coefficients,一组用来预测未来(forecast),另一组用来预测过去(backcast)。每个block对输入的时间序列进行处理后,输出一个预测的未来时间序列,以及一个预测的过去时间序列。每个block的输入,是上一层block的输入减去上一层block的输出。通过这种方式,N-BEATS模型每层需要处理的是之前层无法正确拟合的残差,也起到了一个将时间序列进行逐层分解,每层预测时间序列一部分的作用。最终的预测结果是各个block预测结果的加和。
步骤305,将所述未来线性趋势序列与所述未来非线性残差序列之和作为所述未来网络流量时间序列。
图5为本申请实施例提供的一种获取目标网络的历史网络流量时间序列方法的流程图,如图5所示,上述步骤301至少包括如下步骤:
步骤501,获取所述目标网络在设定时间段内各个历史时刻对应的网络流量数据;
其中,上述网络流量数据为网络流量大小。上述设定时间段可以根据实际情况进行设置,可以为多年,也可以为多个月。例如,若设定时间段可以为2年,则在设定时间段内各个历史时刻对应的网络流量数据为在2年内各月对应的网络流量数据。若设定时间段可以为5个月,则在设定时间段内各个历史时刻对应的网络流量数据为在5个月内各天对应的网络流量数据。
步骤502,基于时间顺序和所述各个历史时刻对应的网络流量数据,得到所述历史网络流量时间序列。
将各个历史时刻对应的网络流量数据按照时间发生的顺序排列,得到历史网络流量时间序列。例如,历史网络流量时间序列X={x1,x2,…,xt},其中,xt为历史时刻t对应的网络流量数据。
图6为本申请实施例提供的一种分解历史网络流量时间序列方法的流程图,如图6所示,上述步骤302至少包括如下步骤:
步骤601,对所述历史网络流量时间序列进行平滑处理,得到平滑后的历史网络流量时间序列;
具体地,可以使用Loess方法或其他类似方法对历史网络流量时间序列进行平滑处理,以去除历史网络流量时间序列中的噪声和异常值。
步骤602,将所述平滑后的历史网络流量时间序列进行周期性分解,得到季节性序列;
将平滑后的历史网络流量时间序列的周期性分解为每个周期的平均水平,并计算每个历史时刻对应的季节性项。
步骤603,从所述历史网络流量时间序列中去除所述季节性序列,得到所述线性趋势序列;
具体地,将历史网络流量时间序列中每个历史时刻对应的网络流量数据与该历史时刻对应的季节性项相减,得到该历史时刻对应的趋势项,趋势项表示网络流量数据中的长期趋势,可以是增长或下降趋势。
步骤604,从所述平滑后的历史网络流量时间序列中,去除所述季节性序列和所述线性趋势序列,得到所述非线性残差序列。
具体地,从平滑后的历史网络流量时间序列中每个历史时刻对应的网络流量数据中,减去该历史时刻对应的季节性项和趋势项,得到该历史时刻对应的残差项,残差项网络流量数据中的短期波动和随机性。
图7为本申请实施例提供的一种训练第一时间序列预测模型方法的流程图,如图7所示,上述步骤303中的第一时间序列预测模型通过以下方法训练得到:
步骤701,获取第一训练样本集;
其中,所述第一训练样本集包括多个第一样本数据,每个第一样本数据包括历史网络流量时间序列的线性趋势序列,以及未来线性趋势序列。
例如,第一训练样本集包括3个第一样本数据,第一个第一样本数据包括第1-6月的历史网络流量时间序列的线性趋势序列,以及第7月的未来线性趋势序列;第二个第一样本数据包括第2-7月的历史网络流量时间序列的线性趋势序列,以及第8月的未来线性趋势序列;第三个第一样本数据包括第3-8月的历史网络流量时间序列的线性趋势序列,以及第9月的未来线性趋势序列。
步骤702,将所述训练样本集中的各第一样本数据输入预先构建的第一时间序列预测模型,利用所述预先构建的第一时间序列预测模型进行未来线性趋势序列预测,以输出所述第一样本数据对应的未来线性趋势序列为目标,训练所述预先构建的第一时间序列预测模型;
本申请根据预先构建的第一时间序列预测模型输出的第一样本数据对应的未来线性趋势序列,与第一样本数据中的未来线性趋势序列,调整预先构建的第一时间序列预测模型的参数。
步骤703,直到所述预先构建的第一时间序列模型收敛,得到所述第一时间序列模型。
图8为本申请实施例提供的一种训练第二时间序列预测模型方法的流程图,如图8所示,上述步骤304中的第二时间序列预测模型通过以下方法训练得到:
步骤801,获取第二训练样本集;
其中,所述第二训练样本集包括多个第二样本数据,每个第二样本数据包括历史网络流量时间序列的非线性残差序列,以及未来非线性残差序列。
例如,第二训练样本集包括4个第二样本数据,第一个第二样本数据包括第1-6月的历史网络流量时间序列的非线性残差序列,以及第7月的未来非线性残差序列;第二个第二样本数据包括第2-7月的历史网络流量时间序列的非线性残差序列,以及第8月的未来非线性残差序列;第三个第二样本数据包括第3-8月的历史网络流量时间序列的非线性残差序列,以及第9月的未来非线性残差序列;第四个第二样本数据包括第4-9月的历史网络流量时间序列的非线性残差序列,以及第10月的未来非线性残差序列。
步骤802,将所述训练样本集中的各第二样本数据输入预先构建的第二时间序列预测模型,利用所述预先构建的第二时间序列预测模型进行未来非线性残差序列预测,以输出所述第二样本数据对应的未来非线性残差序列为目标,训练所述预先构建的第二时间序列预测模型;
本申请根据预先构建的第二时间序列预测模型输出的第二样本数据对应的未来非线性残差序列,与第二样本数据中的未来非线性残差序列,调整预先构建的第二时间序列预测模型的参数。
步骤803,直到所述预先构建的第二时间序列模型收敛,得到所述第二时间序列模型。
以根据多个省的网络流量数据得到的历史网络流量时间序列为例,利用本申请提供的网络流量预测方法以及现有的网络流量预测方法分别进行预测,利用本申请提供的网络流量预测方法得到的未来网络流量时间序列,利用现有网络流量预测方法得到的未来网络流量时间序列更准确。因此,本申请在使用较低质量的历史网络流量数据进行网络流量预测时,能够提高预测的准确度。并且,本申请提供的网络流量预测方法的性能明显优于ARIMA、N-BEATS、LSTM(Long Short Term Memory network,长短期记忆网络)、Prophet(一种时间序列预测算法)等多种方法的性能。综上所述,本申请提供的网络流量预测方法能够准确预测网络流量的方向和规模,为网络规划和扩容提供重要参考。
基于相同的技术构思,本申请示例性的提供了一种网络流量预测装置,如图9所示,该装置包括:
分解模块901,用于将目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列;
第一预测模块902,用于利用第一时间序列预测模型对所述历史网络流量时间序列的线性趋势序列进行预测,得到未来线性趋势序列;其中,所述第一时间序列预测模型用于预测未来网络流量的趋势项随时间变化的规律;
第二预测模块903,用于利用第二时间序列预测模型对所述历史网络流量时间序列的非线性残差序列进行预测,得到未来非线性残差序列;其中,所述第二时间序列预测模型用于预测未来网络流量的残差项随时间变化的规律;
获得模块904,用于基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列。
可选地,所述分解模块901用于通过以下方法获得历史网络流量时间序列:
获取所述目标网络在设定时间段内各个历史时刻对应的网络流量数据;
基于时间顺序和所述各个历史时刻对应的网络流量数据,得到所述历史网络流量时间序列。
可选地,所述获得模块904用于:
将所述未来线性趋势序列与所述未来非线性残差序列之和作为所述未来网络流量时间序列。
可选地,所述分解模块901用于:
利用时间序列分解方法,将所述历史网络流量时间序列分解为所述线性趋势序列和所述非线性残差序列。
可选地,所述分解模块901用于:
对所述历史网络流量时间序列进行平滑处理,得到平滑后的历史网络流量时间序列;
将所述平滑后的历史网络流量时间序列进行周期性分解,得到季节性序列;
从所述历史网络流量时间序列中去除所述季节性序列,得到所述线性趋势序列;
从所述平滑后的历史网络流量时间序列中,去除所述季节性序列和所述线性趋势序列,得到所述非线性残差序列。
可选地,所述第一预测模块902用于通过以下方法训练得到所述第一时间序列预测模型:
获取第一训练样本集,其中,所述第一训练样本集包括多个第一样本数据,每个第一样本数据包括历史网络流量时间序列的线性趋势序列,以及未来线性趋势序列;
将所述训练样本集中的各第一样本数据输入预先构建的第一时间序列预测模型,利用所述预先构建的第一时间序列预测模型进行未来线性趋势序列预测,以输出所述第一样本数据对应的未来线性趋势序列为目标,训练所述预先构建的第一时间序列预测模型;
直到所述预先构建的第一时间序列模型收敛,得到所述第一时间序列模型。
可选地,所述第二预测模块903用于通过以下方法训练得到所述第二时间序列预测模型:
获取第二训练样本集,其中,所述第二训练样本集包括多个第二样本数据,每个第二样本数据包括历史网络流量时间序列的非线性残差序列,以及未来非线性残差序列;
将所述训练样本集中的各第二样本数据输入预先构建的第二时间序列预测模型,利用所述预先构建的第二时间序列预测模型进行未来非线性残差序列预测,以输出所述第二样本数据对应的未来非线性残差序列为目标,训练所述预先构建的第二时间序列预测模型;
直到所述预先构建的第二时间序列模型收敛,得到所述第二时间序列模型。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种电子设备。该电子设备可以用于执行以上方法实施例所述的动作。在该实施例中,电子设备的结构可以如图10所示,包括存储器101以及一个或多个处理器102。
存储器101,用于存储处理器102执行的计算机程序。存储器101可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
存储器101可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器101也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器101是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器101可以是上述存储器的组合。
处理器102,可以包括一个或多个中央处理单元(central processing unit,CPU)或者为数字处理单元等。所述处理器102,用于调用存储器101中存储的计算机程序时实现上述网络流量预测方法。
本申请实施例中不限定上述存储器101和处理器102之间的具体连接介质。作为一种示例,本申请实施例在图10中以存储器101和处理器102之间通过总线103连接,总线103在图10中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线103可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,处理器102可用于执行以上由分解模块、第一预测模块、第二预测模块、获得模块中任意一项或多项执行的动作。
基于同一发明构思,本申请实施例提供一种计算机可读存储介质,计算机程序产品包括:计算机程序代码,当计算机程序代码在计算机上运行时,使得计算机执行如前文论述任一的网络流量预测方法。由于上述计算机可读存储介质解决问题的原理与网络流量预测方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施,重复之处不再赘述。
基于同一发明构思,本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括:计算机程序代码,当该计算机程序代码在计算机上运行时,使得计算机执行如前文论述任一的网络流量预测方法。由于上述计算机程序产品解决问题的原理与网络流量预测方法相似,因此上述计算机程序产品的实施可以参见方法的实施,重复之处不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列用户操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种网络流量预测方法,其特征在于,包括:
将目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列;
利用第一时间序列预测模型对所述历史网络流量时间序列的线性趋势序列进行预测,得到未来线性趋势序列;其中,所述第一时间序列预测模型用于预测未来网络流量的趋势项随时间变化的规律;
利用第二时间序列预测模型对所述历史网络流量时间序列的非线性残差序列进行预测,得到未来非线性残差序列;其中,所述第二时间序列预测模型用于预测未来网络流量的残差项随时间变化的规律;
基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列。
2.如权利要求1所述的方法,其特征在于,所述历史网络流量时间序列通过以下方法获得:
获取所述目标网络在设定时间段内各个历史时刻对应的网络流量数据;
基于时间顺序和所述各个历史时刻对应的网络流量数据,得到所述历史网络流量时间序列。
3.如权利要求1所述的方法,其特征在于,所述基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列,包括:
将所述未来线性趋势序列与所述未来非线性残差序列之和作为所述未来网络流量时间序列。
4.如权利要求1所述的方法,其特征在于,所述将历史网络流量时间序列分解为线性趋势序列和非线性残差序列,包括:
利用时间序列分解方法,将所述历史网络流量时间序列分解为所述线性趋势序列和所述非线性残差序列。
5.如权利要求4所述的方法,其特征在于,所述利用时间序列分解方法,将所述历史网络流量时间序列分解为所述线性趋势序列和所述非线性残差序列,包括:
对所述历史网络流量时间序列进行平滑处理,得到平滑后的历史网络流量时间序列;
将所述平滑后的历史网络流量时间序列进行周期性分解,得到季节性序列;
从所述历史网络流量时间序列中去除所述季节性序列,得到所述线性趋势序列;
从所述平滑后的历史网络流量时间序列中,去除所述季节性序列和所述线性趋势序列,得到所述非线性残差序列。
6.如权利要求1~5任一所述的方法,其特征在于,所述第一时间序列预测模型通过以下方法训练得到:
获取第一训练样本集,其中,所述第一训练样本集包括多个第一样本数据,每个第一样本数据包括历史网络流量时间序列的线性趋势序列,以及未来线性趋势序列;
将所述训练样本集中的各第一样本数据输入预先构建的第一时间序列预测模型,利用所述预先构建的第一时间序列预测模型进行未来线性趋势序列预测,以输出所述第一样本数据对应的未来线性趋势序列为目标,训练所述预先构建的第一时间序列预测模型;
直到所述预先构建的第一时间序列模型收敛,得到所述第一时间序列模型。
7.如权利要求1~5任一所述的方法,其特征在于,所述第二时间序列预测模型通过以下方法训练得到:
获取第二训练样本集,其中,所述第二训练样本集包括多个第二样本数据,每个第二样本数据包括历史网络流量时间序列的非线性残差序列,以及未来非线性残差序列;
将所述训练样本集中的各第二样本数据输入预先构建的第二时间序列预测模型,利用所述预先构建的第二时间序列预测模型进行未来非线性残差序列预测,以输出所述第二样本数据对应的未来非线性残差序列为目标,训练所述预先构建的第二时间序列预测模型;
直到所述预先构建的第二时间序列模型收敛,得到所述第二时间序列模型。
8.一种网络流量预测装置,其特征在于,包括:
分解模块,用于将目标网络的历史网络流量时间序列分解为线性趋势序列和非线性残差序列;
第一预测模块,用于利用第一时间序列预测模型对所述历史网络流量时间序列的线性趋势序列进行预测,得到未来线性趋势序列;其中,所述第一时间序列预测模型用于预测未来网络流量的趋势项随时间变化的规律;
第二预测模块,用于利用第二时间序列预测模型对所述历史网络流量时间序列的非线性残差序列进行预测,得到未来非线性残差序列;其中,所述第二时间序列预测模型用于预测未来网络流量的残差项随时间变化的规律;
获得模块,用于基于所述未来线性趋势序列和所述未来非线性残差序列,得到未来网络流量时间序列。
9.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行权利要求1~7中任一所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,其包括程序代码,当所述程序代码在电子设备上运行时,所述程序代码用于使所述电子设备执行权利要求1~7中任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310955863.3A CN117081942A (zh) | 2023-08-01 | 2023-08-01 | 一种网络流量预测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310955863.3A CN117081942A (zh) | 2023-08-01 | 2023-08-01 | 一种网络流量预测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117081942A true CN117081942A (zh) | 2023-11-17 |
Family
ID=88705318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310955863.3A Pending CN117081942A (zh) | 2023-08-01 | 2023-08-01 | 一种网络流量预测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117081942A (zh) |
-
2023
- 2023-08-01 CN CN202310955863.3A patent/CN117081942A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nasiri et al. | A simulation optimisation approach for real-time scheduling in an open shop environment using a composite dispatching rule | |
Gupta et al. | Resource usage prediction of cloud workloads using deep bidirectional long short term memory networks | |
CN107040397B (zh) | 一种业务参数获取方法及装置 | |
Huang et al. | Medical service demand forecasting using a hybrid model based on ARIMA and self-adaptive filtering method | |
Chen et al. | Optimal variability sensitive condition-based maintenance with a Cox PH model | |
Bisi et al. | Software development efforts prediction using artificial neural network | |
US20210342691A1 (en) | System and method for neural time series preprocessing | |
CN115249081A (zh) | 一种对象类型的预测方法、装置、计算机设备和存储介质 | |
WO2017071369A1 (zh) | 一种预测用户离网的方法和设备 | |
Zhang et al. | SamEn‐SVR: using sample entropy and support vector regression for bug number prediction | |
WO2020102220A1 (en) | Adherence monitoring through machine learning and computing model application | |
CN110766184A (zh) | 订单量预测方法和装置 | |
CN112651817A (zh) | 一种智能财务决策大数据分析系统 | |
Branchi et al. | Learning to act: a reinforcement learning approach to recommend the best next activities | |
Sharko et al. | Methodological basis of causal forecasting of the economic systems development management processes under the uncertainty | |
US11620493B2 (en) | Intelligent selection of time series models | |
CN116684330A (zh) | 基于人工智能的流量预测方法、装置、设备及存储介质 | |
CN116827950A (zh) | 云资源的处理方法、装置、设备及存储介质 | |
CN112181659A (zh) | 云仿真内存资源预测模型构建方法与内存资源预测方法 | |
CN110717537B (zh) | 训练用户分类模型、执行用户分类预测的方法及装置 | |
US20230267007A1 (en) | System and method to simulate demand and optimize control parameters for a technology platform | |
CN107644042B (zh) | 软件程序点击率预估排序方法及服务器 | |
Celik et al. | Sequential Monte Carlo-based fidelity selection in dynamic-data-driven adaptive multi-scale simulations | |
Dulhare et al. | An efficient hybrid clustering to predict the risk of customer churn | |
Almomani et al. | Selecting a good stochastic system for the large number of alternatives |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |