CN112105048A - 基于双周期Holt-Winters模型和SARIMA模型的组合预测方法 - Google Patents

基于双周期Holt-Winters模型和SARIMA模型的组合预测方法 Download PDF

Info

Publication number
CN112105048A
CN112105048A CN202010731814.8A CN202010731814A CN112105048A CN 112105048 A CN112105048 A CN 112105048A CN 202010731814 A CN202010731814 A CN 202010731814A CN 112105048 A CN112105048 A CN 112105048A
Authority
CN
China
Prior art keywords
prediction
model
time
value
sarima
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010731814.8A
Other languages
English (en)
Other versions
CN112105048B (zh
Inventor
侯懿健
啜钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202010731814.8A priority Critical patent/CN112105048B/zh
Publication of CN112105048A publication Critical patent/CN112105048A/zh
Application granted granted Critical
Publication of CN112105048B publication Critical patent/CN112105048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control
    • H04W28/06Optimizing the usage of the radio link, e.g. header compression, information sizing, discarding information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Computational Mathematics (AREA)
  • Operations Research (AREA)
  • Mathematical Optimization (AREA)
  • Tourism & Hospitality (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Mathematical Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于双周期Holt‑Winters模型和SARIMA模型的组合预测方法,属于无线网络流量预测和网络优化领域。首先提取基站m个无线网络流量数据,利用前m‑k项数据,进行预测步长为k的双周期Holt‑Winters模型预测和SARIMA模型预测,分别存入数组
Figure DDA0002603598730000011
Figure DDA0002603598730000012
将m‑k~m时刻的原始流量数据与预测结果
Figure DDA0002603598730000013
Figure DDA0002603598730000014
分别对比,计算误差平方和EDHW及ESA。然后利用误差平方和倒数法确定DHW模型和SARIMA模型的权系数;同理对前m项数据进行双周期Holt‑Winters模型预测和SARIMA模型预测,将m+1~m+k时刻的预测结果存入数组yDHW和ySA中,并利用权系数wDHW和wSA,将对应时刻的预测结果进行加权组合,得到之后k个时间粒度的预测结果ycombine[i]。最后利用预测结果观测未来k小时的流量数据变化情况。本发明计算效率高,提升了稳定度与准确度。

Description

基于双周期Holt-Winters模型和SARIMA模型的组合预测方法
技术领域
本发明属于无线网络流量预测和网络优化领域,具体是一种基于双周期Holt-Winters模型和SARIMA模型的组合预测方法。
背景技术
随着移动通信技术的飞速发展,人们对通信的需求逐渐增大,移动设备的不断普及,无线网络也悄无声息进入了人们的生产生活中,并逐渐成为必不可少的工具,具体表现在无线网络流量的爆发式增长。
正在到来的5G时代和高速率低时延的传输,使无线网络的应用场景更加丰富,从而导致无线网络流量数据不断增长,网络变得越来越拥挤,而用户对体验质量的要求也越来越高,这给网络优化和管理带来了更大的难度。准确的流量预测模型可以提供未来流量的变化趋势,从而使运营商可以进行有效的访问控制、拥塞管理和网络资源分配等。
在数据预测的实践过程中,往往会发现各种预测方式都有可能会出现时好时坏的现象,除了数据本身特性的影响,还有可能是因为不同的预测方法对于数据信息的提取方式不同,进而在预测某项数据时会因忽略某种特征而导致预测的误差较大。目前已有研究表明,组合预测模型可以有效地弥补单项预测模型可能存在的不足之处,提高模型预测的稳定度。
发明内容
为了解决单项预测模型预测准确性的稳定度不高的问题,本发明提出了将Holt-Winters模型改为双周期的Holt-Winters模型(DHW),并且将DHW的预测结果和季节性差分自回归滑动平均(SARIMA)模型的预测结果进行线性加权组合,从而得到最终预测结果的方法。
基于双周期的Holt-Winters模型和SARIMA组合预测流程如下:
步骤一、提取基站无线网络流量数据,共有m个数据,预测长度为k;
步骤二、利用前m-k项数据,进行预测步长为k的双周期Holt-Winters模型预测,得到未来k个时间粒度的预测结果,并存入数组
Figure BDA0002603598710000011
双周期Holt-Winters模型的改进之处是:将原模型中的季节项拆分为两部分:
Figure BDA0002603598710000012
Figure BDA0002603598710000013
并将γ和σ作为季节项的平滑指数;
双周期Holt-Winters模型的具体预测步骤如下:
步骤201、初始化参数α、β、γ、σ,并采用L-BFGS算法对这四个参数进行优化;
目标函数为均方根误差,其中,α是水平项的指数平滑系数,β是趋势项的指数平滑系数,γ是季节项1的指数平滑系数,σ是季节项2的指数平滑系数;
步骤202、对水平项、趋势项和两个季节项的初始值公式选取如下:
水平项的初始值:
Figure BDA0002603598710000021
趋势项的初始值:
Figure BDA0002603598710000022
季节项的初始值:
Figure BDA0002603598710000023
Figure BDA0002603598710000024
其中,p1为周期长度1,p2为周期长度2,Yi为第i个流量数据。
步骤203、利用如下水平值、趋势值和季节值的迭代公式,以及前m-k个数据计算出第m-k时刻的水平值L′m-k、趋势值T′m-k和季节值
Figure BDA0002603598710000025
迭代公式(t=1,2,3,…,m-k-1):
t时刻的水平值:
Figure BDA0002603598710000026
t时刻的趋势值:T′t=β(L′t-L′t-1)+(1-β)T′t-1
t时刻的季节值1:
Figure BDA0002603598710000027
t时刻的季节值2:
Figure BDA0002603598710000028
m-k时刻的水平值:
Figure BDA0002603598710000029
m-k时刻的趋势值:
T′m-k=β(L′m-k-L′m-k-1)+(1-β)T′m-k-1
m-k时刻的季节值1:
Figure BDA00026035987100000210
m-k时刻的季节值2:
Figure BDA00026035987100000211
步骤204、利用m-k+l时刻的预测公式计算之后m-k~m时刻的流量预测结果,并存入数组
Figure BDA00026035987100000212
m-k+l时刻的预测公式为:
Figure BDA00026035987100000213
其中,l=1,2,3…k。
步骤三、将m-k~m时刻的原始流量数据与预测结果
Figure BDA0002603598710000031
对比,利用如下公式计算误差平方和EDHW
误差平方和公式:
Figure BDA0002603598710000032
其中,
Figure BDA0002603598710000033
代表数组
Figure BDA0002603598710000034
的第i个预测值,Ym-k+i代表第m-k+i时刻实际流量数据。
步骤四、利用前m-k项数据,进行预测步长为k的SARIMA模型预测,得到未来k个时间粒度的预测结果,并存入数组
Figure BDA0002603598710000035
SARIMA模型预测的具体步骤如下:
步骤401、在参数范围内,使用“网格搜索”方法来迭代地搜寻SARIMA(p,d,q)(P,D,Q,s)中p、d、q、P、D、Q参数的不同组合,输出每个模型的AIC(Akaike信息标准)值;
其中,p为自回归的阶数、q为移动平均的阶数,P为季节值回归平均的阶数、Q为季节移动平均的阶数,d为逐期差分的阶数,D为季节差分的阶数;
参数p、d、q、P、D、Q的取值范围均设定在0到2之间;s是周期长度,由数据周期决定。对于这些参数的每个组合,使用python中statsmodels模块的SARIMAX()函数拟合一个新的SARIMA模型,并输出每个模型的AIC(Akaike信息标准)值。
AIC计算公式为:AIC=2k-2ln(L)
其中k是预测长度,L是似然函数。
步骤402、在输出的AIC值中,选取最小的AIC值对应的参数模型SARIMA(pm,dm,qm)(Pm,Dm,Qm,s)作为相对最佳模型;
步骤403、判断相对最佳模型的残差序列是否满足白噪声的特点,如果是,则模型合理,否则模型不合理;
步骤404、利用模型SARIMA(pm,dm,qm)(Pm,Dm,Qm,s),对之后m-k~m时刻的无线网络下行流量进行预测,得到预测结果
Figure BDA0002603598710000036
步骤五、将m-k~m时刻的原始流量数据与预测结果
Figure BDA0002603598710000037
对比,利用如下公式计算误差平方和ESA
Figure BDA0002603598710000038
其中,
Figure BDA0002603598710000039
代表数组
Figure BDA00026035987100000310
的第i个预测值,Ym-k+i代表第m-k+i时刻实际流量数据。
步骤六、利用误差平方和倒数法确定DHW模型和SARIMA模型的权系数;
DHW模型的权系数wDHW计算公式如下:
Figure BDA00026035987100000311
SARIMA模型的权系数wSA计算公式如下:
Figure BDA0002603598710000041
步骤七、利用前m项数据,重复步骤二进行预测步长为k的双周期Holt-Winters模型预测,将m+1~m+k时刻的预测结果存入数组yDHW中;
步骤八、利用前m项数据,重复步骤四进行预测步长为k的SARIMA模型预测,将m+1~m+k时刻的预测结果存入数组ySA中;
步骤九、利用权系数wDHW和wSA,将数组yDHW、ySA对应时刻的预测结果进行加权组合,得到之后k个时间粒度的预测结果ycombine[i],即未来k小时的无线网络流量预测结果;
ycombine[i]=wDHW*yDHW[i]+wSA*ySA[i] i=0,1,2…,k-1
步骤十、利用预测结果ycombine观测未来k小时的流量数据变化情况,为网络资源调度与管理提供指导。
本发明与现有技术相比,具有以下优势:
本发明一种基于双周期Holt-Winters模型和SARIMA模型的组合预测方法,无需进行大量模型训练,计算效率高,能够在一定程度上提升预测模型的稳定度与准确度,利用该方法得出的预测结果可为无线网络优化提供参考。
附图说明
图1是本发明一种基于双周期Holt-Winters模型和SARIMA模型的组合预测方法原理图;
图2是本发明一种基于双周期Holt-Winters模型和SARIMA模型的组合预测方法流程图;
图3是本发明采用的双周期Holt-Winters模型预测的预测流程图;
图4是本发明采用的SARIMA模型参数确定流程图;
图5是本发明不同预测长度下单项预测和组合预测结果的均方根误差对比图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图对本发明作进一步的详细和深入描述。
Holt-Winters模型和SARIMA(季节性差分自回归滑动平均)模型是两种应用十分广泛的时间序列预测方法,它们为解决无线网络流量预测问题提供了互补的方法:Holt-Winters模型重点关注的是数据的趋势特性和周期特性,而SARIMA算法着重关注了数据的自相关特性。通过实践发现,两个模型在有些情况下都会存在预测效果不稳定的情况,将两者进行组合可在一定程度上弥补两个单项预测模型的不足,从而提高预测准确度和稳定性。
基于此,本发明提出了一种基于双周期Holt-Winters模型和SARIMA模型的组合预测方法,如图1所示,首先,提取某基站的无线网络流量数据,长度为m,规定预测长度为k;并划分为训练集和测试集,训练集的长度为m-k,测试集的长度为k;然后,将训练集分别经过DHW模型预测和SARIMA模型预测,得到预测结果
Figure BDA0002603598710000051
Figure BDA0002603598710000052
分别计算两者的误差平方和EDHW和ESA,进而计算两者的权系数wDHW和wSA;然后再次利用长度为m的无线网络流量数据,分别经过DHW模型预测和SARIMA模型预测,得到预测结果yDHW和ySA;最后,预测结果yDHW和ySA结合权系数wDHW和wSA进行加权组合,得到之后k个时间粒度的预测结果ycombine[i],即未来k小时的无线网络流量预测结果。
如图2所示,基于双周期的Holt-Winters模型和SARIMA组合预测流程如下:
步骤一、提取基站无线网络流量数据,共有m个数据,预测长度为k;
步骤二、利用前m-k项数据,进行预测步长为k的双周期Holt-Winters模型预测,得到未来k个时间粒度的预测结果,并存入数组
Figure BDA0002603598710000053
现有的Holt-Winters模型公式描述如下:
t时刻的水平值:Lt=α(Yt-St-1)+(1-α)(Lt-1+Tt-1)
t时刻的趋势值:Tt=β(Lt-Lt-1)+(1-β)Tt-1
t时刻的季节值:St=γ(Yt-Lt-1-Tt-1)+(1-γ)St-p
t+k时刻的预测值:Ft+k=Lt+kTt+St+k-p
其中p为周期长度,对于以往的无线网络流量预测,往往将p设为24,即关注一天24小时的周期性,但对于一个地区而言,无线网络流量不只有日重复特性,还会存在周重复现象,因此在这里将Holt-Winters改为双周期Holt-Winters模型,即增加一个周期值p2=168(7天);双周期Holt-Winters模型的改进之处是:将原模型中的季节项拆分为两部分:
Figure BDA0002603598710000054
Figure BDA0002603598710000055
并将γ和σ作为季节项的平滑指数;
如图3所示,双周期Holt-Winters模型的具体预测步骤如下:
步骤201、初始化参数α、β、γ、σ,并采用L-BFGS算法进行优化,目标函数为均方根误差。
α是水平项的指数平滑系数,β是趋势项的指数平滑系数,γ是季节项1的指数平滑系数,σ是季节项2的指数平滑系数;
步骤202、对训练集中的水平项、趋势项和两个季节项的初始值公式选取如下:
水平项的初始值:
Figure BDA0002603598710000056
趋势项的初始值:
Figure BDA0002603598710000057
季节项的初始值:
Figure BDA0002603598710000058
Figure BDA0002603598710000061
其中,p1为周期长度1,p2为周期长度2,Yi为第i个流量数据。
步骤203、利用如下水平值、趋势值和季节值的迭代公式,以及前m-k个数据计算出第m-k时刻的水平值L′m-k、趋势值T′m-k和季节值
Figure BDA0002603598710000062
迭代公式(t=1,2,3,…,m-k-1):
t时刻的水平值:
Figure BDA0002603598710000063
t时刻的趋势值:T′t=β(L′t-L′t-1)+(1-β)T′t-1
t时刻的季节值1:
Figure BDA0002603598710000064
t时刻的季节值2:
Figure BDA0002603598710000065
m-k时刻的水平值:
Figure BDA0002603598710000066
m-k时刻的趋势值:
T′m-k=β(L′m-k-L′m-k-1)+(1-β)T′m-k-1
m-k时刻的季节值1:
Figure BDA0002603598710000067
m-k时刻的季节值2:
Figure BDA0002603598710000068
步骤204、利用m-k+l时刻的预测公式计算之后m-k~m时刻的流量预测结果,并存入数组
Figure BDA0002603598710000069
m-k+l时刻的预测公式为:
Figure BDA00026035987100000610
其中,l=1,2,3…k。
步骤三、将m-k~m时刻的原始流量数据与预测结果
Figure BDA00026035987100000611
对比,利用如下公式计算误差平方和EDHW
误差平方和公式:
Figure BDA00026035987100000612
其中,
Figure BDA00026035987100000613
代表数组
Figure BDA00026035987100000614
的第i个预测值,Ym-k+i代表第m-k+i时刻实际流量数据。
步骤四、利用前m-k项数据,进行预测步长为k的SARIMA模型预测,得到未来k个时间粒度的预测结果,并存入数组
Figure BDA0002603598710000071
如图4所示,SARIMA模型预测的具体步骤如下:
步骤401、在参数范围内,使用“网格搜索”方法来迭代地搜寻SARIMA(p,d,q)(P,D,Q,s)中p、d、q、P、D、Q参数的不同组合,输出每个组合模型的AIC(Akaike信息标准)值;
其中,p为自回归的阶数、q为移动平均的阶数,P为季节值回归平均的阶数、Q为季节移动平均的阶数,d为逐期差分的阶数,D为季节差分的阶数;
参数p、d、q、P、D、Q的取值范围均设定在0到2之间;s是周期长度,由数据周期决定。对于这些参数的每个组合,使用python中statsmodels模块的SARIMAX()函数拟合一个新的SARIMA模型,并输出每个模型的AIC(Akaike信息标准)值。
AIC计算公式如下:
AIC=2k-2ln(L)
其中k是预测长度,L是似然函数。
步骤402、在输出的AIC值中,选取最小的AIC值对应的参数模型SARIMA(pm,dm,qm)(Pm,Dm,Qm,s)作为相对最佳模型;
步骤403、判断相对最佳模型的残差序列是否满足白噪声的特点,如果是,则模型合理,否则模型不合理,重新进行参数确定;
步骤404、利用模型SARIMA(pm,dm,qm)(Pm,Dm,Qm,s),对之后m-k~m时刻的无线网络下行流量进行预测,得到预测结果
Figure BDA0002603598710000072
步骤五、将m-k~m时刻的原始流量数据与预测结果
Figure BDA0002603598710000073
对比,利用如下公式计算误差平方和ESA
Figure BDA0002603598710000074
其中,
Figure BDA0002603598710000075
代表数组
Figure BDA0002603598710000076
的第i个预测值,Ym-k+i代表第m-k+i时刻实际流量数据。
步骤六、利用误差平方和倒数法确定DHW模型和SARIMA模型的权系数;
DHW模型的权系数wDHW计算公式如下:
Figure BDA0002603598710000077
SARIMA模型的权系数wSA计算公式如下:
Figure BDA0002603598710000078
步骤七、利用前m项数据,重复步骤二进行预测步长为k的双周期Holt-Winters模型预测,将m+1~m+k时刻的预测结果存入数组yDHW中;
步骤八、利用前m项数据,重复步骤四进行预测步长为k的SARIMA模型预测,将m+1~m+k时刻的预测结果存入数组ySA中;
步骤九、利用权系数wDHW和wSA,将数组yDHW、ySA对应时刻的预测结果进行加权组合,得到之后k个时间粒度的预测结果ycombine[i],即未来k小时的无线网络流量预测结果;
ycombine[i]=wDHW*yDHW[i]+wSA*ySA[i] i=0,1,2…,k-1
步骤十、利用预测结果ycombine观测未来k小时的流量数据变化情况,为网络资源调度与管理提供指导。
本实施例采用某基站无线网络下行流量数据。整体流程包括数据选择、权系数的确定以及组合预测。
数据选择:在本实施例中,数据集由中国北方某城市提供,选择的数据是某个基站的时间信息和下行流量数据,其中下行流量数据的单位是MB,采集时间粒度为1小时,共3240个数据,预测步长为12小时,前3228个数据为训练数据,后12个数据为测试数据。
权系数的确定:在权系数确定阶段,利用前3216个数据,分别采用双周期Holt-Winters模型和SARIMA模型对之后12小时数据进行预测,并计算误差平方和。DHW模型的预测流程是:首先采用L-BFGS参数优化算法确定平滑参数α、β、γ,优化的目标函数是均方根误差;之后利用DHW模型递推公式确定水平值、趋势值和两个周期值;最后利用DHW预测公式计算预测结果,完成DHW模型预测。SARIMA模型参数确定流程是:利用网格搜索法确定采用SARIMA(1,1,1)x(1,1,1,24)模型,之后利用python中statsmodels模块的SARIMAX()函数来实现该模型。
权系数计算结果如下:
wDHW=0.426537
wSARIMA=0.573463
组合预测:在组合预测阶段,采用前3228个数据对未来12小时下行流量进行预测,分别进行DHW预测和SARIMA预测,表1是利用DHW模型对未来12个小时无线网络下行流量预测的结果。表2是利用SARIMA模型对未来12小时无线网络下行流量预测的结果。表3是利用权系数wDHW、wSARIMA计算出的组合预测结果。
表1
Figure BDA0002603598710000081
Figure BDA0002603598710000091
表2
Figure BDA0002603598710000092
表3
Figure BDA0002603598710000093
为了进一步说明组合预测模型的准确度与稳定度,如图5所示,将不同预测长度下单项预测模型和组合预测模型的均方根误差结果进行对比,可看出存在两种可能情况:组合预测模型的准确度介于DHW和SARIMA之间,或者组合预测模型的准确度均优于两个单项模型。而且组合预测模型预测效果的稳定度要高于单项预测模型,可在一定程度上避免单项预测模型在某些情况下预测效果较差的情况。
至此,完成组合预测模型的构建和预测。

Claims (2)

1.基于双周期Holt-Winters模型和SARIMA模型的组合预测方法,其特征在于,流程如下:
步骤一、提取基站无线网络流量数据,共有m个数据,预测长度为k;
步骤二、利用前m-k项数据,进行预测步长为k的双周期Holt-Winters模型预测,得到未来k个时间粒度的预测结果,并存入数组
Figure FDA0002603598700000011
双周期Holt-Winters模型的改进之处是:将原模型中的季节项拆分为两部分:
Figure FDA0002603598700000012
Figure FDA0002603598700000013
并将γ和σ作为季节项的平滑指数;
具体步骤如下:
步骤201、初始化参数α、β、γ、σ,并采用L-BFGS算法对这四个参数进行优化;
目标函数为均方根误差,其中,α是水平项的指数平滑系数,β是趋势项的指数平滑系数,γ是季节项1的指数平滑系数,σ是季节项2的指数平滑系数;
步骤202、对水平项、趋势项和两个季节项的初始值公式选取如下:
水平项的初始值:
Figure FDA0002603598700000014
趋势项的初始值:
Figure FDA0002603598700000015
季节项的初始值:
Figure FDA0002603598700000016
Figure FDA0002603598700000017
其中,p1为周期长度1,p2为周期长度2,Yi为第i个流量数据;
步骤203、利用如下水平值、趋势值和季节值的迭代公式,以及前m-k个数据计算出第m-k时刻的水平值L′m-k、趋势值T′m-k和季节值
Figure FDA0002603598700000018
迭代公式(t=1,2,3,…,m-k-1):
t时刻的水平值:
Figure FDA0002603598700000019
t时刻的趋势值:T′t=β(L′t-L′t-1)+(1-β)T′t-1
t时刻的季节值1:
Figure FDA00026035987000000110
t时刻的季节值2:
Figure FDA00026035987000000111
m-k时刻的水平值:
Figure FDA00026035987000000112
m-k时刻的趋势值:
T′m-k=β(L′m-k-L′m-k-1)+(1-β)T′m-k-1
m-k时刻的季节值1:
Figure FDA00026035987000000113
m-k时刻的季节值2:
Figure FDA00026035987000000114
步骤204、利用m-k+l时刻的预测公式计算之后m-k~m时刻的流量预测结果,并存入数组
Figure FDA0002603598700000021
m-k+l时刻的预测公式为:
Figure FDA0002603598700000022
其中,l=1,2,3…k;
步骤三、将m-k~m时刻的原始流量数据与预测结果
Figure FDA0002603598700000023
对比,利用如下公式计算误差平方和EDHW
误差平方和公式:
Figure FDA0002603598700000024
其中,
Figure FDA0002603598700000025
代表数组
Figure FDA0002603598700000026
的第i个预测值,Ym-k+i代表第m-k+i时刻实际流量数据;
步骤四、利用前m-k项数据,进行预测步长为k的SARIMA模型预测,得到未来k个时间粒度的预测结果,并存入数组
Figure FDA0002603598700000027
步骤五、将m-k~m时刻的原始流量数据与预测结果
Figure FDA0002603598700000028
对比,利用如下公式计算误差平方和ESA
Figure FDA0002603598700000029
其中,
Figure FDA00026035987000000210
代表数组
Figure FDA00026035987000000211
的第i个预测值,Ym-k+i代表第m-k+i时刻实际流量数据;
步骤六、利用误差平方和倒数法确定DHW模型和SARIMA模型的权系数;
DHW模型的权系数wDHW计算公式如下:
Figure FDA00026035987000000212
SARIMA模型的权系数wSA计算公式如下:
Figure FDA00026035987000000213
步骤七、利用前m项数据,重复步骤二进行预测步长为k的双周期Holt-Winters模型预测,将m+1~m+k时刻的预测结果存入数组yDHW中;
步骤八、利用前m项数据,重复步骤四进行预测步长为k的SARIMA模型预测,将m+1~m+k时刻的预测结果存入数组ySA中;
步骤九、利用权系数wDHW和wSA,将数组yDHW、ySA对应时刻的预测结果进行加权组合,得到之后k个时间粒度的预测结果ycombine[i],即未来k小时的无线网络流量预测结果;
ycombine[i]=wDHW*yDHW[i]+wSA*ySA[i] i=0,1,2…,k-1
步骤十、利用预测结果ycombine观测未来k小时的流量数据变化情况,为网络资源调度与管理提供指导。
2.如权利要求1所述的基于双周期Holt-Winters模型和SARIMA模型的组合预测方法,其特征在于,步骤四中所述的SARIMA模型预测的具体步骤如下:
步骤401、在参数范围内,使用“网格搜索”方法来迭代地搜寻SARIMA(p,d,q)(P,D,Q,s)中p、d、q、P、D、Q参数的不同组合,输出每个模型的AIC(Akaike信息标准)值;
其中,p为自回归的阶数、q为移动平均的阶数,P为季节值回归平均的阶数、Q为季节移动平均的阶数,d为逐期差分的阶数,D为季节差分的阶数;
参数p、d、q、P、D、Q的取值范围均设定在0到2之间;s是周期长度,由数据周期决定;对于这些参数的每个组合,使用python中statsmodels模块的SARIMAX()函数拟合一个新的SARIMA模型,并输出每个模型的AIC(Akaike信息标准)值;
AIC计算公式如下:
AIC=2k-2ln(L)
其中k是预测长度,L是似然函数;
步骤402、在输出的AIC值中,选取最小的AIC值对应的参数模型SARIMA(pm,dm,qm)(Pm,Dm,Qm,s)作为相对最佳模型;
步骤403、判断相对最佳模型的残差序列是否满足白噪声的特点,如果是,则模型合理,否则模型不合理;
步骤404、利用模型SARIMA(pm,dm,qm)(Pm,Dm,Qm,s),对之后m-k~m时刻的无线网络下行流量进行预测,得到预测结果
Figure FDA0002603598700000031
CN202010731814.8A 2020-07-27 2020-07-27 基于双周期Holt-Winters模型和SARIMA模型的组合预测方法 Active CN112105048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010731814.8A CN112105048B (zh) 2020-07-27 2020-07-27 基于双周期Holt-Winters模型和SARIMA模型的组合预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010731814.8A CN112105048B (zh) 2020-07-27 2020-07-27 基于双周期Holt-Winters模型和SARIMA模型的组合预测方法

Publications (2)

Publication Number Publication Date
CN112105048A true CN112105048A (zh) 2020-12-18
CN112105048B CN112105048B (zh) 2021-10-12

Family

ID=73749756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010731814.8A Active CN112105048B (zh) 2020-07-27 2020-07-27 基于双周期Holt-Winters模型和SARIMA模型的组合预测方法

Country Status (1)

Country Link
CN (1) CN112105048B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033906A (zh) * 2021-04-07 2021-06-25 山东润一智能科技有限公司 基于三参数指数平滑的能耗预测方法及系统
CN114786190A (zh) * 2022-05-09 2022-07-22 中国联合网络通信集团有限公司 一种流量的预测方法、装置及存储介质
CN117390895A (zh) * 2023-12-08 2024-01-12 华科五洲(天津)海洋工程有限公司 半潜船压载系统仿真方法、装置及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130196685A1 (en) * 2008-10-06 2013-08-01 Root Wireless, Inc. Web server and method for hosting a web page for presenting location based user quality data related to a communication network
CN107094093A (zh) * 2017-04-13 2017-08-25 北京网瑞达科技有限公司 网络系统中的网络设备周期性的性能指标数据预测方法
CN107547154A (zh) * 2016-06-23 2018-01-05 华为技术有限公司 一种建立视频流量预测模型的方法及装置
CN109257760A (zh) * 2018-09-28 2019-01-22 西安交通大学深圳研究院 无线网络中的用户流量预测系统
CN109325638A (zh) * 2018-11-09 2019-02-12 电子科技大学 一种基于rbf神经网络的sdn流量预测方法
US20190087741A1 (en) * 2016-03-23 2019-03-21 Nanjing Howso Technology Co., Ltd Method for dynamically selecting optimal model by three-layer association for large data volume prediction
CN110381523A (zh) * 2019-06-17 2019-10-25 盐城吉大智能终端产业研究院有限公司 一种基于tvf-emd-lstm模型的蜂窝基站网络流量预测方法
CN110839253A (zh) * 2019-11-08 2020-02-25 西北工业大学青岛研究院 一种确定无线网格网络流量的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130196685A1 (en) * 2008-10-06 2013-08-01 Root Wireless, Inc. Web server and method for hosting a web page for presenting location based user quality data related to a communication network
US20190087741A1 (en) * 2016-03-23 2019-03-21 Nanjing Howso Technology Co., Ltd Method for dynamically selecting optimal model by three-layer association for large data volume prediction
CN107547154A (zh) * 2016-06-23 2018-01-05 华为技术有限公司 一种建立视频流量预测模型的方法及装置
CN107094093A (zh) * 2017-04-13 2017-08-25 北京网瑞达科技有限公司 网络系统中的网络设备周期性的性能指标数据预测方法
CN109257760A (zh) * 2018-09-28 2019-01-22 西安交通大学深圳研究院 无线网络中的用户流量预测系统
CN109325638A (zh) * 2018-11-09 2019-02-12 电子科技大学 一种基于rbf神经网络的sdn流量预测方法
CN110381523A (zh) * 2019-06-17 2019-10-25 盐城吉大智能终端产业研究院有限公司 一种基于tvf-emd-lstm模型的蜂窝基站网络流量预测方法
CN110839253A (zh) * 2019-11-08 2020-02-25 西北工业大学青岛研究院 一种确定无线网格网络流量的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DIOGO CLEMENTE 等: "Assessment of Traffic Prediction Models for Mobile Communication Networks", 《2019 22ND INTERNATIONAL SYMPOSIUM ON WIRELESS PERSONAL MULTIMEDIA COMMUNICATIONS (WPMC)》 *
刘昕玥 等: "基于组合核函数SVM的中小流域流量预测研究", 《计算机仿真》 *
魏臻 等: "基于VMD-DE的混沌网络流量组合预测研究", 《合肥工业大学学报(自然科学版)》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033906A (zh) * 2021-04-07 2021-06-25 山东润一智能科技有限公司 基于三参数指数平滑的能耗预测方法及系统
CN114786190A (zh) * 2022-05-09 2022-07-22 中国联合网络通信集团有限公司 一种流量的预测方法、装置及存储介质
CN117390895A (zh) * 2023-12-08 2024-01-12 华科五洲(天津)海洋工程有限公司 半潜船压载系统仿真方法、装置及存储介质
CN117390895B (zh) * 2023-12-08 2024-02-09 华科五洲(天津)海洋工程有限公司 半潜船压载系统仿真方法、装置及存储介质

Also Published As

Publication number Publication date
CN112105048B (zh) 2021-10-12

Similar Documents

Publication Publication Date Title
CN112105048B (zh) 基于双周期Holt-Winters模型和SARIMA模型的组合预测方法
CN108846517B (zh) 一种分位数概率性短期电力负荷预测集成方法
CN106485262B (zh) 一种母线负荷预测方法
CN107330514B (zh) 一种基于集成极限学习机的空气质量预测方法
CN112633316B (zh) 一种基于边界估值理论的负荷预测方法和装置
CN111026548B (zh) 一种逆向深度强化学习的电力通信设备测试资源调度方法
CN110267292B (zh) 基于三维卷积神经网络的蜂窝网络流量预测方法
CN112330487B (zh) 一种光伏发电短期功率预测方法
CN115374995A (zh) 一种分布式光伏、小风电场站功率预测方法
CN113469426A (zh) 基于改进bp神经网络的光伏输出功率预测方法及系统
CN111461404A (zh) 一种基于神经网络预测区间的短期负荷和水电预测方法
CN111062539B (zh) 基于次级用电量特性聚类分析的总电量预测方法
CN109981749A (zh) 一种基于极限梯度提升的云工作流任务执行时间预测方法
CN110633859A (zh) 一种两阶段分解集成的水文序列预测方法
CN113435595A (zh) 基于自然进化策略的极限学习机网络参数两阶段优化方法
CN116245030A (zh) 一种参数自动反馈调节的深度学习需水预测方法
CN117494888A (zh) 基于优化级联的分布式光伏功率预测方法及系统
CN107026755B (zh) 一种基于排序学习的服务推荐方法
CN116646929A (zh) 一种基于pso-cnn-bilstm的短期风电功率预测方法
CN111612648B (zh) 光伏发电预测模型的训练方法、装置和计算机设备
CN110648248B (zh) 一种发电站的控制方法、装置及设备
CN112561575B (zh) 一种ctr预估模型选择方法及装置
CN105701591A (zh) 一种基于神经网络的电网业务分类方法
CN115423149A (zh) 一种能源互联网负荷预测和噪声等级估计的增量迭代聚类方法
CN114548479A (zh) 一种基于指数平滑的时序数据预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant