CN108111353B - 预付卡剩余流量预测方法、网络终端和存储介质 - Google Patents

预付卡剩余流量预测方法、网络终端和存储介质 Download PDF

Info

Publication number
CN108111353B
CN108111353B CN201711439119.9A CN201711439119A CN108111353B CN 108111353 B CN108111353 B CN 108111353B CN 201711439119 A CN201711439119 A CN 201711439119A CN 108111353 B CN108111353 B CN 108111353B
Authority
CN
China
Prior art keywords
sequence
frequency
frequency sequence
low
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711439119.9A
Other languages
English (en)
Other versions
CN108111353A (zh
Inventor
潘洋
卢玉帅
赵展
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Guanglian Digital Technology Co ltd
Original Assignee
Shenzhen Guanglian Saixun Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Guanglian Saixun Co ltd filed Critical Shenzhen Guanglian Saixun Co ltd
Priority to CN201711439119.9A priority Critical patent/CN108111353B/zh
Publication of CN108111353A publication Critical patent/CN108111353A/zh
Application granted granted Critical
Publication of CN108111353B publication Critical patent/CN108111353B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种预付卡剩余流量预测方法、网络终端和计算机可读存储介质。预付卡剩余流量预测方法包括通过采集预付卡的数据流量信息,获取最优粒度的时间序列,并对时间序列进行一层或多层小波分解,得到低频序列和平稳的高频序列,并对低频序列和高频序列分别构建预测模型进行拟合,并根据预测步长对拟合后的低频序列和拟合后的高频序列进行预测,并进行波形重构得到重构序列,并根据重构序列对剩余流量进行预测。本发明提出的技术方案则采用小波分解以及对低频序列和高频序列分别构建预测模型相结合的方法,算法复杂程度低、增强了时间序列预测的时序关联性,降低算法复杂性,降低计算时间、提高预测精度。

Description

预付卡剩余流量预测方法、网络终端和存储介质
技术领域
本发明涉及物联卡应用、计算机与数学交叉领域,具体的为一种预付卡剩余流量预测方法、网络终端和计算机可读存储介质。
背景技术
随着物联网的发展,物联网技术广泛应用于移动传媒、监控和监测、医疗健康、车联网、可穿戴设备、智能表具、无线POS机等诸多领域,而物联网设备之间的基础通信手段之一就是采用物联卡。
物联卡服务商从运营商购买流量提供给用户使用。但用户每月消耗流量无法确定,为保障所有用户能够享受较低的流量费用,服务商会预先激活足量的物联卡,用以支撑流量高峰。但是存在两方面问题,其一,如果预先激活的卡数过多,相应流量池累积也会增多,当前活跃用户无法消耗完导致流量剩余,明显会增加服务商成本;其二,如果用户流量使用爆发性增长,流量池供应不足,服务商与运营商进行结算时,需要支付高额的套餐外费用,同样会增加服务商成本。准确预测当前用户的流量消耗并根据预测流量消耗情况采取剩余流量的促销或者补充等措施以降低服务商成本是目前亟需要解决的问题。
而目前的数据流量预测方法存在一定的局限性,例如结合神经网络的RNN(Recurrent neural Network,循环神经网络)算法、LSTM((Long Short-Term Memory,时间递归神经网络)算法,其算法程度高、计算时间长;例如传统的FARIMA((FractalAutoregressive Integrated Moving Average,分数差分自回归求和移动平均)模型算法,采用了不同程度的全域求和平均,平滑了序列本身所具有的高可变信息,影响预测随机因素的效果;例如AR(Auto Regressive,自回归)模型、MA(Moving Average,滑动平均)模型、ARMA(Autoregressive Moving Average,自回归滑动平均)模型、ARIMA(AutoregressiveIntegrated Moving Average,差分自回归滑动平均)模型算法,则是将非平稳序列平稳化处理后,再选择合适的模型预测,但仍然存在非平稳趋势、时间预测的时序关联性不够、预测精度较低的问题。
发明内容
本发明的主要目的在于提供一种预付卡剩余流量预测方法和计算机可读存储介质,旨在解决目前流量预测算法的算法程度高、计算时间长、预测精度低的问题。
为实现上述目的,本发明提供的一种预付卡剩余流量的预测方法,所述方法包括:
采集预付卡的数据流量信息,获取最优粒度的时间序列;
判断所述高频序列的平稳度是否符合预设条件;
当所述高频序列的平稳度不符合预设条件的情况下,则返回对所述时间序列进行小波分解,得到低频序列和高频序列的步骤,对所述时间序列进一步地小波分解;
当所述高频序列的平稳度符合预设条件的情况下,对所述低频序列和所述高频序列分别构建预测模型进行拟合获得拟合后的低频序列和拟合后的高频序列;
确定预测步长;
对所述拟合后的低频序列和所述拟合后的高频序列分别按照所述预测步长进行预测获得预测后的低频序列和预测后的高频序列;
对所述预测后的低频序列和所述预测后的高频序列进行小波重构获得重构序列;
根据所述重构序列对所述剩余流量进行预测。
优选地,所述判断所述高频序列的平稳度是否符合预设条件的步骤,包括:
通过对所述高频序列采用最小二乘法的直线拟合得到拟合直线的斜率或平方根检验;根据所述拟合直线的斜率或检验结果判断所述高频序列的平稳度;在所述拟合直线的斜率小于预设值或不满足验证条件时,则判断所述高频序列为平稳。
优选地,所述当所述高频序列的平稳度不符合预设条件的情况下,则返回对所述时间序列进行小波分解,得到低频序列和高频序列的步骤,对所述时间序列进一步地小波分解的步骤,包括:
当所述高频序列的平稳度不符合预设条件的情况下,判断所述时间序列已被分解的层数是否大于预设层数;当所述时间序列已被分解的层数大于预设层数时,则停止对所述时间序列进行进一步地小波分解;当所述时间序列已被分解的层数小于预设层数时,则返回所述通过对所述时间序列进行小波分解,得到低频时间序列和高频时间序列的步骤,以对所述时间序列进行进一步地小波分解。
优选地,述当所述高频序列的平稳度符合预设条件的情况下,对所述高频序列和所述低频序列分别构建预测模型进行拟合获得拟合后的高频序列和拟合后的低频序列的步骤,包括:
当所述高频序列的平稳度符合预设条件的情况下,对所述低频序列构建ARIMA模型进行拟合,对所述高频序列构建ARMA模型进行拟合,获得所述拟合后的低频序列和拟合后的高频序列。
优选地,所述对所述低频序列构建ARIMA模型进行拟合的步骤,包括:
对所述低频序列进行差分运算获取差分阶数;
获取所述低频序列的自相关系数和偏自相关系数;根据所述低频序列的自相关系数、偏自相关系数和差分阶数对所述低频序列构建ARIMA预测模型进行拟合获得低频预估序列;根据所述低频预估序列和低频序列获得低频残差序列;判断所述低频残差序列是否是高斯白噪声;若是,则以所述低频预估序列为拟合后的低频序列;若否,则对所述低频序列重新建模。
优选地,所述对所述高频序列构建ARMA模型进行拟合的步骤,包括:
获取所述高频序列的自相关系数和偏自相关系数;根据所述高频序列的自相关系数、偏自相关系数对所述高频序列构建ARMA模型进行拟合获得高频预估序列;根据所述高频预估序列和高频序列获得高频残差序列;判断所述高频残差序列是否是高斯白噪声;若是,则以所述高频预估序列为拟合后的高频序列;若否,则对所述高频序列重新建模。
优选地,所述确定预测步长包括:
获取所述低频序列的自相关系数和偏自相关系数;获取所述采集预付卡的数据流量信息的数据量和预测的数据流量的数据量的比例即训练预测比;根据所述低频序列的自相关系数和偏自相关系数以及所述训练预测比确定预测步长。
为实现上述目的,本发明还提供一种网络终端,其特征在于,包括控制器、存储器以及存储在存储器上并可在控制器上运行的计算机程序,所述控制器执行所述计算机程序时实现上述任一项所述的预付卡剩余流量预测方法的步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的预付卡剩余流量预测方法的步骤。
本发明提出的技术方案中,通过采集预付卡的数据流量信息,获取最优粒度的时间序列,并对所述时间序列进行小波分解,得到低频序列和高频序列,当所述高频序列不平稳时,则对时间序列进行多层小波分解直到高频序列平稳,并对所述低频序列和所述高频序列分别构建预测模型进行拟合,跟据确定的预测步长对拟合后的低频序列和拟合后的高频序列进行预测,并对预测后的低频序列和预测后高频序列进行波形重构,得到重构序列,并根据所述重构序列对所述剩余流量进行预测。本发明提出的技术方案则采用小波分解以及对低频序列和高频序列分别构建预测模型相结合的方法,算法复杂程度低、增强了时间序列预测的时序关联性,同时可以适当减少小波分解的层数,降低算法复杂性,降低计算时间、提高预测精度。
附图说明
图1为本发明预付卡剩余流量预测方法第一实施例的流程示意图;
图2为本发明预付卡剩余流量预测方法第二实施例中的步骤S10的细化流程示意图;
图3为本发明一具体示例中采集的不同时间序列的ARIMA的拟合值和实际值的波形图,其中:
(a)为原始序列每天流量消耗的波形图;
(b)为1天拟合的拟合值和实际值的波形图;
(c)为7天拟合的拟合值和实际值的波形图;
(d)为15天拟合的拟合值和实际值的波形图;
(e)为30天拟合的拟合值和实际值的波形图;
图4为本发明预付卡剩余流量预测方法第三实施例中的步骤S30的细化流程示意图;
图5为本发明预付卡剩余流量预测方法第四实施例中的步骤S40的细化流程示意图;
图6为本发明预付卡剩余流量预测方法第五实施例中的步骤S50的细化流程示意图;
图7为本发明一具体示例中所述低频序列和高频序列的自相关和偏自相关图;
图8为本发明一具体示例中所述低频序列和高频序列经过模型拟合后的实际值和拟合值的波形图,其中:
(a)为时间序列的低频序列CA和高频序列CD;
(b)为低频序列进行ARIMA拟合后的实际值和拟合值波形图;
(c)为高频序列进行ARMA拟合后的实际值和拟合值波形图;
图9为本发明低频序列和高频序列经过模型拟合后的波形重构的实际值和预测值的波形图;
图10为本发明一实施例中的网络终端的模块结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
请参照图1,为本发明第一实施例中的预付卡剩余流量预测方法的方法流程图,所述预付卡剩余流量预测方法100包括步骤:
步骤S10,采集预付卡的数据流量信息,获取最优粒度的时间序列。
具体地,在预付卡用户流量预测场景中,获取的时间序列通常具有小样本、非平稳、短期预测的限定。平稳时间序列的均值通常为常数、自协方差函数与起点无关,而非平稳序列则这两项都不满足。而在预付卡用户流量预测场景中获取的时间序列还具有明显的趋势项。
由于预付卡用户流量数据按天生成,数据量通常超过4千万条或更多,过细的时间粒度不利于模型建立和流量预测,并且时间序列也会对数据过于敏感,随机因素将会影响模型预测的稳定性。流量数据随着用户的增加,以及服务的完善,用户每天流量消耗会经历由增长到稳定的变化过程,因此流量数据时间序列具有一定的趋势。例如初始以1天、7天、15天、30天为时间间隔,累计流量总消耗,并据此得到对应的时间序列,由于均为非平稳序列,采用ARIMA模型进行拟合,根据拟合最优结果,选取以最优粒度的时间序列作为后续训练集。
步骤S20,对所述时间序列进行小波分解,得到低频序列和高频序列。
具体地,对于平稳序列,处理的算法可以是傅立叶变换,但是在实际应用中的绝大多数时间序列是非平稳序列,而处理非平稳序列采用就是小波分解(wavelet transform)。小波分解将原始数据分解为低通近似部分,保留原序列的趋势,以及高频细节部分,包含原序列随机因素。
选取最优粒度的时间序列为{Xt},序列{Xt}的离散小波变换是一种规范正交变换,假设{Wn,n=0,L,N-1}表示离散小波变换的系数,则可以将序列X的离散小波变换写成W=WX,其中W是长度为N=2J的列向量,其第n个元素数是第n个离散小波变换系数Wn。W是N×N的实值矩阵,定义了离散小波变换且满足WTW=I。
序列X公式为:
Figure BDA0001525976250000061
Figure BDA0001525976250000062
Figure BDA0001525976250000063
则将序列X表示成一个常数向量SJ和J个另外向量Dj(j=1,L,J)的和,其中每一个Dj都包含与X在某一尺度上的变化有关的一个时间序列,称Dj是第j层小波细节。对0≤j≤J-1,令:
Figure BDA0001525976250000064
则Sj是X的第j层小波光滑,同理,定义X的第j层小波粗糙,公式为:
Figure BDA0001525976250000071
则X=Sj+Rj,通过选定实值小波过滤器{hl}对长为N的时间序列用小波过滤器循环滤波,循环周期为N,滤波后输出的奇数指标的元素用来形容第一层小波系数的长为N/2的向量w1,为高频子空间,相应由尺度滤波器循环滤波输出第一层尺度系数的长为N/2的向量v1,为低频子空间,所述w1和v1为一层小波分解,采用塔式算法可以得到需要的第j层滤波向量。其中,X分解为v1和w1的公式为:
Figure BDA0001525976250000072
其中,G、H分别是高通滤波器和低通滤波器。
步骤S30,判断所述高频序列的平稳度是否符合预设条件。
步骤S40,当所述高频序列的平稳度不符合预设条件的情况下,则返回对所述时间序列进行小波分解,得到低频序列和高频序列的步骤,对所述时间序列进一步地小波分解;
具体地,首先对所述时间序列进行一层小波分解,得到低频序列和高频序列,因为低频序列包含原序列的趋势,为非平稳的,高频序列包含原序列随机因素,要求得到的高频序列为平稳序列。
当高频序列非平稳,则返回对所述时间序列进行二层小波分解,直到所述高频序列为平稳序列。
步骤S50,当所述高频序列的平稳度符合预设条件的情况下,对所述低频序列和所述高频序列分别构建预测模型进行拟合获得拟合后的低频序列和拟合后的高频序列。
具体地,所述高频序列为平稳性序列,所述低频序列为非平稳序列,对平稳性序列可以构建AR、MA、ARMA模型进行拟合,对于非平稳性序列构建ARIMA模型进行拟合。因为所述低频序列和所述高频序列,单个序列值虽然具有不确定性,但是整个序列的变化量具有一定的趋势性,可以用相应的数学模型近似描述。构建合适的模型拟合,可以更本质地认识时间序列的结构和特征,变化只跟当前值、过去值或者是误差项目之间的关系,因为具有趋势性,可以用于对时间序列的短期预测。
步骤S60,确定预测步长;
步骤S70,对所述拟合后的低频序列和所述拟合后的高频序列分别按照所述预测步长进行预测获得预测后的低频序列和预测后的高频序列。
具体地,对所述低频序列和所述高频序列进行模型拟合后,为了预测下一个周期如1个星期或者1个月的数据量,首先需要确定预测步长N,在一具体实施方式中,可以根据需要预测的时间,以及根据低频序列本身的变化规律来确定预测步长N;然后对所述拟合后的低频序列和所述拟合后的高频序列进行N步预测获得预测后的低频序列和预测后的高频序列。
步骤S80,对所述预测后的低频序列和所述预测后的高频序列进行小波重构获得重构序列。
具体地,重构是小波分解的逆过程,对所述预测后的低频序列和所述预测后的高频序列进行波形重构,所述重构公式为:
Figure BDA0001525976250000081
其中,G*、H*分别为G、H的共轭转置矩阵。
步骤S90,根据所述重构序列对所述剩余流量进行预测。
具体地,经过上述算法后,通过所述重构序列对用户的流量消耗进行预测,根据流量池大小,可预测剩余流量,并服务商对剩余流量的处理提供了数据支持。
本发明提出的技术方案中,通过采集预付卡的数据流量信息,获取最优粒度的时间序列,并对所述时间序列进行小波分解,得到低频序列和高频序列,当所述高频序列不平稳时,则对时间序列进行多层小波分解直到高频序列平稳,并对所述低频序列和所述高频序列分别构建预测模型进行拟合,根据确定的预测步长对拟合后的低频序列和拟合后的高频序列进行预测,并对预测后的低频序列和预测后高频序列进行波形重构,得到重构序列,并根据所述重构序列对所述剩余流量进行预测。本发明提出的技术方案则采用小波分解以及对低频序列和高频序列分别构建预测模型相结合的方法,算法复杂程度低、增强了时间序列预测的时序关联性,同时可以适当减少小波分解的层数,降低算法复杂性,降低计算时间、提高预测精度。
请参照图2,基于本发明第一实施例中的预付卡剩余流量预测方法100提出本发明第二实施例中的预付卡剩余流量预测方法中的步骤S10的细化流程图,并结合实验结果进行说明。在该第二实施例中,所述步骤S20~S90均与第一实施例中相同,在此不再赘述;其不同在于,步骤S10具体可以包括:
步骤S11,采集预付卡的数据流量信息,按照不同时间频率获得对应的时间序列;
步骤S12,通过对所述不同时间频率获得对应的时间序列进行ARIMA模型拟合,并获取拟合误差率;
步骤S13,获取最低拟合误差率所对应的时间序列为最优粒度的时间序列。
具体地,采集用户的数据信息,例如初始以1天、7天、15天、30天为时间间隔,累计流量总消耗,并据此得到对应的时间序列,由于均为非平稳序列,分别对1天、7天、15天、30天的时间序列采用ARIMA模型进行拟合,拟合后计算拟合误差率,以最低误差率所对应的时间序列为最有粒度的时间序列,选取以最优粒度的时间序列作为后续训练集。
请一并结合图3,进一步地,ARIMA模型拟合公式在下述具体示例中说明,所述拟合误差率计算公式可以为:
Figure BDA0001525976250000091
其中Zt为Xt的预测值。
例如,采集18万以上客户产生的每天流量消耗数据,分别按照不同的时间粒度进行处理,分为1天、7天、15天、30天得到具有不同数据量和数据量级的时间序列,所述数量如表1所示。
表一:
时间粒度 数据量级 数据量 说明
1天 400Gbps 447 每天流量消耗
7天 2Tbps 61 按7天累计
15天 4Tbps 25 按15天累计
30天 8Tbps 14 按30天累计
按照所述数据量进行ARIMA进行拟合,拟合之后的拟合值和实际值的波形图请参照图3,其中:
(a)为原始序列每天流量消耗的波形图;
(b)为1天拟合的拟合值和实际值的波形图;
(c)为7天拟合的拟合值和实际值的波形图;
(d)为15天拟合的拟合值和实际值的波形图;
(e)为30天拟合的拟合值和实际值的波形图。
按照所述拟合误差率计算公式计算预测值和实际值之间的误差,得到表二。
表二:
Figure BDA0001525976250000101
通过RMSE衡量不同时间粒度下模型拟合优度,从表二中可以分析出,7天时间序列与ARIMA具有较高的模型适应度,因此后续可以采用7天流量时间序列作为最优粒度的时间序列,并作为后续分析和预测的数据。
本实施例采集最优粒度的时间序列作为后续的预测模型,相比较任何一个时间粒度的时间序列来说,并没有对于序列的时间粒度采用一定的方法进行过滤,合适时间粒度的序列对于消除序列的随机因素、提高序列的平稳性具有重要意义。本发明的实施例能够进一步地降低误差,提升预测的准确率。
请参照图4,基于本发明第一实施例中的预付卡剩余流量预测方法100提出本发明第三实施例中的预付卡剩余流量预测方法中的步骤S30的细化流程图,并结合实验结果进行说明。在该第三实施例中,所述步骤S10~S90中除步骤S30外其他步骤均与第一实施例相同,步骤S30具体可以包括:
步骤S31,通过对所述高频序列采用最小二乘法的直线拟合得到拟合直线的斜率或平方根检验;
步骤S32,根据所述拟合直线的斜率或检验结果判断所述高频序列的平稳度;
步骤S33,在所述拟合直线的斜率小于预设值或检验结果满足验证条件时,则判断所述高频序列为平稳。
具体的,判断所述高频序列是否平稳,可以采用最小二乘法、平方根检验或者矩估计等,本实施例中当采用最小二乘法对直线进行拟合,所述直线拟合的作用相当于趋势线,使用斜率评估波形斜率,斜率越小说明越平稳,无需再次分解,如果不平稳则需要再次进行小波分解。
所述预设值设为ε=0.1,当直线斜率小于预设值时,则所述低频序列平稳,不需要再进行小波分解。所述预设值可根据采集的数据量多少重新设置,即根据样本大小以及频率重新设置。当采用平方根进行检验时,根据高频序列的模型方程,得到序列的特征方程,计算平方根检验,当检验结果平方根满足|λ|<1时,则序列是平稳的,否则,所述高频序列为非平稳,仍需要再次进行小波分解。
在一具体示例中,采用最小二乘法对上述表一中的所述原始7天流量时间序列以及对其进行一层小波分解的低频序列和高频序列进行拟合得到直线的斜率如表三。
表三:
序列类型 斜率 平稳性
原始7天序列 0.9 非平稳
小波分解-低频序列 0.75 非平稳
小波分解-高频序列 0.09 平稳
从表三中可以分析出,所述以7天流量时间序列作为最优粒度的时间序列,进行一层小波分解得到素数低频序列和所述高频序列,所述高频序列的斜率小于预设值,高频序列平稳,则所述时间序列无需再次进行小波分解。
请参照图5,基于本发明第一实施例中的预付卡剩余流量预测方法100提出本发明第四实施例中的预付卡剩余流量预测方法中的步骤S40的细化流程图,在该实施例中,所述步骤S10~S90中除步骤S40外其他步骤均与第一实施例相同,步骤S40具体可以包括:
步骤S41,当所述高频序列的平稳度不符合预设条件的情况下,判断所述时间序列已被分解的层数是否大于预测层数;
步骤S42,当所述时间序列已被分解的层数大于预设层数时,则停止对所述时间序列进行进一步地小波分解;
步骤S43,当所述时间序列已被分解的层数小于预设层数时,则返回所述通过对所述时间序列进行小波分解,得到低频时间序列和高频时间序列的步骤,以对所述时间序列进行进一步地小波分解。
具体地,理论上,对所述时间序列采用塔式算法可以进行j层小波分解,最大分解层数j满足,j=log2 m-1,所述m为采集的时间序列的数据量,小波分解层数越高,则经过小波分解后的低频部分越光滑,高频随机因素过滤越充足。但是,小波的进一步分解是对低频分量进行的,即进一步分解低频分量的的高频细节特征,分解层数越多,频率范围在逐渐缩小,因此所能表现得信号就越有限,本算法限制小波分解的层数,例如3层。
进一步地,当所述高频序列的平稳度不符合预设条件的情况下,判断所述时间序列已被分解的层数,当所述时间序列的已被分解层数j大于预设值时,则停止对所述时间序列进行进一步地小波分解。本实施例中,所述预设值设为3,当所述时间序列已被分解的层数j小于预设值时,则返回通过对所述时间序列进行小波分解,得到低频时间序列和高频时间序列的步骤,对所述时间序列进行进一步地小波分解。
在本实施例中,限定了所述时间序列的小波分解层数最多为3,由于预付卡时间序列具有趋势性,在本具体方案中,采用一层小波分解就能得到平稳序列。
基于本发明第一实施例提出本发明第五实施例,所述步骤S50可以包括:
步骤S51,当所述高频序列的平稳度符合预设条件的情况下,对所述低频序列构建ARIMA模型进行拟合,对所述高频序列构建ARMA模型进行拟合,获得所述拟合后的低频序列和拟合后的高频序列。
具体地,时间序列通常采用ARIMA、ARMA模型拟合,所述低频序列为非平稳序列,也是先对低频序列进行差分运算,去除趋势想变为平稳序列进行ARMA运算。本方案分别对低频序列和高频序列建模,减少了小波分解的层数。
请参照图6,基于本发明第五实施例中的预付卡剩余流量预测方法提出本发明第六实施例中的预付卡剩余流量预测方法中的步骤S51的细化流程图,在该实施例中,其中,步骤S51中的所述对所述低频序列构建ARIMA模型进行拟合的步骤,包括:
步骤S521,对所述低频序列进行差分运算获取差分阶数;
步骤S522,获取所述低频序列的自相关系数和偏自相关系数;
步骤S523,根据所述低频序列的自相关系数、偏自相关系数和差分阶数对所述低频序列构建ARIMA预测模型进行拟合获得低频预估序列;
步骤S524,根据所述低频预估序列和低频序列获得低频残差序列;
步骤S525,判断所述低频残差序列是否是高斯白噪声;
步骤S526,若是,则以所述低频预估序列为拟合后的低频序列;
步骤S527,若否,则对所述低频序列重新建模。
具体地,进行ARIMA拟合必须获得参数p、d、q,其中p、q为滞后阶,d为差分阶数,首先将低频序列进行差分运算获取差分阶数d,所述差分阶数d不超过2,经过差分运算后即将不平稳的低频序列转化为平稳序列,再对平稳序列进行ARMA拟合。
具体地,差分公式为:
Figure BDA0001525976250000131
其中
Figure BDA0001525976250000132
为前向差分算子,n∈¥+为差分阶数,
差分算法能够平稳化n次趋势,消除序列所具有的趋势,在本实施例中,所述差分阶数d不超过2。
具体地,ARMA公式为:
Figure BDA0001525976250000133
其中ft为Yt的预测值,Yt为所述低频序列进行差分运算后的序列,p,q∈¥为滞后阶,αi(i=1,2,L,p)为自相关系数,θj(j=1,2,L,q)为随机干扰或预测误差,ut为随机误差,服从均值为零的正态分布N(0,σ2),即高斯白噪声序列。其中,如何定阶p、q,即如何获取所述低频序列的自相关系数和偏自相关系数主要工具是自相关函数(ACF)和偏自相关函数(PACF),确定p、q值可以采用自动定阶或者观察函数图像。
理论上,采用ARIMA模型拟合,从公式上看,为随机误差,但是对实际序列进行ARIMA拟合,为了检验所述模型是否合适,则判断所述残差序列是否是高斯白噪声。具体地,所述残差序列的公式为ut:εt=ft-Yt
具体地,根据所述低频预估序列和所述序列的差获得低频残差序列,当所述低频残差序列为高斯白噪声,则所述ARIMA模型是合适的模型,反之,则需要重新建模,而影响建模不合适的原因,可能是对p、q定阶不合适,返回重新计算构建模型。
请继续参照图6,在该第六实施例里,其中,所述步骤S51中的所述对所述高频序列构建ARMA模型进行拟合的步骤,包括:
步骤S531,获取所述高频序列的自相关系数和偏自相关系数;
步骤S532,根据所述高频序列的自相关系数、偏自相关系数对所述高频序列构建ARMA模型进行拟合获得高频预估序列;
步骤S533,根据所述高频预估序列和高频序列获得高频残差序列;
步骤S534,判断所述高频残差序列是否是高斯白噪声;
步骤S535,若是,则以所述高频预估序列为拟合后的高频序列;
步骤S536,若否,则对所述高频序列重新建模。
具体地,所述高频序列为平稳序列,构建ARMA模型进行拟合,所述拟合的步骤方法与所述低频序列进行差分运算后再进行的步骤相同,在此不再赘述。
基于本发明第一实施例中的预付卡剩余流量预测方法提出本发明第七实施例中的预付卡剩余流量预测方法中的步骤S60的细化流程图,并结合实验结果进行说明。在该第七实施例中,所述步骤S10~S90中除步骤S60外其他步骤均与第一实施例相同,步骤S60具体可以包括:
步骤S61,获取所述低频序列的自相关系数和偏自相关系数;
步骤S62,获取所述采集预付卡的数据流量信息的数据量和预测的数据流量的数据量的比例即训练预测比;
步骤S63,根据所述低频序列的自相关系数和偏自相关系数以及所述训练预测比确定预测步长。
具体地,所述预测步长也可以称为预测的时间长度N。N的设定需要考虑所述低频序列的自相关系数p和偏自相关系数q值的大小以及所述采集预付卡的数据流量信息的数据量和预测的数据流量的数据量的比例即训练预测比。因为,预测时间长短要根据模型的性能确定,实际问题中希望往后预测的时间越长越好,但是鉴于模型的性能存在限制,所以需要结合时间序列的时间粒度以及模型预测的结果确定预测的时间长短,即预测步长。
具体地,在一具体示例中,根据p和q以及训练预测与设定步长N的关系如表四。
表四
p,q 训练预测比 步长N
p,q≤1 10:1 4
1≤p,q≤3 12:1 2
p,q≥3 12:1 2
进一步地,例如所述训练的时间序列为数据量为7天的流量时间序列,数据量为62,需要预测之后一个月的数据量,近似为4周,相对于时间粒度7天,预测步长为4。
请一并参照图7和图8和图9。
图7为以上述表一中的所述7天流量时间序列作为最优粒度的时间序列,所述7天流量时间序列进行一层小波分解后,所述低频序列和高频序列的自相关和偏自相关图。
从图7中可以分析出,所述低频序列以及高频序列的的自相关函数和偏自相关函数都呈“拖尾”现象,因此高频序列采用ARMA模型进行拟合,低频序列差分运算后采用ARMA模型拟合。
图8为以上述表一中的所述7天流量时间序列进行一层小波分解后,低频序列和高频序列经过模型拟合后的实际值和拟合值的波形图,其中:
(a)为时间序列的低频序列CA和高频序列CD;
(b)为低频序列进行ARIMA拟合后的实际值和拟合值波形图;
(c)为高频序列进行ARMA拟合后的实际值和拟合值波形图。
从图8中可以分析出,所述低频序列的拟合结果和所述高频序列的拟合结果,其拟合程度很高,算法准确适用。
图9为以上述表一中的所述7天流量时间序列进行一层小波分解后,低频序列和高频序列经过模型拟合后的波形重构的实际值和预估值的波形图。
进一步地,以下基于本发明第一实施例中的预付卡剩余流量预测方法还提出另一具体示例,采集6个月的数据流量预测,2017年2月至7月流量的消耗。采用所述预付卡剩余流量的预测方法分别预测6个月的流量,并计算预测误差。
误差根据以下公式计算:
Figure BDA0001525976250000151
其中ypre为预测流量消耗,yreal为实际流量消耗,ypool流量池大小,通过相对误差可以准确衡量模型预测准确度。
具体地,采集6个月的数据流量进行预测如表五。
表五
Figure BDA0001525976250000161
从表五中可以分析出,通过对比采用小波分解前后的预测误差,可以看出,进行小波分解后,再采用合适的模型拟合,误差明显降低,准确率有了进一步的提升。
进一步地,请参照图10,本发明还提供一种网络终端101,包括存储器10、控制器20以及存储在存储器10上并可在控制器20上运行的计算机程序,其中,
所述存储器10,可用于存储软件程序以及各种数据。存储器10可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统等;存储数据区可存储根据所述预付卡剩余流量预测方法的使用所创建的数据或信息等,还可以存储计算机程序(例如小波函数、重构函数、最小二乘法函数、ARMA、ARIMA模型等)。此外,存储器10可以包括高速随机存取存储器、还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述控制器20,是所述网络终端的控制中心,通过运行或执行存储在存储器内的软件程序和/或模块,以及调用存储在存储器10内的数据,执行网络终端105的各种功能和处理数据。控制器20可包括一个或多个处理单元;优选地,控制器20可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等。
所述控制器20执行所述计算机程序时实现如上述任一项实施例中所述的预付卡剩余流量预测方法的步骤。
进一步地,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例中所述的预付卡剩余流量预测方法的步骤。
在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第X实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料、方法步骤或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种预付卡剩余流量预测方法,其特征在于,包括:
采集预付卡的数据流量信息,获取最优粒度的时间序列,包括:对时间序列进行ARIMA模型拟合,并获取拟合误差率;
对所述时间序列进行小波分解,得到低频序列和高频序列;
判断所述高频序列的平稳度是否符合预设条件;
当所述高频序列的平稳度不符合预设条件的情况下,则返回对所述时间序列进行小波分解,得到低频序列和高频序列的步骤,对所述时间序列进一步地小波分解;
当所述高频序列的平稳度符合预设条件的情况下,对所述低频序列和所述高频序列分别构建预测模型进行拟合获得拟合后的低频序列和拟合后的高频序列;
确定预测步长;
对所述拟合后的低频序列和所述拟合后的高频序列分别按照所述预测步长进行预测获得预测后的低频序列和预测后的高频序列;
对所述预测后的低频序列和所述预测后的高频序列进行小波重构获得重构序列;
根据所述重构序列对所述剩余流量进行预测;
获取最低拟合误差率所对应的时间序列为最优粒度的时间序列。
2.如权利要求1所述的预付卡剩余流量预测方法,其特征在于,所述采集预付卡的数据流量信息,获取最优粒度的时间序列的步骤,还包括:
采集预付卡的数据流量信息,按照不同时间频率获得对应的时间序列;
通过对所述不同时间频率获得对应的时间序列进行ARIMA模型拟合。
3.如权利要求1所述的预付卡剩余流量预测方法,其特征在于,所述判断所述高频序列的平稳度是否符合预设条件的步骤,包括:
通过对所述高频序列采用最小二乘法的直线拟合得到拟合直线的斜率或平方根检验;
根据所述拟合直线的斜率或检验结果判断所述高频序列的平稳度;
在所述拟合直线的斜率小于预设值或检验结果满足验证条件时,则判断所述高频序列为平稳。
4.如权利要求1所述的预付卡剩余流量预测方法,其特征在于,所述当所述高频序列的平稳度不符合预设条件的情况下,则返回对所述时间序列进行小波分解,得到低频序列和高频序列的步骤,对所述时间序列进一步地小波分解的步骤,包括:
当所述高频序列的平稳度不符合预设条件的情况下,判断所述时间序列已被分解的层数是否大于预设层数;
当所述时间序列已被分解的层数大于预设层数时,则停止对所述时间序列进行进一步地小波分解;
当所述时间序列已被分解的层数小于预设层数时,则返回所述通过对所述时间序列进行小波分解,得到低频时间序列和高频时间序列的步骤,以对所述时间序列进行进一步地小波分解。
5.如权利要求1所述的预付卡剩余流量预测方法,其特征在于,所述当所述高频序列的平稳度符合预设条件的情况下,对所述高频序列和所述低频序列分别构建预测模型进行拟合获得拟合后的高频序列和拟合后的低频序列的步骤,包括:
当所述高频序列的平稳度符合预设条件的情况下,对所述低频序列构建ARIMA模型进行拟合,对所述高频序列构建ARMA模型进行拟合,获得所述拟合后的低频序列和拟合后的高频序列。
6.如权利要求5所述的预付卡剩余流量预测方法,其特征在于,所述对所述低频序列构建ARIMA模型进行拟合的步骤,包括:
对所述低频序列进行差分运算获取差分阶数;
获取所述低频序列的自相关系数和偏自相关系数;
根据所述低频序列的自相关系数、偏自相关系数和差分阶数对所述低频序列构建ARIMA预测模型进行拟合获得低频预估序列;
根据所述低频预估序列和低频序列获得低频残差序列;
判断所述低频残差序列是否是高斯白噪声;
若是,则以所述低频预估序列为拟合后的低频序列;
若否,则对所述低频序列重新建模。
7.如权利要求5所述的预付卡剩余流量预测方法,其特征在于,所述对所述高频序列构建ARMA模型进行拟合的步骤,包括:
获取所述高频序列的自相关系数和偏自相关系数;
根据所述高频序列的自相关系数、偏自相关系数对所述高频序列构建ARMA模型进行拟合获得高频预估序列;
根据所述高频预估序列和高频序列获得高频残差序列;
判断所述高频残差序列是否是高斯白噪声;
若是,则以所述高频预估序列为拟合后的高频序列;
若否,则对所述高频序列重新建模。
8.如权利要求1所述的预付卡剩余流量预测方法,其特征在于,所述确定预测步长包括:
获取所述低频序列的自相关系数和偏自相关系数;
获取所述采集预付卡的数据流量信息的数据量和预测的数据流量的数据量的比例即训练预测比;
根据所述低频序列的自相关系数和偏自相关系数以及所述训练预测比确定预测步长。
9.一种网络终端,其特征在于,包括控制器、存储器以及存储在存储器上并可在控制器上运行的计算机程序,所述控制器执行所述计算机程序时实现如权利要求1-8中任一项所述的预付卡剩余流量预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的预付卡剩余流量预测方法的步骤。
CN201711439119.9A 2017-12-26 2017-12-26 预付卡剩余流量预测方法、网络终端和存储介质 Active CN108111353B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711439119.9A CN108111353B (zh) 2017-12-26 2017-12-26 预付卡剩余流量预测方法、网络终端和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711439119.9A CN108111353B (zh) 2017-12-26 2017-12-26 预付卡剩余流量预测方法、网络终端和存储介质

Publications (2)

Publication Number Publication Date
CN108111353A CN108111353A (zh) 2018-06-01
CN108111353B true CN108111353B (zh) 2021-10-15

Family

ID=62211838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711439119.9A Active CN108111353B (zh) 2017-12-26 2017-12-26 预付卡剩余流量预测方法、网络终端和存储介质

Country Status (1)

Country Link
CN (1) CN108111353B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740111B (zh) * 2018-12-24 2023-09-22 华北科技学院 对地电场值预测方法
CN109889999B (zh) * 2018-12-29 2020-11-27 深圳市中天网景科技有限公司 一种物联网卡的流量池管理方法、系统和终端
CN109788450B (zh) * 2019-01-15 2019-12-13 深圳市中天网景科技有限公司 一种物联网卡的流量共享方法、系统和终端
CN111262873B (zh) * 2020-01-20 2022-06-03 安徽大学 一种基于小波分解的用户登录特征预测方法及其装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949394B1 (en) * 2003-07-10 2015-02-03 Sprint Communications Company L.P. Forecasting link utilization between points of presence in an IP network
CN101631317B (zh) * 2009-08-19 2011-12-28 哈尔滨工业大学 一种移动通信话务量的多步预测方法
CN101739819A (zh) * 2009-11-19 2010-06-16 北京世纪高通科技有限公司 预测交通流的方法和装置
CN102891770A (zh) * 2012-10-22 2013-01-23 哈尔滨工业大学深圳研究生院 一种利用短相关模型预测长相关序列的方法
CN104268408A (zh) * 2014-09-28 2015-01-07 江南大学 一种基于小波系数arma模型的能耗数据宏观预测方法
CN106533750B (zh) * 2016-10-28 2019-05-21 东北大学 一种云环境下非平稳型应用用户并发量的预测系统及方法

Also Published As

Publication number Publication date
CN108111353A (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
CN108111353B (zh) 预付卡剩余流量预测方法、网络终端和存储介质
Cardinali et al. Costationarity of locally stationary time series
US8954910B1 (en) Device mismatch contribution computation with nonlinear effects
Giesecke et al. Monte Carlo algorithms for default timing problems
CN112132485A (zh) 一种指标数据处理方法、装置、电子设备及存储介质
CN106127570A (zh) 征信系统的稳定性指标生成方法及装置
CN116757378A (zh) 需求响应评估模型训练方法、应用评估方法及相关设备
CN109255368B (zh) 随机选取特征的方法、装置、电子设备及存储介质
CN109116183B (zh) 谐波模型参数辨识方法、装置、存储介质及电子设备
CN109829000B (zh) 一种河川年径流量数据的一致性处理方法及装置
CN111008740A (zh) 数据传播趋势的预测方法、设备、存储介质及装置
CN114548173A (zh) 一种精准的周期性检测方法、系统及存储介质
CN108243037B (zh) 网站流量异常确定方法及装置
CN112559965B (zh) 产品抽样检测方法及装置、电子设备、计算机可读介质
Boubaker A generalized arfima model with smooth transition fractional integration parameter
CN114418304A (zh) 一种不良资产包的评估方法和装置
CN109347691B (zh) 一种用于Web服务的数据采样方法、装置及设备
CN113139673A (zh) 一种预测空气质量的方法、装置、终端及存储介质
CN113127803A (zh) 业务集群容量预估模型的建立方法、装置及电子设备
Luz et al. Minimax-robust estimation problems for sequences with periodically stationary increments observed with noise
CN113159177B (zh) 基于批归一化参数定点化的目标检测方法、系统、设备
Meinl A novel wavelet based approach for time series data analysis
CN116108086B (zh) 一种时序数据的评估方法、装置、电子设备及存储介质
CN115879405B (zh) 电路性能的检测方法及计算机存储介质和终端设备
CN112148764B (zh) 特征的筛选方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 518000 1402, building 1, Chongwen Park, Nanshan wisdom Park, 3370 Liuxian Avenue, Fuguang community, Taoyuan Street, Nanshan District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Guanglian Saixun Co.,Ltd.

Address before: Room 701, unit 3, building C, Kexing Science Park, No. 15, Keyuan Road, high tech park, Nanshan District, Shenzhen City, Guangdong Province

Applicant before: SHENZHEN AUTONET Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220812

Address after: 518000 1404, building 1, Chongwen Park, Nanshan Zhiyuan, No. 3370 Liuxian Avenue, Fuguang community, Taoyuan Street, Nanshan District, Shenzhen, Guangdong

Patentee after: Shenzhen Guanglian Digital Technology Co.,Ltd.

Address before: 518000 1402, building 1, Chongwen Park, Nanshan wisdom Park, 3370 Liuxian Avenue, Fuguang community, Taoyuan Street, Nanshan District, Shenzhen, Guangdong Province

Patentee before: Shenzhen Guanglian Saixun Co.,Ltd.