CN111740865B

CN111740865B - 一种流量波动趋势预测方法、装置及电子设备

Info

Publication number: CN111740865B
Application number: CN202010582650.7A
Authority: CN
Inventors: 康林; 段效晨; 秦占明; 赵艳杰; 罗廷方; 王玉东; 付元宝
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2020-06-23
Filing date: 2020-06-23
Publication date: 2022-09-02
Anticipated expiration: 2040-06-23
Also published as: CN111740865A

Abstract

本发明实施例提供了一种流量波动趋势预测方法、装置及电子设备，应用于流量监控领域。该方法包括：获取待预测的目标时间段对应的流量数据序列；流量数据序列包括按照时间先后排序的、目标系统在连续多个参考时间段内的实际流量值，连续多个参考时间段与目标时间段在横向时间维度或纵向时间维度上属于连续时间段；利用流量数据序列，按照预定的流量预测方式，确定目标系统在目标时间段内的预测流量数据；基于预测流量数据，预测目标系统在目标时间段内相对于指定时间段的流量波动趋势；其中，指定时间段为横向时间维度上目标时间段的上一时间段。可见，通过本方案，可以实现对于网络系统的流量波动趋势进行有效预测的目的。

Description

一种流量波动趋势预测方法、装置及电子设备

技术领域

本发明涉及流量监控技术领域，特别是涉及一种流量波动趋势预测方法、装置及电子设备。

背景技术

流量预测是流控的重要环节，也是流控迈向智能化的关键一步。具体而言，针对一个网络系统而言，关于流量波动趋势的预测，即预测流量波动趋势是异常趋势还是正常趋势，对于异常流量的及时预警极为重要，能够及时有效的预警CC(Challenge Collapsar)攻击/爬虫等危害企业网络正常经营活动的行为。

因此，如何对流量波动趋势进行有效预测，从而为及时有效的预警CC(ChallengeCollapsar)攻击/爬虫等行为提供数据基础，是一个亟待解决的问题。

发明内容

本发明实施例的目的在于提供一种流量波动趋势预测方法、装置及电子设备，以实现对于网络系统的流量波动趋势进行有效预测的目的。具体技术方案如下：

第一方面，本发明实施例提供了一种流量波动趋势预测方法，所述方法包括：

获取待预测的目标时间段对应的流量数据序列；其中，所述流量数据序列包括按照时间先后排序的、目标系统在连续多个参考时间段内的实际流量值，所述连续多个参考时间段与所述目标时间段在横向时间维度或纵向时间维度上属于连续时间段；

利用所述流量数据序列，按照预定的流量预测方式，确定所述目标系统在所述目标时间段内的预测流量数据；

基于所述预测流量数据，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势；

其中，所述指定时间段为横向时间维度上所述目标时间段的上一时间段。

可选地，所述连续多个参考时间段与所述目标时间段在纵向时间维度上属于连续时间段；

所述利用所述流量数据序列，按照预定的流量预测方式，确定所述目标系统在所述目标时间段内的预测流量数据，包括：

计算所述流量数据序列的绝对中位差MAD数值；

计算所述MAD数值与当前时刻的实际流量值的和值，作为所述目标系统在所述目标时间段内的预测流量数据。

可选地，所述基于所述预测流量数据，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势，包括：

判断所述预测流量数据和参考流量数据的差值，是否大于第一阈值，如果是，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势为异常趋势，否则，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势为正常趋势；

其中，所述参考流量数据为所述目标系统在所述指定时间内的实际流量值。

可选地，所述连续多个参考时间段与所述目标时间段在横向时间维度上属于连续时间段；

对所述流量数据序列进行一阶差分处理，得到目标数据序列；

将所述目标数据序列输入预先训练的、用于预测流量数据的机器学习模型，得到输出结果，作为所述目标系统在所述目标时间段内的预测流量数据；

其中，所述机器学习模型为基于训练样本集训练得到，所述训练样本集中包括样本序列，所述样本序列包括按照时间先后顺序排列的、所述目标系统在连续多个样本时间段内的实际流量值，所述连续多个样本时间段为横向时间维度的连续时间段。

判断所述预测流量数据的绝对值是否大于第二阈值，如果是，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势为异常趋势，否则，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势为正常趋势。

可选地，所述机器学习模型包括：自回归滑动平均ARMA模型，或者，长短期记忆网络LSTM模型。

可选地，所述ARMA模型的表达式为：

Y_t＝β₀+β₁Y_t-1+β₂Y_t-2+...+β_pY_t-p+ε₀+α₁ε_t-1+α₂ε_t-2+...+α_pε_t-p

其中，Y_t为待预测的目标时间段t内的预测流量数据，Y_t-1为参考时间段t-1与参考时间段t-2内的实际流量值的一阶差分值，Y_t-2为参考时间段t-2与参考时间段t-3的实际流量值内的一阶差分值，Y_t-p为参考时间段t-p与参考时间段t-(p+1)内的实际流量值的一阶差分值，β₀、β₁、β₂…β_p为ARMA模型的第一类网络参数，ε₀、ε_t-1、ε_t-2…ε_t-p为ARMA模型的第二类模型参数，α₁、α₂…α_p为ARMA模型的第三类模型参数。

可选地，所述机器学习模型包括LSTM模型时，在对所述流量数据序列进行一阶差分处理，得到目标数据序列之后，将所述目标数据序列输入预先训练的、用于预测流量数据的机器学习模型，得到输出结果之前，所述方法还包括：

对所述目标数据序列进行归一化处理，得到归一化后的目标数据序列；

所述将所述目标数据序列输入预先训练的、用于预测流量数据的机器学习模型，得到输出结果，包括：

将归一化后的目标数据序列输入预先训练的、用于预测流量数据的机器学习模型，得到输出结果。

第二方面，本发明实施例提供了一种流量波动趋势预测装置，所述装置包括：

序列获取模块，用于获取待预测的目标时间段对应的流量数据序列；其中，所述流量数据序列包括按照时间先后排序的、目标系统在连续多个参考时间段内的实际流量值，所述连续多个参考时间段与所述目标时间段在横向时间维度或纵向时间维度上属于连续时间段；

流量数据预测模块，用于利用所述流量数据序列，按照预定的流量预测方式，确定所述目标系统在所述目标时间段内的预测流量数据；

波动趋势确定模块，用于基于所述预测流量数据，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势；

所述流量数据预测模块包括：

第一计算子模块，用于计算所述流量数据序列的绝对中位差MAD数值；

第二计算子模块，用于计算所述MAD数值与当前时刻的实际流量值的和值，作为所述目标系统在所述目标时间段内的预测流量数据。

可选地，所述波动趋势确定模块包括：

第一确定子模块，用于判断所述预测流量数据和参考流量数据的差值，是否大于第一阈值，如果是，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势为异常趋势，否则，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势为正常趋势；

所述流量数据预测模块包括：

序列获得子模块，用于对所述流量数据序列进行一阶差分处理，得到目标数据序列；

结果确定子模块，用于将所述目标数据序列输入预先训练的、用于预测流量数据的机器学习模型，得到输出结果，作为所述目标系统在所述目标时间段内的预测流量数据；

可选地，所述波动趋势确定模块包括：

第二确定子模块，用于判断所述预测流量数据的绝对值是否大于第二阈值，如果是，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势为异常趋势，否则，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势为正常趋势。

可选地，所述ARMA模型的表达式为：

可选地，所述机器学习模型包括LSTM模型时，所述装置还包括：

归一化模块，用于在所述序列获得子模块对所述流量数据序列进行一阶差分处理，得到目标数据序列之后，所述结果确定子模块将所述目标数据序列输入预先训练的、用于预测流量数据的机器学习模型，得到输出结果之前，对所述目标数据序列进行归一化处理，得到归一化后的目标数据序列；

所述结果确定子模块具体用于：

第三方面，本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现本发明实施例提供的一种流量波动趋势预测方法的步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现本发明实施例所提供的一种流量波动趋势预测方法的步骤。

本发明实施例提供的方案中，考虑到连续多个参考时间段内的流量具有一定的流量规律，因此，采用连续多个参考时间段的实际流量值，构建作为预测依据的流量数据序列，并结合预定的流量预测方式，来确定目标系统在目标时间段内的预测流量数据，可以保证目标系统在目标时间段内的预测流量数据的有效性；进而，考虑到流量波动趋势在横向时间维度上更有价值，因此，基于预测流量数据，预测目标系统在目标时间段内相对于指定时间段的流量波动趋势。可见，通过本方案，可以实现对于网络系统的流量波动趋势进行有效预测的目的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例所提供的一种流量波动趋势预测方法的流程示意图；

图2为本发明实施例所提供的一种流量波动趋势预测方法的另一流程示意图；

图3为本发明实施例所提供的一种流量波动趋势预测方法的另一流程示意图；

图4为本发明实施例所提供的一种流量波动趋势预测装置的结构示意图；

图5为本发明实施例所提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

为了实现对于网络系统的流量波动趋势进行有效预测的目的，本发明实施例提供了一种流量波动趋势预测方法、装置以及电子设备。

其中，本发明实施例所提供的一种流量波动趋势预测方法可以应用于电子设备，该电子设备可以为网络侧的服务器，当然，也可以为存在流量波动趋势预测需求的终端设备，这也是合理的。另外，实现流量波动趋势预测方法的执行主体具体可以为运行于电子设备中的一种流量波动趋势预测装置。

并且，本发明实施例所提及的目标系统可以为任一存在流量监控的网络系统，例如：视频网站、音乐平台、新闻网站等等。另外，需要强调的是，所谓的流量即对于网络系统的访问量。

下面首先对本发明实施例所提供的一种流量波动趋势预测方法进行介绍。

如图1所示，本发明实施例所提供的一种流量波动趋势预测方法，可以包括如下步骤：

S101，获取待预测的目标时间段对应的流量数据序列；

其中，该流量数据序列包括按照时间先后排序的、目标系统在连续多个参考时间段内的实际流量值，该连续多个参考时间段与该目标时间段在横向时间维度或纵向时间维度上属于连续时间段。所谓的按照时间先后排序具体指：时间靠前的参考时间段的实际流量值排列在前，时间靠后的参考时间段的实际流量值排列在后。

可以理解的是，从横向时间维度上，一个时间周期可以被划分为多个时间段，该待预测的目标时间段可以为多个时间段中的一个时间段。举例而言：一个时间为一天，那么，一天可以被划分为24个时间段，此时，该待预测的目标时间段可以为24个时间段中的一个时间段；当然，一天也可以被划分为24*60个时间段，此时，该待预测的目标时间段为24*60个时间段中的一个时间段。

并且，由于后续需利用横向时间维度上该目标时间段的上一时间段的实际流量值，以及，该连续多个参考时间段与该目标时间段可以在横向时间维度上属于连续时间段，因此，在对目标时间段进行预测时，横向时间维度上目标时间段的上一时间段已经结束，这样可以保证能够获知该上一时间段的实际流量值。基于该种分析，针对目标时间段的流量波动趋势预测的触发时间点可以为：该目标时间段的起始时间点，或者，进入该目标时间段一段时长后，这都是合理的。举例而言：假设一天被划分为24个时间段，目标时间段为第4个时间段，那么，针对目标时间段的流量波动趋势预测的触发时间点可以为：作为第4个时间段的起始时间点的03:00，或者，进入第4个时间段30s或1分钟之后，等等。

另外，为了便于理解该连续多个参考时间段与该目标时间段在横向时间维度属于连续时间段，举例而言：假设一天被划分为24个时间段，目标时间段为2020-02-15的第7个时间段，即06:00-07:00，而连续多个参考时间段的数量为4个，此时，该连续多个参考时间段可以包括：2020-02-15的02:00-03:00、03:00-04:00、04:00-05:00、05:00-06:00，可见，该连续多个参考时间段与该目标时间段为横向时间维度上的连续时间段。

为了便于理解该连续多个参考时间段与该目标时间段在纵向时间维度属于连续时间段，举例而言：假设一天被划分为24个时间段，目标时间段为2020-02-15的第7个时间段，即06:00-07:00，而连续多个参考时间段的数量为4个，此时，该连续多个参考时间段可以为：2020-02-11的06:00-07:00、2020-02-12的06:00-07:00、2020-02-13的06:00-07:00、2020-02-14的06:00-07:00，此时，该连续多个参考时间段与该目标时间段为纵向时间维度上的连续时间段。

另外，需要强调的是，连续多个参考时间段的时间段数量可以根据实际情况设定，在此不作限定。例如：该时间段数量可以设定为2个、3个、4个、5个、6个等等。

S102，利用该流量数据序列，按照预定的流量预测方式，确定该目标系统在该目标时间段内的预测流量数据；

在获得该流量数据序列后，可以按照预定的流量预测方式，基于该流量数据序列来确定该目标系统在该目标时间段内的预测流量数据。需要说明的是，考虑到连续多个参考时间段内的流量具有一定的流量规律，因此，采用连续多个参考时间段的实际流量值，构建作为预测依据的流量数据序列，并结合预定的流量预测方式，来确定目标系统在目标时间段内的预测流量数据，可以保证目标系统在目标时间段内的预测流量数据的有效性。

其中，按照不同的流量预测方式所确定出的预测流量数据的数据类型可以不同。举例而言：预测流量数据可以为流量值，也可以为相对于该连续多个参考时间段中与目标时间段最接近的时间段的差异值，或者，对于该差异值进行归一化处理后所得到的值，这都合理的。

其中，利用该流量数据序列，按照预定的流量预测方式，确定该目标系统在该目标时间段内的预测流量数据的具体实现方式存在多种。为了方案清楚及布局清晰，后续结合具体实施例，来对确定该目标系统在该目标时间段内的预测流量数据的具体实现方式进行介绍。

S103，基于该预测流量数据，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势。

其中，该指定时间段为横向时间维度上该目标时间段的上一时间段。

在确定出目标系统在目标时间段内的预测流量数据后，考虑到流量波动趋势在横向时间维度上更有价值，因此，可以基于该预测流量数据，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为正常趋势或异常趋势。具体而言，当差异程度达到指定程度时，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为异常趋势，而当差异程度未达到指定程度时，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为正常趋势。

由于预测流量数据的数据类型可以有多种，因此，为了方便理解方案，后续结合具体实施例，对基于该预测流量数据，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为正常趋势或异常趋势的具体实现方式进行介绍。

下面以该连续多个参考时间段与该目标时间段在纵向时间维度上属于连续时间段为例，对本发明实施例所提供的一种流量波动趋势预测方法进行详细介绍。

如图2所示，本发明实施例所提供的一种流量波动趋势预测方法，可以包括如下步骤：

S201，获取待预测的目标时间段对应的流量数据序列；

其中，该流量数据序列包括按照时间先后排序的、目标系统在连续多个参考时间段内的实际流量值，该连续多个参考时间段与该目标时间段在纵向时间维度上属于连续时间段。

本实施例中，步骤S201与上述实施例的步骤S101类似，区别在于：S201中该连续多个参考时间段与该目标时间段在纵向时间维度上属于连续时间段，而S101中该连续多个参考时间段与该目标时间段在横向时间维度或纵向时间维度上属于连续时间段。

S202，计算该流量数据序列的绝对中位差MAD数值；

可以理解的是，理论上MAD＝median(|x-median(x)|)，即用原数据减去中位数后得到的新数据的绝对值的中位数。但是，在实际应用中，考虑到序列中数据的波动情况，MAD＝K*median(|x-median(x)|)，其中，K为波动系数，也可以称为比例因子常量。K的具体值依赖于分布类型，对于正太分布类型，K＝1.4826。考虑到本发明实施例所涉及的序列中的流量值属于离散型随机变量，而流量数据序列繁多，因此，本发明实施例对于各个流量数据序列统一按照正太分布类型来进行计算。

基于上述分析，计算该流量数据序列的绝对中卫差MAD数值的方式可以包括：

确定该流量数据序列中的中位数，将该流量数据序列中各个实际流量值依次减去所确定的中位数，并求取各个差值的绝对值，然后求取各个绝对值的中位数；

将该各个绝对值的中位数乘以K，得到该流量数据序列的绝对中位差MAD数值。

S203，计算该MAD数值与当前时刻的实际流量值的和值，作为该目标系统在该目标时间段内的预测流量数据；

可以理解的是，该当前时刻的实际流量值为当前时刻至该目标时间段的起始时间点的时间范围内的实际流量值。

S204，基于该预测流量数据，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势；

由于该预测流量数据的数据类型为流量值，因此，示例性地，在一种实现方式种，基于该预测流量数据，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势，可以包括：

判断该预测流量数据和参考流量数据的差值，是否大于第一阈值，如果是，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为异常趋势，否则，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为正常趋势；

其中，参考流量数据为该目标系统在指定时间段内的实际流量值。

其中，该第一阈值可以根据实际情况设定，在此不作限定。

示例性地，在另一种实现方式中，基于该预测流量数据，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势，可以包括：

判断该预测流量数据和参考流量数据的差值，是否大于第一阈值；

当判断结果为是时，判断该预测流量数据是否大于预定流量值，如果是，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为异常趋势，否则，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为正常趋势；

当判断结果为否时，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为正常趋势。

需要强调的是，上述所给出的基于该预测流量数据，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势仅仅作为示例，并不应该构成对本发明实施例的限定。例如：还可以判断该预测流量数据和参考流量数据的差值乘以指定修正系数后所得到的值，是否大于一指定阈值，如果是，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为异常趋势；否则，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为正常趋势。

本发明实施例提供的方案中，考虑到纵向时间维度上连续多个参考时间段内的流量具有一定的流量规律，因此，采用纵向时间维度上连续多个参考时间段的实际流量值，构建作为预测依据的流量数据序列，并结合中位差算法，来确定目标系统在目标时间段内的预测流量数据，可以保证目标系统在目标时间段内的预测流量数据的有效性；进而，考虑到流量波动趋势在横向时间维度上更有价值，因此，通过比对目标时间段和指定时间段的流量值的差值与第一阈值的关系，预测目标系统在目标时间段内相对于指定时间段的流量波动趋势。可见，通过本方案，可以实现对于网络系统的流量波动趋势进行有效预测的目的。

下面以该连续多个参考时间段与该目标时间段在横向时间维度上属于连续时间段为例，对本发明实施例所提供的一种流量波动趋势预测方法进行详细介绍。

如图3所示，本发明实施例所提供的一种流量波动趋势预测方法，可以包括如下步骤：

S301，获取待预测的目标时间段对应的流量数据序列；

其中，该流量数据序列包括按照时间先后排序的、目标系统在连续多个参考时间段内的实际流量值，该连续多个参考时间段与该目标时间段在横向时间维度上属于连续时间段。

本实施例中，步骤S301与上述实施例的步骤S101类似，区别在于：S301中该连续多个参考时间段与该目标时间段在横向时间维度上属于连续时间段，而S101中该连续多个参考时间段与该目标时间段在横向时间维度或纵向时间维度上属于连续时间段。

S302，对该流量数据序列进行一阶差分处理，得到目标数据序列；

其中，对该流量数据序列进行一阶差分处理，得到目标数据序列具体为：

计算该流量数据序列中连续相邻两个实际流量值的差值，利用该差值构成目标数据序列。

示例性，假设该流量数据序列为：{200,300,250,300,350,400}，对该流量数据序列进行一阶差分处理后所得到的目标数据序列为：{100,-50,50,50,50}。

S303，将该目标数据序列输入预先训练的、用于预测流量数据的机器学习模型，得到输出结果，作为该目标系统在该目标时间段内的预测流量数据；

在获得目标序列后，可以利用预先训练的机器学习模型对该目标序列进行预测处理，得到输出结果，作为该目标系统在该目标时间段内的预测流量数据。

其中，该机器学习模型为基于训练样本集训练得到，该训练样本集中包括样本序列，该样本序列包括按照时间先后顺序排列的、该目标系统在连续多个样本时间段内的实际流量值，该连续多个样本时间段为横向时间维度的连续时间段。

另外，需要说明的是，由于需要通过对样本序列进行特定处理，如一阶差分处理，来得到机器学习模型的输入数据和输出数据，该输出数据为监督值，也可以称为真值，因此，该样本序列中连续多个样本时间段比连续多个参考时间段多一个时间段。

其中，该机器学习模型可以包括：自回归滑动平均ARMA模型，或者，长短期记忆网络LSTM模型，当然并不局限于此。

为了方案清楚及布局清晰，后续介绍自回归滑动平均ARMA模型和长短期记忆网络LSTM模型的具体形式，和训练过程等内容。

S304，基于该预测流量数据，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势；

由于该预测流量数据为差异值，那么，示例性地，在一种实现方式种，基于该预测流量数据，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势，可以包括：

判断该预测流量数据的绝对值是否大于第二阈值，如果是，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为异常趋势，否则，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为正常趋势。

其中，该第二阈值可以根据实际情况设定，在此不作限定。

判断该预测流量数据的绝对值与指定修正参数的乘积是否大于第二阈值，如果是，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为异常趋势，否则，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为正常趋势。

需要强调的是，上述所给出的基于该预测流量数据，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势仅仅作为示例，并不应该构成对本发明实施例的限定。

本发明实施例提供的方案中，考虑到横向时间维度上连续多个参考时间段内的流量具有一定的流量规律，因此，采用横向时间维度上连续多个参考时间段的实际流量值，构建作为预测依据的流量数据序列，并利用预先训练地机器学习模型，来确定目标系统在目标时间段内的预测流量数据，可以保证目标系统在目标时间段内的预测流量数据的有效性；进而，考虑到流量波动趋势在横向时间维度上更有价值，因此，通过比对目标时间段的预测流量数据与第二阈值的关系，预测目标系统在目标时间段内相对于指定时间段的流量波动趋势。可见，通过本方案，可以实现对于网络系统的流量波动趋势进行有效预测的目的。

为了方案清楚以及布局清晰，下面介绍ARMA模型的具体形式和训练过程等内容。

其中，该ARMA模型的表达式可以为：

本领域技术人员可以理解的是，针对ARMA模型训练，即确定第一类模型参数、第二类模型参数和第三类模型参数的过程。具体而言，该ARMA模型的训练过程可以包括：

(1)确定初始的ARMA模型，其中，该初始的ARMA模型中第一类模型参数、第二类模型参数和第三类模型参数设置有初始值，并且，该初始的ARMA模型的输入数据是包含p个数值的序列。

(2)获得样本训练集，该样本训练集包括多个样本序列，每个样本序列包括按照时间先后顺序排列的、该目标系统在连续p+2个样本时间段内的实际流量值，该连续p+2个样本时间段为横向时间维度的连续时间段。

示例性的，针对每个时段为1分钟而言，可以统计8:00-10:00的时长内，各个时间段的实际流量值，将多组连续p+2个时间段的实际流量值，按照实现先后顺序，形成样本训练，这样得到多个样本序列，每个样本序列包括连续p+2个实际流量值。

(3)针对每个样本序列，将该样本序列进行一阶差分处理，得到该样本序列对应的备用序列；

由于对样本序列进行一阶差分处理，因此，样本序列对应的备用序列包括p+1个数值。

(4)以每个备用序列中的前p个数值作为输入内容，每个备用序列中的最后一个数值作为输出内容，即真值，对该初始的ARMA模型进行训练，得到训练完成的ARMA模型。

具体而言，将每个备用序列中的前p个数值作为输入内容输入初始的ARMA模型，得到每个备用序列对应的预测结果；基于每个备用序列的预测结果和真值的差异，计算损失值；当损失值小于预定阈值时，表明该ARMA模型收敛，此时，得到训练完成的ARMA模型；当损失值不小于预定阈值时，表明该ARMA模型未收敛，此时，按照预定的调整方式，调整ARMA模型中的第一类模型参数、第二类模型参数和第三类模型参数，并返回将每个备用序列中的前p个数值作为输入内容输入初始的ARMA模型的步骤，直至模型收敛为止。

其中，预定的参数调整方式可以为梯度下降方式或梯度提升方式，等等，本发明实施例对此不作限定。

针对上述过程可知，实现流量波动预测的具体过程如下：

获取待预测的目标时间段对应的流量数据序列，该流量数据序列包括：按照实现先后排序的、目标系统的连续p+1个参考时间段的实际流量值；该连续多个参考时间段与该目标时间段在横向时间维度上属于连续时间段；

对该流量数据序列进行一阶差分处理，得到目标数据序列，该目标数据序列中包括p个数值；

将该目标数据序列作为输入内容，输入至预先训练的ARMA模型，得到输出结果，作为预测流量数据；其中，该输出结果为目标时间段相对于指定时间段的差异值；

下面介绍LSTM模型的具体形式和训练过程等内容。

本发明实施例中，LSTM模型的模型结构可以采用现有技术中存在的任一种结构。其中，对于LSTM模型的训练过程，可以包括如下步骤：

(1)确定初始的LSTM模型，其中，该初始的LSTM模型中各个模型参数设置有初始值，并且，设定该初始的LSTM模型的输入数据是包含P个数值的序列。

(4)以每个备用序列中的前p个数值作为输入内容，每个备用序列中的最后一个数值作为输出内容，即真值，对该初始的LSTM模型进行训练，得到训练完成的LSTM模型。

具体而言，将每个备用序列中的前p个数值作为输入内容输入初始的LSTM模型，得到每个备用序列对应的预测结果；基于每个备用序列的预测结果和真值的差异，计算损失值；当损失值小于预定阈值时，表明该LSTM模型收敛，此时，得到训练完成的LSTM模型；当损失值不小于预定阈值时，表明该LSTM模型未收敛，此时，按照预定的调整方式，调整LSTM模型中的各个模型参数，并返回将每个备用序列中的前p个数值作为输入内容输入初始的LSTM模型的步骤，直至模型收敛为止。

针对上述过程可知，实现流量波动预测的具体过程如下：

将该目标数据序列作为输入内容，输入至预先训练的LSTM模型，得到输出结果，作为预测流量数据；其中，该输出结果为目标时间段相对于指定时间段的差异值；

判断该预测流量数据的绝对值是否大于第二阈值，如果是，预测该目标系统在该目标时间段内相对于指定时间段的流量波动趋势为异常趋势，否则，预测i目标系统在该目标时间段内相对于指定时间段的流量波动趋势为正常趋势。

另外，为了提升训练速率，以每个备用序列中的前p个数值作为输入内容，每个备用序列中的最后一个数值作为输出内容，即真值，对该初始的LSTM模型进行训练之前，可以对每个备用序列进行归一化处理，得到新的备用序列，然后以各个新的备用序列中的前p个数值作为输入内容，每个新的备用序列中的最后一个数值作为输出内容，即真值，对该初始的LSTM模型进行训练。

相应的，在流量波动趋势预测过程中，在对所述流量数据序列进行一阶差分处理，得到目标数据序列之后，将所述目标数据序列输入预先训练的、用于预测流量数据的机器学习模型，得到输出结果之前，所述方法还可以包括：

对该目标数据序列进行归一化处理，得到归一化后的目标数据序列；

所述将该目标数据序列输入预先训练的、用于预测流量数据的机器学习模型，得到输出结果，包括：

相应于上述方法实施例，本发明实施例还提供了一种流量波动趋势预测装置。如图4所示，本发明实施例所提供的一种流量波动趋势预测装置，可以包括：

序列获取模块410，用于获取待预测的目标时间段对应的流量数据序列；其中，所述流量数据序列包括按照时间先后排序的、目标系统在连续多个参考时间段内的实际流量值，所述连续多个参考时间段与所述目标时间段在横向时间维度或纵向时间维度上属于连续时间段；

流量数据预测模块420，用于利用所述流量数据序列，按照预定的流量预测方式，确定所述目标系统在所述目标时间段内的预测流量数据；

波动趋势确定模块430，用于基于所述预测流量数据，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势；

所述流量数据预测模块420可以包括：

可选地，在所述流量数据预测模块420包括第一计算子模块和第二计算子模块的前提下，所述波动趋势确定模块430可以包括：

所述流量数据预测模块420可以包括：

可选地，所述流量数据预测模块420包括序列获得子模块和结果确定子模块时，所述波动趋势确定模块430可以包括：

可选地，所述ARMA模型的表达式为：

所述结果确定子模块具体用于：

相应于上述方法实施例，本发明实施例还提供了一种电子设备，如图5所示，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信，

存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现本发明实施例所提供的流量波动趋势预测方法的步骤。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述实施例中任一所述的流量波动趋势预测方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的流量波动趋势预测方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种流量波动趋势预测方法，其特征在于，所述方法包括：

获取待预测的目标时间段对应的流量数据序列；其中，所述流量数据序列包括按照时间先后排序的、目标系统在连续多个参考时间段内的实际流量值，所述连续多个参考时间段与所述目标时间段在横向时间维度或纵向时间维度上属于连续时间段；所述横向时间维度上属于连续时间段的时间段为：一个时间周期中按照时间先后顺序相连接续的时间段，所述纵向时间维度上属于连续时间段的时间段为：不同时间周期中属于同一时间范围的时间段；

2.根据权利要求1所述的方法，其特征在于，所述连续多个参考时间段与所述目标时间段在纵向时间维度上属于连续时间段；

计算所述流量数据序列的绝对中位差MAD数值；

3.根据权利要求2所述的方法，其特征在于，所述基于所述预测流量数据，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势，包括：

4.根据权利要求1所述的方法，其特征在于，所述连续多个参考时间段与所述目标时间段在横向时间维度上属于连续时间段；

5.根据权利要求4所述的方法，其特征在于，所述基于所述预测流量数据，预测所述目标系统在所述目标时间段内相对于指定时间段的流量波动趋势，包括：

6.根据权利要求4所述的方法，其特征在于，所述机器学习模型包括：自回归滑动平均ARMA模型，或者，长短期记忆网络LSTM模型。

7.根据权利要求6所述的方法，其特征在于，所述ARMA模型的表达式为：

8.根据权利要求6所述的方法，其特征在于，所述机器学习模型包括LSTM模型时，在对所述流量数据序列进行一阶差分处理，得到目标数据序列之后，将所述目标数据序列输入预先训练的、用于预测流量数据的机器学习模型，得到输出结果之前，所述方法还包括：

9.一种流量波动趋势预测装置，其特征在于，所述装置包括：

序列获取模块，用于获取待预测的目标时间段对应的流量数据序列；其中，所述流量数据序列包括按照时间先后排序的、目标系统在连续多个参考时间段内的实际流量值，所述连续多个参考时间段与所述目标时间段在横向时间维度或纵向时间维度上属于连续时间段；所述横向时间维度上属于连续时间段的时间段为：一个时间周期中按照时间先后顺序相连接续的时间段，所述纵向时间维度上属于连续时间段的时间段为：不同时间周期中属于同一时间范围的时间段；

10.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-8任一所述的方法步骤。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-8任一所述的方法步骤。