CN113268403B

CN113268403B - 时间序列的分析预测方法、装置、设备及存储介质

Info

Publication number: CN113268403B
Application number: CN202110572876.3A
Authority: CN
Inventors: 金叶; 徐锐; 沈松; 王柯; 朱威; 张皞; 武晓頔; 李东佩
Original assignee: China United Network Communications Group Co Ltd
Current assignee: China United Network Communications Group Co Ltd
Priority date: 2021-05-25
Filing date: 2021-05-25
Publication date: 2023-10-31
Anticipated expiration: 2041-05-25
Also published as: CN113268403A

Abstract

本申请提供一种时间序列的分析预测方法、装置、设备及存储介质，其中，该方法提供一种简单的时间序列分析预测方法，通过预设分析预测模型对目标服务器的时间序列数据的临界值进行预测，上述预设分析预测模型通过参考服务器的上述时间序列数据，以及参考服务器的上述时间序列数据对应的在预设时间的临界值训练得到，进而，获取上述时间序列数据的预测临界值，其中，预测过程中无需时间序列达到平稳状态，解决现有使用差分自回归移动平均模型进行时间序列分析预测，存在的模型构建过程较为繁琐，且要求时间序列是平稳非白噪声时间序列的问题。

Description

时间序列的分析预测方法、装置、设备及存储介质

技术领域

本申请涉及设备运维技术领域，尤其涉及一种时间序列的分析预测方法、装置、设备及存储介质。

背景技术

随机经济的不断发展，各大运营商在落地云服务的过程中，设置了越来越多的服务器资源。因此，如何有效维护这些服务器以及高效利用所有服务器资源成为各大运营商关注的重点和难点。

相关技术中，服务器在长期运行过程中，各项负载监控指标，例如中央处理器(Central Processing Unit，CPU)使用率、内存使用率等，会产生大量的时间序列数据。技术人员采用分析预测方法对这些时间序列数据进行分析预测，例如分析预测出下一时刻的临界值(如CPU使用率最大值、内存使用率最小值等)。从而，技术人员可以基于上述分析预测结果指导服务器的运维工作，并尽可能实现对服务器资源的高效利用。其中，现有技术人员主要采用的分析预测方法是基于差分自回归移动平均模型的时间序列分析预测方法。

但是，上述差分自回归移动平均模型的构建过程较为繁琐，而且，差分自回归移动平均模型要求时间序列是平稳非白噪声时间序列。如果时间序列不能达到平稳状态，则无法使用差分自回归移动平均模型。因此，如何提供一种简单的时间序列分析预测方法，并且不管时间序列是否达到平稳状态都能基于该时间序列进行后续分析预测，成为一个急需解决的问题。

发明内容

为解决现有技术中存在的问题，本申请提供一种时间序列的分析预测方法、装置、设备及存储介质。

第一方面，本申请实施例提供一种时间序列的分析预测方法，该方法包括如下步骤：

获取目标服务器的时间序列数据，所述时间序列数据包括CPU使用率时间序列、内存使用率时间序列、平均输入输出(input/output，IO)请求次数时间序列、网卡每秒接收字节数时间序列和网卡每秒发送字节数时间序列中一个或多个；

将所述目标服务器的所述时间序列数据输入预设分析预测模型，所述预设分析预测模型通过参考服务器的所述时间序列数据，以及所述参考服务器的所述时间序列数据对应的在预设时间的临界值训练得到，所述临界值包括最大值和/或最小值；

根据所述预设分析预测模型的输出，获得所述目标服务器的所述时间序列数据的预测临界值。

在一种可能的实现方式中，在所述将所述目标服务器的所述时间序列数据输入预设分析预测模型之前，还包括：

对所述目标服务器的所述时间序列数据进行预处理，所述预处理包括数据去重、时间序列集划分、数据类型转换、缺失值填充、时间序列特征提取、时间序列特征构造、独热编码(One-Hot编码)和数据融合中一个或多个；

所述将所述目标服务器的所述时间序列数据输入预设分析预测模型，包括：

将预处理后的时间序列数据输入所述预设分析预测模型。

在一种可能的实现方式中，所述预处理包括所述时间序列特征提取和所述时间序列特征构造；

所述对所述目标服务器的所述时间序列数据进行预处理，包括：

提取所述目标服务器的所述时间序列数据的第一序列特征，以及所述目标服务器的所述时间序列数据对应的历史时间序列数据的第二序列特征；

根据所述第一序列特征和所述第二序列特征，确定预设特征变量的值，所述预设特征变量包括是周几、是否是工作日、是否是周末和是否是节假日中一个或多个；

根据所述预设特征变量的值，进行时间序列特征构造。

在一种可能的实现方式中，在所述根据所述预设分析预测模型的输出，获得所述目标服务器的所述时间序列数据的预测临界值之后，还包括：

获取所述目标服务器的所述时间序列数据对应的实际临界值；

根据所述实际临界值和所述预测临界值，确定所述预设分析预测模型的预测准确率。

在一种可能的实现方式中，所述根据所述实际临界值和所述预测临界值，确定所述预设分析预测模型的预测准确率，包括：

计算所述实际临界值与所述预测临界值的差值；

根据所述差值，确定所述预设分析预测模型的预测准确率。

在一种可能的实现方式中，在所述根据所述实际临界值和所述预测临界值，确定所述预设分析预测模型的预测准确率之后，还包括：

若所述预测准确率低于预设准确率阈值，则生成所述预设分析预测模型不可信的提示，并根据所述参考服务器的所述时间序列数据，以及所述参考服务器的所述时间序列数据对应的在所述预设时间的临界值，重新对所述预设分析预测模型进行训练。

第二方面，本申请实施例提供一种时间序列的分析预测装置，包括：

获取模块，用于获取目标服务器的时间序列数据，所述时间序列数据包括CPU使用率时间序列、内存使用率时间序列、平均IO请求次数时间序列、网卡每秒接收字节数时间序列和网卡每秒发送字节数时间序列中一个或多个；

输入模块，用于将所述目标服务器的所述时间序列数据输入预设分析预测模型，所述预设分析预测模型通过参考服务器的所述时间序列数据，以及所述参考服务器的所述时间序列数据对应的在预设时间的临界值训练得到，所述临界值包括最大值和/或最小值；

预测模块，用于根据所述预设分析预测模型的输出，获得所述目标服务器的所述时间序列数据的预测临界值。

在一种可能的实现方式中，所述输入模块，具体用于：

对所述目标服务器的所述时间序列数据进行预处理，所述预处理包括数据去重、时间序列集划分、数据类型转换、缺失值填充、时间序列特征提取、时间序列特征构造、One-Hot编码和数据融合中一个或多个；

将预处理后的时间序列数据输入所述预设分析预测模型。

所述输入模块，具体用于：

根据所述预设特征变量的值，进行时间序列特征构造。

在一种可能的实现方式中，还包括评估模块，用于在所述预测模块根据所述预设分析预测模型的输出，获得所述目标服务器的所述时间序列数据的预测临界值之后，获取所述目标服务器的所述时间序列数据对应的实际临界值；

在一种可能的实现方式中，所述评估模块，具体用于：

计算所述实际临界值与所述预测临界值的差值；

根据所述差值，确定所述预设分析预测模型的预测准确率。

在一种可能的实现方式中，所述评估模块，还用于：

第三方面，本申请实施例提供一种时间序列的分析预测设备，包括：

处理器；

存储器；以及

计算机程序；

其中，所述计算机程序被存储在所述存储器中，并且被配置为由所述处理器执行，所述计算机程序包括用于执行如第一方面所述的方法的指令。

第四方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序使得服务器执行第一方面所述的方法。

第五方面，本申请实施例提供一种计算机程序产品，包括计算机指令，所述计算机指令被处理器执行第一方面所述的方法。

本申请实施例提供的时间序列的分析预测方法、装置、设备及存储介质，该方法通过获取目标服务器的时间序列数据，该时间序列数据包括CPU使用率时间序列、内存使用率时间序列、平均IO请求次数时间序列、网卡每秒接收字节数时间序列和网卡每秒发送字节数时间序列中一个或多个，进而，将目标服务器的上述时间序列数据输入预设分析预测模型，根据该预设分析预测模型的输出，获得目标服务器的上述时间序列数据的预测临界值，其中，上述预设分析预测模型通过参考服务器的上述时间序列数据，以及参考服务器的上述时间序列数据对应的在预设时间的临界值训练得到，该临界值包括最大值和/或最小值，即本申请实施例提供一种简单的时间序列分析预测方法，通过上述预设分析预测模型对目标服务器的时间序列数据的临界值进行预测，进而获取该时间序列数据的预测临界值，其中，预测过程中无需时间序列达到平稳状态，解决现有使用差分自回归移动平均模型进行时间序列分析预测，存在的模型构建过程较为繁琐，且要求时间序列是平稳非白噪声时间序列的问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的时间序列的分析预测系统架构示意图；

图2为本申请实施例提供的一种时间序列的分析预测方法的流程示意图；

图3为本申请实施例提供的一种缺失值填充的示意图；

图4为本申请实施例提供的一种利用预设分析预测模型进行时间序列的分析预测的示意图；

图5为本申请实施例提供的另一种时间序列的分析预测方法的流程示意图；

图6为本申请实施例提供的一种时间序列的分析预测装置的结构示意图；

图7为本申请实施例提供的另一种时间序列的分析预测装置的结构示意图；

图8A提供本申请所述时间序列的分析预测设备的一种可能的基本硬件架构；

图8B提供本申请所述时间序列的分析预测设备的另一种可能的基本硬件架构。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”及“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

相关技术中，服务器在长期运行过程中，各项负载监控指标，例如CPU使用率、内存使用率等，会产生大量的时间序列数据。技术人员采用分析预测方法对这些时间序列数据进行分析预测，例如分析预测出下一时刻的临界值(如CPU使用率最大值、内存使用率最小值等)。从而，技术人员可以基于上述分析预测结果指导服务器的运维工作，并尽可能实现对服务器资源的高效利用。

现有技术人员主要采用的分析预测方法是基于差分自回归移动平均模型的时间序列分析预测方法。基于差分自回归移动平均模型：此模型要求时间序列是平稳非白噪声时间序列，需要先通过ADF单位根平稳性检验法或绘图观察法对时间序列的平稳性进行检验，再用Ljung-Box自相关检验对时间序列进行白噪声检验。对于不平稳的时间序列，上述模型需要通过d阶差分运算或者取对数操作得到平稳的时间序列。对于平稳的非白噪声序列，上述模型通过自相关函数和偏自相关函数得到模型的p、d、q值，从而进行后续时间序列分析预测。

然而，上述差分自回归移动平均模型的构建过程较为繁琐，而且，差分自回归移动平均模型要求时间序列是平稳非白噪声时间序列。如果时间序列不能达到平稳状态，则无法使用差分自回归移动平均模型。

为了解决上述问题，本申请实施例提出一种简单的时间序列的分析预测方法，可以通过预设分析预测模型对目标服务器的时间序列数据的临界值进行预测，进而获取该时间序列数据的预测临界值，其中，预测过程中无需时间序列达到平稳状态，解决现有使用差分自回归移动平均模型进行时间序列分析预测，存在的模型构建过程较为繁琐，且要求时间序列是平稳非白噪声时间序列的问题。

可选地，本申请提供的一种时间序列的分析预测方法，可以适用于图1所示的时间序列的分析预测系统架构示意图，如图1所示，该系统可以包括接收装置101、处理装置102和显示装置103中至少一种。

在具体实现过程中，接收装置101可以是输入/输出接口，也可以是通信接口，可以用于接收目标服务器的时间序列数据，该时间序列数据包括CPU使用率时间序列、内存使用率时间序列、平均IO请求次数时间序列、网卡每秒接收字节数时间序列和网卡每秒发送字节数时间序列中一个或多个。

处理装置102可以通过上述接收装置101获取上述目标服务器的时间序列数据，也可以直接从运营商的数据库中获取上述目标服务器的时间序列数据，进而，通过上述预设分析预测模型对目标服务器的时间序列数据的临界值进行预测，获取该时间序列数据的预测临界值，其中，预测过程中无需时间序列达到平稳状态，解决现有使用差分自回归移动平均模型进行时间序列分析预测，存在的模型构建过程较为繁琐，且要求时间序列是平稳非白噪声时间序列的问题。

显示装置103可以用于对上述目标服务器的时间序列数据、该时间序列数据的预测临界值等进行显示。

显示装置还可以是触摸显示屏，用于在显示的上述内容的同时接收用户指令，以实现与用户的交互。

应理解，上述处理器可以通过处理器读取存储器中的指令并执行指令的方式实现，也可以通过芯片电路实现。

上述系统仅为一种示例性系统，具体实施时，可以根据应用需求设置。

可以理解的是，本申请实施例示意的结构并不构成对时间序列的分析预测系统架构的具体限定。在本申请另一些可行的实施方式中，上述架构可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置，具体可根据实际应用场景确定，在此不做限制。图1所示的部件可以以硬件，软件，或软件与硬件的组合实现。

另外，本申请实施例描述的系统架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着系统架构的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

下面以几个实施例为例对本申请的技术方案进行描述，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图2为本申请实施例提供了一种时间序列的分析预测方法的流程示意图，该方法可以由任意执行时间序列的分析预测方法的装置来执行，该装置可以通过软件和/或硬件实现。如图2所示，在图1所示系统架构的基础上，本申请实施例提供的时间序列的分析预测可以包括如下步骤：

S201：获取目标服务器的时间序列数据，该时间序列数据包括CPU使用率时间序列、内存使用率时间序列、平均IO请求次数时间序列、网卡每秒接收字节数时间序列和网卡每秒发送字节数时间序列中一个或多个。

在本申请实施例中以执行主体为图1中上述处理装置为例，上述处理装置获取目标服务器的时间序列数据，其中，目标服务器可以为需要对服务器的时间序列进行分析预测的服务器，可以根据实际情况确定。

示例性的，上述处理装置可以从运营商Hive数据库中获取目标服务器的时间序列数据，例如5个指标(CPU使用率、内存使用率、平均IO请求次数、网卡每秒接收字节数和网卡每秒发送字节数)的2个月的时间序列数据，该时间序列数据可以包括如下字段：采集日期(data_date)、采集小时(data_hour)、服务器IP(ip)、最大值(max_value)、最小值(min_value)、平均值(avg_value)等。例如如表1所示，一个指标(例如CPU使用率、内存使用率、平均IO请求次数、网卡每秒接收字节数或网卡每秒发送字节数)的时间序列包含5个特征：采集日期、采集小时、最大值、最小值和平均值。

表1

采集日期	采集小时	最大值	最小值	平均值
					2019/8/26	0	42.9	0.59	18.695

S202：将上述目标服务器的上述时间序列数据输入预设分析预测模型，该预设分析预测模型通过参考服务器的上述时间序列数据，以及上述参考服务器的上述时间序列数据对应的在预设时间的临界值训练得到，该临界值包括最大值和/或最小值。

其中，上述处理装置可以将上述目标服务器的上述时间序列数据输入预设分析预测模型，从而，根据该预设分析预测模型的输出，获得上述目标服务器的上述时间序列数据的预测临界值。

这里，上述参考服务器的上述时间序列数据可以为任意已知服务器的上述时间序列数据，上述参考服务器的上述时间序列数据对应的在预设时间的临界值可以为上述参考服务器的上述时间序列数据对应的在预设时间的实际临界值。其中，上述预设时间可以根据时间情况确定，例如上述参考服务器的上述时间序列数据的采集日期是2019/8/26，上述预设时间可以是2019/8/27，即上述参考服务器的上述时间序列数据对应的在预设时间的临界值可以为上述参考服务器的上述时间序列数据对应的在2019/8/27的临界值。

另外，为了提高后续时间序列的分析预测的准确率，上述处理装置在将上述目标服务器的上述时间序列数据输入预设分析预测模型之前，可以对上述目标服务器的上述时间序列数据进行预处理，该预处理包括数据去重、时间序列集划分、数据类型转换、缺失值填充、时间序列特征提取、时间序列特征构造、One-Hot编码和数据融合中一个或多个。

示例性的，上述预处理包括数据去重。上述处理装置在将上述目标服务器的上述时间序列数据输入预设分析预测模型之前，可以检测上述目标服务器的上述时间序列数据是否有重复数据，如果有，对上述目标服务器的上述时间序列数据进行去重处理。

其中，上述处理装置在检测上述目标服务器的上述时间序列数据是否有重复数据时，可以基于该时间序列数据包括的字段，例如采集日期和采集小时检测。如果检测到某一指标(CPU使用率、内存使用率、平均IO请求次数、网卡每秒接收字节数和网卡每秒发送字节数)的时间序列数据中有相同的采集日期和采集小时，则上述处理装置判断有重复数据，进行去重处理。

例如如表2所示，一个指标的两个时间序列，采集日期和采集小时相同，则上述处理装置判断有重复数据。

表2

采集日期	采集小时	最大值	最小值	平均值
					2019/8/26	0	42.9	0.59	18.695
2019/8/26	0	42.9	0.1	17.555

在本申请实施例中，上述预处理还可以包括时间序列集划分。上述处理装置在将上述目标服务器的上述时间序列数据输入预设分析预测模型之前，可以根据不同指标(CPU使用率、内存使用率、平均IO请求次数、网卡每秒接收字节数和网卡每秒发送字节数)的时间序列数据，进行时间序列集划分，例如一个人指标的时间序列数据划分到一个时间序列集中。另外，上述处理装置还可以获取上述目标服务器的IP，根据服务器的IP和上述不同指标，对多个服务器的时间序列数据进行划分。例如，令服务器的IP为i1,i2,i3,……，CPU使用率、内存使用率、平均IO请求次数、网卡每秒接收字节数和网卡每秒发送字节数的指标ID为x1,x2,x3,x4,x5。当IP＝i1，ID＝x1时，得到一台服务器某一指标(例如CPU使用率)的时间序列数据，将其划分到一个时间序列集中。

这里，上述预处理还可以包括数据类型转换。上述预设分析预测模型要求输入模型的数据的类型是预设类型，上述处理装置在将上述目标服务器的上述时间序列数据输入预设分析预测模型之前，可以检测上述目标服务器的上述时间序列数据的类型是否为预设类型，如果不是，则进行数据类型转换。其中，由上述可知，一个指标的时间序列数据包括字段：采集日期、采集小时、最大值、最小值、平均值等。这里不同的字段的类型可能不同，上述预设类型可以包括多种类型。例如上述采集日期对应的预设类型可以是日期型，上述最大值对应的预设类型可以是float64等。上述处理装置检测上述目标服务器的上述时间序列数据中的采集日期是否为日期型，最大值是否为float64等，如果不是，则行数据类型转换。

上述预处理还可以包括缺失值填充。为了使后续处理中数据连续，上述处理装置在将上述目标服务器的上述时间序列数据输入预设分析预测模型之前，可以对上述目标服务器的上述时间序列数据进行缺失值填充，例如当某天的值整体缺失时，采用众数填充法进行填充；当某天的值部分缺失时，用0填充。如图3所示，上述处理装置检测第T日数据是否整体缺失，如果是整体缺失，计算T-30的日期，判断(T-30,T)区间的数据是否存在。如果存在，第T日第H小时数据用(T-30,T)区间内所有第H小时的众数填充。如果不存在，第T日第H小时数据用0填充。另外，如果第T日数据不是整体缺失，上述处理装置检测第T日第H小时数据是否缺失，如果是，第H小时数据用0填充。

上述预处理还可以包括时间序列特征提取和时间序列特征构造。上述处理装置在将上述目标服务器的上述时间序列数据输入预设分析预测模型之前，可以提取上述目标服务器的上述时间序列数据的第一序列特征，以及上述目标服务器的上述时间序列数据对应的历史时间序列数据的第二序列特征，进而，根据第一序列特征和第二序列特征，确定预设特征变量的值，该预设特征变量包括是周几、是否是工作日、是否是周末和是否是节假日中一个或多个，从而，根据上述预设特征变量的值，进行时间序列特征构造。其中，上述历史时间序列数据可以根据实际情况确定，例如当天的前m天前n小时的历史时间序列数据。

示例性的，上述处理装置可以令采集日期为d1,d2,…,di,…,d60，采集小时为h0,h1,…,hj,…(0<＝h0,h1,…hj,…,h23<＝23)，其中，h0＝0,h1＝1,h2＝2,……，对某一指标进行特征提取的方法如下：

对每一条数据T＝di,H＝hj，提取该天该小时前P天前Q小时(1<＝P<＝30,0<＝Q<＝24)的数据扩充为该天该小时的特征，扩充后第di日第hj时的数据集合由如下两部分组成：

(1)第di日第hj时原始特征(第一序列特征)：{di,hj,max_value,min_value,avg_value}；

(2)第di日第hj时前m天前n小时特征(第二序列特征)(i-P<＝m<＝i-1,j-Q<＝n<＝j，m、n取遍区间内的所有整数)：{di-m,hj-n,max_value(i-m,j-n),min_value(i-m,j-n),avg_value(i-m,j-n)}。

在上面提取特征基础上，上述处理装置继续进行特征构造，特征构造方法如下：

令变量day标识该天是周几，day∈{x|1<＝x<＝7}，变量work_day标识该天是否是工作日，work_day∈{0,1}，变量week_day标识该天是否是周末，week_day∈{0,1}，变量holiday标识该天是否是节假日，holiday∈{0,1}，通过日期序列d1,d2,…,di,…,d60计算出当T＝di时，第T天是周几、是否是工作日、是否周末、是否节假日。第T＝di天的数据构造方法如下：

构造第T＝di天的本体特征：当天周几、当天是否工作日、当天是否周末、当天是否节假日，即{daydi,work_daydi,week_daydi,holidaydi}

构造第T＝di-1天的本体特征：昨天是周几、昨天是否是工作日、昨天是否是周末、昨天是否是节假日，即{daydi-1,work_daydi-1,week_daydi-1,holidaydi-1}

构造第T＝di+1天的本体特征：明天是周几、明天是否是工作日、明天是否是周末、明天是否是节假日，即{daydi+1,work_daydi+1,week_daydi+1,holidaydi+1}

将di、di-1、di+1天的特征合并，形成第T＝di天的数据集：

{daydi-1,work_daydi-1,week_daydi-1,holidaydi-1,daydi,work_daydi，week_daydi,holidaydi,daydi+1,work_daydi+1,week_daydi+1,holidaydi+1}

另外，上述预处理还可以包括One-Hot编码和数据融合。上述处理装置在将上述目标服务器的上述时间序列数据输入预设分析预测模型之前，可以利用One-Hot编码对数据集进行进一步扩充，这里以进行上述时间序列特征提取和时间序列特征构造后的数据为例，上述处理装置扩充的方法为：

将数据集中需要进行One-Hot编码的数据字段挑选出来，主要有如下字段：{T,H,dm,hn,daydi-1,work_daydi-1,week_daydi-1,holidaydi-1,daydi,work_daydi,week_daydi,holidaydi,daydi+1,work_daydi+1,week_daydi+1,holidaydi+1},其中，1<＝i<＝60,0<＝j<＝23,i-P<＝m<＝i-1,j-Q<＝n<＝j，1<＝P<＝30,0<＝Q<＝24。

然后，对这些字段进行分类，不同的类别采用不同的One-Hot编码方式。该数据集字段主要分为4类：日期类、小时类、周类、布尔类。这些类别的One-Hot编码方式如下：

对于日期类字段，一个字段可以扩充为一个31维的值，当天是几号就在第几维标1，其余维取0。日期类字段共有P+1个，经过One-Hot编码后扩充为(P+1)×31维。例如，当P＝4时，日期类字段由5维扩充为155维。

对于小时类字段，一个字段可以扩充为24维的值，当前是第几小时就在第几维取1，其余小时取0。小时类字段共有P×Q+1个，经过One-Hot编码后扩充为(P×Q+1)×24维。例如，当P＝4，Q＝4时，小时类字段由17维扩充为408维。

对于周类字段，一个字段可以扩充为7维的值，当天是周几，就在第几维取1，其余小时取0。周类字段共有P+1个，经过One-Hot编码后扩充为(P+1)×7维。例如，当P＝4时，周类字段由5维扩充为35维。

对于布尔类字段，一个字段可以扩充为2维的值。布尔类字段共有9个，经过One-Hot编码后扩充为9×2维。

在上述扩充后，上述处理装置进行数据融合的方法如下：

按照prop_id字段对原始数据集进行划分，一共5个指标，划分成5个数据块。对于每个指标的数据块，进一步按照data_hour字段划分成24个小时数据块。对于每个小时数据块，按照日期划分成单条数据，一条数据对应某天某小时的数据。即第h小时数据块的数据是时间序列中所有第h小时的数据集合。对prop_id字段进行One-Hot编码。

S203：根据上述预设分析预测模型的输出，获得上述目标服务器的上述时间序列数据的预测临界值。

示例性的，上述处理装置利用上述预设分析预测模型进行时间序列数据分析的过程可以如图4所示，首先上述处理装置获取上述目标服务器的时间序列数据，输入上述预设分析预测模型，进而，获得上述目标服务器的时间序列数据的预测临界值。

在获得上述目标服务器的时间序列数据的预测临界值之后，上述处理装置可以根据该预测临界值，指导服务器的运维工作，并尽可能实现对服务器资源的高效利用。

本申请实施例，通过获取目标服务器的时间序列数据，该时间序列数据包括CPU使用率时间序列、内存使用率时间序列、平均IO请求次数时间序列、网卡每秒接收字节数时间序列和网卡每秒发送字节数时间序列中一个或多个，进而，将目标服务器的上述时间序列数据输入预设分析预测模型，根据该预设分析预测模型的输出，获得目标服务器的上述时间序列数据的预测临界值，其中，上述预设分析预测模型通过参考服务器的上述时间序列数据，以及参考服务器的上述时间序列数据对应的在预设时间的临界值训练得到，该临界值包括最大值和/或最小值，即本申请实施例提供一种简单的时间序列分析预测方法，通过上述预设分析预测模型对目标服务器的时间序列数据的临界值进行预测，进而获取该时间序列数据的预测临界值，其中，预测过程中无需时间序列达到平稳状态，解决现有使用差分自回归移动平均模型进行时间序列分析预测，存在的模型构建过程较为繁琐，且要求时间序列是平稳非白噪声时间序列的问题。

另外，本申请实施例在上述根据上述预设分析预测模型的输出，获得上述目标服务器的上述时间序列数据的预测临界值之后，上述处理装置还考虑对预设分析预测模型进行评估。图5为本申请实施例提出的另一种时间序列的分析预测方法的流程示意图。如图5所示，该方法包括：

S501：获取目标服务器的时间序列数据，该时间序列数据包括CPU使用率时间序列、内存使用率时间序列、平均IO请求次数时间序列、网卡每秒接收字节数时间序列和网卡每秒发送字节数时间序列中一个或多个。

S502：将上述目标服务器的上述时间序列数据输入预设分析预测模型，该预设分析预测模型通过参考服务器的上述时间序列数据，以及上述参考服务器的上述时间序列数据对应的在预设时间的临界值训练得到，该临界值包括最大值和/或最小值。

S503：根据上述预设分析预测模型的输出，获得上述目标服务器的上述时间序列数据的预测临界值。

其中，步骤S501-S503参见上述步骤S201-S203的相关描述，此处不再赘述。

S504：获取上述目标服务器的上述时间序列数据对应的实际临界值。

S505：根据上述实际临界值和上述预测临界值，确定上述预设分析预测模型的预测准确率。

这里，上述处理装置可以计算上述实际临界值与上述预测临界值的差值，进而，根据该差值，确定上述预设分析预测模型的预测准确率。

示例性的，上述处理装置可以在计算上述实际临界值与上述预测临界值的差值后，利用下述公式，计算均方根误差(RMSE)：

其中，n为测试样本的数量，yi为获取的实际临界值，为模型的预测临界值。

上述处理装置根据上述RMSE，确定上述预设分析预测模型的预测准确率。RMSE越小，说明预测值与实际值相差越小，模型准确率越高，模型预测越准。

另外，上述处理装置在根据上述实际临界值和预测临界值，确定上述预设分析预测模型的预测准确率之后，如果该预测准确率低于预设准确率阈值，可以生成预设分析预测模型不可信的提示，并根据上述参考服务器的上述时间序列数据，以及上述参考服务器的上述时间序列数据对应的在上述预设时间的临界值，重新对上述预设分析预测模型进行训练。

其中，上述预设准确率阈值可以根据实际情况确定。上述处理装置在上述预设分析预测模型的预测准确率较低时，生成相应提示，并重新对上述预设分析预测模型进行训练，以使后续使用重新训练的模型进行时间序列的分析预测，提高后续处理的准确率。

本申请实施例中，在上述根据上述预设分析预测模型的输出，获得上述目标服务器的上述时间序列数据的预测临界值之后，上述处理装置还考虑对预设分析预测模型进行评估，以基于评估结果进行相应优化，例如如果评估模型准确率较低，则重新对模型进行训练，提高后续处理的准确率。而且，本申请实施例提供一种简单的时间序列分析预测方法，通过上述预设分析预测模型对目标服务器的时间序列数据的临界值进行预测，进而获取该时间序列数据的预测临界值，其中，预测过程中无需时间序列达到平稳状态，解决现有使用差分自回归移动平均模型进行时间序列分析预测，存在的模型构建过程较为繁琐，且要求时间序列是平稳非白噪声时间序列的问题。

对应于上文实施例的时间序列的分析预测方法，图6为本申请实施例提供的时间序列的分析预测装置的结构示意图。为了便于说明，仅示出了与本申请实施例相关的部分。图6为本申请实施例提供的一种时间序列的分析预测装置的结构示意图，该时间序列的分析预测装置60包括：获取模块601、输入模块602以及预测模块603。这里的时间序列的分析预测装置可以是上述处理装置本身，或者是实现上述处理装置的功能的芯片或者集成电路。这里需要说明的是，获取模块、输入模块以及预测模块的划分只是一种逻辑功能的划分，物理上两者可以是集成的，也可以是独立的。

其中，获取模块601，用于获取目标服务器的时间序列数据，所述时间序列数据包括CPU使用率时间序列、内存使用率时间序列、平均IO请求次数时间序列、网卡每秒接收字节数时间序列和网卡每秒发送字节数时间序列中一个或多个。

输入模块602，用于将所述目标服务器的所述时间序列数据输入预设分析预测模型，所述预设分析预测模型通过参考服务器的所述时间序列数据，以及所述参考服务器的所述时间序列数据对应的在预设时间的临界值训练得到，所述临界值包括最大值和/或最小值。

预测模块603，用于根据所述预设分析预测模型的输出，获得所述目标服务器的所述时间序列数据的预测临界值。

在一种可能的实现方式中，所述输入模块602，具体用于：

将预处理后的时间序列数据输入所述预设分析预测模型。

所述输入模块602，具体用于：

根据所述预设特征变量的值，进行时间序列特征构造。

本申请实施例提供的装置，可用于执行上述图2所述方法实施例的技术方案，其实现原理和技术效果类似，本申请实施例此处不再赘述。

图7为本申请实施例提供的另一种时间序列的分析预测装置的结构示意图，在图6基础上，上述时间序列的分析预测装置60还包括：评估模块604。

在一种可能的实现方式中，评估模块604，用于在所述预测模块根据所述预设分析预测模型的输出，获得所述目标服务器的所述时间序列数据的预测临界值之后，获取所述目标服务器的所述时间序列数据对应的实际临界值；

在一种可能的实现方式中，所述评估模块604，具体用于：

计算所述实际临界值与所述预测临界值的差值；

根据所述差值，确定所述预设分析预测模型的预测准确率。

在一种可能的实现方式中，所述评估模块604，还用于：

本申请实施例提供的装置，可用于执行上述图5所述方法实施例的技术方案，其实现原理和技术效果类似，本申请实施例此处不再赘述。

可选地，图8A和8B分别示意性地提供本申请所述时间序列的分析预测设备的一种可能的基本硬件架构。

参见图8A和8B，时间序列的分析预测设备包括至少一个处理器801以及通信接口803。进一步可选的，还可以包括存储器802和总线804。

其中，时间序列的分析预测设备中，处理器801的数量可以是一个或多个，图8A和8B仅示意了其中一个处理器801。可选地，处理器801，可以是CPU、图形处理器(GraphicsProcessing Unit，GPU)或者数字信号处理(Digital Signal Process，DSP)。如果时间序列的分析预测设备具有多个处理器801，多个处理器801的类型可以不同，或者可以相同。可选地，时间序列的分析预测设备的多个处理器801还可以集成为多核处理器。

存储器802存储计算机指令和数据；存储器802可以存储实现本申请提供的上述时间序列的分析预测方法所需的计算机指令和数据，例如，存储器802存储用于实现上述时间序列的分析预测方法的步骤的指令。存储器802可以是以下存储介质的任一种或任一种组合：非易失性存储器(例如只读存储器(Read-Only Memory，ROM)、固态驱动器(Solid StateDisk或Solid State Drive，SSD)、硬盘驱动器(Hard Disk Drive，HDD)、光盘)，易失性存储器。

通信接口803可以为所述至少一个处理器提供信息输入/输出。也可以包括以下器件的任一种或任一种组合：网络接口(例如以太网接口)、无线网卡等具有网络接入功能的器件。

可选的，通信接口803还可以用于时间序列的分析预测设备与其它计算设备或者终端进行数据通信。

进一步可选的，图8A和8B用一条粗线表示总线804。总线804可以将处理器801与存储器802和通信接口803连接。这样，通过总线804，处理器801可以访问存储器802，还可以利用通信接口803与其它计算设备或者终端进行数据交互。

在本申请中，时间序列的分析预测设备执行存储器802中的计算机指令，使得时间序列的分析预测设备实现本申请提供的上述时间序列的分析预测方法，或者使得时间序列的分析预测设备部署上述的时间序列的分析预测装置。

从逻辑功能划分来看，示例性的，如图8A所示，存储器802中可以包括获取模块601、输入模块602以及预测模块603。这里的包括仅仅涉及存储器中所存储的指令被执行时可以分别实现获取模块、输入模块以及预测模块的功能，而不限定是物理上的结构。

示例性的，如图8B所示，存储器802中还可以包括评估模块604。这里的包括仅仅涉及存储器中所存储的指令被执行时还可以实现评估模块的功能，而不限定是物理上的结构。

另外，上述的时间序列的分析预测设备除了可以像上述图8A和图8B通过软件实现外，也可以作为硬件模块，或者作为电路单元，通过硬件实现。

本申请提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序使得服务器执行本申请提供的上述时间序列的分析预测方法。

本申请提供一种计算机程序产品，包括计算机指令，所述计算机指令被处理器执行本申请提供的上述时间序列的分析预测方法。

本申请提供一种芯片，包括至少一个处理器和通信接口，所述通信接口为所述至少一个处理器提供信息输入和/或输出。进一步，所述芯片还可以包含至少一个存储器，所述存储器用于存储计算机指令。所述至少一个处理器用于调用并运行该计算机指令，以执行本申请提供的上述时间序列的分析预测方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

Claims

1.一种时间序列的分析预测方法，其特征在于，包括：

获取目标服务器的时间序列数据，所述时间序列数据包括中央处理器使用率时间序列、内存使用率时间序列、平均输入输出请求次数时间序列、网卡每秒接收字节数时间序列和网卡每秒发送字节数时间序列中一个或多个；

根据所述预设分析预测模型的输出，获得所述目标服务器的所述时间序列数据的预测临界值；

在所述将所述目标服务器的所述时间序列数据输入预设分析预测模型之前，还包括：

对所述目标服务器的所述时间序列数据进行预处理，所述预处理包括时间序列特征提取、时间序列特征构造和独热编码；

对所述目标服务器的所述时间序列数据进行时间序列特征提取；

对进行时间序列特征提取之后的时间序列数据进行时间序列特征构造；

对进行时间序列特征构造之后的时间序列数据，利用独热编码进行字段挑选，并对所挑选的字段进行分类；所述字段分为4类：日期类、小时类、周类、布尔类；

其中，不同类别的字段的独热编码方式如下：

对于所述日期类字段，一个字段扩充为一个31维的值；所述日期类字段共有P+1个，独热编码后扩充为(P+1)×31维；

对于小时类字段，一个字段扩充为24维的值；所述小时类字段共有P×Q+1个，独热编码后扩充为(P×Q+1)×24维；

对于周类字段，一个字段扩充为7维的值；所述周类字段共有P+1个，独热编码后扩充为(P+1)×7维；

对于布尔类字段，一个字段扩充为2维的值；所述布尔类字段共有9个，独热编码后扩充为9×2维；其中，1<＝P<＝30,0<＝Q<＝24；

所述预处理还包括类型转换；所述时间序列数据包括字段：采集日期、采集小时、最大值、最小值、平均值；

检测所述目标服务器的所述时间序列数据中的采集日期是否为日期型，最大值是否为float64；如果不是，则进行数据类型转换。

2.根据权利要求1所述的方法，其特征在于，

将预处理后的时间序列数据输入所述预设分析预测模型。

3.根据权利要求2所述的方法，其特征在于，所述对所述目标服务器的所述时间序列数据进行预处理，包括：

根据所述预设特征变量的值，进行时间序列特征构造。

4.根据权利要求1至3中任一项所述的方法，其特征在于，在所述根据所述预设分析预测模型的输出，获得所述目标服务器的所述时间序列数据的预测临界值之后，还包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述实际临界值和所述预测临界值，确定所述预设分析预测模型的预测准确率，包括：

计算所述实际临界值与所述预测临界值的差值；

根据所述差值，确定所述预设分析预测模型的预测准确率。

6.根据权利要求4所述的方法，其特征在于，在所述根据所述实际临界值和所述预测临界值，确定所述预设分析预测模型的预测准确率之后，还包括：

7.一种时间序列的分析预测装置，其特征在于，包括：

获取模块，用于获取目标服务器的时间序列数据，所述时间序列数据包括中央处理器使用率时间序列、内存使用率时间序列、平均输入输出请求次数时间序列、网卡每秒接收字节数时间序列和网卡每秒发送字节数时间序列中一个或多个；

预测模块，用于根据所述预设分析预测模型的输出，获得所述目标服务器的所述时间序列数据的预测临界值；

所述输入模块，具体用于：对所述目标服务器的所述时间序列数据进行预处理，所述预处理包括时间序列特征提取、时间序列特征构造和独热编码；

其中，不同类别的字段的独热编码方式如下：

8.一种时间序列的分析预测设备，其特征在于，包括：

处理器；

存储器；以及

计算机程序；

其中，所述计算机程序被存储在所述存储器中，并且被配置为由所述处理器执行，所述计算机程序包括用于执行如权利要求1-6任一项所述的方法的指令。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序使得服务器执行权利要求1-6任一项所述的方法。