CN111897695A

CN111897695A - 获取kpi异常数据样本的方法、装置和计算机设备

Info

Publication number: CN111897695A
Application number: CN202010762945.2A
Authority: CN
Inventors: 邓悦; 郑立颖; 徐亮
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-07-31
Filing date: 2020-07-31
Publication date: 2020-11-06
Anticipated expiration: 2040-07-31
Also published as: CN111897695B; WO2021139253A1

Abstract

本发明涉及人工智能技术，应用于智慧城市中，提出的获取KPI异常数据样本的方法、装置、计算机设备和存储介质，其中方法包括：获取预设时间段的KPI数据；将KPI数据进行异常检测得到潜在异常数据点，以潜在异常数据点为终点，按时间顺序回溯截取一指定片段KPI数据作为候选KPI异常数据；对候选KPI异常数据与已知KPI异常数据进行调整，使两者时间长度一致，并将两者的对应数据点进行相似距离计算得到多个规整路径距离；依据各规整路径距离判断候选KPI异常数据是否为KPI异常数据；若是，则将候选KPI异常数据标记成KPI异常数据，以作为训练智能KPI异常识别模型的样本，通过少量已知的KPI异常数据样本即可得到大量的KPI异常数据样本，大大地降低运维成本。

Description

获取KPI异常数据样本的方法、装置和计算机设备

技术领域

本发明涉及到人工智能的技术领域，特别是涉及到一种获取KPI异常数据样本的方法、装置、计算机设备和存储介质。

背景技术

互联网服务如搜索引擎和网上购物，已经成为我们日常生活中不可或缺的一部分，为了确保业务不中断，通常运营商都需要密切监控各种KPI(关键性能指标)，例如搜索响应时间、CPU使用率等，以准确检测KPI异常并及时启动故障排除和解决措施。

KPI异常检测是智能运维领域中非常重要的一环，在智能运维领域中，通常采用KPI异常算法来预测KPI的异常情况，这样就需要大量的KPI异常样本数据来帮助训练和评估算法，但目前标记异常的KPI数据需要专业知识以及大量的劳动力，不但耗费大量的人力物力资源，而且效率较低。

发明内容

本发明的主要目的为提供一种获取KPI异常数据样本的方法、装置、计算机设备和存储介质，旨在解决现有技术中标记KPI异常样本耗时耗力的技术问题。

基于上述发明目的，本发明提出一种获取KPI异常数据样本的方法，包括：获取预设时间段的KPI数据，所述KPI数据为时间序列数据类型的数据，每一条KPI数据包括多个数据点，且按时间顺序每一单位时间对应一所述数据点；

将所述KPI数据进行异常检测，得到对应的潜在异常数据点，以所述潜在异常数据点为终点，按时间顺序回溯截取一指定片段的KPI数据作为候选KPI异常数据；

对所述候选KPI异常数据与预设的已知KPI异常数据进行调整，以使所述候选KPI异常数据与所述已知KPI异常数据所对应的时间长度一致；

对调整后的所述候选KPI异常数据与所述已知KPI异常数据中的对应数据点进行相似距离计算得到多个规整路径距离，所述规整路径距离为调整后的所述候选KPI异常数据与所述已知KPI异常数据中所有相似数据点的距离之和；

依据各所述规整路径距离判断所述候选KPI异常数据是否为KPI异常数据；

若是，则将所述候选KPI异常数据标记成KPI异常数据，以作为训练智能KPI异常识别模型的样本。

进一步地，所述将所述KPI数据进行异常检测，得到对应的潜在异常数据点的步骤，包括：

将所述KPI数据进行预处理，得到标准化的KPI数据；

对标准化后的所述KPI数据进行特征提取，得到对应各数据点的特征信息；

将所述特征信息通过预设的孤立森林算法计算，得到所述特征信息对应的特征分数；

将所述特征分数与预设的第一阈值进行比较，当所述特征分数超过所述第一阈值，则将所述特征分数对应的数据点作为所述潜在异常数据点，否则，将所述特征分数对应的数据点作为正常数据点。

进一步地，所述KPI数据的数据点为数值，所述数值用于代表一预设指标，所述对标准化后的所述KPI数据进行特征提取，得到对应各数据点的特征信息的步骤，包括：

获取所述KPI数据对应的历史数据，所述历史数据为按时间顺序处于所述预设时间段之前的KPI数据；

将所述历史数据输入至预设的时间序列预测模型进行计算，得到对应所述预设时间段的预测KPI数据；

将所述预测KPI数据与所述标准化后的KPI数据中的各个数据点进行对比，得到各所述数据点的实际值与预测值之间的绝对差；

以所述绝对差作为各所述数据点的特征信息。

进一步地，所述对调整后的所述候选KPI异常数据与所述已知KPI异常数据中的对应数据点进行相似距离计算得到多个规整路径距离的步骤，包括：

依据所述候选KPI异常数据以及所述已知KPI异常数据的中各个数据点找出多个规整路径，其中，所述规整路径表示为

w_k表示第k步路径，且max(|X|,|Y|)≤k≤|X|+|Y|，X为所述候选KPI异常数据的实际时间长度，Y为所述已知KPI异常数据的实际时间长度，k为所述候选KPI异常数据与所述已知KPI异常数据调整后的时间长度，w_k＝(i,j)，表示所述候选KPI异常数据的时间序列中第i个数据点与所述已知KPI异常数据时间序列中第j个点构成第k步路径；

按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离。

进一步地，所述按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离的步骤，包括：

按照各所述规整路径依次计算所述候选KPI异常数据与所述已知KPI异常数据的数据点距离；

当所述数据点距离大于第二阈值，则停止计算当前的所述规整路径，并获取下一所述规整路径重新计算，直至按照所有所述规整路径全部计算完毕，得到各所述规整路径距离。

按当前的所述规整路径计算出每一步的路径距离值，以及依据所述候选KPI异常数据的特征信息计算出一指定值；

以所述路径距离值中的最小值作为最佳值，并判断所述指定值是否大于所述最佳值；

若是，则停止计算当前的所述规整路径，并获取下一所述规整路径重新计算，直至按照所有所述规整路径全部计算完毕，得到各所述规整路径距离。

进一步地，所述特征信息包括特征值，所述依据所述候选KPI异常数据的特征信息计算出一指定值的步骤，包括：

依次获取所述候选KPI异常数据中最大的特征值、最小的特征值、第一个数据点的特征值以及最后一个数据点的特征值；

对所述最大的特征值、最小的特征值、第一个数据点的特征值以及最后一个数据点的特征值求最大平方差，得到所述指定值。

本发明还提供一种获取KPI异常数据样本的装置，包括：

获取数据单元，用于获取预设时间段的KPI数据，所述KPI数据为时间序列数据类型的数据，每一条KPI数据包括多个数据点，且按时间顺序每一单位时间对应一所述数据点；

异常检测单元，用于将所述KPI数据进行异常检测，得到对应的潜在异常数据点，以所述潜在异常数据点为终点，按时间顺序回溯截取一指定片段的KPI数据作为候选KPI异常数据；

调整时间单元，用于对所述候选KPI异常数据与预设的已知KPI异常数据进行调整，以使所述候选KPI异常数据与所述已知KPI异常数据中的时间序列所对应的时间长度一致；

计算距离单元，用于对调整后的所述候选KPI异常数据与所述已知KPI异常数据中的对应数据点进行相似距离计算得到多个规整路径距离，所述规整路径距离为调整后的所述候选KPI异常数据与所述已知KPI异常数据中所有相似数据点的距离之和；

判断异常单元，用于依据各所述规整路径距离判断所述候选KPI异常数据是否为KPI异常数据；

标记异常单元，用于判定所述候选KPI异常数据为KPI异常数据，则将所述候选KPI异常数据标记成KPI异常数据，以作为训练智能KPI异常识别模型的样本。

本发明还提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述获取KPI异常数据样本的方法的步骤。

本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述获取KPI异常数据样本的方法的步骤。

本发明的有益效果为：通过少量已知的KPI异常数据样本，结合异常检测和相似度算法即可获得大量的KPI异常样本，与传统的认为采集标记样本相比，可以显著滴减少操作者90％以上的标记时间，大大地降低运维成本。

附图说明

图1为本发明一实施例中获取KPI异常数据样本的方法的步骤示意图；

图2为本发明一实施例中获取KPI异常数据样本的装置的结构示意框图；

图3为本发明一实施例的计算机设备的结构示意框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，本实施例中的获取KPI异常数据样本的方法，包括：

步骤S1：获取预设时间段的KPI数据，所述KPI数据为时间序列数据类型的数据，每一条KPI数据包括多个数据点，且按时间顺序每一单位时间对应一所述数据点；

步骤S2：将所述KPI数据进行异常检测，得到对应的潜在异常数据点，以所述潜在异常数据点为终点，按时间顺序回溯截取一指定片段的KPI数据作为候选KPI异常数据；

步骤S3：对所述候选KPI异常数据与预设的已知KPI异常数据进行调整，以使所述候选KPI异常数据与所述已知KPI异常数据所对应的时间长度一致；

步骤S4：对调整后的所述候选KPI异常数据与所述已知KPI异常数据中的对应数据点进行相似距离计算得到多个规整路径距离，所述规整路径距离为调整后的所述候选KPI异常数据与所述已知KPI异常数据中所有相似数据点的距离之和；

步骤S5：依据各所述规整路径距离判断所述候选KPI异常数据是否为KPI异常数据；

步骤S6：若是，则将对所述候选KPI异常数据标记成KPI异常数据，以作为训练智能KPI异常识别模型的样本。

本实施例中，上述智能KPI异常识别模型通常应用于智能运维领域，例如互联网服务中，通过智能KPI异常识别模型可直接从数百万到千万的数据量中将异常的KPI数据识别出来，而用于训练和评估模型算法的KPI异常样本，则可以通过本申请提供的获取KPI异常数据样本的方法获得，上述KPI(关键性能指标)数据为时间序列数据类型，一段KPI数据可以为按照时间顺序产生的多个数据点，每个数据点对应一个单位时间，例如CPU使用率，在5秒内每一秒所对应的数据点依次为20％、23％、21％、21％、20％，也即一段KPI数据为20％、23％、21％、21％、20％，其对应的时间序列依次为第一秒、第二秒、第三秒、第四秒以及第五秒；若其中一个数据与其余数据差别较大，则可以认为该段KPI数据为异常数据，例如20％、23％、23％、21％、81％，由于出现异常数据81％，则该段为异常数据。

如上述步骤S1所述，获取预设时间段的KPI数据，上述预设时间段可以为一分种，本实施例中，可同时持续监控多个不同的服务器，然后每隔一分钟获取一次KPI数据，例如针对同一个服务器同时获取多条KPI数据，或者同时获取多个服务器的多条不同KPI数据。

如上述步骤S2所述，将获取到的KPI数据进行异常检测，从中获得候选KPI异常数据，首先对KPI数据进行异常检测，例如通过预设的算法进行计算或者通过预设规则进行筛选，从而得到对应各KPI数据的潜在异常数据点，然后以该潜在异常数据点作为片段的终点，按时间顺序回溯截取一指定片段的KPI数据作为候选KPI异常数据，也即上述候选KPI异常数据可以为一条数据的一个片段，本实施例中，可以从一条KPI数据中得到多段候选KPI异常数据或者一段候选KPI异常数据。

如上述步骤S3-S4所述，获得候选KPI异常数据后，可通过异常模板与候选KPI异常数据进行相似度匹配，从而获得与异常模板相似度较高的候选KPI异常数据，也即得到KPI异常数据，上述异常模板为已知的KPI异常数据，也即该已知KPI异常数据也是时间序列数据类型的数据，举例地，可采用动态时间规整算法来计算得到KPI异常数据，动态时间规整是通过对两个时间序列点之间的相似性进行比较，进而得到两个时间序列的相似性，本实施例中，为了计算便利，可对候选KPI异常数据与已知KPI异常数据进行调整，以使候选KPI异常数据与已知KPI异常数据中的时间序列所对应的时间长度一致，即首先将两者进行拉伸或伸缩到相同时间长度，再计算出两者的多个规整路径距离，规整路径距离为候选KPI异常数据与已知KPI异常数据中所有相似数据点的距离之和，上述距离可以为欧式距离。

如上述步骤S5-S6所述，依据各规整路径距离判断候选KPI异常数据是否为KPI异常数据，由于规整路径距离越小，候选KPI异常数据为异常数据的可能性越大，这时可将其中最小规整路径距离与一预设值进行比较，若小于预设值，则该将规整路径距离所对应的候选KPI异常数据作为KPI异常数据。得到KPI异常数据后，对其进行样本标记，使得标记后的KPI异常数据作为训练智能KPI异常识别模型的样本。

本申请提供的获取KPI异常数据样本的方法，通过少量已知的KPI异常数据样本，结合异常检测和相似度算法即可获得大量的KPI异常样本，与传统的认为采集标记样本相比，可以显著滴减少操作者90％以上的标记时间，大大地降低运维成本。

在一个实施例中，上述步骤S2，包括：

步骤S21：将所述KPI数据进行预处理，得到多条标准化的KPI数据；

步骤S22：对标准化后的所述KPI数据进行特征提取，得到对应各数据点的特征信息；

步骤S23：将所述特征信息通过预设的孤立森林算法计算，得到所述特征信息对应的特征分数；

步骤S24：将所述特征分数与预设的第一阈值进行比较，当所述特征分数超过所述第一阈值，则将所述特征分数对应的数据点作为所述潜在异常数据点，否则，将所述特征分数对应的数据点作为正常数据点。

如上述步骤S21所述，将KPI数据进行预处理，具体而言，首先对KPI数据进行查找，由于监视系统可能会出现接收不到数据的情况，导致一些数据点值丢失，若查找到出现丢失数据的情况，可基于相邻的数据点使用线性插值来填充，如，获取相邻数据，然后求平均值，将平均值插入丢失数据点的位置。此外，由于KPI可能来自不同的服务器，可将这些KPI数据进行标准化，以消除规模差异，为后续计算做好准备，例如对每个服务器所采集的KPI数据，分别求得均值和标准差，然后每段KPI数据都减去均值再除以标准差，得到标准化后的KPI数据。

如上述步骤S22所述，为了应用孤立森林算法，首先需要提取异常特征。也即需要对标准化后的KPI数据进行特征提取，得到对应各数据点的特征信息，上述特征信息包括特征值，具体而言，可采用时间序列预测模型作为特征抽取器，在一个实施例中，上述步骤S22，包括：

步骤S221：获取所述KPI数据对应的历史数据，所述历史数据为按时间顺序处于所述预设时间段之前的KPI数据；

步骤S222：将所述历史数据输入至预设的时间序列预测模型进行计算，得到对应所述预设时间段的预测KPI数据；

步骤S223：将所述预测KPI数据与所述标准化后的KPI数据中的各个数据点进行计算，得到各所述数据点的实际值与预测值之间的绝对差；

步骤S224：以所述绝对差作为各所述数据点的特征信息。

本实施例中，需要将实际的候选KPI数据与预测的KPI数据进行计算，以此获得特征信息，而预测的KPI数据可由历史数据输入到时间序列预测模型计算得到，具体而言，首先获取各KPI数据对应的历史数据，该历史数据为按时间顺序处于上述预设时间段之前的KPI数据，例如预设时间段为当前一分钟内的数据，历史数据可以为回溯到前一分钟的数据，或者回溯到两分钟前的数据，历史数据的时间长度也是一分钟。然后将历史数据输入至预设的时间序列预测模型进行计算，得到对应上述预设时间段的预测KPI数据，上述时间序列预测模型可采用现有的算法计算，例如移动平均，此处不再赘述。一般来说，正常的数据点由于与预测数据点的误差较小，符合预期行为，可以很好地预测，而具有非预期模式的异常数据点很难预测，从而产生较大的预测误差。故而将预测KPI数据与标准化后的KPI数据中的各个数据点进行计算，本实施例中，上述KPI数据的数据点为数值，该数值用于代表预设指标，如上述例子中的20％、23％、21％、21％、20％；将上述两段数据的各个数据点进行比较后，得到各数据点的实际值与预测值之间的绝对差，以绝对差作为各数据点的特征信息；设数据点x_i的预测值为p_i，计算出各数据点的实际值与预测值之间的绝对差，即|p_i-x_i|，以此作为数据点的特征信息。

在另一个实施例中，为了提高准确性，可同时采用多个不同的时间序列预测模型来进行预测，例如可同时采用六种具有较低的计算复杂度和良好的性能的算法来计算，分别为差分、移动平均、加权移动平均、指数加权移动平均、自回归综合移动平均和HoltWinters，得到六个对应的预测值，然后均与数据点的实际值进行计算，得到特征矩阵X(n×6)。

如上述步骤S23所述，将特征信息通过预设的孤立森林算法计算，得到特征信息对应的特征分数，需知孤立森林算法通过随机选择一个特征和所选特征的最小值和最大值之间的分割值来隔离观察结果。通常情况下，分离异常数据只需要少数几个条件，而分离正常数据则需要更多的条件，因此，KPI异常数据的特征分数可以是分离指定的观测值所需的条件数。孤立森林算法的递归分区可以用树结构(iTree)来表示，分离KPI数据所需的拆分次数相当于从根节点到终止节点的路径长度，异常的KPI数据则是itree上平均路径长度较短的实例，孤立森林算法中的每个终端节点都有一个在0～1之间的分数，该分数是根据其路径长度计算的，得分越高，异常的可能性越大。由于孤立森林算法为现有技术，具体的计算过程此处不再赘述。

如上述步骤S24所述，为了根据特征分数来检测潜在的异常，可以选择一个合适的阈值θ，此处将该阈值名为第一阈值，将特征分数与预设的第一阈值进行比较，若数据点的特征分数X_i大于θ，则将该数据点作为潜在异常数据点，否则，将特征分数对应的数据点作为正常数据点。

通常，第一阈值的选择需要在高召回率和高精度之间进行权衡，并且一般使用F分数作为度量标准，也即从KPI数据中尽量多地选出具有异常情形的候选KPI异常数据，避免错过，由于在KPI数据中，其异常数据点所占的百分比非常小，通常约为1％。也即大多数数据点可能是正常的，故大部分数据点的特征分数较低，只有少数点有较高的特征分数，因此，可选择第85％分位的异常分数作为第一阈值。

在一个实施例中，上述步骤S4，包括：

步骤S41：依据所述候选KPI异常数据以及所述已知KPI异常数据的中各个数据点找出多个规整路径，其中，所述规整路径表示为

步骤S42：按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离。

本实施例中，采用动态时间规整技术来得到规整路径距离，具体而言，依据候选KPI异常数据以及已知KPI异常数据的中各个数据点找出多个规整路径，由于候选KPI异常数据以及已知KPI异常数据均为时间序列数据，为了便于描述，此处将上述候选KPI异常数据记为第一时间序列c，对应的数据点为c_j，已知KPI异常数据记为第二时间序列q,对应的数据点为q_i；上述规整路径表示为

w₁表示第1步路径，w₂表示第2步路径，w_k表示第k步路径，其中w_k＝(i,j)，即第k步中认为第一段时间序列第i个点和第二段时间序列第j个点是相似的，所有相似点的距离之和作为规整路径距离，用规整路径距离来衡量两个时间序列的相似性。规整路径距离越小，相似度越高。

对于规整路径，其中，max(|X|,|Y|)≤k≤|X|+|Y|，X为候选KPI异常数据的实际时间长度，Y为已知KPI异常数据的实际时间长度，k为候选KPI异常数据与已知KPI异常数据调整后的时间长度；规整路径必须从

开始，到

结束，规整路径

中的i和j必须是单调递增的，所谓单调递增指的是：w_k＝(i,j),w_k+1＝(i′,j′)，i≤i′≤i+1,j≤j′≤j+1；

如果路径已经通过了元素(i,j)，那么路径下一个元素只能是(i+1,j),(i,j+1),(i+1,j+1中的一个，也即第一步先计算第一时间序列的第一个数据点与第二时间序列的第一个数据点的距离；第二步

或者(2,1)或者(2,2)，也即第二步计算第一时间序列的第一个数据与第二时间序列的第二数据点的距离，或者计算第一时间序列的第二个数据与第二个时间序列的第一个数据的距离，或者计算第一时间序列的第二个数据与第二时间序列的第二个数据的距离，以此类推，直至计算到第k步w_k，以保证第一时间序列和第二时间序列的每个数据点都计算过一次，从而得到多个规整路径。

如上述步骤S42所述，按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离，具体而言，上述路径规整距离所对应的距离矩阵：D(i,j)＝Dist(i,j)+min{D(i-1,j),D(i,j-1),D(i-1,j-1)}；

其中,Dist(i,j)表示第一时间序列的第i个点与第二时间序列的第j个点之间的距离。Dist(i,j)衡量的是第一时间序列前i个点与第二时间序列前j个点的相似性；最终的规整路径距离为D(|X|,|Y|)，D(|X|,|Y|)的值越小，两个时间序列的相似性越大。

在一个实施例中，上述步骤S42，包括：

步骤S421：按照各所述规整路径依次计算所述候选KPI异常数据与所述已知KPI异常数据的数据点距离；

步骤S422：当所述数据点距离大于第二阈值，则停止计算当前的所述规整路径，并获取下一所述规整路径重新计算，直至按照所有所述规整路径全部计算完毕，得到各所述规整路径距离。

本实施例中，由于通过规整路径来计算距离的整个过程运算较为庞大复杂，为了提高效率，加快运算，在计算过程中，若一规整路径上两个时间序列中数据点距离太远时可以直接停止计算，然后重复计算下一条规整路径，具体而言，按照各规整路径依次计算候选KPI异常数据与已知KPI异常数据的数据点距离，若第一时间序列的数据点i和第二时间序列的数据点j相距太远，则q_i和c_j匹配度会太低，继续按该规整路径计算会浪费资源，故而可以直接停止计算该条规整路径，上述第二阈值由规整时间窗w决定，在计算距离时，先判断第一时间序列的数据点i和第二时间序列的数据点j的距离是否小于w，如果|i-j|≤w，则继续按规整路径计算，若大于w则停止计算该条规整路径，重新获取下一条规整路径计算，重复上述步骤，直至所有规整路径全部计算完毕，得到各规整路径距离。

其中，当w＝0时，

m是异常模板的长度，也即已知KPI异常数据的长度。当w≥m时，可将上述公式D(i,j)＝Dist(i,j)+min{D(i-1,j),D(i,j-1,Di-1,j-1，改为Di,j＝Disti,j+min{Di-1,j-1,Di-2,j-1,Di-1,j-1})。

在一个实施例中，上述步骤S42，包括：

步骤S423：按当前的所述规整路径计算出每一步的路径距离值，以及依据所述候选KPI异常数据的特征信息计算出一指定值；

步骤S424：以所述路径距离值中的最小值作为最佳值，并判断所述指定值是否大于所述最佳值；

步骤S425：若是，则停止计算当前的所述规整路径，并获取下一所述规整路径重新计算，直至按照所有所述规整路径全部计算完毕，得到各所述规整路径距离。

本实施例中，在得到规整路径之后，计算出当前的规整路径中每一步的路径距离值，并以其中路径距离值的最小值作为最佳值，同时依据候选KPI异常数据的特征信息计算出一指定值，然后判断指定值是否大于最佳值，若大于最佳值，则停止计算当前的规整路径，然后重新获取下一条规整路径计算，重复上述步骤，直至所有规整路径全部计算完毕，得到各规整路径距离，这样可以减少不必要的计算，避免浪费资源。其中，上述指定值可通过以下步骤计算得到：

步骤S421’：依次获取所述候选KPI异常数据中最大的特征值、最小的特征值、第一个数据点的特征值以及最后一个数据点的特征值；

步骤S422’：对所述最大的特征值、最小的特征值、第一个数据点的特征值以及最后一个数据点的特征值求最大平方差，得到所述指定值。

本实施例中，上述特征信息包括特征值，获取候选KPI异常数据这一段时间序列中的最大特征值和最小特征值，以及该时间序列中第一个数据点的特征值以及最后一个数据点的特征值，然后求四个特征值的最大平方差，该最大平方差即为上述指定值。

在另一个实施例中，上述指定值还可以通过以下预设规则获得，首先通过上述规整时间窗口来定义两个新的时间序列U,L：U_i＝max_jq_j；L_i＝min_iq_j；wherej∈[i-w,i+w]；也即对上述第二时间序列进行变形，以规整时间窗w为移动距离，各个数据点向前移动w，得到第二时间序列q的上限，各个数据点向后移动w，得到第二时间序列q的下限，其中，

则该指定值为

其中，I(·)是指示函数。

在另一实施例中，可以叫上述第一时间序列与第二时间序列进行交换，也即上式子中的q,c交换；同样可以对第一时间序列进行变形，以规整时间窗w为移动距离，各个数据点向前移动w，得到第一时间序列c的上限，各个数据点向后移动w，得到第一时间序列c的下限，从而可以获得候选KPI异常数据的对应的上限U和下限L，然后按上述公式获得另一个指定值。

在另一实施例中，在计算规整路径距离的时候，若在计算过程中计算出的距离值大于上述指定值，则会提前终止，将这一候选KPI异常数据减除，不再继续计算下去。

本申请提供的获取KPI异常数据样本的方法，通过在相似度匹配过程中进行筛选，不但鲁棒性好，迭代速度快，而且避免浪费计算资源以及计算时间，显著地缩短了响应时间，同时对硬件的要求低，占用内存很小，方便运维人员部署。

参照图2，本实施例中提供一种获取KPI异常数据样本的装置，该装置对应上述获取KPI异常数据样本的方法，该装置包括：

获取数据单元1，用于获取预设时间段的KPI数据，所述KPI数据为时间序列数据类型的数据，每一条KPI数据包括多个数据点，且按时间顺序每一单位时间对应一所述数据点；

异常检测单元2，用于将所述KPI数据进行异常检测，得到对应的潜在异常数据点，以所述潜在异常数据点为终点，按时间顺序回溯截取一指定片段的KPI数据作为候选KPI异常数据；

调整时间单元3，用于对所述候选KPI异常数据与预设的已知KPI异常数据进行调整，以使所述候选KPI异常数据与所述已知KPI异常数据所对应的时间长度一致；

计算距离单元4，用于对调整后的所述候选KPI异常数据与所述已知KPI异常数据中的对应数据点进行相似距离计算得到多个规整路径距离，所述规整路径距离为调整后的所述候选KPI异常数据与所述已知KPI异常数据中所有相似数据点的距离之和；

判断异常单元5，用于依据各所述规整路径距离判断所述候选KPI异常数据是否为KPI异常数据；

标记异常单元6，用于判定所述候选KPI异常数据为KPI异常数据，则将所述候选KPI异常数据标记成KPI异常数据，以作为训练智能KPI异常识别模型的样本。

如上述获取数据单元1所述，获取预设时间段的KPI数据，上述预设时间段可以为一分种，本实施例中，可同时持续监控多个不同的服务器，然后每隔一分钟获取一次KPI数据，例如针对同一个服务器同时获取多条KPI数据，或者同时获取多个服务器的多条不同KPI数据。

如上述异常检测单元2所述，将获取到的KPI数据进行异常检测，从中获得候选KPI异常数据，首先对KPI数据进行异常检测，例如通过预设的算法进行计算或者通过预设规则进行筛选，从而得到对应各KPI数据的潜在异常数据点，然后以该潜在异常数据点作为片段的终点，按时间顺序回溯截取一指定片段的KPI数据作为候选KPI异常数据，也即上述候选KPI异常数据可以为一条数据的一个片段，本实施例中，可以从一条KPI数据中得到多段候选KPI异常数据或者一段候选KPI异常数据。

如调整时间单元3、计算距离单元4所述，获得候选KPI异常数据后，可通过异常模板与候选KPI异常数据进行相似度匹配，从而获得与异常模板相似度较高的候选KPI异常数据，也即得到KPI异常数据，上述异常模板为已知的KPI异常数据，也即该已知KPI异常数据也是时间序列数据类型的数据，举例地，可采用动态时间规整算法来计算得到KPI异常数据，动态时间规整是通过对两个时间序列点之间的相似性进行比较，进而得到两个时间序列的相似性，本实施例中，为了计算便利，可对候选KPI异常数据与已知KPI异常数据进行调整，以使候选KPI异常数据与已知KPI异常数据中的时间序列所对应的时间长度一致，即将两者进行拉伸或伸缩到相同时间长度，再计算出两者的多个规整路径距离，规整路径距离为候选KPI异常数据与已知KPI异常数据中所有相似数据点的距离之和，上述距离可以为欧式距离。

如上述判断异常单元5、标记异常单元6所述，依据各规整路径距离判断候选KPI异常数据是否为KPI异常数据，由于规整路径距离越小，候选KPI异常数据为异常数据的可能性越大，这时可将其中最小规整路径距离与一预设值进行比较，若小于预设值，则该将规整路径距离所对应的候选KPI异常数据作为KPI异常数据。得到KPI异常数据后，对其进行样本标记，使得标记后的KPI异常数据作为训练智能KPI异常识别模型的样本。

在一个实施例中，上述异常检测单元2，包括：

数据处理子单元，用于将所述KPI数据进行预处理，得到多条标准化的KPI数据；

特征提取子单元，用于对标准化后的所述KPI数据进行特征提取，得到对应各数据点的特征信息；

计算分数子单元，用于将所述特征信息通过预设的孤立森林算法计算，得到所述特征信息对应的特征分数；

比较分数子单元，用于将所述特征分数与预设的第一阈值进行比较，当所述特征分数超过所述第一阈值，则将所述特征分数对应的数据点作为所述潜在异常数据点，否则，将所述特征分数对应的数据点作为正常数据点。

如上述数据处理子单元所述，将KPI数据进行预处理，具体而言，首先对KPI数据进行查找，由于监视系统可能会出现接收不到数据的情况，导致一些数据点值丢失，若查找到出现丢失数据的情况，可基于相邻的数据点使用线性插值来填充，如，获取相邻数据，然后求平均值，将平均值插入丢失数据点的位置。此外，由于KPI可能来自不同的服务器，可将这些KPI数据进行标准化，以消除规模差异，为后续计算做好准备，例如对每个服务器所采集的KPI数据，分别求得均值和标准差，然后每段KPI数据都减去均值再除以标准差，得到标准化后的KPI数据。

如上述特征提取子单元所述，为了应用孤立森林算法，首先需要提取异常特征。也即需要对标准化后的KPI数据进行特征提取，得到对应各数据点的特征信息，上述特征信息包括特征值，具体而言，可采用时间序列预测模型作为特征抽取器，在一个实施例中，上述特征提取子单元，包括：

获取历史模块，用于获取所述KPI数据对应的历史数据，所述历史数据为按时间顺序处于所述预设时间段之前的KPI数据；

预测数据模块，用于将所述历史数据输入至预设的时间序列预测模型进行计算，得到对应所述预设时间段的预测KPI数据；

计算差值模块，用于将所述预测KPI数据与所述标准化后的KPI数据中的各个数据点进行计算，得到各所述数据点的实际值与预测值之间的绝对差；

特征信息模块，用于以所述绝对差作为各所述数据点的特征信息。

本实施例中，需要将实际的候选KPI数据与预测的KPI数据进行计算，以此获得特征信息，而预测的KPI数据可由历史数据输入到时间序列预测模型计算得到，具体而言，首先获取各KPI数据对应的历史数据，该历史数据为按时间顺序处于上述预设时间段之前的KPI数据，例如预设时间段为当前一分钟内的数据，历史数据可以为回溯到前一分钟的数据，或者回溯到两分钟前的数据，历史数据的时间长度也是一分钟。然后将历史数据输入至预设的时间序列预测模型进行计算，得到对应上述预设时间段的预测KPI数据，上述时间序列预测模型可采用现有的算法计算，例如移动平均，此处不再赘述。一般来说，正常的数据点由于与预测数据点的误差较小，符合预期行为，可以很好地预测，而具有非预期模式的异常数据点很难预测，从而产生较大的预测误差。故而将预测KPI数据与标准化后的KPI数据中的各个数据点进行计算，本实施例中，上述KPI数据的数据点为数值，该数值用于代表一预设指标，例如上述例子中的20％、23％、21％、21％、20％；将上述两段数据的各个数据点进行比较后，得到各数据点的实际值与预测值之间的绝对差，以绝对差作为各数据点的特征信息；设数据点x_i的预测值为p_i，计算出各数据点的实际值与预测值之间的绝对差，即|p_i-x_i|，以此作为数据点的特征信息。

如上述计算分数子单元所述，将特征信息通过预设的孤立森林算法计算，得到特征信息对应的特征分数，需知孤立森林算法通过随机选择一个特征和所选特征的最小值和最大值之间的分割值来隔离观察结果。通常情况下，分离异常数据只需要少数几个条件，而分离正常数据则需要更多的条件，因此，KPI异常数据的特征分数可以是分离指定的观测值所需的条件数。孤立森林算法的递归分区可以用树结构(iTree)来表示，分离KPI数据所需的拆分次数相当于从根节点到终止节点的路径长度，异常的KPI数据则是itree上平均路径长度较短的实例，孤立森林算法中的每个终端节点都有一个在0～1之间的分数，该分数是根据其路径长度计算的，得分越高，异常的可能性越大。由于孤立森林算法为现有技术，具体的计算过程此处不再赘述。

如上述比较分数子单元所述，为了根据特征分数来检测潜在的异常，可以选择一个合适的阈值θ，此处将该阈值名为第一阈值，将特征分数与预设的第一阈值进行比较，若数据点的特征分数X_i大于θ，则将该数据点作为潜在异常数据点，否则，将特征分数对应的数据点作为正常数据点。

在一个实施例中，上述计算距离单元4，包括：

找出路径子单元，英语依据所述候选KPI异常数据以及所述已知KPI异常数据的中各个数据点找出多个规整路径，其中，所述规整路径表示为

计算距离子单元，用于按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离。

开始，到

结束，规整路径

如上述计算距离子单元所述，按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离，具体而言，上述路径规整距离所对应的距离矩阵：D(i,j)＝Dist(i,j)+min{D(i-1,j),D(i,j-1),D(i-1,j-1)}；

在一个实施例中，上述计算距离子单元，包括：

计算点距模块，用于按照各所述规整路径依次计算所述候选KPI异常数据与所述已知KPI异常数据的数据点距离；

第一计算模块，用于所述数据点距离大于第二阈值，则停止计算当前的所述规整路径，并获取下一所述规整路径重新计算，直至按照所有所述规整路径全部计算完毕，得到各所述规整路径距离。

其中，当w＝0时，

在一个实施例中，上述计算距离子单元，包括：

计算路值模块，用于按当前的所述规整路径计算出每一步的路径距离值，以及依据所述候选KPI异常数据的特征信息计算出一指定值；

判断定值模块，用于以所述路径距离值中的最小值作为最佳值，并判断所述指定值是否大于所述最佳值；

第二计算模块，用于若是，则停止计算当前的所述规整路径，并获取下一所述规整路径重新计算，直至按照所有所述规整路径全部计算完毕，得到各所述规整路径距离。

获取特征模块，用于依次获取所述候选KPI异常数据中最大的特征值、最小的特征值、第一个数据点的特征值以及最后一个数据点的特征值；

求出方差模块，用于对所述最大的特征值、最小的特征值、第一个数据点的特征值以及最后一个数据点的特征值求最大平方差，得到所述指定值。

则该指定值为

其中，I(·)是指示函数。

参照图3，本发明实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述获取KPI异常样本所需的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种获取KPI异常数据样本的方法。

上述处理器执行上述获取KPI异常数据样本的方法的步骤：获取预设时间段的KPI数据，所述KPI数据为时间序列数据类型的数据，每一条KPI数据包括多个数据点，且按时间顺序每一单位时间对应一所述数据点；将所述KPI数据进行异常检测，得到对应的潜在异常数据点，以所述潜在异常数据点为终点，按时间顺序回溯截取一指定片段的KPI数据作为候选KPI异常数据；对所述候选KPI异常数据与预设的已知KPI异常数据进行调整，以使所述候选KPI异常数据与所述已知KPI异常数据所对应的时间长度一致；对调整后的所述候选KPI异常数据与所述已知KPI异常数据中的对应数据点进行相似距离计算得到多个规整路径距离，所述规整路径距离为调整后的所述候选KPI异常数据与所述已知KPI异常数据中所有相似数据点的距离之和；依据各所述规整路径距离判断所述候选KPI异常数据是否为KPI异常数据；若是，则将所述候选KPI异常数据标记成KPI异常数据，以作为训练智能KPI异常识别模型的样本。

在一个实施例中，上述将所述KPI数据进行异常检测，得到对应的潜在异常数据点的步骤，包括：将所述KPI数据进行预处理，得到标准化的KPI数据；对标准化后的所述KPI数据进行特征提取，得到对应各数据点的特征信息；将所述特征信息通过预设的孤立森林算法计算，得到所述特征信息对应的特征分数；将所述特征分数与预设的第一阈值进行比较，当所述特征分数超过所述第一阈值，则将所述特征分数对应的数据点作为所述潜在异常数据点，否则，将所述特征分数对应的数据点作为正常数据点。

在一个实施例中，上述KPI数据的数据点为数值，所述数值用于代表一预设指标，所述对标准化后的所述KPI数据进行特征提取，得到对应各数据点的特征信息的步骤，包括：获取所述KPI数据对应的历史数据，所述历史数据为按时间顺序处于所述预设时间段之前的KPI数据；将所述历史数据输入至预设的时间序列预测模型进行计算，得到对应所述预设时间段的预测KPI数据；将所述预测KPI数据与所述标准化后的KPI数据中的各个数据点进行对比，得到各所述数据点的实际值与预测值之间的绝对差；以所述绝对差作为各所述数据点的特征信息。

在一个实施例中，上述对调整后的所述候选KPI异常数据与所述已知KPI异常数据中的对应数据点进行相似距离计算得到多个规整路径距离的步骤，包括：依据所述候选KPI异常数据以及所述已知KPI异常数据的中各个数据点找出多个规整路径，其中，所述规整路径表示为

w_k表示第k步路径，且max(|X|,|Y|)≤k≤|X|+|Y|，X为所述候选KPI异常数据的实际时间长度，Y为所述已知KPI异常数据的实际时间长度，k为所述候选KPI异常数据与所述已知KPI异常数据调整后的时间长度，w_k＝(i,j)，表示所述候选KPI异常数据的时间序列中第i个数据点与所述已知KPI异常数据时间序列中第j个点构成第k步路径；按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离。

在一个实施例中，上述按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离的步骤，包括：按照各所述规整路径依次计算所述候选KPI异常数据与所述已知KPI异常数据的数据点距离；当所述数据点距离大于第二阈值，则停止计算当前的所述规整路径，并获取下一所述规整路径重新计算，直至按照所有所述规整路径全部计算完毕，得到各所述规整路径距离。

在一个实施例中，上述按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离的步骤，包括：按当前的所述规整路径计算出每一步的路径距离值，以及依据所述候选KPI异常数据的特征信息计算出一指定值；以所述路径距离值中的最小值作为最佳值，并判断所述指定值是否大于所述最佳值；若是，则停止计算当前的所述规整路径，并获取下一所述规整路径重新计算，直至按照所有所述规整路径全部计算完毕，得到各所述规整路径距离。

在一个实施例中，上述特征信息包括特征值，所述依据所述候选KPI异常数据的特征信息计算出一指定值的步骤，包括：依次获取所述候选KPI异常数据中最大的特征值、最小的特征值、第一个数据点的特征值以及最后一个数据点的特征值；对所述最大的特征值、最小的特征值、第一个数据点的特征值以及最后一个数据点的特征值求最大平方差，得到所述指定值。

本领域技术人员可以理解，图3中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本发明一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现一种获取KPI异常数据样本的方法，具体为：获取预设时间段的KPI数据，所述KPI数据为时间序列数据类型的数据，每一条KPI数据包括多个数据点，且按时间顺序每一单位时间对应一所述数据点；将所述KPI数据进行异常检测，得到对应的潜在异常数据点，以所述潜在异常数据点为终点，按时间顺序回溯截取一指定片段的KPI数据作为候选KPI异常数据；对所述候选KPI异常数据与预设的已知KPI异常数据进行调整，以使所述候选KPI异常数据与所述已知KPI异常数据所对应的时间长度一致；对调整后的所述候选KPI异常数据与所述已知KPI异常数据中的对应数据点进行相似距离计算得到多个规整路径距离，所述规整路径距离为调整后的所述候选KPI异常数据与所述已知KPI异常数据中所有相似数据点的距离之和；依据各所述规整路径距离判断所述候选KPI异常数据是否为KPI异常数据；若是，则将所述候选KPI异常数据标记成KPI异常数据，以作为训练智能KPI异常识别模型的样本。

上述计算机可读存储介质，上述将所述KPI数据进行异常检测，得到对应的潜在异常数据点的步骤，包括：将所述KPI数据进行预处理，得到标准化的KPI数据；对标准化后的所述KPI数据进行特征提取，得到对应各数据点的特征信息；将所述特征信息通过预设的孤立森林算法计算，得到所述特征信息对应的特征分数；将所述特征分数与预设的第一阈值进行比较，当所述特征分数超过所述第一阈值，则将所述特征分数对应的数据点作为所述潜在异常数据点，否则，将所述特征分数对应的数据点作为正常数据点。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储与一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM一多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种获取KPI异常数据样本的方法，其特征在于，包括：

获取预设时间段的KPI数据，所述KPI数据为时间序列数据类型的数据，每一条KPI数据包括多个数据点，且按时间顺序每一单位时间对应一所述数据点；

2.根据权利要求1所述的获取KPI异常数据样本的方法，其特征在于，所述将所述KPI数据进行异常检测，得到对应的潜在异常数据点的步骤，包括：

将所述KPI数据进行预处理，得到标准化的KPI数据；

3.根据权利要求2所述的获取KPI异常数据样本的方法，其特征在于，所述KPI数据的数据点为数值，所述数值用于代表预设指标，所述对标准化后的所述KPI数据进行特征提取，得到对应各数据点的特征信息的步骤，包括：

以所述绝对差作为各所述数据点的特征信息。

4.根据权利要求1所述的获取KPI异常数据样本的方法，其特征在于，所述对调整后的所述候选KPI异常数据与所述已知KPI异常数据中的对应数据点进行相似距离计算得到多个规整路径距离的步骤，包括：

w_k表示第k步路径，且max(|X|，|Y|)≤k≤|X|+|Y|，X为所述候选KPI异常数据的实际时间长度，Y为所述已知KPI异常数据的实际时间长度，k为所述候选KPI异常数据与所述已知KPI异常数据调整后的时间长度，w_k＝(i，j)，表示所述候选KPI异常数据的时间序列中第i个数据点与所述已知KPI异常数据时间序列中第j个点构成第k步路径；

5.根据权利要求4所述的获取KPI异常数据样本的方法，其特征在于，所述按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离的步骤，包括：

6.根据权利要求4所述的获取KPI异常数据样本的方法，其特征在于，所述按照各规整路径分别计算出对应的数据点的距离之和，得到各规整路径距离的步骤，包括：

7.根据权利要6所述的获取KPI异常数据样本的方法，其特征在于，所述特征信息包括特征值，所述依据所述候选KPI异常数据的特征信息计算出一指定值的步骤，包括：

8.一种获取KPI异常数据样本的装置，其特征在于，包括：

调整时间单元，用于对所述候选KPI异常数据与预设的已知KPI异常数据进行调整，以使所述候选KPI异常数据与所述已知KPI异常数据所对应的时间长度一致；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的获取KPI异常数据样本的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的获取KPI异常数据样本的方法的步骤。