CN111949496A - 一种数据检测方法及装置 - Google Patents

一种数据检测方法及装置 Download PDF

Info

Publication number
CN111949496A
CN111949496A CN201910401145.5A CN201910401145A CN111949496A CN 111949496 A CN111949496 A CN 111949496A CN 201910401145 A CN201910401145 A CN 201910401145A CN 111949496 A CN111949496 A CN 111949496A
Authority
CN
China
Prior art keywords
data
value
historical data
abnormal
kpi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910401145.5A
Other languages
English (en)
Other versions
CN111949496B (zh
Inventor
邱娟
殷康璘
杜庆峰
于洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201910401145.5A priority Critical patent/CN111949496B/zh
Publication of CN111949496A publication Critical patent/CN111949496A/zh
Application granted granted Critical
Publication of CN111949496B publication Critical patent/CN111949496B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供一种数据检测方法及装置,其中方法包括:获取预设关键性能指标KPI的待检测数据;将所述待检测数据输入异常检测模型,获得所述待检测数据的异常检测结果;所述异常检测模型为对所述预设KPI的至少一条历史数据记录分别对应的数据特征进行训练获得的模型;所述数据特征表征了所述历史数据记录随时间的变化规律。

Description

一种数据检测方法及装置
技术领域
本申请涉及运维安全技术领域,尤其涉及一种数据检测方法及装置。
背景技术
互联网系统运维过程中通常需要对互联网服务进行异常检测。运维监控平台的关键性能指标(key performance indicator,KPI)是用于检测互联网服务的异常或意外事件的指标。举例来说,KPI可以是指网页响应时长,或者内存使用率。因此,需要对运维监控平台的KPI进行监控,从而及时发现互联网系统的异常情况。
如图1所示,目前对运维监控平台的KPI进行监控的方案是,基于对KPI预先设定的上限或下限阈值进行判断。举例来说,当KPI大于某个值时,则认为KPI异常。如图1所示,KPI的取值在不同时刻是会发生变化的,大于正常参考峰值的KPI范围是不正常区间。这种方式下容易出现误报或漏报。举例来说,某个KPI有高峰期和低谷期,这个KPI如果还是同一个数值,如果出现在低谷期则属于正常情况,如果出现在高峰期,则该数值相对于之前时刻和之后时刻的KPI出现了陡升陡降,则可能被判定为异常情况。
因此,现有技术中对一些异常情况的检测结果不够准确,导致误报或漏报,这是一个亟待解决的问题。
发明内容
本申请实施例提供一种数据检测方法及装置,用以解决现有技术中对一些异常情况的检测结果不够准确,导致误报或漏报的问题。
第一方面,本申请实施例提供一种数据检测方法,该方法包括:获取预设关键性能指标KPI的待检测数据;将所述待检测数据输入异常检测模型,获得所述待检测数据的异常检测结果;所述异常检测模型为对所述预设KPI的至少一条历史数据记录分别对应的数据特征进行训练获得的模型;所述数据特征表征了所述历史数据记录随时间的变化规律。
本申请实施例中,首先获取预设关键性能指标KPI的待检测数据,将所述待检测数据输入异常检测模型,由于所述异常检测模型为对所述预设KPI的至少一条历史数据记录分别对应的数据特征进行训练获得的模型,且所述数据特征表征了所述历史数据记录随时间的变化规律,因此所述异常检测模型学习了所述历史数据记录随时间变化的规律,从而可以根据预设KPI随时间变化的变化规律进行异常检测,使得所述待检测数据的异常检测结果更加准确。
一种可能的实现方式中,所述至少一条历史数据记录中包括N条历史数据记录,N为大于0的整数,基于此,可以按照以下方式获得所述异常检测模型:将所述N条历史数据记录输入预设的变分自编码器,获得M条异常数据记录,M为大于N的整数;对所述N条历史数据记录、所述N条历史数据记录分别对应的数据特征以及所述M条异常数据记录进行学习,获得所述异常检测模型。
上述方式中,可以通过预设的变分自编码器衍生出更多的异常数据记录,使得异常检测模型能够对更多的异常数据记录进行学习,可以让训练学习到的检测模型检测更加全面,对异常检测准确率更高。
一种可能的实现方式中,所述异常检测结果包括第一取值或第二取值;其中,所述第一取值可以用于指示所述待检测数据记录为异常数据,所述第二取值可以用于指示所述待检测数据记录为正常数据。
又一种可能的实现方式中,所述异常检测结果还可以为概率值,若所述概率值大于预设概率阈值,则可以确定所述待检测数据为异常数据;或者,若所述概率值小于或等于所述预设概率阈值,则可以确定所述待检测数据为正常数据。
上述中,所述数据特征可以但不限于包括以下一项或多项:历史数据记录随时间变化的一阶指数平滑值;历史数据记录随时间变化的二阶指数平滑值;历史数据记录随时间变化的一阶差分值。
第二方面,本申请提供一种装置。所述装置具备实现上述第一方面涉及的功能,比如,所述装置包括所述终端设备执行上述第一方面涉及步骤所对应的模块或单元或手段(means),所述功能或单元或手段(means)可以通过软件实现,或者通过硬件实现,也可以通过硬件执行相应的软件实现。
在一种可能的设计中,所述装置包括处理单元、收发单元,处理单元、收发单元执行的功能可以和上述第一方面执行的步骤相对应。
在一种可能的设计中,所述装置包括处理器,还可以包括收发器,所述收发器用于收发信号,所述处理器执行程序指令,以完成上述第一方面中任意可能的设计或实现方式中的方法。其中,所述装置还可以包括一个或多个存储器,所述存储器用于与处理器耦合。所述一个或多个存储器可以和处理器集成在一起,也可以与处理器分离设置,本申请并不限定。
一种可能的方式,存储器保存实现上述第一方面涉及的功能的必要计算机程序指令和/或数据。所述处理器可执行所述存储器存储的计算机程序指令,完成上述第一方面任意可能的设计或实现方式中的方法。
本申请实施例提供一种计算机可读存储介质,所述计算机存储介质中存储有计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述任一种可能的设计中的方法。
本申请实施例提供一种计算机程序产品,当计算机读取并执行所述计算机程序产品时,使得计算机执行上述任一种可能的设计中的方法。
本申请实施例提供一种芯片,所述芯片与存储器相连,用于读取并执行所述存储器中存储的软件程序,以实现上述任一种可能的设计中的方法。
附图说明
图1为现有技术中对通过对KPI设定阈值进行异常检测的示意图;
图2为本申请实施例提供的一种数据检测方法对应的系统架构示意图;
图3为本申请实施例提供的一种数据检测方法的流程示意图;
图4为本申请实施例示例性提供的一种数据检测方法中数据特征的示意图;
图5为本申请实施例示例性提供的一种数据检测方法中数据特征合并的示意图;
图6为本申请实施例示例性提供的一种数据检测方法中生成异常数据记录的示意图;
图7为本申请实施例示例性提供的一种数据检测方法对应的深度学习模型的网络结构示意图;
图8为本申请实施例提供的一种立体声信号处理装置结构法示意图;
图9为本申请实施例提供的一种立体声信号处理装置结构法示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图及具体的实施方式对上述技术方案进行详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互结合。
随着互联网、云计算的发展,用户对供应商提供的互联网服务的稳定性、可用性的要求越来越高,从而对互联网服务的维护提出了更高的要求。在实际运维过程中,运维监控平台的性能关键指标(Key Performance Indicator,KPI)大致分为两种类型:服务KPI和机器KPI。服务KPI是指能够反映网页Web服务的规模、质量的性能指标,例如,网页响应时间,网页访问量,连接错误数量等。机器KPI是指能够反映机器(服务器、路由器、交换机)健康状态的等性能指标,例如,中央处理器(Central Processing Unit,CPU)使用率,内存使用率,磁盘输入输出(Input and Output,IO),网卡吞吐率等,在此不再赘述。
互联网系统运维过程中通常需要对互联网服务进行异常检测。因此,需要对运维监控平台的KPI进行监控,从而及时发现互联网系统的异常情况。目前对运维监控平台的KPI进行监控的方式是基于对KPI上限或下限阈值进行的判断方式。但是,这种方式下容易出现误报或漏报。举例来说,某个KPI有高峰期和低谷期,这个KPI同一个数值,如果出现在低谷期则属于正常情况,如果出现在高峰期,则该数值相对于之前时刻和之后时刻的KPI出现了陡升陡降,属于异常情况。为了克服现有技术中对KPI的异常情况检测时未将变化规律考虑进去,进而对一些异常情况的检测结果不够准确,导致误报或漏报的问题,本申请提出了一种数据检测方法,通过预设KPI的至少一条历史数据记录分别对应的数据特征进行训练获得的异常检测模型,对预设KPI的待检测数据进行检测,从而达到根据历史数据的特征对后续待检测数据进行检测,以延续特征关联性的目的,使得检测结果更为准确。
为了便于理解,首先示例性地描述本申请实施例的应用场景。如图2所示,为本申请实施例提供的数据检测方法可以应用的一种系统架构示意图。该系统架构包括三个部分:互联网系统201;KPI监控平台202;智能运维平台203。
互联网系统201是被监测的目标系统。互联网系统201在运行过程中会产生很多KPI数据,这些KPI数据是在预定时间序列上采集的数据,举例来说,每秒内的网页访问量,每分钟内的连接错误数量,以及每秒的CPU使用率等。显然,时间序列数据可反映出KPI数据的变化规律。
KPI监控平台202是用于对互联网系统201的KPI数据进行获取、采集以及存储的平台。KPI监控平台202包括KPI数据库2021,KPI监控平台202将监控所得的KPI数据存储到KPI数据库2021中。具体地,KPI监控平台202可以对收集到的KPI数据进行了空值处理、归一化操作后,按照KPI数据库2021中预先设定的格式将前述处理后的KPI数据存储到每个KPI对应的数据表中,从而方便智能运维平台按照预设格式从KPI数据库2021中提取KPI数据。
智能运维平台203用于从KPI监控平台202获取KPI数据,并对KPI数据进行建模分析,实现对KPI异常检测。具体地,智能运维平台203包括两个模块:异常检测模块2031和报警模块2032。其中,异常检测模块2031通过从KPI监控平台202中获取的KPI数据进行数据训练,从而学习到KPI数据的变化规律,以对后续待检测的KPI数据进行正常或异常预测。报警模块2032在异常检测模块确定待检测的KPI数据异常时,生成报警消息进行输出,以便运维人员根据报警消息对互联网系统201进行相应的调控。
下面结合图3,详细介绍可应用于图2所示的系统架构中的数据检测方法,图3为本申请实施例提供的一种数据检测方法的流程示意图。
步骤301:获取预设关键性能指标KPI的待检测数据。这里对预设KPI的待检测数据和获取方法不做限定。下面具体举例说明,当步骤301应用于图2所示的系统架构时,KPI监控平台202可以从互联网系统201,获取互联网系统201中一台指定主机的预设关键性能指标KPI的待检测数据,比如是该主机的中央处理器(central process unit,CPU)的占用率。
步骤302:将所述待检测数据输入异常检测模型,获得所述待检测数据的异常检测结果。其中,异常检测模型为根据所述预设KPI的至少一条历史数据记录分别对应的数据特征进行训练获得的模型,所述数据特征表征了所述历史数据记录随时间的变化规律。需要说明的是,预设KPI的历史数据记录指KPI监控平台运行过程中已存储的预设KPI数据记录,预设KPI的历史数据记录中标记了预设KPI数据记录是否异常。
步骤302仅以一种预设KPI为例。实际上,预设KPI的至少一条历史数据记录可以包括多个KPI的历史数据记录。示例性的,步骤302在图2所示的系统架构中具体执行时,KPI监控平台202可以从互联网系统201获取该预设KPI的历史数据记录。
步骤302中获取到的预设KPI的至少一条历史数据记录还可以是进行过数据清洗的历史数据记录。比如步骤302之前,首先从互联网系统201获取到原始的预设KPI的历史数据记录,如果这些原始的预设KPI的历史数据记录并不能直接作为训练异常检测模型的历史数据记录来使用,还需要对历史数据记录进行数据空值处理、归一化操作等数据清洗工作之后,获取到预设KPI的至少一条历史数据记录。其中,预设KPI的至少一条历史数据记录包括以下信息:生成至少一条历史数据记录的时间戳;预设KPI的至少一条数据;表征预设KPI的至少一条数据是否异常的标签值,如0表示该KPI数据异常,1表示该KPI数据正常。
下面示例性的给出确定预设KPI的至少一条历史数据记录的数据特征的过程。
需要说明的是,本申请实施例中,预设KPI的至少一条历史数据记录分别对应的数据特征指,预设KPI的至少一条历史数据记录中每条历史数据记录分别对应的数据特征,包括以下一项或多项:第一特征;第二特征;第三特征;第一特征为该条历史数据记录随时间变化的一阶指数平滑值;第二特征为该条历史数据记录随时间变化的二阶指数平滑值;第三特征为该条历史数据记录随时间变化的一阶差分值。
具体地,确定预设KPI的至少一条历史数据记录的数据特征是对所述预设KPI的至少一条历史数据记录进行特征提取并进行特征合并的步骤。下面结合图4对特征提取过程进行说明,图4为本申请实施例示例性提供的数据特征提取的示意图。其中,特征提取方式有三种,可根据具体场景需求从这三种数据提取方式任选一种或多种,这三种特征提取方式具体包括:
(1)确定预设KPI的至少一条历史数据记录分别对应的第一特征,第一特征为预设KPI的至少一条历史数据记录分别对应的一阶指数平滑值。一阶指数平滑是一种常用的时间序列平滑方法,是以指数式递减加权的移动平均。加权的程度由常数α决定,α数值介于[0,1],举例来说,α=0.1,0.3,0.5,0.7,0.9。预设KPI的至少一条历史数据记录分别对应的一阶指数平滑值可表征某个时刻之前的KPI数据对该时刻KPI数据的影响。
举例来说,在t时刻的实际KPI数据为Yt,而t时刻的一阶指数平滑值为St;t-1时刻的一阶指数平滑值则为St-1,t≥2时,一阶指数平滑值的计算公式为:
St=αYt+(1-α)St-1
(2)确定预设KPI的至少一条历史数据记录分别对应的第二特征,第二特征为预设KPI的至少一条历史数据记录分别对应的一阶指数平滑值。二阶指数平滑是一种在上述一阶指数平滑基础上的时间序列平滑方法,可表征KPI数据的递增、递减和周期性等变化趋势。举例来说,在t时刻的实际KPI数据为Yt,而t时刻的一阶指数平滑值为St,bt是在t时刻对变化趋势的最佳估计值。预设KPI的至少一条历史数据记录分别对应的二阶指数平滑值记为Ft+m,表示在t+m处对Yt值的估计,m为选取的时间步长,举例来说时间粒度为分钟,Ft+m表示在第t+5分钟对Yt值的估计。具体公式如下所示:
S1=Y1
b1=Y1-Y0
对于t>1则有:
St=αYt+(1-α)(Yt-1+bt-1);
bt=β(St-St-1)+(1-β)bt-1
其中α是数据平滑因子,α∈(0,1),β是趋势平滑因子,β∈(0,1)。
Ft+m=St+mbt
上述公式中,举例来说,参数组合为α=0.2,β=0.4;α=0.4,β=0.6;α=0.6,β=0.4;α=0.8,β=0.2。
(3)确定预设KPI的至少一条历史数据记录分别对应的第三特征,第三特征为预设KPI的至少一条历史数据记录分别对应的一阶差分值。一阶差分值可以表征预设KPI的至少一条历史数据记录分别对应的变化快慢程度,一阶差分值的计算公式如下:
Δh(t)=Yt-Yt-d
其中Yt为t时刻的实际KPI数据,Yt-d为(t-d)时刻的实际KPI数据,d为计算一阶差分的KPI数据对应时刻的间隔时长。
在确定预设KPI的至少一条历史数据记录的数据特征的过程中,在根据不同的特征提取方法分别提取了数据特征后,还可以对提取到的数据特征进行合并,图5为本申请实施例示例性提供的数据特征合并的示意图。首先分别提取预设KPI的至少一条历史数据记录分别对应的第一特征、第二特征和第三特征。其中,a1为预设KPI的至少一条历史数据记录分别对应的一阶指数平滑值中任意一个;b1为预设KPI的至少一条历史数据记录分别对应的二阶指数平滑值中任意一个,c1为预设KPI的至少一条历史数据记录分别对应的一阶差分值中任意一个。再将预设KPI的至少一条历史数据记录以及预设KPI的至少一条历史数据记录分别对应的第一特征、第二特征和第三特征合并为一条记录,这样就可以得到的数据特征更加丰富和全面。
在确定预设KPI的至少一条历史数据记录的数据特征的过程中,由于异常情况在互联网系统的实际运行过程中发生概率比较小,因此直接从互联网系统直接获取到的异常历史数据记录较少,所以一些异常情况对应的历史数据记录是缺少的,进而可能导致训练出的异常检测模型的检测结果不能准确识别一些异常情况。因此,预设KPI的至少一条历史数据记录中包括N条历史数据记录,N为大于0的整数,为了衍生出一些缺少的异常历史数据记录,本申请实施例提供一种可选的实施方式为:将N条历史数据记录输入预设的变分自编码器,获得M条异常历史数据记录,M为大于N的整数,从而可以丰富异常历史数据记录,使之训练出来的模型能够更为精准的检测网络异常数据。之后,再将预设KPI的至少一条历史数据记录的数据特征以及M条异常历史数据记录进行学习,获得异常检测模型。举例来说,输入预设检测模型进行深度学习训练,获得异常检测模型。
如图6所示,为本申请实施例示例性提供的一种数据检测方法中生成异常历史数据记录的示意图,图6中输入的训练数据以X1~X6为例,X1~X6均为一组异常历史数据记录,获得M条异常历史数据记录的具体过程如下:
第一步,将X1~X6通过变分自编码器中的均值方差计算模块,计算出每组异常历史数据记录的均值和方差,其中每组异常历史数据记录对应一组均值和方差。举例来说,X1对应均值1和方差1。以下步骤均以X1举例说明生成异常历史数据记录的过程。
第二步,根据均值1和方差1可以确定一个第一正态分布,第一标准正态分布对应着一个均值为0、方差为1的第二标准正态分布。
第三步,在第二标准正态分布中随机采样,每次采样都会得到一个采样值。
第四步,通过生成器将每个采样值转换为一条异常历史数据记录。需要说明的是,生成器是一个神经网络,对生成器的参数进行训练的两个损失函数为信息熵损失函数和KL散度损失函数。
确定了预设KPI的至少一条历史数据记录的数据特征之后,可以得到一个训练数据集。训练数据集指预设KPI的至少一条历史数据记录,以及预设KPI的至少一条历史数据记录分别对应的数据特征。
下面详细说明根据训练数据集,获得异常检测模型的过程。
对具体的学习训练方式不做限定,仅以深度学习训练为例说明获得异常检测模型的过程。将训练数据集输入预设检测模型进行深度学习训练,获得异常检测模型。其中,训练数据集中每一条训练样本包括:预设KPI的至少一条历史数据记录以及经过特征提取并合并的数据特征。异常检测模型可以为一个深度学习模型,深度学习模型的网络结构有多种,下面示例性的以一种深度学习模型的网络结构来说明根据训练数据集,获得异常检测模型的过程。如图7所示,为本申请实施例提供的一种数据检测方法对应的深度学习模型的网络结构示意图,该模型具有两个全连接隐藏层(激活函数采用ReLU)和输出层(激励函数采用Sigmoid)。在对深度学习模型进行训练时,还可以通过随机删除隐层单元(dropout)或正则化的方法对深度学习模型进行处理,以降低过拟合问题。
深度学习模型的训练过程具体如下:
第一步、将训练数据集的训练样本依次输入至深度学习模型。
第二步、根据训练样本中每个维度的取值,以及深度学习模型中隐藏层和输出层的参数和神经元的权重值,确定出训练样本的异常概率值。
第三步、将异常概率值与概率阈值进行比较,输出表征训练样本为正常样本或异常样本的值,如输出值为0或1。
举例来说,若异常概率值大于或等于概率阈值,则输出1,表示训练样本为异常样本;反之,则输出0,表示训练样本为正常样本。
第四步、将输出值与训练样本中的标签值进行比较,以及将异常概率值与概率阈值进行比较,通过比较结果,调整隐藏层和输出层中神经元的权重值,或者概率阈值。
举例来说,一方面,若输出值与标签值一致,说明对训练样本的检测结果准确,可通过调整隐藏层和输出层中神经元的权重值,增加该训练样本后续输入深度学习模型时在第三步得到的异常概率值,更接近1,或者降低概率阈值;另一方面,若输出值与标签值不一致,也可通过调整隐藏层和输出层中神经元的权重值,降低该训练样本后续输入深度学习模型时在第三步得到的异常概率值,或者增加概率阈值。
经过训练数据集输入预设检测模型进行深度学习训练深度学习训练后,调整得到的这个深度学习模型就成为了一个可以检测KPI数据是否异常的异常检测模型,而且确定了KPI数据是否异常的预设概率阈值。
另有两种根据异常检测结果确定预设KPI的待检测数据记录是否异常的可选实施方式,第一种可选实施方式如下:
该方式直接输出待检测数据记录是正常数据记录或异常数据记录。异常检测结果可以为第一取值或第二取值;第一取值可以用于指示待检测数据记录为异常数据记录,第二取值可以用于指示待检测数据记录为正常数据记录。举例来说,第一取值可以为1,第二取值可以为0。当然第一取值和第二取值还可以为其他取值,本申请实施例这里不做限定。
第二种可选实施方式如下:
该方式下,异常检测结果还可以为异常概率值,若异常概率值大于预设概率阈值,则确定待检测数据记录为异常数据记录;或者,异常概率值小于或等于预设概率阈值,则确定待检测数据记录为正常数据记录。举例来说,预设概率阈值为0.8,异常概率值为0.9,从而确定确定待检测数据记录为异常数据记录,相当于第二种可选实施方式下,在异常概率值大于或等于0.8时,映射第一种方式中的第一取值;异常概率值小于0.8时,映射第一种方式中的第二取值。
本申请实施例采用多种提取方法对KPI数据记录进行特征提取,最终将提取到的所有特征进行合并,并作为深度学习模型训练的输入数据。算法可以自适应不同类型的KPI、自动提取特征,并满足实际运维场景中实时异常检测的要求。
本申请还可采用基于变分自编码器的过采样技术解决正常样本和异常样本不均衡的问题。采用了变分自编码器对KPI数据记录进行数据均衡处理,基于现有数据集中异常数据的规律,模拟出更多异常数据,解决数据不均匀的问题。模型的训练数据集不局限于单一KPI的监控数据,以致于本申请所训练的一个异常检测模型可以同时适应多种KPI的异常检测。
如图8所示,为本申请实施例提供一种数据检测装置的结构示意图。该数据检测装置可以用于执行上述各方法实施例中终端设备的动作,该通信装置800包括:收发单元801和处理单元802。收发单元801,用于获取预设关键性能指标KPI的待检测数据;处理单元802,用于将所述待检测数据输入异常检测模型,获得所述待检测数据的异常检测结果;所述异常检测模型为对所述预设KPI的至少一条历史数据记录分别对应的数据特征进行训练获得的模型;所述数据特征表征了所述历史数据记录随时间变化的变化规律。其中,所述数据特征包括但不限于为以下一项或多项:历史数据记录随时间变化的一阶指数平滑值;历史数据记录随时间变化的二阶指数平滑值;历史数据记录随时间变化的一阶差分值。
示例性的,所述至少一条历史数据记录中可以包括N条历史数据记录,N为大于0的整数,所述处理单元802还可以将所述N条历史数据记录输入预设的变分自编码器,获得M条异常数据记录,M为大于N的整数;并对所述N条历史数据记录、所述N条历史数据记录分别对应的数据特征以及所述M条异常数据记录进行学习,获得所述异常检测模型。使得学习到的异常检测模型检测准确性更好。
一种实施例中,所述异常检测结果可以为为第一取值或第二取值,所述处理单元802若确定所述异常检测结果为所述第一取值,则可以确定所述待检测数据记录为异常数据记录;或者,若确定所述异常检测结果为所述第二取值,则可以确定所述待检测数据记录为正常数据记录。
另一种实施例中,所述异常检测结果还可以为概率值,所述处理单元802在所述概率值大于预设概率阈值,则确定所述待检测数据为异常数据记录;或者若所述概率值小于或等于所述预设概率阈值,则确定所述待检测数据为正常数据记录。
如图9所示,为本申请实施例提供一种数据检测装置的结构示意图。参见图9,该装置包括:处理器901、通信模块902。还可以进而包括存储器,由存储器存储可执行指令,所述可执行指令用于指示所述处理器901通过通信模块902执行上述方法实施例中的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (13)

1.一种数据检测方法,其特征在于,包括:
获取预设关键性能指标KPI的待检测数据;
将所述待检测数据输入异常检测模型,获得所述待检测数据的异常检测结果;所述异常检测模型为对所述预设KPI的至少一条历史数据记录分别对应的数据特征进行训练获得的模型;所述数据特征表征了所述历史数据记录随时间的变化规律。
2.如权利要求1所述的方法,其特征在于,所述至少一条历史数据记录中包括N条历史数据记录,N为大于0的整数,按照以下方式获得所述异常检测模型:
将所述N条历史数据记录输入预设的变分自编码器,获得M条异常数据记录,M为大于N的整数;
对所述N条历史数据记录、所述N条历史数据记录分别对应的数据特征以及所述M条异常数据记录进行学习,获得所述异常检测模型。
3.如权利要求1所述的方法,其特征在于,所述异常检测结果为第一取值或第二取值;所述第一取值指示所述待检测数据记录为异常数据记录,所述第二取值指示所述待检测数据记录为正常数据记录。
4.如权利要求1所述的方法,其特征在于,所述异常检测结果为概率值;
若所述概率值大于预设概率阈值,则确定所述待检测数据为异常数据记录;
或者,若所述概率值小于或等于所述预设概率阈值,则确定所述待检测数据为正常数据记录。
5.如权利要求1至4任一所述的方法,其特征在于,所述数据特征包括以下一项或多项:
历史数据记录随时间变化的一阶指数平滑值;
历史数据记录随时间变化的二阶指数平滑值;
历史数据记录随时间变化的一阶差分值。
6.一种数据检测装置,其特征在于,包括:
收发单元,用于获取预设关键性能指标KPI的待检测数据;
处理单元,用于将所述待检测数据输入异常检测模型,获得所述待检测数据的异常检测结果;所述异常检测模型为对所述预设KPI的至少一条历史数据记录分别对应的数据特征进行训练获得的模型;所述数据特征表征了所述历史数据记录随时间的变化规律。
7.如权利要求6所述的装置,其特征在于,所述至少一条历史数据记录中包括N条历史数据记录,N为大于0的整数,所述处理单元具体用于:
将所述N条历史数据记录输入预设的变分自编码器,获得M条异常数据记录,M为大于N的整数;
对所述N条历史数据记录、所述N条历史数据记录分别对应的数据特征以及所述M条异常数据记录进行学习,获得所述异常检测模型。
8.如权利要求6所述的装置,其特征在于,所述异常检测结果为第一取值或第二取值,所述处理单元具体用于:
若所述异常检测结果为所述第一取值,则确定所述待检测数据记录为异常数据记录;
或者,若所述异常检测结果为所述第二取值,则确定所述待检测数据记录为正常数据记录。
9.如权利要求6所述的装置,其特征在于,所述异常检测结果为概率值,所述处理单元具体用于:
若所述概率值大于预设概率阈值,则确定所述待检测数据为异常数据记录;或者
若所述概率值小于或等于所述预设概率阈值,则确定所述待检测数据为正常数据记录。
10.如权利要求6至9任一所述的装置,其特征在于,所述数据特征包括以下一项或多项:
历史数据记录随时间变化的一阶指数平滑值;
历史数据记录随时间变化的二阶指数平滑值;
历史数据记录随时间变化的一阶差分值。
11.一种数据检测装置,其特征在于,包括:存储器与处理器,所述存储器用于存储指令,所述处理器用于执行所述存储器存储的指令,以执行如权利要求1至5中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,包括计算机可读指令,当通信装置读取并执行所述计算机可读指令时,使得所述通信装置执行如权利要求1至5中任一项所述的方法。
13.一种计算机程序产品,其特征在于,包括计算机可读指令,当通信装置读取并执行所述计算机可读指令,使得所述通信装置执行如权利要求1至5中任一项所述的方法。
CN201910401145.5A 2019-05-15 2019-05-15 一种数据检测方法及装置 Active CN111949496B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910401145.5A CN111949496B (zh) 2019-05-15 2019-05-15 一种数据检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910401145.5A CN111949496B (zh) 2019-05-15 2019-05-15 一种数据检测方法及装置

Publications (2)

Publication Number Publication Date
CN111949496A true CN111949496A (zh) 2020-11-17
CN111949496B CN111949496B (zh) 2022-06-07

Family

ID=73335679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910401145.5A Active CN111949496B (zh) 2019-05-15 2019-05-15 一种数据检测方法及装置

Country Status (1)

Country Link
CN (1) CN111949496B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112187555A (zh) * 2020-12-01 2021-01-05 北京蒙帕信创科技有限公司 一种基于机器学习的实时kpi数据异常检测方法及装置
CN112766429A (zh) * 2021-04-09 2021-05-07 北京瑞莱智慧科技有限公司 一种异常检测的方法、装置、计算机设备和介质
CN112987675A (zh) * 2021-05-06 2021-06-18 北京瑞莱智慧科技有限公司 一种异常检测的方法、装置、计算机设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040039968A1 (en) * 2000-09-11 2004-02-26 Kimmo Hatonen System, device and method for automatic anomally detection
CN102647306A (zh) * 2012-03-22 2012-08-22 华为技术有限公司 一种网络指标呈现方法及装置
CN109032829A (zh) * 2018-07-23 2018-12-18 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040039968A1 (en) * 2000-09-11 2004-02-26 Kimmo Hatonen System, device and method for automatic anomally detection
CN102647306A (zh) * 2012-03-22 2012-08-22 华为技术有限公司 一种网络指标呈现方法及装置
CN109032829A (zh) * 2018-07-23 2018-12-18 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112187555A (zh) * 2020-12-01 2021-01-05 北京蒙帕信创科技有限公司 一种基于机器学习的实时kpi数据异常检测方法及装置
CN112187555B (zh) * 2020-12-01 2021-03-19 北京蒙帕信创科技有限公司 一种基于机器学习的实时kpi数据异常检测方法及装置
CN112766429A (zh) * 2021-04-09 2021-05-07 北京瑞莱智慧科技有限公司 一种异常检测的方法、装置、计算机设备和介质
CN112987675A (zh) * 2021-05-06 2021-06-18 北京瑞莱智慧科技有限公司 一种异常检测的方法、装置、计算机设备和介质
CN112987675B (zh) * 2021-05-06 2021-07-23 北京瑞莱智慧科技有限公司 一种异常检测的方法、装置、计算机设备和介质

Also Published As

Publication number Publication date
CN111949496B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
CN109347668B (zh) 一种服务质量评估模型的训练方法及装置
CN111949496B (zh) 一种数据检测方法及装置
WO2020077672A1 (zh) 一种服务质量评估模型的训练方法及装置
CN109000940B (zh) 一种机车车辆异常轴温诊断方法及系统
US20190087737A1 (en) Anomaly detection and automated analysis in systems based on fully masked weighted directed
CN113518011B (zh) 异常检测方法和装置、电子设备及计算机可读存储介质
CN112015153B (zh) 一种无菌灌装生产线异常检测系统和方法
EP1958034B1 (en) Use of sequential clustering for instance selection in machine condition monitoring
KR20180108446A (ko) Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
US20210201201A1 (en) Method and apparatus for determining storage load of application
US10394631B2 (en) Anomaly detection and automated analysis using weighted directed graphs
Lim et al. Identifying recurrent and unknown performance issues
CN114297036A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN114528190B (zh) 单指标异常的检测方法、装置、电子设备及可读存储介质
KR101960755B1 (ko) 미취득 전력 데이터 생성 방법 및 장치
EP3712728A1 (en) Apparatus for predicting equipment damage
CN111160959A (zh) 一种用户点击转化预估方法及装置
CN117041017B (zh) 数据中心的智能运维管理方法及系统
CN116684878B (zh) 一种5g信息传输数据安全监测系统
CN116909712A (zh) 基于机器学习的智能任务调度系统及其方法
CN115858606A (zh) 时序数据的异常检测方法、装置、设备及存储介质
CN111563078B (zh) 基于时序数据的数据质量检测方法、检测装置及存储装置
CN109978038B (zh) 一种集群异常判定方法及装置
CN116957361B (zh) 一种基于虚实结合的船舶任务系统健康状态检测方法
US20220283139A1 (en) Method, system and paperboard production machine for estimating paperboard quality parameters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant