CN113568950A - 一种指标检测方法、装置、设备及介质 - Google Patents

一种指标检测方法、装置、设备及介质 Download PDF

Info

Publication number
CN113568950A
CN113568950A CN202110865028.1A CN202110865028A CN113568950A CN 113568950 A CN113568950 A CN 113568950A CN 202110865028 A CN202110865028 A CN 202110865028A CN 113568950 A CN113568950 A CN 113568950A
Authority
CN
China
Prior art keywords
index
data
detected
detection
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110865028.1A
Other languages
English (en)
Inventor
岑贞德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202110865028.1A priority Critical patent/CN113568950A/zh
Publication of CN113568950A publication Critical patent/CN113568950A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Mathematical Optimization (AREA)
  • Development Economics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Linguistics (AREA)
  • Debugging And Monitoring (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Quality & Reliability (AREA)

Abstract

本公开实施例涉及一种指标检测方法、装置、设备及介质,其中该方法包括:获取待检测的目标运行指标以及所述目标运行指标的数据采集参数;确定所述目标运行指标的指标类型,并获取与所述指标类型相应的异常检测模型;其中,不同指标类型分别对应不同异常检测模型;根据所述数据采集参数采集所述目标运行指标对应的待检测时序数据;基于所述异常检测模型检测所述待检测时序数据是否异常。这种方式不再需要人工设置阈值,而是可以按照目标运行指标的指标类型,采取与指标类型相应的异常检测模型直接对待检测时序数据进行异常检测,在节约人力成本的基础上也可以有效提升异常检测效率。

Description

一种指标检测方法、装置、设备及介质
技术领域
本公开涉及信息处理技术领域,尤其涉及一种指标检测方法、装置、设备及介质。
背景技术
对于购物网站、游戏系统等各种基于网络技术实现的线上系统而言,系统运行的稳定性非常重要。而线上系统的规模和复杂度会随着业务不断增长,系统稳定性变得愈加重要。面对数量众多的系统运行指标,如何识别系统运行异常是保证系统稳定性的关键环节。
在相关技术中,主要采用设定阈值的方式来判别运行指标的数据是否异常,这种方式需要相关人员为每个运行指标分别配置阈值,所需的人工成本极高,费时费力,且效率低下。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种指标检测方法、装置、设备及介质。
本公开实施例提供了一种指标检测方法,所述方法包括:获取待检测的目标运行指标以及所述目标运行指标的数据采集参数;确定所述目标运行指标的指标类型,并获取与所述指标类型相应的异常检测模型;其中,不同指标类型分别对应的不同异常检测模型;根据所述数据采集参数采集所述目标运行指标对应的待检测时序数据;基于所述异常检测模型检测所述待检测时序数据是否异常。
可选的,所述数据采集参数包括数据源信息、数据筛选规则、数据提取粒度以及粒度降采样策略;所述基于所述数据采集参数采集所述目标运行指标对应的待检测时序数据的步骤,包括:根据所述数据源信息确定目标数据源;基于所述数据筛选规则从所述目标数据源中筛选出所述目标运行指标对应的最小粒度的原始时序数据;按照所述粒度降采样策略对所述原始时序数据进行合并操作,以得到与所述数据提取粒度匹配的待检测时序数据。
可选的,所述确定所述目标运行指标的指标类型的步骤,包括:查询所述目标运行指标的指标类型;所述指标类型包括季节性单指标类型、非季节性单指标类型或多指标类型;其中,所述季节性单指标类型为与其它指标无关的且相应时序数据具有季节性规律的指标;所述非季节性单指标类型为与其它指标无关的且相应时序数据不具有季节性规律的指标;所述多指标类型为由至少两个指标共同确定的指标。
可选的,当所述指标类型为季节性单指标类型时,所述基于所述异常检测模型判断所述待检测时序数据是否异常的步骤,包括:采用预设算法计算得到所述待检测时序数据的残差;采用预设的异常点检测算法对所述残差进行异常检测,基于检测结果判断所述待检测时序数据是否异常。
可选的,所述采用预设算法计算得到所述待检测时序数据的残差的步骤,包括:基于指数平滑算法计算得到所述待检测时序数据的第一残差,和/或,基于线性回归算法计算得到所述待检测时序数据的第二残差;所述采用预设的异常点检测算法对所述残差进行异常检测,基于检测结果判断所述待检测时序数据是否异常的步骤,包括:采用第一异常点检测算法对得到的所述第一残差进行异常检测,得到第一异常点检测结果;采用第二异常点检测算法对得到的所述第二残差进行异常检测,得到第二异常点检测结果;根据所述第一异常点检测结果和所述第二异常点检测结果的并集判断所述待检测时序数据是否异常。
可选的,所述基于线性回归算法计算得到所述待检测时序数据的第二残差的步骤,包括:采用至少两种步长对所述待检测时序数据进行线性回归,得到每种步长对应的第二残差;所述采用第二异常点检测算法对所述第二残差进行异常检测,得到第二异常点检测结果的步骤,包括:采用第二异常点检测算法分别对每种步长对应的第二残差进行异常检测,并将每种步长对应的第二残差的异常点检测结果的交集作为第二异常点检测结果。
可选的,当所述指标类型为非季节性单指标类型时,所述基于所述异常检测模型判断所述待检测时序数据是否异常的步骤,包括:采用预设的异常点检测算法对所述待检测时序数据进行异常检测,基于检测结果判断所述待检测时序数据是否异常。
可选的,当所述指标类型为多指标类型时,所述基于所述异常检测模型判断所述待检测时序数据是否异常的步骤,包括:基于二项分布函数和标准分数函数计算得到所述待检测时序数据的标准分数;采用预设的异常点检测算法对所述标准分数进行异常检测,基于检测结果判断所述待检测时序数据是否异常。
可选的,所述基于二项分布函数和标准分数函数计算得到所述待检测时序数据的标准分数的步骤,包括:基于所述目标运行指标在第二指定时间区间内的历史时序数据确定二项分布函数的期望参数和标准差参数;基于所述二项分布函数的期望参数和标准差参数、以及标准分数函数计算得到所述待检测时序数据的标准分数;其中,所述二项分布函数的期望参数等于所述标准分数函数中的平均数参数,所述二项分布函数的标准差参数等于所述标准分数函数中的标准差参数。
可选的,所述异常检测模型均包括N-sigma异常点检测算法和/或IQR异常点检测算法。
本公开实施例还提供了一种指标检测装置,包括:指标获取模块,用于获取待检测的目标运行指标以及所述目标运行指标的数据采集参数;模型获取模块,用于确定所述目标运行指标的指标类型,并获取与所述指标类型相应的异常检测模型;其中,不同指标类型分别对应不同异常检测模型;数据采集模块,用于根据所述数据采集参数采集所述目标运行指标对应的待检测时序数据;异常检测模块,用于基于所述异常检测模型检测所述待检测时序数据是否异常。
本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的指标检测方法。
本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的指标检测方法。
本公开实施例提供的上述技术方案,首先获取目标运行指标以及目标运行指标的数据采集参数,然后确定目标运行指标的指标类型,并获取与指标类型相应的异常检测模型;之后根据数据采集参数采集目标运行指标对应的待检测时序数据,最终基于异常检测模型检测待检测时序数据是否异常。这种方式不再需要人工设置阈值,而是可以按照目标运行指标的指标类型,采取与指标类型相应的异常检测模型直接对待检测时序数据进行异常检测,在节约人力成本的基础上也可以有效提升异常检测效率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种指标检测方法的流程示意图;
图2为本公开实施例提供的另一种指标检测方法的流程示意图;
图3为本公开实施例提供的一种无阈值监控告警系统的结构示意图;
图4为本公开实施例提供的一种指标检测装置的结构示意图;
图5为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
相关技术在监控系统是否异常时,都是采用人工设置告警阈值(也即,异常阈值)的方式来对系统的运行指标进行异常检测,并在指标数据超出阈值时确定数据异常,之后还可以进一步发起告警,比如在线人数同比上周下降30%则告警,或数量掉零时告警等。但是由于不同的运行指标可能在不同时间有不同的表现,为了减少漏报误报,相关人员还需要持续关注运行指标的变化,并定期动态调整各指标对应的阈值,需要耗费极大的人工成本,而且当系统需要监控的指标数量越来越多时,手动设定阈值的方式就变得不切实际了。为此本公开实施例提供了一种指标检测方法、装置、设备及介质,详细说明如下:
图1为本公开实施例提供的一种指标检测方法的流程示意图,该方法可以由指标检测装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法主要包括如下步骤S102~步骤S108:
步骤S102,获取待检测的目标运行指标以及目标运行指标的数据采集参数。
其中,目标运行指标可以为目标系统的运行指标,目标系统为线上系统,诸如可以为游戏系统、购物系统、交友系统等等,可以根据实际情况进行选择。目标运行指标即为用户想要监测是否异常的运行指标,可以由用户进行指定,运行指标诸如可以是系统登录人数等流量类指标,也可以是诸如响应延迟时长等延迟类指标,还可以是由至少两个指标共同确定的指标,诸如成功率指标等。指标种类在此不进行限制。运行指标通常以单变量时间序列数据的形式存在,比如登录发起数这个指标在14:01时值为100,在14:00时值为90,在13:59时值为80……可以以1分钟为粒度组成了一串有序的数据点,每个点由时间和一个数值组成。此时登录发起数对应的时序数据可表示为X={xt,xt-1,…,xt-n,…},其中xt代表t时刻的数值。在实际应用中,时序数据的粒度可以根据实际需求而设置,诸如以30秒为粒度(即每30秒对应一个数据点)、以1分钟为粒度(即每1分钟对应一个数据点)、以30分钟为粒度(即每30分钟对应一个数据点)等等,在此不进行限制。假设通过符号g表示时序数据的粒度,在一些实施方式中可以设置粒度的单位为秒,以1分钟为粒度的时序数据中,则可表示为g=60,也即每一分钟(60秒)对应一个数据点。
在一些实施方式中,用户的查询指令中携带有待检测的目标运行指标以及该目标运行指标的数据采集参数,当接收到用户的查询指令时,即可获取到待检测的目标运行指标以及该目标运行指标的数据采集参数。其中,数据采集参数用于表征采集目标运行指标的时序数据的方式,也可以理解为数据采集条件等。示例性地,数据采集参数包括数据源信息、数据筛选规则、数据提取粒度以及粒度降采样策略中的一种或多种。
步骤S104,确定目标运行指标的指标类型,并获取与指标类型相应的异常检测模型;其中,不同指标类型分别对应不同异常检测模型。
在一些实施方式中,可以预先根据系统运行指标的时序数据的表现形式而将运行指标划分为多种类型,诸如,可以将指标类型划分为单指标类型和多指标类型,被划为单指标类型的运行指标可以理解为是独立指标,诸如,系统的登录人数等指标可认为是单指标;而被划为多指标类型的运行指标可以认为是与至少两个指标相关联的非独立指标,诸如系统接口的成功率指标则可认为是与成功数指标与发起数指标相关的非独立指标,具体而言是需要成功数指标的数据与发起数指标的数据共同通过决定。考虑到大多数多指标类型的指标仅与两个指标相关,在一些具体实施方式中,可以直接将多指标类型设定为双指标类型,诸如成功率指标即属于双指标类型。进一步,还可以根据时序数据是否具有季节周期性规律而将单指标类型划分为季节性单指标类型和非季节性单指标类型。可以理解的是,以上仅为一种示例,在实际应用中可以根据实际情况而灵活划分指标类型。
在确定目标运行指标的指标类型时,可以直接基于获取到的目标运行指标的时序数据(可以是待检测时序数据和/或指定时段内的历史时序数据)的表现形式进行分析,得到该目标运行指标对应的指标类型;还可以直接查找预先建立的指标类型表,在该指标类型表中已根据各运行指标的数据表现形式确定相应的指标类型,并建立有运行指标与指标类型的对应关系,因此可通过查表的方式直接确定目标运行指标对应的指标类型。
在本实施例中,可以针对不同的指标类型采用不同的异常检测模型,也即,所采用的异常检测模型与指标类型相关,不同指标类型分别对应不同异常检测模型。异常检测模型是预先构建的能够直接从时序数据中检测出异常点的模型。该异常检测模型可以理解为预先构建的针对时序数据所采用的异常检测流程或算法。本实施例在确定目标运行指标对应的指标类型之后,可以直接获取该指标类型相应的异常检测模型,以便后续进行异常检测。
步骤S106,根据数据采集参数采集目标运行指标对应的待检测时序数据。
如前所述,目标系统在运行时,每个运行指标都会对应有大量的时序数据,而在前述步骤S102获取到目标运行指标的数据采集参数之后,可基于数据采集参数从目标运行指标所对应的大量时序数据中采集到所需检测的时序数据。诸如,数据采集参数包括数据源信息、数据筛选规则、数据提取粒度以及粒度降采样策略,数据源信息用于表征待检测时序数据的获取方式(也即,数据来源),数据筛选规则可用于表征用户设置的诸如时间周期、地域范围等筛选条件,数据提取粒度可用于表征最终所得到的待检测时序数据的粒度大小,粒度降采样策略可用于表征将时序数据的粒度变大的方式等。以上均可通过用户/系统预先设置,在此不进行限定。
步骤S108,基于异常检测模型检测待检测时序数据是否异常。也即,采用上述获取到的与指标类型相应的异常检测模型检测待检测时序数据是否异常。
一种实施方式中,无论是何种异常检测模型,都包含异常点检测算法,异常点检测算法诸如可以是IQR(InterQuartile Range,四分位距)异常检测算法、N-sigma异常检测算法等,在此不进行限制。其中,N-sigma异常检测算法基于3-sigma定律,即对于服从正态分布的样本来说,几乎99.73%的值都在平均值正负3个标准差的范围内,所以可以认为超过这个范围的值就是异常值。N的值不一定是3,在实际应用时可以根据情况做调整。IQR异常检测算法使用了四分位距,四分位距是75%分位数和25%分位数的差,在该算法中认为大于75%分位数加上N个四分位距或小于25%分位数减去N个四分位距的值都是异常值,N通常为1.5,但也可以根据实际情况做调整。IQR异常检测算法因为使用的是分位数,所以不容易受到异常值的影响。通过上述方式,无需固定设置阈值,而是采用统计学方式,根据数据分布规律进行异常点检测,可以提升异常检测效率以及异常检测可靠性。
不同的异常检测模型中还可以包括针对指标类型而相应采取的预处理算法,以通过该预处理算法将时序数据转换为异常点检测算法可处理的数据,诸如,针对季节性单指标类型的运行指标,可以预先将待检测时序数据转换为异常点检测算法可处理的不具有季节性规律的数据,之后再采用预设的异常点检测算法对转换后的数据进行异常检测,而对于非季节性单指标类型的运行指标,则可以直接采用异常点检测算法进行异常检测。本公开实施例提供的上述技术方案,不再需要人工设置阈值,而是可以按照目标运行指标的指标类型,采取与指标类型相应的异常检测模型直接对待检测时序数据进行异常检测,在节约人力成本的基础上也可以有效提升异常检测效率。
在数据采集参数包括数据源信息、数据筛选规则、数据提取粒度以及粒度降采样策略的基础上,本实施例给出了一种基于数据采集参数采集目标运行指标对应的待检测时序数据的实施方式:首先根据数据源信息确定目标数据源;然后基于数据筛选规则从目标数据源中筛选出目标运行指标对应的最小粒度的原始时序数据;之后按照粒度降采样策略对原始时序数据进行合并操作,以得到与数据提取粒度匹配的待检测时序数据。为便于理解,以下结合一种具体的实施方式详细说明:
首先接收针对目标运行指标的查询语句;查询语句携带有目标运行指标对应的数据源信息和数据筛选规则;然后根据数据源信息确定目标数据源,并基于数据筛选规则、数据提取粒度以及粒度降采样策略从目标数据源中提取出目标运行指标对应的待检测时序数据,具体而言,首先基于数据筛选规则从目标数据源中筛选出目标运行指标对应的最小粒度的原始时序数据;然后按照粒度降采样策略对原始时序数据进行合并操作,以得到与数据提取粒度匹配的待检测时序数据。其中,数据筛选规则诸如包括时间筛选规则、地域筛选规则等,具体可根据实际需求而灵活设置。在一些实施方式中,可以预先确定指定目标运行指标的类型,诸如如果目标运行指标为单指标类型,则只需一条查询语句即可,如果目标运行指标为多指标类型,则相应可以需要多条查询语句,诸如目标运行指标为由成功数和发起数共同决定的成功率,则可通过两条查询语句分别调取成功数和发起数的相关数据。
查询语句的格式可以由系统进行定义,该查询语句中可以携带有多种信息,除了数据源信息、数据筛选规则之外,还可以携带有数据提取粒度和粒度降采样策略;诸如数据筛选条件、数据提取粒度、粒度降采样策略等信息都可以由用户根据实际情况而预先设置。数据降采样策略可以用于指示对提取出的原始时序数据采用何种降采样操作,数据提取粒度可以用于指示最终所得到的待检测时序数据的粒度大小。前述降采样操作是指将时序数据的粒度变大,具体可理解为将小粒度的多个数据进行合并得到大粒度的一个数据,合并方式诸如可以为求取多个数据的平均值、最大值、最小值等。比如原始时序数据的粒度是30秒,通过降采样操作(合并操作)则可以得到粒度为1分钟、5分钟或者1小时的时序数据。粒度为30秒的时序数据的表现形式为:每30秒对应一个数据,而粒度为1分钟的时序数据的表现形式为:每1分钟对应一个数据,若要将粒度为30秒的时序数据通过降采样方式变为粒度为1分钟的时序数据,则需要将2个粒度为30秒的数据合并为1个粒度为1分钟(60秒)的数据。又诸如,最小粒度是以秒为单位,每秒对应一个数据,基于粒度降采样策略将数据合并,得到用户所需粒度(数据提取粒度)的时序数据,便于后续能够更高效的进行数据分析处理。
本公开实施例给出了一种确定目标运行指标的指标类型的具体实施方式,可参照如下步骤实现:查询目标运行指标的指标类型,其中,指标类型包括季节性单指标类型、非季节性单指标类型或多指标类型。其中,季节性单指标类型为与其它指标无关的且相应时序数据具有季节性规律的指标;非季节性单指标类型为与其它指标无关的且相应时序数据不具有季节性规律的指标;多指标类型为由至少两个指标共同确定的指标。
在一种实施方式中,可以直接从预先记录有每个运行指标以及指标类型之间的对应关系的指标信息表中查询目标运行指标对应的指标类型。在该指标信息表中,清楚地记录有运行指标是季节性单指标类型、非季节性单指标类型或是多指标类型。
在另一种实施方式中,指标信息表中仅是简单记录有目标运行指标对应的是单指标类型还是多指标类型,或者,在查询语句中已预先为目标运行指标简单标识出其属于单指标类型还是多指标类型,如果目标运行指标属于单指标类型,还可以进一步基于目标运行指标在第一指定时间区间内的历史时序数据判断目标运行指标属于季节性单指标类型还是非季节性单指标类型。
也即,在获取到待检测的目标运行指标时,首先判别该目标运行指标属于单指标类型还是双指标类型,如果属于单指标类型,则再进一步判别该目标运行指标的时序数据是否具有季节性规律,如果是,则为季节性单指标类型,否则为非季节性单指标类型。一个时序数据受到季节性因素的影响时,比如该时序数据在每天、每周、每季度或每年出现的大的波动形状都类似,则可称该时序数据具有季节性规律。诸如登录发起数等指标则归属于季节性单指标类型,其数值明显与时间相关,成一定的季节性规律。
在实际应用中,可以采用季节性时间序列分析算法来判断时间序列是否为季节性,本公开实施例给出了如下一种实施方式:通过自相关系数判断时序数据是否具有季节性规律。考虑到绝大多数的季节性指标都与人们的工作生活规律相关,所以可以只考虑小周期为1天,大周期为7天的情况。自相关系数Rk的公式可参照如下:
Figure BDA0003187224080000111
其中,xi代表i时刻的值,
Figure BDA0003187224080000112
表示时序数据的均值,g为时序数据的粒度;k值表示时序数据在一天内所包含的数据点个数,n为时序数据的总长度。在获得自相关系数Rk之后,可以通过如下式子是否成立:
Figure BDA0003187224080000113
若成立,则认为该时序数据具有季节性,该时序数据对应的指标为季节性单指标;否则该时序数据不具有季节性,该时序数据对应的指标为非季节性单指标。
在实际应用中,通过上述判断后,可以直接记录每个运行指标对应的指标类型在指定位置,后续直接调用获取即可。
基于以上方式,可以确定出目标运行指标的指标类型,然后采取与该指标类型相应的异常检测模型判断所述待检测时序数据是否异常。该异常检测模型实际可以理解为预先构建的针对时序数据所采用的异常检测流程或算法,指标类型不同,所对应的异常检测模型也不同。对于季节性单指标类型和多指标类型而言,诸如N-sigma异常点检测算法和IQR异常点检测算法等异常点检测算法无法进行处理,因此需要对指标数据进行预处理,转换为异常点检测算法可处理的数据;而对于非季节性单指标类型而言,异常点检测算法可直接处理,则无需再进行数据转换,因此在单指标类型和多指标类型分别对应的异常检测模型中都包含有预处理算法,只是数据类型不同,所采用的预处理算法不同。为便于理解,以下针对三种类型的运行指标所采用的异常检测模型的实现原理分别阐述如下:
(一)季节性单指标类型
对于季节性单指标类型的目标运行指标,可以采用预设算法计算得到该目标运行指标对应的待检测时序数据的残差;其中,残差即为异常点检测算法可处理的不具有季节性规律的数据。预设算法可以包括指数平滑算法和/或线性回归算法等可以计算数据残差的算法。
在一些实施方式中,可以基于指数平滑算法计算得到待检测时序数据的第一残差,然后采用第一异常点检测算法对所述第一残差进行异常检测,得到第一异常点检测结果;和/或,基于线性回归算法计算得到待检测时序数据的第二残差;然后采用第二异常点检测算法对第二残差进行异常检测,得到第二异常点检测结果。
可以理解的是,在实际实施时可采用如下三种方案(1)仅采用指数平滑算法,此时可得到第一异常点检测结果;(2)仅采用线性回归算法,此时可得到第二异常点检测结果;(3)同时采用指数平滑算法和线性回归算法,此时可同时得到第一异常点检测结果和第二异常点检测结果。
之后,可以根据第一异常点检测结果和第二异常点检测结果的并集判断待检测时序是否异常。可以理解的是,对于上述方案(1),虽然不存在第二异常点检测结果,但可视为第二异常点检测结果为空集,此时第一异常点检测结果和第二异常点检测结果的并集仍旧为第一异常点检测结果;对于上述方案(2),虽然不存在第一异常点检测结果,但可视为第一异常点检测结果为空集,此时第一异常点检测结果和第二异常点检测结果的并集仍旧为第二异常点检测结果。
在基于线性回归算法计算得到待检测时序数据的第二残差时,可以仅采用一种步长对待检测时序数据进行线性回归,为了能够发现同环比异常,还可以采用至少两种步长对待检测时序数据进行线性回归,得到每种步长对应的第二残差;然后采用第二异常点检测算法分别对每种步长对应的第二残差进行异常检测,并将每种步长对应的第二残差的异常点检测结果的交集作为第二异常点检测结果。
在一种具体的实施示例中,可以分别对检测时段内的待检测时序数据做步长为1天和7天的线性自回归异常检测,具体是:
1)对当前数据点和前1、2、3天同时刻的数据点做线性回归,对回归残差执行IQR异常检测得到异常点集合A1d。当然,若数据量不足以计算(诸如仅能获取到少于3天的同时刻的数据点),则A1d为空。
2)对当前数据点和前7、14、21天同时刻的数据点做线性回归,对回归残差执行IQR异常检测得到异常点集合A7d。若数据量不足以计算,则A7d为空。
之后可将A1d∩A7d作为第二异常点检测结果。
在基于指数平滑算法计算得到待检测时序数据的第一残差时,可以针对第一残差执行N-sigma异常检测,得到异常点集合Aresid,Aresid即为第一异常点检测结果。
最后针对待检测时序数据得到的异常点检测结果为:
Afinal=(A1d∩A7d)∪Aresid
通过上述方式,可以较准确地从待检测时序数据中筛选出异常点,保障告警可靠性。
(二)非季节性单指标类型
对于非季节性单指标类型的目标运行指标,无需再进行数据预处理,可直接采用诸如N-sigma异常检测算法或IQR异常检测算法查找目标运行指标的待检测时序数据中的异常点。
(三)多指标类型
对于多指标类型的目标运行指标,为了能够较为准确的判断异常情况,在本公开实施例中可以基于二项分布函数以及标准分数函数计算得到待检测时序数据的标准分数;其中,标准分数为异常点检测算法可处理的不具有季节性规律的数据,然后再采用预设的异常点检测算法对标准分数进行异常检测。在计算标准分数时,可以首先基于目标运行指标在指定时间区间内的历史时序数据确定二项分布函数的期望参数以及标准差参数;然后基于二项分布函数的期望参数和标准差参数,以及标准分数函数计算得到待检测时序数据的标准分数。其中,二项分布函数的期望参数等于标准分数函数中的平均数参数,二项分布函数的标准差参数等于标准分数函数中的标准差参数。
在实际应用中,考虑到大多数多指标类型的指标仅与两个指标相关,在一些具体实施方式中,可以直接将多指标类型设定为双指标类型,双指标类型为由两个指标共同确定的指标,诸如,可以为由成功数指标与发起数指标通过决定的成功率指标。成功数指标诸如可以是指系统某接口成功接收消息(或成功处理消息)的数量指标,发起数指标诸如可以是指该接口外部向该接口发起请求的数量指标。假设双指标类型为需要由第一指标和第二指标共同确定的指标,则在实际应用中,所获取的双指标类型对应的时序数据可以包括第一指标的时序数据和第二指标的时序数据,第一指标的时序数据和第二指标的时序数据可以分别以两条序列的形式呈现,也可以糅合在一起以一条序列的方式呈现,诸如以(第一指标,第二指标)这种点对的形式呈现,此外,还可以直接基于第一指标的时序数据和第二指标的时序数据计算得到由第三指标(第一指标和第二指标共同确定)的时序数据,直接将计算得到的该时序数据作为双指标类型对应的时序数据。以双类型指标为需要由发起数与成功数共同确定的成功率指标为例,在一些实施示例中,可以直接获取发起数的时序数据以及成功数的时序数据,当然也可以获取发起数的时序数据以及失败数的时序数据,通过失败数与发起数来计算成功数,或者还可以获取成功数的时序数据和失败数的成功数据,通过成功数和失败数来计算发起数。
以下均以目标运行指标为基于发起数和成功数共同确定的成功率指标(双指标类型)为例进行说明:
假设一个接口的平均成功率为80%,而某个时间段里针对该接口只有一个请求,当这个请求失败时,成功率就是0;如果只看成功率,这显然属于异常,但把数量考虑在内之后,就可能不算异常了,因为请求本身有20%的失败概率,即便这次失败了也是可以接受的。
可以理解的是,每个请求要么成功要么失败,只有两种结果,因此可以把单次请求看做一次0-1分布的伯努利实验,更进一步,相同接口的多次请求之间是独立同分布的,所以可以假定某个时间段内的多次同接口请求结果服从二项分布,可先用最大似然估计获得二项分布的参数估计,进一步得到标准分数后,通过标准分数消除掉不同数量的差异,得到每个数据点偏离正常水平的程度,最后根据这个偏离程度判断是否异常。具体做法可参照如下:
首先获取成功率指标的历史时序数据(诸如获取过去最多14天的数据),得到发起总数countstart和成功总数countsuccess,然后基于求出基准成功率ratebase
Figure BDA0003187224080000161
然后对于待检测时序数据进行预处理,得到每个时间点的发起数Xstart和成功数Xsuccess,基于二项分布函数和标准分数函数,得到每个时间点的标准分布Z,之后对Z执行N-sigma异常检测即可得到异常点集合。其中,标准分布Z可参照如下公式:
Figure BDA0003187224080000162
其中,ratebaseXstart可视为二项分布的期望,
Figure BDA0003187224080000163
为二项分布的标准差;而标准分数函数的通用表达式为:Z=(x-μ)/σ;其中Z为标准分数;x为某一具体分数,在上述示例中具体为Xsuccess;μ为平均数,在上述示例中具体为二项分布的期望ratebaseXstart;σ为标准差,在上述示例中具体为
Figure BDA0003187224080000164
在得到标准分数Z之后,可以对标准分数Z执行N-sigma异常点检测算法,得到最终的异常点集合。
通过上述方式,可以较准确地从待检测时序数据中筛选出异常点,有助于基于筛选出的异常点保障指标异常检测的可靠性。
在上述基础上,可以参见图2所示的一种指标检测方法的流程示意图,主要包括如下步骤S202~步骤S216:
步骤S202,获取目标系统的目标运行指标对应的待检测时序数据。
步骤S204,获取目标运行指标的指标类型;当指标类型为季节性单指标类型时,执行步骤S206;当指标类型为非季节性单指标类型时,执行步骤S210;指标类型为多指标类型时,执行步骤S212;
步骤S206,采用指数平滑算法和/或线性回归算法计算得到待检测时序数据的残差;
步骤S208,采用预设的异常点检测算法对残差进行异常检测;
步骤S210,采用预设的异常点检测算法对待检测时序数据进行异常检测;
步骤S212,基于二项分布函数和标准分数函数计算得到待检测时序数据的标准分数;
步骤S214,采用预设的异常点检测算法对标准分数进行异常检测;
步骤S216,基于异常检测结果判断待检测时序数据是否异常。以上步骤的具体实施方式可参照前述相关内容,在此不再赘述。
通过上述方式,可以根据目标运行指标的指标类型而有针对性的采取异常检测策略进行异常检测,无需人为设置告警阈值,解决了面对大量的运行指标,人工难以高效、准确地配置告警阈值的问题,在节约人力成本的基础上也可以有效识别指标异常情况,提升异常检测效率,保障指标异常检测的可靠性。
在通过前述方式判别出待检测时序数据异常之后,还可以执行告警操作,诸如,可以向指定终端以短信、邮件或者其它即时通讯方式发送目标运行指标异常的告警消息,还可以采用设定方式在界面上展示目标运行指标的异常信息。由于前述指标检测方法较为可靠高效,因此也有助于进一步保障基于指标检测结果进行告警的可靠性,可有效降低误报、漏报等现象。
本公开实施例还提供了一种可应用于前述指标检测方法的系统,该系统不仅可执行指标检测方法,还可以基于指标检测结果进行告警,本公开实施例提供了如图3所示的一种无阈值监控告警系统的结构示意图,主要包括异常检测单元、数据单元以及告警单元。其中,异常检测单元是无阈值监控告警系统的核心,主要负责诸如管理告警规则、调度训练任务和检测任务等任务操作,数据单元主要负责提供需检测的时序数据,可以屏蔽数据源差异而从各种数据源中提取所需的待检测数据;告警单元主要负责在监控到异常时通过各种途径将告警消息发送给用户。为便于理解,以下分别进行描述:
1)数据单元(也可称为数据获取单元)
数据单元在接收到针对待检测指标的查询语句后,可对该查询语句进行解析,得到该待检测指标的数据源、筛选条件、粒度、降采样策略等信息,然后基于数据源信息,调用相应的数据源接口来提取待检测指标与筛选条件匹配的原始时序数据,此时可以按照最低粒度提取原始时序数据,之后再使用指定的降采样策略对获取到的原始时序数据执行降采样,最后返回降采样后的时序数据。
在实际应用中,为了提升系统性能和减少数据源的压力,还可以设定单此查询的最大时间范围限制,若一个查询的时间范围超过了该限制,则可以将这个查询拆分成多个小查询,比如最大时间范围限制是1天,而用户的查询请求是查询过去28天的数据是否异常,则可以将该过去28天数据的查询拆成28个1天的查询,然后将28个1天的查询结果进行合并,反馈合并后的查询结果以及将查询结果缓存在指定位置。
2)异常检测单元
异常检测单元可以通过数据单元获运行指标的待检测时序数据,然后对待检测时序数据进行异常检测。在本公开实施方式中,可以将线上系统的运行指标划分为单指标类型和多指标类型,单指标类型可进一步划分为季节性单指标和非季节性单指标。在接收到针对待检测运行指标(目标运行指标)的查询语句之后,可首先判别该运行指标所属的类别,然后有针对性的采取相应异常检测模型进行异常检测。
如果目标运行指标为季节性单指标类型或多指标类型,将待检测时序数据转换为异常点检测算法可处理的不具有季节性规律的数据,采用预设的异常点检测算法对转换后的数据进行异常检测,基于检测结果判断待检测时序数据是否异常;如果目标运行指标为非季节性单指标类型,采用异常点检测算法判断待检测时序数据是否异常。具体可参照前述相关内容执行,在此不再赘述。
也可以理解为,异常检测单元内置有每类型指标对应的异常检测模型,可直接针对目标运行指标的指标类型调取相应的异常检测模型进行检测操作。
在实际应用中,系统可以预先训练(构建)每类型指标对应的异常检测模型,然后在异常检测时直接采用训练好的异常检测模型即可。
在一些实施方式中,为了支持近实时的异常检测,检测流程需要频繁执行(最高一分钟检测一次),为了减少异常检测时的计算量,系统将检测流程拆分成训练任务和检测任务。一般来说,训练任务计算量大,倾向于低频运行,而检测任务计算量小,倾向于高频运行。在训练任务中,使用过去一段较长时间的数据构建异常检测模型,该异常检测模型可能包含数据的特征数值(比如分类类型、平均值、标准差等)以及检测任务需要用到的算法参数等信息,基于这些参数以及算法整体构建出成熟可用的异常检测流程。在检测任务中,则可以直接使用这个模型对待检测时序数据进行异常检测。
在实际应用中,可以由用户配置告警规则并指示系统会以不同的策略(诸如设定执行周期)执行训练任务和检测任务。当告警规则处于启用状态时,训练任务和检测任务会各自以固定间隔时间重复执行。诸如,训练任务默认一天执行一次,但若告警规则有更新,则会在下一个任务调度周期(30秒为一周期)里执行以便及时更新模型。检测任务的执行间隔时间配置包含在告警规则里,可由用户手动指定。在检测任务执行时,使用最近一次训练任务产出的模型,若检测出异常,则生成告警信息,调用告警单元给用户发送告警消息。
3)告警单元
告警单元用于执行告警操作,诸如,在异常检测单元检测出目标运行指标异常时,会指示告警单元向指定终端以短信、邮件或者其它即时通讯方式发送目标运行指标异常的告警消息,还可以采用设定方式在界面上展示目标运行指标的异常信息,具体告警方式可以根据实际情况而灵活设置,在此不进行限制。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述无阈值监控告警系统的三个主要单元的具体工作过程,可以参考方法实施例中的对应过程,在此不再赘述。以上无阈值监控告警系统可执行本发明任意实施例所提供的指标检测方法,具备执行方法相应的有益效果。
对应于前述指标检测方法,本公开实施例提供了一种指标检测装置,参见图4所示的一种指标检测装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中,该指标检测装置主要包括如下模块:
指标获取模块42,用于获取待检测的目标运行指标以及目标运行指标的数据采集参数;
模型获取模块44,用于确定目标运行指标的指标类型,并获取与指标类型相应的异常检测模型;其中,不同指标类型分别对应不同异常检测模型;
数据采集模块46,用于根据数据采集参数采集目标运行指标对应的待检测时序数据;
异常检测模块48,用于基于异常检测模型检测待检测时序数据是否异常。
本公开实施例提供的上述技术方案,不再需要人工设置阈值,而是可以按照目标运行指标的指标类型,采取与指标类型相应的异常检测模型直接对待检测时序数据进行异常检测,在节约人力成本的基础上也可以提升指标检测效率。
在一些实施方式中,数据采集参数包括数据源信息、数据筛选规则、数据提取粒度以及粒度降采样策略;数据采集模块46用于:根据数据源信息确定目标数据源;基于数据筛选规则从目标数据源中筛选出目标运行指标对应的最小粒度的原始时序数据;按照粒度降采样策略对原始时序数据进行合并操作,以得到与数据提取粒度匹配的待检测时序数据。
在一些实施方式中,模型获取模块44用于:查询目标运行指标的指标类型;指标类型包括季节性单指标类型、非季节性单指标类型或多指标类型;其中,季节性单指标类型为与其它指标无关的且相应时序数据具有季节性规律的指标;非季节性单指标类型为与其它指标无关的且相应时序数据不具有季节性规律的指标;多指标类型为由至少两个指标共同确定的指标。
在一些实施方式中,当指标类型为季节性单指标类型时,异常检测模块48用于:采用预设算法计算得到待检测时序数据的残差;采用预设的异常点检测算法对残差进行异常检测,基于检测结果判断待检测时序数据是否异常。
在一些实施方式中,异常检测模块48进一步用于:基于指数平滑算法计算得到待检测时序数据的第一残差,和/或,基于线性回归算法计算得到待检测时序数据的第二残差;采用第一异常点检测算法对得到的第一残差进行异常检测,得到第一异常点检测结果;采用第二异常点检测算法对得到的第二残差进行异常检测,得到第二异常点检测结果;根据第一异常点检测结果和第二异常点检测结果的并集判断待检测时序是否异常。
在一些实施方式中,异常检测模块48进一步用于:采用至少两种步长对待检测时序数据进行线性回归,得到每种步长对应的第二残差;采用第二异常点检测算法分别对每种步长对应的第二残差进行异常检测,并将每种步长对应的第二残差的异常点检测结果的交集作为第二异常点检测结果。
在一些实施方式中,当指标类型为非季节性单指标类型时,异常检测模块48用于:采用预设的异常点检测算法对待检测时序数据进行异常检测,基于检测结果判断待检测时序数据是否异常。
在一些实施方式中,当指标类型为多指标类型时,异常检测模块48用于:基于二项分布函数和标准分数函数计算得到待检测时序数据的标准分数;采用预设的异常点检测算法对标准分数进行异常检测,基于检测结果判断待检测时序数据是否异常。
在一些实施方式中,异常检测模块48进一步用于:基于目标运行指标在第二指定时间区间内的历史时序数据确定二项分布函数的期望参数和标准差参数;基于二项分布函数的期望参数和标准差参数、以及标准分数函数计算得到待检测时序数据的标准分数;其中,二项分布函数的期望参数等于标准分数函数中的平均数参数,二项分布函数的标准差参数等于标准分数函数中的标准差参数。
在一些实施方式中,异常检测模型均包括N-sigma异常点检测算法和/或IQR异常点检测算法。
本公开实施例所提供的指标检测装置可执行本发明任意实施例所提供的指标检测方法,具备执行方法相应的功能模块和有益效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置实施例的具体工作过程,可以参考方法实施例中的对应过程,在此不再赘述。
图5为本公开实施例提供的一种电子设备的结构示意图。如图5所示,电子设备500包括一个或多个处理器501和存储器502。
处理器501可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备500中的其他组件以执行期望的功能。
存储器502可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器501可以运行所述程序指令,以实现上文所述的本公开的实施例的指标检测方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备500还可以包括:输入装置503和输出装置504,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
此外,该输入装置503还可以包括例如键盘、鼠标等等。
该输出装置504可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置504可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备500中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备500还可以包括任何其他适当的组件。
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本公开实施例所提供的指标检测方法。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本公开实施例所提供的指标检测方法。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本公开实施例还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本公开实施例中的指标检测方法。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (13)

1.一种指标检测方法,其特征在于,包括:
获取待检测的目标运行指标以及所述目标运行指标的数据采集参数;
确定所述目标运行指标的指标类型,并获取与所述指标类型相应的异常检测模型;其中,不同指标类型分别对应不同异常检测模型;
根据所述数据采集参数采集所述目标运行指标对应的待检测时序数据;
基于所述异常检测模型检测所述待检测时序数据是否异常。
2.根据权利要求1所述的方法,其特征在于,所述数据采集参数包括数据源信息、数据筛选规则、数据提取粒度以及粒度降采样策略;
所述根据所述数据采集参数采集所述目标运行指标对应的待检测时序数据的步骤,包括:
根据所述数据源信息确定目标数据源;
基于所述数据筛选规则从所述目标数据源中筛选出所述目标运行指标对应的最小粒度的原始时序数据;
按照所述粒度降采样策略对所述原始时序数据进行合并操作,以得到与所述数据提取粒度匹配的待检测时序数据。
3.根据权利要求1所述的方法,其特征在于,所述确定所述目标运行指标的指标类型的步骤,包括:
查询所述目标运行指标的指标类型,所述指标类型包括季节性单指标类型、非季节性单指标类型或多指标类型;
其中,所述季节性单指标类型为与其它指标无关的且相应时序数据具有季节性规律的指标;所述非季节性单指标类型为与其它指标无关的且相应时序数据不具有季节性规律的指标;所述多指标类型为由至少两个指标共同确定的指标。
4.根据权利要求3所述的方法,其特征在于,当所述指标类型为季节性单指标类型时,所述基于所述异常检测模型检测所述待检测时序数据是否异常的步骤,包括:
采用预设算法计算得到所述待检测时序数据的残差;
采用预设的异常点检测算法对所述残差进行异常检测,基于检测结果判断所述待检测时序数据是否异常。
5.根据权利要求4所述的方法,其特征在于,所述采用预设算法计算得到所述待检测时序数据的残差的步骤,包括:
基于指数平滑算法计算得到所述待检测时序数据的第一残差,和/或,基于线性回归算法计算得到所述待检测时序数据的第二残差;
所述采用预设的异常点检测算法对所述残差进行异常检测,基于检测结果判断所述待检测时序数据是否异常的步骤,包括:
采用第一异常点检测算法对得到的所述第一残差进行异常检测,得到第一异常点检测结果;
采用第二异常点检测算法对得到的所述第二残差进行异常检测,得到第二异常点检测结果;
根据所述第一异常点检测结果和所述第二异常点检测结果的并集判断所述待检测时序是否异常。
6.根据权利要求5所述的方法,其特征在于,所述基于线性回归算法计算得到所述待检测时序数据的第二残差的步骤,包括:
采用至少两种步长对所述待检测时序数据进行线性回归,得到每种步长对应的第二残差;
所述采用第二异常点检测算法对所述第二残差进行异常检测,得到第二异常点检测结果的步骤,包括:
采用第二异常点检测算法分别对每种步长对应的第二残差进行异常检测,并将每种步长对应的第二残差的异常点检测结果的交集作为第二异常点检测结果。
7.根据权利要求3所述的方法,其特征在于,当所述指标类型为非季节性单指标类型时,所述基于所述异常检测模型检测所述待检测时序数据是否异常的步骤,包括:
采用预设的异常点检测算法对所述待检测时序数据进行异常检测,基于检测结果判断所述待检测时序数据是否异常。
8.根据权利要求3所述的方法,其特征在于,当所述指标类型为多指标类型时,所述基于所述异常检测模型检测所述待检测时序数据是否异常的步骤,包括:
基于二项分布函数和标准分数函数计算得到所述待检测时序数据的标准分数;
采用预设的异常点检测算法对所述标准分数进行异常检测,基于检测结果判断所述待检测时序数据是否异常。
9.根据权利要求8所述的方法,其特征在于,所述基于二项分布函数和标准分数函数计算得到所述待检测时序数据的标准分数的步骤,包括:
基于所述目标运行指标在指定时间区间内的历史时序数据确定二项分布函数的期望参数和标准差参数;
基于所述二项分布函数的期望参数和标准差参数、以及标准分数函数计算得到所述待检测时序数据的标准分数;其中,所述二项分布函数的期望参数等于所述标准分数函数中的平均数参数,所述二项分布函数的标准差参数等于所述标准分数函数中的标准差参数。
10.根据权利要求1至9任一项所述的方法,其特征在于,所述异常检测模型均包括N-sigma异常点检测算法和/或IQR异常点检测算法。
11.一种指标检测装置,其特征在于,包括:
指标获取模块,用于获取待检测的目标运行指标以及所述目标运行指标的数据采集参数;
模型获取模块,用于确定所述目标运行指标的指标类型,并获取与所述指标类型相应的异常检测模型;其中,不同指标类型分别对应不同异常检测模型;
数据采集模块,用于根据所述数据采集参数采集所述目标运行指标对应的待检测时序数据;
异常检测模块,用于基于所述异常检测模型检测所述待检测时序数据是否异常。
12.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-10中任一所述的指标检测方法。
13.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-10中任一所述的指标检测方法。
CN202110865028.1A 2021-07-29 2021-07-29 一种指标检测方法、装置、设备及介质 Pending CN113568950A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110865028.1A CN113568950A (zh) 2021-07-29 2021-07-29 一种指标检测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110865028.1A CN113568950A (zh) 2021-07-29 2021-07-29 一种指标检测方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN113568950A true CN113568950A (zh) 2021-10-29

Family

ID=78169075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110865028.1A Pending CN113568950A (zh) 2021-07-29 2021-07-29 一种指标检测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113568950A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115392812A (zh) * 2022-10-31 2022-11-25 成都飞机工业(集团)有限责任公司 一种异常根因定位方法、装置、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750429A (zh) * 2019-09-06 2020-02-04 平安科技(深圳)有限公司 运维管理系统的异常检测方法、装置、设备及存储介质
CN110851338A (zh) * 2019-09-23 2020-02-28 平安科技(深圳)有限公司 异常检测方法、电子设备及存储介质
CN111338878A (zh) * 2020-02-21 2020-06-26 平安科技(深圳)有限公司 异常检测方法、装置、终端设备及存储介质
CN111459778A (zh) * 2020-03-12 2020-07-28 平安科技(深圳)有限公司 运维系统异常指标检测模型优化方法、装置及存储介质
CN112084056A (zh) * 2020-08-25 2020-12-15 腾讯科技(深圳)有限公司 异常检测方法、装置、设备及存储介质
CN112380044A (zh) * 2020-12-04 2021-02-19 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备和存储介质
CN112395120A (zh) * 2019-08-14 2021-02-23 阿里巴巴集团控股有限公司 异常点检测方法、装置、设备及存储介质
CN112712113A (zh) * 2020-12-29 2021-04-27 广州品唯软件有限公司 一种基于指标的告警方法、装置及计算机系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395120A (zh) * 2019-08-14 2021-02-23 阿里巴巴集团控股有限公司 异常点检测方法、装置、设备及存储介质
CN110750429A (zh) * 2019-09-06 2020-02-04 平安科技(深圳)有限公司 运维管理系统的异常检测方法、装置、设备及存储介质
CN110851338A (zh) * 2019-09-23 2020-02-28 平安科技(深圳)有限公司 异常检测方法、电子设备及存储介质
CN111338878A (zh) * 2020-02-21 2020-06-26 平安科技(深圳)有限公司 异常检测方法、装置、终端设备及存储介质
CN111459778A (zh) * 2020-03-12 2020-07-28 平安科技(深圳)有限公司 运维系统异常指标检测模型优化方法、装置及存储介质
CN112084056A (zh) * 2020-08-25 2020-12-15 腾讯科技(深圳)有限公司 异常检测方法、装置、设备及存储介质
CN112380044A (zh) * 2020-12-04 2021-02-19 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备和存储介质
CN112712113A (zh) * 2020-12-29 2021-04-27 广州品唯软件有限公司 一种基于指标的告警方法、装置及计算机系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115392812A (zh) * 2022-10-31 2022-11-25 成都飞机工业(集团)有限责任公司 一种异常根因定位方法、装置、设备及介质
CN115392812B (zh) * 2022-10-31 2023-03-24 成都飞机工业(集团)有限责任公司 一种异常根因定位方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN111459778B (zh) 运维系统异常指标检测模型优化方法、装置及存储介质
WO2021217855A1 (zh) 异常根因定位方法、装置、电子设备及存储介质
CN112712113B (zh) 一种基于指标的告警方法、装置及计算机系统
CN113518011B (zh) 异常检测方法和装置、电子设备及计算机可读存储介质
JP6689995B2 (ja) コンピュータシステムの監視装置および方法
CN112188531A (zh) 异常检测方法、装置、电子设备及计算机存储介质
US11017330B2 (en) Method and system for analysing data
CN112818066A (zh) 一种时序数据异常检测方法、装置及电子设备和存储介质
CN110083475B (zh) 一种异常数据的检测方法及装置
CN112148768A (zh) 一种指标时间序列异常检测方法、系统及存储介质
US11567483B2 (en) Computer-implemented determination of a quality indicator of a production batch-run that is ongoing
CN112948223B (zh) 一种监测运行情况的方法和装置
CN110677271B (zh) 基于elk的大数据告警方法、装置、设备及存储介质
CN113342625A (zh) 一种数据监控方法及系统
CN113988723A (zh) 一种基于用电数据异常分析的用户行为锁定方法和系统
CN117971606A (zh) 基于ElasticSearch的日志管理系统及方法
CN112988512A (zh) 一种时序数据异常检测方法、装置、设备及存储介质
CN113568950A (zh) 一种指标检测方法、装置、设备及介质
US20130198147A1 (en) Detecting statistical variation from unclassified process log
US10360249B2 (en) System and method for creation and detection of process fingerprints for monitoring in a process plant
CN114202256A (zh) 架构升级预警方法、装置、智能终端及可读存储介质
CN116471174B (zh) 一种日志数据监测系统、方法、装置和存储介质
CN117009181A (zh) 异常日志的处理方法、存储介质与设备
CN110688273B (zh) 分类模型的监控方法、装置、终端以及计算机存储介质
CN117194191A (zh) 日志监控告警方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination